Essence
Figure 2: THS results over 310 prompts with 3 agents
๋ณธ ๋
ผ๋ฌธ์ LLM์ hallucination ๋ฌธ์ ๋ฅผ ํด๊ฒฐํ๊ธฐ ์ํด multi-agent orchestration ์ ๊ทผ๋ฒ์ ์ ์ํ๋ค. OVON framework ๊ธฐ๋ฐ NLP ์ธํฐํ์ด์ค๋ฅผ ํตํด ์ฌ๋ฌ specialized agent๋ค์ด ํ๋ ฅํ์ฌ hallucination์ ๋จ๊ณ์ ์ผ๋ก ํ์งํ๊ณ ์ํํ๋ ์์คํ
์ ๊ตฌํํ๊ณ , ์๋ก์ด KPI๋ค์ ๋์
ํ์ฌ hallucination mitigation ํจ๊ณผ๋ฅผ ์ ๋ํํ๋ค.
Achievement
Figure 2: THS results over 310 prompts with 3 agents
Multi-agent ํ์ดํ๋ผ์ธ์ hallucination ์ํ ํจ๊ณผ: 310๊ฐ prompts์ ๋ํด 3๊ฐ agent๋ก ๊ตฌ์ฑ๋ ํ์ดํ๋ผ์ธ์ด progressive hallucination score reduction ๋ฌ์ฑ. Novel KPI ์ฒด๊ณ ๊ฐ๋ฐ: Factual Claim Density, Factual Grounding References, Fictional Disclaimer Frequency, Explicit Contextualization Score ๋ฑ 4๊ฐ ์๋ก์ด ์งํ๋ก hallucination ์์ค์ ์ ๋ํ. OVON ๊ธฐ๋ฐ inter-agent communication ํจ๊ณผ ์
์ฆ: Structured JSON message ๊ธฐ๋ฐ agent ์ํธ์์ฉ์ด context ๋ณด์กด ๋ฐ transparency ํฅ์์ ํตํด system ์ ๋ขฐ์ฑ ์ฆ์ง. AI explainability ๊ฐ์ : Speculative content์ ๋ช
ํํ ๊ตฌ๋ถ๊ณผ explicit disclaimers ์ถ๊ฐ๋ก AI ์์ฑ ์๋ต์ ํด์ ๊ฐ๋ฅ์ฑ ํฅ์.
Evaluation
Novelty: 4/5 Technical Soundness: 3/5 Significance: 4/5 Clarity: 3/5 Overall: 3/5
์ดํ: ๋ณธ ๋
ผ๋ฌธ์ multi-agent orchestration์ ํตํ hallucination mitigation์ ์ค์ง์ ๊ฐ๋ฅ์ฑ์ ๋ณด์ฌ์ฃผ๋ ์๋ฏธ ์๋ empirical study์ด๋ฉฐ, OVON ๊ธฐ๋ฐ structured communication๊ณผ novel KPI ์ฒด๊ณ๋ AI reliability ํฅ์์ ๊ธฐ์ฌํ ์ ์๋ค. ๋ค๋ง ์ ํ๋ LLM ๋ฒ์, prompt ๋ํ์ฑ์ ๋ถ๋ช
ํ์ฑ, KPI ํ๋น์ฑ ๊ฒ์ฆ ๋ถ์กฑ, ๊ทธ๋ฆฌ๊ณ underlying LLM์ black-box ํ๊ณ์ ๋ํ ํด๊ฒฐ์ฑ
๋ถ์ฌ๋ก ์ธํด ๋ฐฉ๋ฒ๋ก ์ ์๋ฐ์ฑ๊ณผ ๊ฒฐ๊ณผ์ ์ผ๋ฐํ ๊ฐ๋ฅ์ฑ์ด ์ ํ๋๋ค.
๊ฐ์ด ๋ณด๋ฉด ์ข์ ๋
ผ๋ฌธ
๊ธฐ๋ฐ ์ฐ๊ตฌ
295 ๋
ผ๋ฌธ์์ ์ ์๋ ๋ฉํฐ์์ด์ ํธ ๊ธฐ๋ฐ ๋์ ์ค์ผ์คํธ๋ ์ด์
์, 396์ agentic AI๋ฅผ ์ด์ฉํ ํ๊ฐ ์ํ ํ๋ ์์ํฌ์ ๋ฉ์ ์ ๊ด๋ฆฌ ์ ๋ต์ ์ง์ ์ ์ด๋ก ์ ๊ทผ๊ฑฐ๋ฅผ ์ ๊ณตํฉ๋๋ค.
๊ธฐ๋ฐ ์ฐ๊ตฌ
736์ SciTrust ๋
ผ๋ฌธ์ LLM ํ๊ฐ ๊ฒ์ฆ ๋ฐ ์ํ ํ๊ฐ ์งํ์ ํ๋ ์์ํฌ๋ฅผ ์ ๋ฆฝํด, 396์ด ์ ์ํ ์์ด์ ํธ ์กฐ์จ ๋ฐฉ์์ ์ ๋ขฐ์ฑ ํ๊ฐ์ ํต์ฌ ๊ธฐ๋ฐ์ ์ ๊ณตํฉ๋๋ค.
๊ธฐ๋ฐ ์ฐ๊ตฌ
Agentic AI์ ๋ฐ์ ๊ณผ ํ๊ณ์ ๋ํ ๊ด๋ฒ์ํ ์๋ฒ ์ด๋ก, ํ๊ฐ ๋ฌธ์ ์ํ ๋ฐ ์ ๋ขฐ์ฑ ํ๋ ์์ํฌ ๋
ผ์์ ๋ฐฐ๊ฒฝ์ ์ ๊ณตํ๋ค.
๋ค๋ฅธ ์ ๊ทผ
747 ๋
ผ๋ฌธ์ LLM์ step-by-step ํ๊ฐ ์๊ธฐ์ ๊ฒ ๋ฐฉ์์ ํ์ฉํ์ฌ, 396์ ๋ค์ค ์์ด์ ํธ ์กฐ์ ์ ์์กดํ์ง ์๋ ๋ค๋ฅธ ํ๊ฐ ์ํ ๋ฐ ์ง๋จ ์ ๋ต์ ๋ณด์ฌ์ค๋๋ค.
๋ค๋ฅธ ์ ๊ทผ
610๋ฒ ๋
ผ๋ฌธ์ VLM์ hallucination ์์ ๊ธฐ๋ฒ์ ๋ค๋ฃจ๋ฉฐ, 396๋ฒ ๋
ผ๋ฌธ์์ ๋ค์ํ hallucination ์ํ ์ ๋ต ๋น๊ต์ ์ ํฉํ ๋์ ์ ๊ทผ๋ฒ์ ์ ์ํ๋ค.
๋ค๋ฅธ ์ ๊ทผ
๋ค๊ตญ์ด LLM์ ํ๊ฐ ํ์ง ๋ฐ ํ๊ฐ๋ฅผ ์ํ ๋ค๋ฅธ ๋ฒค์น๋งํฌ๋ฅผ ์ ์ํ๋ ์ฐ๊ตฌ์ด๋ค.
ํ์ ์ฐ๊ตฌ
396 ๋
ผ๋ฌธ์ ์์ด์ ํธ ๊ธฐ๋ฐ ํ๊ฐ ๊ฐ์ ๋ฐฉ๋ฒ์ ์ ์ํ์ฌ 021 ๋
ผ๋ฌธ์์ ์ธ๊ธ๋ ๋ฌธ์ ์ ๋ํ ์ค์ง์ ์ธ ์๋ฃจ์
์ ๋ณด์ฌ์ค๋๋ค.
ํ์ ์ฐ๊ตฌ
396 ๋
ผ๋ฌธ์ ๋ค์ค ์์ด์ ํธ ๋ฐฉ๋ฒ์ผ๋ก LLM ํ๊ฐ(hallucination) ์ํ ๋ฐฉ์์ ์ ์ํ์ฌ, 736์ ์ ๋ขฐ์ฑ ํ๊ฐ์์ ์ ์ํ ํ๊ฐ ์ฒ๋ฆฌ์ ์ค์ง์ ๋์ ๋ฐฉ๋ฒ์ ๋ณด์ํด์ค๋๋ค.
ํ์ ์ฐ๊ตฌ
์์ด์ ํธ ๊ธฐ๋ฐ ์์ฐ์ด ์ฒ๋ฆฌ๋ก ํ์๋ฆฌ(hallucination)๋ฅผ ์ค์ด๋ ค๋ ์ ๊ทผ์ CiteCheck์ ์ธ์ฉ ๋งฅ๋ฝ ์ค๋ฅ ํ์ง ํ๋ ์์ํฌ์ ์ ์ฌํ ๊ฐ์ ๋ฐฉํฅ์ ์ ์ํฉ๋๋ค.
์์ฉ ์ฌ๋ก
396๋ฒ ๋
ผ๋ฌธ์ ํ๊ฐ ์ํ ๋ฐ ์ ๋ขฐ์ฑ ํฅ์ ํ๋ ์์ํฌ๋ 493๋ฒ LitLLM์์ ๊ณผํ ๋
ผ๋ฌธ ๋ฆฌ๋ทฐ ์์ฑ ์ ํ๊ฐ์ ์ค์ด๊ธฐ ์ํ ๊ฒ์-์ฆ๊ฐ ์์ฑ pipeline์ ํ์ฉ๋ฉ๋๋ค.
์์ฉ ์ฌ๋ก
851๋ฒ ๋
ผ๋ฌธ์ ์คํ์ค ์ํฌํ๋ก์ฐ ์ต์ ํ์ ์์ด์ ํฑ AI๋ฅผ ํ์ฉํ๋ฉฐ, 396๋ฒ์ multi-agent orchestrated communication ๊ธฐ๋ฒ์ด ์ค์ ์์ฉ ์ฌ๋ก๋ก ๊ตฌํ๋๋ค.
๋ฐ๋ก /๋นํ
SFT ๊ธฐ๋ฐ LLM์ด ๋์ผํ ํ๊ฐ ์์์ ๋ณด์ด๋ ํ์์ ๋ด์ธ์, ์์ด์ ํธ ์กฐ์จ๋ง์ผ๋ก๋ ํ๊ณ๊ฐ ์์์ ์์ฌํ๋ค.
๋ฐ๋ก /๋นํ
Hallucination mitigation ๋
ผ๋ฌธ์ ํ๊ฐ ์ค์ด๊ธฐ๋ฅผ ๋ชฉํ๋ก ํ์ฌ, ์๋์ ํ๊ฐ ํ์ฉ ๊ฐ๋ฅ์ฑ๊ณผ ํ๊ณ๋ฅผ ๋์กฐ์ ์ผ๋ก ๋ณด์ฌ์ค๋ค.