์ ์: Michael D. Skarlinski, Sam Cox, Jon M. Laurent, James D. Braza, Michaela Hinks, Michael J. Hammerling, Manvitha Ponnapati, Samuel G. Rodriques, Andrew D. White | ๋ ์ง: 2024-09-26 | DOI: 10.48550/arXiv.2409.13740 📄 PDF
Essence
LLM(Large Language Model)์ ํ๊ฐ(hallucination) ๋ฌธ์ ๋ฅผ ๊ทน๋ณตํ ์์ด์ ํธ ์์คํ
PaperQA2๋ฅผ ๊ฐ๋ฐํ์ฌ, ๊ณผํ ๋ฌธํ ๊ฒ์, ์์ฝ, ๋ชจ์ ํ์ง ์์
์์ ๋ฐ์ฌ ์์ค์ ๊ณผํ์๋ฅผ ๋ฅ๊ฐํ๋ ์ฑ๋ฅ์ ๋ฌ์ฑํ๋ค.
Evaluation
์ดํ: ์ด ๋
ผ๋ฌธ์ ๊ณผํ ๋ฌธํ ํฉ์ฑ์์ LLM์ ์ด์ธ๊ฐ ์ฑ๋ฅ ๋ฌ์ฑ์ ์๊ฒฉํ ๋ฐฉ๋ฒ๋ก ์ผ๋ก ์
์ฆํ ์ค์ํ ๊ธฐ์ฌ๋ก, LitQA2 ๋ฒค์น๋งํฌ์ PaperQA2 ์์คํ
์ ์ค๊ณ๊ฐ ์ค์ง์ ๊ฐ์น ๋์. ๋ค๋ง ๋ชจ์ ํ์ง์ ์ ๋ขฐ๋ ํ๊ณ์ ๋๋ฉ์ธ ํธํฅ์ ๊ทน๋ณตํ๊ณ , ๊ณ์ฐ ํจ์จ์ฑ์ ๊ฐ์ ํ๋ค๋ฉด ๊ณผํ ์ฐ๊ตฌ ์ธํ๋ผ๋ก์์ ๊ฐ๋ฅ์ฑ์ด ๋์ฑ ๊ฐํ๋ ๊ฒ์ผ๋ก ํ๋จ๋จ.
๊ฐ์ด ๋ณด๋ฉด ์ข์ ๋
ผ๋ฌธ
๊ธฐ๋ฐ ์ฐ๊ตฌ
PaperQA๋ ๊ณผํ ๋ฌธํ ๊ฒ์ ๋ฐ ์์ฝ์ ์ํ ์ด๊ธฐ retrieval-augmented LLM ๊ธฐ๋ฐ ์์ด์ ํธ๋ก, PaperQA2 ๊ฐ๋ฐ์ ๊ธฐ์ ์ ์ถ๋ฐ์ ์ด ๋๋ค.
๋ค๋ฅธ ์ ๊ทผ
Llms for literature review ๋
ผ๋ฌธ์ LLM ๊ธฐ๋ฐ์ ๋ฌธํ ๋ฆฌ๋ทฐ ์๋ํ์ ํ๊ฐ ๊ฐ์์ ์ง์คํ์ฌ, ์์ฝ ๋ฐ ๋ชจ์ ํ์ง ์์ฉ ์ธก๋ฉด์ ๋ค๋ฅธ ์ ๊ทผ๋ฒ์ ์ ์ํ๋ค.
๋ค๋ฅธ ์ ๊ทผ
LLM ๊ธฐ๋ฐ ์ฌํ๊ณผํ ์ฐ๊ตฌ ๋ฐฉ๋ฒ๋ก ์ ๋ค๋ฃจ๋ ์ ์ฌํ ์ ๊ทผ๋ฒ์ ์ฐ๊ตฌ์ด๋ค.
๋ค๋ฅธ ์ ๊ทผ
ScholarCopilot ๋
ผ๋ฌธ์ LLM์ ํ์ฉํ ํ์ ๋ฌธํ ๋ถ์ ๋ฐ ์์ฝ ๋ถ์ผ์ ์ต์ ์์ฉ ์ฐ๊ตฌ๋ก PaperQA2 ์ฑ๋ฅ ๋น๊ต์ ์ ์ฉํ๋ค.
ํ์ ์ฐ๊ตฌ
Language agents achieve superhuman synthesis ๋
ผ๋ฌธ์ PaperQA์ retrieval-augmented ์์ด์ ํธ ๊ฐ๋
์ ๊ณ ๋ํํ์ฌ ๋ฐ์ฌ ์์ค ๊ณผํ ์์ฝ๊ณผ ๋ชจ์ ํ์ง๊น์ง ํ์ฅํ๋ค.
ํ์ ์ฐ๊ตฌ
527์ AI ์์ ์ฑ๊ณผ ํด์๊ฐ๋ฅ์ฑ ๋
ผ์๋ 457์์ LLM ํ๊ฐ ๋ฐฉ์ง ๋ฐ ์ ๋ขฐ์ฑ ํ๋ณด ์์ด์ ํธ ๊ฐ๋ฐ์ ํต์ฌ ์ด์๋ฅผ ๋์ฑ ์ฌ์ธต์ ์ผ๋ก ๊ณ ์ฐฐํฉ๋๋ค.
ํ์ ์ฐ๊ตฌ
457๋ฒ ๋
ผ๋ฌธ์ AI ๊ธฐ๋ฐ ์๋ ์ง์ ํฉ์ฑ ๋๊ตฌ์ ์ค์ ํ์ฉ ํจ๊ณผ์ ์ ์ฌ๋ ฅ, ๋์ ๊ณผ์ ๋ฑ์ ์ฌ์ธต์ ์ผ๋ก ๋ถ์ํด ๋๊ตฌ๋ณ ํน์ฑ์ ํ์ฅ ์ค๋ช
ํฉ๋๋ค.
์์ฉ ์ฌ๋ก
PaperQA2 ๋ฑ ์ค์ ๋๋ฉ์ธ(๊ณผํ ๋ฌธํ ๋ถ์)์ ๋๊ท๋ชจ LLM์ ์ ์ฉํด ์ธ๊ฐ๋ณด๋ค ๋์ ์ฑ๋ฅ ๋ฌ์ฑ์ ์ค์ฆํ๋ค.