์ ์: Qingyun Wang, Lifu Huang, Zhiying Jiang, Kevin Knight, Heng Ji, Mohit Bansal, Yi Luan | ๋ ์ง: 2019 | DOI: 10.18653/v1/P19-1191 📄 PDF
Essence
PaperRobot์ ๋จ๊ณ๋ณ ๋
ผ๋ฌธ ์์ฑ ๊ณผ์ : ๊ธฐ์กด ๋
ผ๋ฌธ ์ฝ๊ธฐ โ ์ง์ ๊ทธ๋ํ ๊ตฌ์ฑ โ ์๋ก์ด ์์ด๋์ด ์์ธก โ ์๋ก์ด ๋
ผ๋ฌธ ์์ฑ
PaperRobot์ ๊ธฐ์กด ์์ํ ๋
ผ๋ฌธ์์ ์ง์ ๊ทธ๋ํ๋ฅผ ์๋์ผ๋ก ๊ตฌ์ถํ๊ณ , ๋งํฌ ์์ธก์ ํตํด ์๋ก์ด ๊ณผํ์ ์์ด๋์ด๋ฅผ ์์ฑํ ํ, ๋ฉ๋ชจ๋ฆฌ-์ดํ
์
๋คํธ์ํฌ๋ก ์ ๋ชฉ, ์ด๋ก, ๊ฒฐ๋ก ์ ์์ฐจ์ ์ผ๋ก ์์ฑํ๋ ์๋ ์ฐ๊ตฌ ๋ณด์กฐ ์์คํ
์ด๋ค.
Evaluation
์ดํ: PaperRobot์ ์์ํ ๋
ผ๋ฌธ ์๋ ์์ฑ์ด๋ผ๋ ์ค์ ์ ๋ฌธ์ ์ ๋ฉํฐ๋ชจ๋ฌ ์ ๊ทผ(๊ทธ๋ํ+ํ
์คํธ)์ ์ ์ฉํ ์์์ ์ธ ์ฐ๊ตฌ์ด๋ฉฐ, Turing ํ
์คํธ์์ ์ธ๊ฐ๊ณผ ๊ฒฝ์ํ ์ ์๋ ์์ค์ ์ฑ๊ณผ๋ฅผ ๋ณด์๋ค. ๋ค๋ง ์์ฑ๋ ํ
์คํธ์ ๊ณผํ์ ์ ํ์ฑ ๊ฒ์ฆ๊ณผ ์ค์ ํ์ฉ๋์ ๋ํ ์ฌ์ธต ๋ถ์์ด ๋ณด์๋๋ค๋ฉด ํ์ ์ถํ ์ํ๊ณ์ ์ค์ง์ ๊ธฐ์ฌ๋ฅผ ํ ์ ์์ ๊ฒ์ผ๋ก ์์๋๋ค.
๊ฐ์ด ๋ณด๋ฉด ์ข์ ๋
ผ๋ฌธ
๊ธฐ๋ฐ ์ฐ๊ตฌ
PaperRobot์ ์์ด์ ํธํ ๊ณผํ ์์ด๋์ด ์์ฑ ์์คํ
์ ์ฃผ์ ์ด๊ธฐ ์ฌ๋ก๋ก, ์ดํ ๊ณผํ LLM ๋ณด์กฐ ์์คํ
๊ฐ๋ฐ์ ์ด๋ก ์ ๊ทผ๊ฐ์ด ๋ฉ๋๋ค.
๊ธฐ๋ฐ ์ฐ๊ตฌ
Hypothesis Generation with Large Language Models ๋
ผ๋ฌธ์ LLM ๊ธฐ๋ฐ ๊ณผํ์ ์์ด๋์ด ์์ฑ ๊ธฐ๋ฒ์ ์ด๋ก ์ ์ผ๋ก ๋ถ์ํ์ฌ PaperRobot์ ๊ทผ๊ฐ์ด ๋๋ค.
๊ธฐ๋ฐ ์ฐ๊ตฌ
PaperRobot ๋
ผ๋ฌธ์ L-CiteEval์ ์ธ์ฉ ์ ํ๋ ๋ฐ ์๋ ํ๊ฐ ๋ฒค์น๋งํฌ ์ค๊ณ์ ์ด๋ก ์ ๊ทผ๊ฐ์ ์ ๊ณตํฉ๋๋ค.
๊ธฐ๋ฐ ์ฐ๊ตฌ
603์ PaperRobot์ ๋
ผ๋ฌธ ์์ด๋์ด ์์ฑ, ๋ฌธํ ๊ฒํ , ๋ถ์ ๋ฑ 110์ ๋ฐ์ดํฐ-๊ฐ์ค-๋ฌธํ ์๋ ํ์ดํ๋ผ์ธ๊ณผ ์ฐ๊ณ๋๋ ์ด๋ก ์ ๊ธฐ๋ฐ์ ์ ๊ณตํฉ๋๋ค.
๊ธฐ๋ฐ ์ฐ๊ตฌ
603์ PaperRobot์ ์๋ ์์ด๋์ด ์์ฑ, ๊ฐ์ค ์์ฑ, ๋ฐ๋ณต์ ๋
ผ์ ๋ฑ 149์ multi-agent ๊ฐ์ค ์์ฑ ํ๋ ์์ํฌ์ ์ด๋ก ์ ๋ฐํ์ด ๋ฉ๋๋ค.
๋ค๋ฅธ ์ ๊ทผ
603 ๋
ผ๋ฌธ์ LLM ๊ธฐ๋ฐ ๋จ๊ณ์ ๊ณผํ ๋
ผ๋ฌธ ์ด์ ์์ฑ์ ์ ๊ณตํด 729์ ํ์ ์ ์์ด๋์ด ์์ฑ ๋ฐ ๋
ผ๋ฌธ ์ ์ ์์คํ
๊ณผ ๋์์ ์ฐ๊ด์ฑ์ด ์์ต๋๋ค.
๋ค๋ฅธ ์ ๊ทผ
603 ๋
ผ๋ฌธ์ AI๊ฐ ์ ์ง์ ์ผ๋ก ๋
ผ๋ฌธ ์ด์์ ์์ฑยท์์ ํ๋ ๊ณผ์ ์ ๋ค๋ค, 194์ ์ฒด์ธ ๊ธฐ๋ฐ ์์ด๋์ด ์งํ์ ๋๋น๋๋ bottom-up ์์ฑ ๋ฐฉ์์ ์ ์ํ๋ค.
๋ค๋ฅธ ์ ๊ทผ
Scicueval์ ๊ณผํ ๋
ผ๋ฌธ ์์ฝ ๋ฐ ์์ด๋์ด ๋์ถ ์๋ํ์ ๋ค์ํ ๋ฐฉ๋ฒ์ ํ๊ฐํ์ฌ, PaperRobot์ ์๋ ์ด์ ์์ฑ ๋ฐฉ์๊ณผ ์ฑ๊ณผ๋ฅผ ๋น๊ตํ๋ ์ฐธ๊ณ ์๋ฃ๊ฐ ๋ฉ๋๋ค.
๋ค๋ฅธ ์ ๊ทผ
SurveyX๋ LLM ๊ธฐ๋ฐ ๋
ผ๋ฌธ ๋ถ๋ฅยท์๋ํ ์๋ฒ ์ด ๋ถ์ผ๋ก, PaperRobot์ ์ง์๊ทธ๋ํ ยท ์์ฑ ๋ฐฉ๋ฒ๋ก ์ ํ์ฅยท์ ์ฉํ๋ ์ฌ๋ก๊ฐ ๋๋ค.
๋ค๋ฅธ ์ ๊ทผ
603์ ์ฐ๊ตฌ ์์ด๋์ด ์ด์ ์๋์์ฑ ์์คํ
์ผ๋ก, 1088๊ณผ ๊ฐ์ด ๋
ผ๋ฌธ ๋ฐ์ดํฐ ์๋ ์ฒ๋ฆฌ๋ฅผ ๋ชฉํ๋ก ํ์ง๋ง ํ์ ์ง์ ์ด ๋ค๋ฅด๋ค.
๋ค๋ฅธ ์ ๊ทผ
AI ๊ธฐ๋ฐ ๊ณผํ ์์ด์ ํธ๊ฐ ๋
ผ๋ฌธ-ํนํ ๋ฑ research discovery๋ฅผ ์๋ํํ๋ ํ๋ ์์ํฌ๋ฅผ ํตํด, PaperRobot๊ณผ ์ต์ agentic ์ ๊ทผ๋ฒ ๋น๊ต๊ฐ ๊ฐ๋ฅํฉ๋๋ค.
ํ์ ์ฐ๊ตฌ
์ธ๊ฐ-LLM ํ์
์ผ๋ก ์ฐ๊ตฌ ์์ด๋์ด ์๋ํ ๋ฐ ํ๊ฐ ์์คํ
์ ์ฌ๋ก๋ก, PaperRobot์ ์์ด๋์ด ์์ฑ ํ๋ก์ฐ์ ์ค์ง์ ๋น๊ต๊ฐ ๊ฐ๋ฅํฉ๋๋ค.
ํ์ ์ฐ๊ตฌ
Chain of Ideas ๋
ผ๋ฌธ์ ์๋ก์ด ๊ณผํ ์์ด๋์ด ์์ฑ ๋ฐ ์งํ ๊ณผ์ ์ ๋ชจ๋ธ๋ง์ ์ด์ ์ ๋ง์ถ์ด, PaperRobot์ ์์ด๋์ด ์์ฑ ๋ฉ์ปค๋์ฆ์ ์ฌํ์ํต๋๋ค.
ํ์ ์ฐ๊ตฌ
Can LLMs Generate Novel Research Ideas ๋
ผ๋ฌธ์ LLM์ด ์ค์ ๋ก ์ผ๋ง๋ ์ฐธ์ ํ๊ณ ๋
์ฐฝ์ ์์ด๋์ด๋ฅผ ์์ฑ ๊ฐ๋ฅํ์ง ์ธ๊ฐ ํ๊ฐ๋ฅผ ํ ๋๋ก ํ์ฅ ์ฐ๊ตฌ๋ฅผ ์ ๊ณตํ๋ค.
ํ์ ์ฐ๊ตฌ
371๋ฒ ๋
ผ๋ฌธ์ PaperRobot์ด ๋ค๋ฃฌ ์๋ ๋
ผ๋ฌธ ์์ฑ๊ณผ ์ ์ฌํ๊ฒ, LLM ๊ธฐ๋ฐ์ ์ ์ ์ ์ ๋ณด ๋ถ์์ ์๋ํํ๋ ์๋ก์ด ์์ฉ ์ฌ๋ก๋ฅผ ์ ์ํฉ๋๋ค.