์ ์: Atilla Kaan Alkan, Shashwat Sourav, Maja Jablonska, Simone Astarita, Rishabh Chakrabarty, Nikhil Garuda, Pranav Khetarpal, Maciej Piรณro, Dimitrios Tanoglidis, Kartheik G. Iyer, Mugdha S. Polimera, Michael J. Smith, Tirthankar Ghosal, Marc Huertas-Company, Sandor Kruk, Kevin Schawinski, Ioana Ciucฤ | ๋ ์ง: 2025-04-07 | DOI: 10.48550/arXiv.2504.05496 📄 PDF
Essence
Figure 1: Taxonomy of Methods for Scienti๏ฌc Hypothesis Generation (SHG).
๋ณธ ๋
ผ๋ฌธ์ ๊ณผํ์ ๋ฐ๊ฒฌ์์ ๊ฐ์ค ์์ฑ์ ์ํ Large Language Models์ ํ์ฉ์ ๊ดํ ํฌ๊ด์ ์ธ ์๋ฒ ์ด๋ก, ํ๋กฌํํ
๋ถํฐ ๋ณต์กํ ํ๋ ์์ํฌ๊น์ง์ ๊ธฐ์กด ๋ฐฉ๋ฒ๋ค์ ๋ถ๋ฅํ๊ณ ํ๊ฐ ์ ๋ต ๋ฐ ํฅํ ๋ฐฉํฅ์ ์ ์ํ๋ค.
Evaluation
Novelty: 3/5 Technical Soundness: 3/5 Significance: 4/5 Clarity: 4/5 Overall: 4/5
์ดํ: ๋ณธ ๋
ผ๋ฌธ์ ๊ณผํ์ ๊ฐ์ค ์์ฑ ๋ถ์ผ์์ LLMs์ ์ญํ ๊ณผ ๊ฐ๋ฅ์ฑ์ ์ ๋ฆฌํ ์์์ ์ ํ ์ข
ํฉ ์๋ฒ ์ด๋ก, ์ฐ๊ตฌ์๋ค์ ์ํ ํฌ๊ด์ ์ฐธ๊ณ ์๋ฃ๋ฅผ ์ ๊ณตํ๋ค. ๋ค๋ง ์ค์ ๊ณผํ์ ๊ฒ์ฆ ๋ฐ์ดํฐ์ ์ ๋์ ํ๊ฐ ๋ฉํธ๋ฆญ์ ๋ถ์กฑ์ผ๋ก ์ธํด ์ค๋ฌด ์ ์ฉ ๊ฐ๋ฅ์ฑ์ ๋ํ ์ถ๊ฐ ์ค์ฆ ์ฐ๊ตฌ๊ฐ ํ์ํ๋ค.
๊ฐ์ด ๋ณด๋ฉด ์ข์ ๋
ผ๋ฌธ
๊ธฐ๋ฐ ์ฐ๊ตฌ
31(Survey on Hypothesis Generation)์ ์ฆ๋ช
์๋ํ์ LLM ๊ธฐ๋ฐ ์ํ ํ๊ตฌ์ ๊ดํ ์ต์ ์ฐ๊ตฌ๋ํฅ์ ํฌ๊ด์ ์ผ๋ก ์์ ํด 486์ ๋ฐฐ๊ฒฝ์ง์์ผ๋ก ์ ํฉํฉ๋๋ค.
๊ธฐ๋ฐ ์ฐ๊ตฌ
031 ๋
ผ๋ฌธ์ ๊ณผํ์ ๋ฐ๊ฒฌ์ ์ํ ๊ฐ์ค ์์ฑ์ ๊ดํ ์๋ฒ ์ด๋ก, 468์ ์์ด๋์ด ๋์ฝ์ ์ด๋ก ์ ๊ทผ๊ฑฐ์ ๋ฐฐ๊ฒฝ์ ์ ์ํฉ๋๋ค.
๊ธฐ๋ฐ ์ฐ๊ตฌ
๊ณผํ์ ๊ฐ์ค ์์ฑ ๋ฐ ๋
ผ๋ฌธ ๊ฐ ๊ด๊ณ ํ์์ ๋ํ survey๋ก ์ด ๋
ผ๋ฌธ์ ๋ฌธ์ ์์์ ์ด๋ก ์ ๊ธฐ๋ฐ์ ์ ์ํฉ๋๋ค.
๊ธฐ๋ฐ ์ฐ๊ตฌ
A Survey on Hypothesis Generation for Scientific Discovery ๋
ผ๋ฌธ์ LLM์ ์ด์ฉํ ํ์-ํ์ฉ ๊ตฌ์กฐ์ ๊ณผํ์ ๊ฐ์ค ์์ฑ ์ฐ๊ตฌ์ ์ด๋ก ์ ๋ฐฐ๊ฒฝ์ ์์ธํ ์ค๋ช
ํฉ๋๋ค.
๊ธฐ๋ฐ ์ฐ๊ตฌ
๊ณผํ์ ๋ฐ๊ฒฌ์ ์ํ ๊ฐ์ค ์์ฑ์ ๊ดํ ์ ๋ฐ์ ์กฐ์ฌ๋ก, ๊ฐ์ ์คํ์ค์์ ์ด๋ฃจ์ด์ง๋ ์๋ ์ค๊ณ์ ์ด๋ก ์ ๊ธฐ๋ฐ์ ์ ๊ณตํฉ๋๋ค.
๊ธฐ๋ฐ ์ฐ๊ตฌ
๊ณผํ์ ๊ฐ์ค์์ฑ ๋ฒค์น๋งํฌ๋ฅผ ์ ์ํด, LLM ๊ธฐ๋ฐ ๊ฐ์ค ์์ฑ ์ฐ๊ตฌ์ ํ๊ฐ๋ฐฉ์๊ณผ ๋ฐ์ ์ ํ์์ ์ธ ๊ธฐ๋ฐ ์๋ฃ๋ก ์์ฉํ๋ค.
๊ธฐ๋ฐ ์ฐ๊ตฌ
๊ณผํ์ ๋ฐ๊ฒฌ์ ์ํ ๊ฐ์ค ์์ฑ ํ๋ก์ธ์ค์ LLM ์ฌ๊ณ ๋ฐฉ์์ ๋ํ ๊ธฐ์ด ์ด๋ก ์ ์ ๊ณตํ์ฌ ๋ฒค์น๋งํฌ์ ์ค๊ณ ์ทจ์ง๋ฅผ ์ดํดํ๋ ๋ฐ ๋์์ด ๋๋ค.
๊ธฐ๋ฐ ์ฐ๊ตฌ
๊ณผํ์ ๊ฐ์ค ์์ฑ ๋ฐ ์๋ํ ์ฐ๊ตฌ์ ๋ํ ์ด๋ก ์ ยท๋ฐฉ๋ฒ๋ก ์ ๊ธฐ๋ฐ์ธ '๊ณผํ์ ๋ฐ๊ฒฌ์ ์ํ ๊ฐ์ค ์์ฑ ์๋ฒ ์ด'๋ฅผ ์ฐธ๊ณ ํด ๋ฒค์น๋งํฌ ๊ตฌ์ฑ์ ๋ฐฉํฅ์ฑ์ ํ์
ํ ์ ์์ต๋๋ค.
๊ธฐ๋ฐ ์ฐ๊ตฌ
๊ณผํ์ ๋ฐ๊ฒฌ์์ ๊ฐ์ค ์์ฑ ๋ฐ ํ๊ฐ ๋ฐฉ๋ฒ๋ก ์ ๋ํ ์ฒด๊ณ์ ์๋ฒ ์ด๋ฅผ ์ ๊ณตํ์ฌ EAIRA ํ๊ฐ ํ๋ ์์ํฌ์ ์ด๋ก ์ ํ ๋๋ฅผ ํ์ฑํ๋ค.
๊ธฐ๋ฐ ์ฐ๊ตฌ
031๋ฒ ๋
ผ๋ฌธ์ ๊ณผํ์ ๋ฐ๊ฒฌ ๊ณผ์ ์์ LLM์ ๊ฐ์ค ์์ฑ๊ณผ ๊ทธ ๋ฐฉ๋ฒ๋ก ๋ฆฌ๋ทฐ๋ฅผ ์ ๊ณตํ์ฌ, 506๋ฒ ๊ณผํ์ฐ๊ตฌ ์ ์ฃผ๊ธฐ LLM ์ ์ฉ ์ข
ํฉ ๋ฆฌ๋ทฐ์ ๊ธฐ์ด๊ฐ ๋ฉ๋๋ค.
๊ธฐ๋ฐ ์ฐ๊ตฌ
031์ hypothesis generation์ ์ํ ๊ณผํ์ ๋ฐ๊ฒฌ์ ์๋ํ ์ค๊ณ ์๋ฆฌ๋ฅผ ๋ค๋ฃจ๋ฉฐ, 1125์ ์คํ ์ค๊ณยท๋ฐ๊ฒฌ ํ๋ ์์ํฌ ์ดํด์ ๋์์ด ๋ฉ๋๋ค.
๊ธฐ๋ฐ ์ฐ๊ตฌ
๊ณผํ์ ๋ฐ๊ฒฌ์ ์ํ ๊ฐ์ค ์์ฑ ์๋ํ์ Agentic ์ฌ์ด์ธ์ค์ ์ด๋ก ์ ์ฐ๊ฒฐ๊ด๊ณ๋ฅผ ์ค๋ช
ํ์ฌ, [352]์ ์๋ฒ ์ด์ ๋
ผ์์ ๊ธฐ๋ฐ์ด ๋ฉ๋๋ค.
๊ธฐ๋ฐ ์ฐ๊ตฌ
์ธ์ด๋ชจ๋ธ ๊ธฐ๋ฐ ๊ณผํ์ ๊ฐ์ค ์์ฑ์ ๊ดํ Survey ๋
ผ๋ฌธ์ LLM ์ ์ฉ ๋ฐฉ๋ฒ ์ฒด๊ณํ ํ์์ฑ ๋
ผ์์ ๊ทผ๊ฐ์ด ๋๋ค.
๊ธฐ๋ฐ ์ฐ๊ตฌ
A Survey on Hypothesis Generation for Scientific Discovery in Biomedicine ๋
ผ๋ฌธ์ ์์๋ช
๋ถ์ผ์์ AI ๊ฐ์ค ์์ฑ์ ๋ค์ํ ์ฌ๋ก์ ๊ธฐ๋ณธ ํจ๋ฌ๋ค์์ ์ฒด๊ณ์ ์ผ๋ก ์ ๋ฆฌํ๋ค.
๊ธฐ๋ฐ ์ฐ๊ตฌ
์๋ช
๊ณผํ ๋ถ์ผ ๊ณผํ์ ๊ฐ์ค ์์ฑ์ ๋ํด ์๋ฒ ์ดํ ๋
ผ๋ฌธ์ผ๋ก, ์ ๊ฒฝ๊ณผํ ์๋ํ ํ์ดํ๋ผ์ธ์ ์ด๋ก ์ ๊ทผ๊ฑฐ๋ก ์ฐ๊ณํด ๋ณผ ์ ์์ต๋๋ค.
๊ธฐ๋ฐ ์ฐ๊ตฌ
์ฐ๊ตฌ ์์ด๋์ด ๋ฐ ๊ณผํ์ ์์
์ ์๋ ์ฐ์ ํ์ต์ ์ํ ํ์ดํผ์๋๋ฆฌ์ค ๋ฒค์น๋งํฌ๋ก, few-shot continual learning์ ์ด๋ก ์ ๊ธฐ๋ฐ์ด ๋ฉ๋๋ค.
๊ธฐ๋ฐ ์ฐ๊ตฌ
์ฐ๊ตฌ ์์ด๋์ด์ ์๋ ์์ฑ ๋ฐ ๊ฒ์ฆ ๊ฒฐํจ์ ๋ํด ํ๊ฐํ๋ 031 ๋
ผ๋ฌธ์ด 694์ ๊ณผํ์ ์๋ํ ์์คํ
ํ๊ณ๋ฅผ ์ง์ ํ๋ ์ด๋ก ์ ๊ทผ๊ฑฐ๋ฅผ ์ ๊ณตํ๋ค.
๊ธฐ๋ฐ ์ฐ๊ตฌ
031์ ๊ณผํ์ ๋ฐ๊ฒฌ์์์ ๊ฐ์ค ์์ฑ ๋ฐ ํ๊ฐ ํ๋ ์์ํฌ๋ฅผ ๋ค๋ฃจ๋ฉฐ, 3250์ ์ธํฌ ๋์ ๊ฐ์ค ํ์๊ณผ ์ง๊ฒฐ๋ฉ๋๋ค.
๊ธฐ๋ฐ ์ฐ๊ตฌ
031์ ๊ณผํ์ ๊ฐ์ค ์์ฑ ์๋ํ์ ๊ดํ ์ต์ ๋ฐฉ๋ฒ๋ก ์ ์ง์ ์ ์ผ๋ก ์ ๋ฆฌํ์ฌ, 3264์ด ์๋ํ๋ ์๋ ๋ชจ๋ธ ๊ธฐ๋ฐ ์ธํฌ ํ๋ ์์ธก์ ๊ทผ๋ณธ์ ์ด๋ก ๋ฐฐ๊ฒฝ์ ์ ๊ณตํฉ๋๋ค.
๊ธฐ๋ฐ ์ฐ๊ตฌ
LLM ๊ธฐ๋ฐ ๊ณผํ ๋ชจ์ฌ ๋ฐ ์ํฌํ๋ก์ฐ ์๋ํ ๋ฐฉ๋ฒ์ ๋ํ ์ต์ ์ฐ๊ตฌ ๋ํฅ๊ณผ ๋์ ๊ณผ์ ๋ฅผ ์๊ฐํจ.
๊ธฐ๋ฐ ์ฐ๊ตฌ
031 ๋
ผ๋ฌธ์ ๊ณผํ์ ๊ฐ์ค ์์ฑ์ ๋ํ LLMยทAI ์ ๊ทผ๋ฒ๋ค์ ๋ฆฌ๋ทฐ๋ก, 3015๊ฐ ๋ค๋ฃจ๋ AI-๊ธฐ๋ฐ ๋ฐ๊ฒฌ ํ์ฅ์ ์ด๋ก ์ ๋ฐฐ๊ฒฝ์ ์ ๊ณตํ๋ค.
๋ค๋ฅธ ์ ๊ทผ
์๋ํ๋ ๊ณผํ์ ๋ฐ๊ฒฌ ๋ฐ ๊ฐ์ค ์์ฑ์ ์ํ AI ์์คํ
์ ๋ค๋ฃจ๋ ์ ์ฌํ ์ฐ๊ตฌ์ด๋ค.
๋ค๋ฅธ ์ ๊ทผ
์ฐ๊ตฌ ๊ฐ์ค ์๋ ์์ฑ ๋ฐ ๊ฒ์ฆ์ ์ํ LLM ํ์ฉ์ ๋ค๋ฃจ๋ ์ ์ฌํ ์ฐ๊ตฌ์ด๋ค.
๋ค๋ฅธ ์ ๊ทผ
LLM์ ๋ถํ์ค์ฑ ์ฒ๋ฆฌ๋ฅผ ์ํ ๋์์ ๋ฅ๋ ํ์ต ํ๋ ์์ํฌ์ด๋ค.
๋ค๋ฅธ ์ ๊ทผ
๊ณผํ ์ฐ๊ตฌ์์ LLM ๊ธฐ๋ฐ ์์ด๋์ด ์์ฑ ๋ฐ ํ์ ์ ๋ค๋ฃจ๋ ๊ด๋ จ ์ฐ๊ตฌ์ด๋ค.
๋ค๋ฅธ ์ ๊ทผ
031์ ๊ณผํ์ ๋ฐ๊ฒฌ์ ๊ฐ์ค ์์ฑ ๋ถ์ผ์์ LLM ๋ฒค์น๋งํน์ ๋ค๋ฃจ๊ณ ์์ด 724์ '๊ณผํ AI ์ค๋น๋' ํ๊ฐ์ ํ ๋ถ์ผ(๊ฐ์ค ์์ฑ)์ ์ด์ ์ ๋ง์ถ ๋์ ์ฐ๊ตฌ์
๋๋ค.
๋ค๋ฅธ ์ ๊ทผ
๊ณผํ์ ๋ฐ๊ฒฌ์ ์ํ LLM ๊ธฐ๋ฐ ๊ฐ์ค ์์ฑ ๋ฐ ํ๊ฐ๋ฅผ ๋ค๋ฃจ๋ ๋งค์ฐ ์ ์ฌํ ์ฐ๊ตฌ์ด๋ค.
๋ค๋ฅธ ์ ๊ทผ
031๋ฒ ๋
ผ๋ฌธ์ ๊ณผํ์ ๊ฐ์ค ์์ฑ ํ๋ ์์ํฌ์ ๋ํ ์ข
ํฉ์ ๋ฆฌ๋ทฐ๋ฅผ ์ ๊ณตํ์ฌ, 3282๋ฒ์ ๊ฐ์ค ์๋ ๊ฒ์ฆ ๋ฃจํ ๋ฐฉ๋ฒ๊ณผ ๋น๊ต ์ฝ๊ธฐ์ ์ ํฉํฉ๋๋ค.
ํ์ ์ฐ๊ตฌ
492๋ ๋ฐ์ดํฐ์ ๋ฌธํ ๊ฒฐํฉ ๋ฐฉ์์์ ์๋ก์ด ๊ฐ์ค ์์ฑ ์ ๊ทผ์ ์ ์ํด 031์ ๋ถ๋ฅ์ฒด๊ณ์ ํ์ค์ ์์๋ฅผ ์ ๊ณตํ๋ค.
ํ์ ์ฐ๊ตฌ
๊ณผํ์ ๊ฐ์ค์์ฑ์ ์ ๋ขฐ์ฑ ํ๊ฐ, ์ค์ ์ ์ฉ์ ํ๊ณ์ ์ ๋ต์ ๋ค๋ฃจ๋ฏ๋ก, 031์ด ์ ์ํ โํฅํ ์์ฌ์ โ์ ์ค์ ๋ก ๋ค๋ฃฌ ์ฐ๊ตฌ์.
์์ฉ ์ฌ๋ก
418์ ์์ฌ ๊ณผํ ๋ถ์ผ์์ LLM ๊ธฐ๋ฐ ๊ฐ์ค์์ฑ ๋ฐฉ๋ฒ์ ์ค์ ๋ก ์ ์ฉํ ์ฌ๋ก๋ก, 031์ ์๋ฒ ์ด ์ด๋ก ์ด ์ค์ ๋ก ์ด๋ป๊ฒ ํ์ฉ๋๋์ง ๋ณด์ฌ์ค๋ค.
์์ฉ ์ฌ๋ก
๋ค์ค ์์ด์ ํธ์ RAG ๊ธฐ์ ์ ์์ ์์ฌ๊ฒฐ์ ์ ์ ์ฉํด, LLM ๊ธฐ๋ฐ ๊ณผํ์ ๊ฐ์ค ์์ฑ์ ์ค์ ์๋ฃ ์ ์ฉ ๊ฐ๋ฅ์ฑ์ ๋ณด์ฌ์ค๋ค.