Embracing Foundation Models for Advancing Scientific Discovery

์ €์ž: Sikun Guo, Amir Hassan Shariatmadari, Guangzhi Xiong, Aidong Zhang | ๋‚ ์งœ: 2024-12-15 | DOI: 10.1109/BigData62323.2024.10825618 📄 PDF


Essence

Figure 1

Fig. 1. An overview of our proposed KG-CoI for knowledge-grounded hypothesis generation. โ€œKG-Rโ€ and โ€œLit-Rโ€ are retrieve

๋ณธ ๋…ผ๋ฌธ์€ ๊ธฐ์ดˆ ๋ชจ๋ธ(Foundation Models), ํŠนํžˆ ๋Œ€๊ทœ๋ชจ ์–ธ์–ด ๋ชจ๋ธ(LLM)์„ ๊ณผํ•™ ๋ฐœ๊ฒฌ์— ํ™œ์šฉํ•˜๊ธฐ ์œ„ํ•ด ์ง€์‹-๊ธฐ๋ฐ˜ ์•„์ด๋””์–ด ์‚ฌ์Šฌ(KG-CoI) ๋ฐฉ๋ฒ•๋ก ๊ณผ IdeaBench ๋ฒค์น˜๋งˆํฌ๋ฅผ ์ œ์•ˆํ•œ๋‹ค.

Motivation

Achievement

Figure 1

Fig. 1. An overview of our proposed KG-CoI for knowledge-grounded hypothesis generation. โ€œKG-Rโ€ and โ€œLit-Rโ€ are retrieve

How

Figure 3

Fig. 3. Prompt template used to generate research ideas.

Originality

Limitation & Further Study

Evaluation

Novelty: 4/5 Technical Soundness: 3/5 Significance: 4/5 Clarity: 4/5 Overall: 4/5

์ดํ‰: ๋ณธ ๋…ผ๋ฌธ์€ Foundation Models์„ ๊ณผํ•™ ๋ฐœ๊ฒฌ์— ํ†ตํ•ฉํ•˜๊ธฐ ์œ„ํ•œ ๋ช…ํ™•ํ•œ ๋น„์ „๊ณผ ์‹คํ–‰ ๊ฐ€๋Šฅํ•œ ํ”„๋ ˆ์ž„์›Œํฌ๋ฅผ ์ œ์‹œํ•˜๋ฉฐ, ํŠนํžˆ KG-CoI์™€ IdeaBench๋Š” ์ธ๊ฐ„-AI ํ˜‘๋ ฅ ์‹œ๋Œ€์˜ ๊ณผํ•™ ์—ฐ๊ตฌ ๋ฐฉ์‹์„ ํ˜์‹ ํ•  ์ˆ˜ ์žˆ๋Š” ์ค‘์š”ํ•œ ๊ธฐ์—ฌ๋‹ค. ๋‹ค๋งŒ ์‹ค์ฆ์  ํ‰๊ฐ€์™€ ๊ตฌ์ฒด์ ์ธ ๊ตฌํ˜„ ์„ธ๋ถ€์‚ฌํ•ญ์ด ์ถ”๊ฐ€๋˜๋ฉด ๋”์šฑ ๊ฐ•๋ ฅํ•œ ์—ฐ๊ตฌ๊ฐ€ ๋  ์ˆ˜ ์žˆ๋‹ค.

๊ฐ™์ด ๋ณด๋ฉด ์ข‹์€ ๋…ผ๋ฌธ

๊ธฐ๋ฐ˜ ์—ฐ๊ตฌ
LLM์„ ํ™œ์šฉํ•œ ๊ณผํ•™์  ์•„์ด๋””์–ด ์ƒ์„ฑ์˜ ์ด๋ก ์ ยท๋ฐฉ๋ฒ•๋ก ์  ๊ธฐ๋ฐ˜์„ ์ œ๊ณตํ•œ๋‹ค.
๊ธฐ๋ฐ˜ ์—ฐ๊ตฌ
LLM ๊ธฐ๋ฐ˜ ๊ณผํ•™ ์ง€์‹ ์ฒ˜๋ฆฌ์˜ ๋ฐฉ๋ฒ•๋ก ์  ๊ธฐ๋ฐ˜์„ ์ œ๊ณตํ•œ๋‹ค.
๊ธฐ๋ฐ˜ ์—ฐ๊ตฌ
๋Œ€๊ทœ๋ชจ ์ง€์‹๊ทธ๋ž˜ํ”„๋ฅผ ๊ตฌ์ถ•ํ•˜์—ฌ LLM ๊ธฐ๋ฐ˜ ๊ณผํ•™ ๋ฐœ๊ฒฌ์˜ ์ง€์‹ ๊ธฐ๋ฐ˜์„ ์ œ๊ณตํ•œ๋‹ค.
๊ธฐ๋ฐ˜ ์—ฐ๊ตฌ
๊ธฐ์ดˆ๋ชจ๋ธ๊ณผ ์•„์ด๋””์–ด ์‚ฌ์Šฌ ๋ฐฉ๋ฒ•๋ก ์ด ChemMiner์—์„œ ๋ณตํ•ฉ์  ํฌ๋กœ์Šค๋ ˆํผ๋Ÿฐ์‹ฑ ๋ฐ ๋ฉ€ํ‹ฐ๋ชจ๋‹ฌ ์ •๋ณด์ฒ˜๋ฆฌ ๊ตฌํ˜„์— ์ด๋ก ์  ๊ทผ๊ฑฐ๋ฅผ ์ œ๊ณตํ•ฉ๋‹ˆ๋‹ค.
๊ธฐ๋ฐ˜ ์—ฐ๊ตฌ
heterogeneous ๊ทธ๋ž˜ํ”„ ๊ธฐ๋ฐ˜ ํ•™์Šต ๋ฐฉ๋ฒ•๋ก ์˜ ์ด๋ก ์  ๊ธฐ๋ฐ˜์„ ์ œ๊ณตํ•œ๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
์ƒ์˜ํ•™ ์ง€์‹ ๋„คํŠธ์›Œํฌ๋ฅผ ํ†ตํ•œ ์ž๋™ ๊ฐ€์„ค ์ƒ์„ฑ ์‹œ์Šคํ…œ์œผ๋กœ ์œ ์‚ฌํ•œ ๋ฌธ์ œ๋ฅผ ๋‹ค๋ฅธ ๋ฐฉ๋ฒ•์œผ๋กœ ํ•ด๊ฒฐํ•œ๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
LLM ๊ธฐ๋ฐ˜ ๊ณผํ•™ ๋ฐœ๊ฒฌ ์ง€์›์„ ๋‹ค๋ฅธ ํ”„๋ ˆ์ž„์›Œํฌ๋กœ ๊ตฌํ˜„ํ•œ ์—ฐ๊ตฌ์ด๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
๊ณผํ•™์  ๋„๋ฉ”์ธ ํŠนํ™” ์–ธ์–ด๋ชจ๋ธ ๊ฐœ๋ฐœ์„ ๋‹ค๋ฃจ๋Š” ์œ ์‚ฌํ•œ ์—ฐ๊ตฌ์ด๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
AI ๊ธฐ๋ฐ˜ ๊ณผํ•™ ์—ฐ๊ตฌ ์ง€์› ๋„๊ตฌ๋ฅผ ๋‹ค๋ฅธ ์ ‘๊ทผ๋ฒ•์œผ๋กœ ๊ตฌํ˜„ํ•œ ์—ฐ๊ตฌ์ด๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
๊ธฐ์ดˆ ๋ชจ๋ธ์„ ๊ณผํ•™ ๋ฐœ๊ฒฌ์— ํ™œ์šฉํ•˜๋Š” ๋‹ค๋ฅธ ๋ฐฉ๋ฒ•๋ก ์  ์ ‘๊ทผ์„ ์ œ์‹œํ•œ ์—ฐ๊ตฌ์ด๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
๊ณผํ•™์  ๋Œ€๊ทœ๋ชจ ์–ธ์–ด๋ชจ๋ธ์˜ ๋ฐœ์ „์„ ์ข…ํ•ฉ์ ์œผ๋กœ ์กฐ์‚ฌํ•˜๋Š” ์œ ์‚ฌํ•œ ์—ฐ๊ตฌ์ด๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
๊ณผํ•™ ๋ถ„์•ผ LLM์˜ ๋ฐœ์ „๊ณผ ์‘์šฉ์„ ์ข…ํ•ฉ์ ์œผ๋กœ ๋ถ„์„ํ•˜๋Š” ๋งค์šฐ ์œ ์‚ฌํ•œ ์„œ๋ฒ ์ด ์—ฐ๊ตฌ์ด๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
LLM์„ ํ™œ์šฉํ•œ ๊ณผํ•™ ํ…์ŠคํŠธ ์ฒ˜๋ฆฌ์™€ ์š”์•ฝ์˜ ๋Œ€์•ˆ์  ์ ‘๊ทผ์„ ์ œ์‹œํ•œ๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
LLM์„ ํ™œ์šฉํ•œ ๊ณผํ•™์  ์•„์ด๋””์–ด ์ƒ์„ฑ์„ ๋‹ค๋ฅธ ๋ฐฉ๋ฒ•๋ก ์œผ๋กœ ์ ‘๊ทผํ•œ ์œ ์‚ฌ ์—ฐ๊ตฌ์ด๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
๊ธฐ์ดˆ ๋ชจ๋ธ์„ ๊ณผํ•™ ๋ฐœ๊ฒฌ์— ํ™œ์šฉํ•˜๋Š” ๋‹ค๋ฅธ ๋ฒค์น˜๋งˆํฌ๋‚˜ ๋ฐฉ๋ฒ•๋ก ์„ ์ œ์‹œํ•œ๋‹ค.
ํ›„์† ์—ฐ๊ตฌ
๊ธฐ์ดˆ ๋ชจ๋ธ์„ ํ™œ์šฉํ•œ ๊ณผํ•™ ๋ฐœ๊ฒฌ ๋ฒค์น˜๋งˆํ‚น์„ ํ™•์žฅํ•œ ์—ฐ๊ตฌ์ด๋‹ค.
ํ›„์† ์—ฐ๊ตฌ
1072๋ฒˆ ๋…ผ๋ฌธ์€ ๊ณผํ•™ ๋ถ„์•ผ ๋Œ€ํ˜• ๊ธฐ์ดˆ ๋ชจ๋ธ ์ „๋ง์„ ๋‹ค๋ฃจ๋ฉฐ, 344๋ฒˆ์˜ ์ƒ๋ฌผ์ •๋ณดํ•™ FM ๋ฆฌ๋ทฐ์˜ ๋ฏธ๋ž˜ ์ง€ํ–ฅ์  ๋…ผ์˜์™€ ํ™•์žฅ์„ ์ƒ์— ์žˆ์Šต๋‹ˆ๋‹ค.
ํ›„์† ์—ฐ๊ตฌ
LLM์„ ๊ณผํ•™๊ณ„๋Ÿ‰ํ•™ ๋ถ„์•ผ์— ์ ์šฉํ•˜๋Š” ๊ตฌ์ฒด์  ๋ฐฉ๋ฒ•๋ก ์„ ํ™•์žฅ ์ œ์‹œํ•œ๋‹ค.
์‘์šฉ ์‚ฌ๋ก€
๋ณธ ๋…ผ๋ฌธ์—์„œ ์ œ์‹œ๋œ ํŒŒ์šด๋ฐ์ด์…˜ ๋ชจ๋ธ ํ™œ์šฉ ์ด๋ก ์ด, LLaMP๊ฐ€ ์‹ค์งˆ์ ์œผ๋กœ Materials Project ๋“ฑ ์†Œ์žฌ-์‹œ๋ฎฌ๋ ˆ์ด์…˜ ๋„๊ตฌ์—์„œ ๊ตฌํ˜„๋œ ์‚ฌ๋ก€๋ฅผ ๋ณด์—ฌ์ค๋‹ˆ๋‹ค.
← ๋ชฉ๋ก์œผ๋กœ ๋Œ์•„๊ฐ€๊ธฐ

๐ŸŽง Audio Overview

์ด ๋…ผ๋ฌธ ๋ฆฌ๋ทฐ๋ฅผ ํŒŸ์บ์ŠคํŠธํ˜• ์˜ค๋””์˜ค๋กœ ์ƒ์„ฑํ•ฉ๋‹ˆ๋‹ค. (Gemini ยท ํ‚ค๋Š” ๋ธŒ๋ผ์šฐ์ €์—๋งŒ ์ €์žฅ ยท ์™„์„ฑ๋ณธ์€ ์ด๋ฉ”์ผ๋กœ๋„ ์ „์†ก)
โ–ธ ๊ณ ๊ธ‰: ๊ตฌ์„ฑ ๋ฐฉํ–ฅ(๋Œ€๋ณธ ์ž‘์„ฑ ์ง€์นจ) ์ง์ ‘ ์ˆ˜์ •