Hypothesis Generation for Materials Discovery and Design Using Goal-Driven and Constraint-Guided LLM Agents

์ €์ž: Shrinidhi Kumbhar, Venkatesh Mishra, Kevin Coutinho, Divij Handa, Ashif Iquebal | ๋‚ ์งœ: 2025 | DOI: 10.48550/arXiv.2501.13299 📄 PDF


Essence

Figure 1

Figure 1: Overview of our iterative hypothesis gener-

Materials discovery ๊ฐ€์†ํ™”๋ฅผ ์œ„ํ•ด ๋ชฉํ‘œ ๊ธฐ๋ฐ˜์˜ ์ œ์•ฝ ์กฐ๊ฑด์ด ์žˆ๋Š” LLM agent๋ฅผ ์„ค๊ณ„ํ•˜๊ณ , ์‹ค์ œ ๋…ผ๋ฌธ ๋ฐ์ดํ„ฐ๋กœ ๊ตฌ์„ฑ๋œ MATDESIGN ๋ฒค์น˜๋งˆํฌ์™€ ํ•จ๊ป˜ ๊ฐ€์„ค ์ƒ์„ฑ ๋ฐ ํ‰๊ฐ€ ํ”„๋ ˆ์ž„์›Œํฌ๋ฅผ ์ œ์‹œํ•œ๋‹ค.

Motivation

Achievement

Figure 2

Figure 2: The left plot illustrates the Closeness metric scores across three evaluation criteria for the three configu-

How

Figure 1

Figure 1: Overview of our iterative hypothesis gener-

Originality

Limitation & Further Study

Evaluation

Novelty: 4/5 Technical Soundness: 3/5 Significance: 4/5 Clarity: 4/5 Overall: 4/5

์ดํ‰: ๋ณธ ๋…ผ๋ฌธ์€ materials discovery ๊ฐ€์†ํ™”๋ฅผ ์œ„ํ•œ tool-free LLM agent ํ”„๋ ˆ์ž„์›Œํฌ์™€ ํ•จ๊ป˜ ๋ฐ์ดํ„ฐ ์œ ์ถœ ๋ฌธ์ œ๋ฅผ ํ•ด๊ฒฐํ•œ MATDESIGN ๋ฒค์น˜๋งˆํฌ, ๊ทธ๋ฆฌ๊ณ  ์žฌ๋ฃŒ ๊ณผํ•™์ž์˜ ํ‰๊ฐ€ ๊ธฐ์ค€์„ ๋ฐ˜์˜ํ•œ ์ด์› ๋ฉ”ํŠธ๋ฆญ์„ ์ œ์‹œํ•˜์—ฌ LLM ๊ธฐ๋ฐ˜ ๊ฐ€์„ค ์ƒ์„ฑ ์—ฐ๊ตฌ์˜ ์ค‘์š”ํ•œ ์ง„์ „์„ ์ด๋ฃจ์—ˆ๋‹ค.

๊ฐ™์ด ๋ณด๋ฉด ์ข‹์€ ๋…ผ๋ฌธ

๊ธฐ๋ฐ˜ ์—ฐ๊ตฌ
788์˜ ๋ชฉํ‘œ ์ง€ํ–ฅ ์žฌ๋ฃŒ ์„ค๊ณ„์™€ ๋ถ€๋ถ„ ๊ณต๊ฐ„ ํƒ์ƒ‰ ๋ฐฉ์‹์€ 418 ๋…ผ๋ฌธ์˜ LLM ๊ธฐ๋ฐ˜ ์†Œ์žฌ ๋ฐœ๊ฒฌ์šฉ ๊ฐ€์„ค ์ƒ์„ฑ ๋ฐ ํƒ์ƒ‰์˜ ๊ทผ๊ฐ„์ด ๋ฉ๋‹ˆ๋‹ค.
๊ธฐ๋ฐ˜ ์—ฐ๊ตฌ
LLM์„ ํ™œ์šฉํ•œ ๊ฐœ๋ฐฉ ๋„๋ฉ”์ธ ๊ณผํ•™ ๊ฐ€์„ค ์ž๋™ ์ƒ์„ฑ ์‹œ์Šคํ…œ์„ ์ œ์•ˆํ•˜์—ฌ, ์žฌ๋ฃŒ๊ณผํ•™ ๊ฐ€์„ค์ƒ์„ฑ ์‘์šฉ์˜ ๊ธฐ๋ฐ˜์ด ๋œ๋‹ค.
๊ธฐ๋ฐ˜ ์—ฐ๊ตฌ
๊ณผํ•™์  ๊ฐ€์„ค ์ƒ์„ฑ์—์„œ ๊ฒ€์ƒ‰ ๋ฐ ์ •๋ณด ์ •๋ ฌ ๊ธฐ์ˆ ์˜ ์—ญํ• ์„ ์ •๋ฆฌํ•˜์—ฌ, ์‹ค์ œ ๋…ผ๋ฌธ ๋ฐ์ดํ„ฐ ๊ธฐ๋ฐ˜ ํ‰๊ฐ€(๋ณธ ๋…ผ๋ฌธ)์˜ ์ด๋ก ์  ๊ทผ๊ฑฐ๊ฐ€ ๋ฉ๋‹ˆ๋‹ค.
๊ธฐ๋ฐ˜ ์—ฐ๊ตฌ
Hypothesis Generation for Materials Discovery and Design ๋…ผ๋ฌธ์€ ๋Œ€๊ทœ๋ชจ LLM ๊ธฐ๋ฐ˜ ์ธ๊ณผ์ถ”๋ก ์  ๊ฐ€์„ค ์ƒ์„ฑ์˜ ์ด๋ก ์  ๋ฐฐ๊ฒฝ์„ ๋„์‹œ๊ณผํ•™ ์ž๋™ํ™”์—๋„ ์ ์šฉํ•  ๊ทผ๊ฑฐ๋ฅผ ์ œ๊ณตํ•ฉ๋‹ˆ๋‹ค.
๊ธฐ๋ฐ˜ ์—ฐ๊ตฌ
์žฌ๋ฃŒ๊ณผํ•™ ๋ถ„์•ผ์—์„œ LLM๊ณผ foundation model ์ตœ์‹  ๋™ํ–ฅ์„ ์š”์•ฝํ•ด ์‹ค์ œ ์ ์šฉ ํ™•์žฅ ๊ฐ€๋Šฅ์„ฑ ๋…ผ์˜์— ๋„์›€์„ ์ค๋‹ˆ๋‹ค.
๊ธฐ๋ฐ˜ ์—ฐ๊ตฌ
๊ณผํ•™์  ๊ฐ€์„ค๋ง ํƒ์ƒ‰์— ๋Œ€ํ•œ ์ด๋ก ์  ํ˜•์‹ํ™”์™€ ์—์ด์ „ํŠธ ๊ตฌํ˜„ ์›๋ฆฌ๋ฅผ ๋‹ค๋ฃจ์–ด, ๋ชฉํ‘œ ๊ธฐ๋ฐ˜ ์žฌ๋ฃŒ๋ฐœ๊ฒฌ LLM agent ์„ค๊ณ„์— ๊ทผ๊ฐ„์„ ์ด๋ฃฌ๋‹ค.
๊ธฐ๋ฐ˜ ์—ฐ๊ตฌ
๊ณผํ•™ ์•„์ด๋””์–ด ์ƒ์„ฑ๊ณผ ๋ฐœ๊ฒฌ ์ž๋™ํ™”์˜ ๊ฐœ๋…์  ๋ถ„์„์œผ๋กœ, LLM ๊ธฐ๋ฐ˜ ๊ฐ€์„ค ์ƒ์„ฑ ์‹œ์Šคํ…œ์˜ ์ฒ ํ•™์ ยท์‹คํ—˜์  ์ฒ ํ•™์„ ์ œ๊ณตํ•ฉ๋‹ˆ๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
๊ฐ•ํ™”ํ•™์Šต ๊ธฐ๋ฐ˜ ์‹คํ—˜ ์ตœ์ ํ™” ์—์ด์ „ํŠธ์˜ ์œ ์‚ฌํ•œ ์ ‘๊ทผ ๋ฐฉ์‹์ด๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
ํ•ฉ๊ธˆ ์„ค๊ณ„ ์ž๋™ํ™”๋ฅผ ์œ„ํ•œ AI ๊ธฐ๋ฐ˜ ์ ‘๊ทผ๋ฒ•์˜ ์œ ์‚ฌํ•œ ๋ฌธ์ œ๋ฅผ ๋‹ค๋ฅด๊ฒŒ ์ ‘๊ทผํ•œ๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
418์€ ์ง€์‹ ๊ทธ๋ž˜ํ”„์™€ AI๋ฅผ ํ™œ์šฉํ•œ ์†Œ์žฌ ๊ฐ€์„ค ์ƒ์„ฑ ๋ฌธ์ œ๋ฅผ ๋‹ค๋ฃจ์–ด, 705์˜ ๋Œ€๊ทœ๋ชจ ์˜จํ†จ๋กœ์ง€ ๋ฐ LLM-์—์ด์ „ํŠธ ํ†ตํ•ฉ ๋ชจ๋ธ๊ณผ ๊ฐ™์€ ๋งฅ๋ฝ์ด๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
์žฌ๋ฃŒ๊ณผํ•™์—์„œ LLM์˜ ๋‹ค์–‘ํ•œ ์—ญํ• (๊ฐ€์„ค ์ƒ์„ฑ ํฌํ•จ) ๋ฐ ์ „๋žต์  ์‚ฌ์šฉ ํ”„๋ ˆ์ž„์›Œํฌ๋ฅผ ์ œ์•ˆํ•˜์—ฌ, ๋ชฉํ‘œ ๊ธฐ๋ฐ˜ ์—์ด์ „ํŠธ ์„ค๊ณ„์™€ ์ฐจ๋ณ„์ ์„ ๋น„๊ตํ•  ์ˆ˜ ์žˆ๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
์žฌ๋ฃŒ๊ณผํ•™์—์„œ LLM ๊ธฐ๋ฐ˜ ๊ณผํ•™์  ๊ฐ€์„ค ์ƒ์„ฑ๊ณผ knowledge-guided agent์˜ ํŠน์žฅ์ ์„ ๋น„๊ตํ•  ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
Knowledge graph์™€ LLM์„ ํ™œ์šฉํ•˜์—ฌ ๊ฐ€์„ค ์ž๋™ ์ƒ์„ฑ ๋ฐ ํ‰๊ฐ€๋ฅผ ์ˆ˜ํ–‰ํ•˜๋Š” ๋˜๋‹ค๋ฅธ ๋ฐฉ๋ฒ•์„ ์ œ์‹œํ•ด, ๋‘ ์‹œ์Šคํ…œ์˜ ํŠน์ง•์„ ๋น„๊ตํ•  ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
RAG-LLM ๊ธฐ๋ฐ˜ ๋‚˜๋…ธ์†Œ์žฌ ์„ค๊ณ„ ์ž๋™ํ™”๋ผ๋Š” ์œ ์‚ฌ ๋ชฉ์ ์ด์ง€๋งŒ, ์„œ๋กœ ๋‹ค๋ฅธ ๋„๋ฉ”์ธ(์žฌ๋ฃŒ vs. ๋‚˜๋…ธ๊ตฌ์กฐ)๊ณผ ์ ‘๊ทผ์„ ์ทจํ•œ๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
์ž์œจ ์†Œ์žฌ ๊ฐœ๋ฐœ ๋ฐ ์‹คํ—˜์‹ค-์ƒ์šฉํ™” ๊ฐ„ ๊ฒฉ์ฐจ๋ฅผ ํ•ด์†Œํ•˜๊ธฐ ์œ„ํ•œ ์œ ์‚ฌํ•œ ํ”„๋ ˆ์ž„์›Œํฌ๋ฅผ ์ œ์•ˆํ•˜๋Š” ์—ฐ๊ตฌ์ด๋‹ค.
ํ›„์† ์—ฐ๊ตฌ
์ƒ๋ช…๊ณผํ•™ ๊ธฐ๋ฐ˜ ์ž๋™ํ™” ์‹œ์Šคํ…œ์—์„œ ๊ฐ€์„ค ์ƒ์„ฑยท์ถ”๋ก ์„ ์œ„ํ•œ ์—์ด์ „ํŠธ์  ์ ‘๊ทผ์˜ ์‹ค์ œ ๊ตฌํ˜„ ์‚ฌ๋ก€๋ฅผ ๋ณด์—ฌ์ค€๋‹ค.
ํ›„์† ์—ฐ๊ตฌ
์žฌ๋ฃŒ ๋ฐœ๊ฒฌ๊ณผ ์„ค๊ณ„์—์„œ LLM์„ ํ™œ์šฉํ•œ ๊ฐ€์„ค ์ƒ์„ฑ ๋ฐฉ๋ฒ•๋ก  ๋…ผ๋ฌธ์œผ๋กœ, ์‹ ๊ทœ์„ฑ ํ‰๊ฐ€ ๋ฐ ๊ณผํ•™์  ํƒํ—˜ ์—ฌ๋ถ€์— ์ ์šฉ๋  ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค.
ํ›„์† ์—ฐ๊ตฌ
HoneyComb์˜ LLM-์—์ด์ „ํŠธ์™€ ์ง€์‹๊ทธ๋ž˜ํ”„ ํ†ตํ•ฉ ํ”„๋ ˆ์ž„์›Œํฌ๋ฅผ ์‹ค์ œ ๊ฐ€์„ค ์ƒ์„ฑ ๋ฐ ํ‰๊ฐ€ ํŒŒ์ดํ”„๋ผ์ธ์œผ๋กœ ํ™•์žฅํ•œ ๋…ผ๋ฌธ์ž…๋‹ˆ๋‹ค.
ํ›„์† ์—ฐ๊ตฌ
418๋ฒˆ ๋…ผ๋ฌธ์€ LLM์„ ํ™œ์šฉํ•œ ์†Œ์žฌ ๋ฐœ๊ฒฌ ๊ฐ€์„ค ์ƒ์„ฑ ๋ฐฉ๋ฒ•์„ ๋‹ค๋ฃจ์–ด, 719๋ฒˆ๊ณผ ๋น„์Šทํ•œ AI ๊ธฐ๋ฐ˜ ๊ฐ€์„ค ์ƒ์„ฑ์„ ์†Œ์žฌ ๊ณผํ•™์— ์‘์šฉํ•œ๋‹ค.
์‘์šฉ ์‚ฌ๋ก€
์‹œ๊ฐ-ํ…์ŠคํŠธ ์ •๋ณด ์ถ”์ถœ ๋ฐฉ๋ฒ•์„ ํ†ตํ•ด 418์˜ ๋…ผ๋ฌธ ๋ฐ์ดํ„ฐ ๊ธฐ๋ฐ˜ ๊ฐ€์„ค ์ƒ์„ฑ ํ”„๋ ˆ์ž„์›Œํฌ์˜ ์ž…๋ ฅ ํ™•์žฅ์„ฑ์„ ํƒ์ƒ‰ํ•œ๋‹ค.
์‘์šฉ ์‚ฌ๋ก€
์žฌ๋ฃŒ ๊ณผํ•™์  ์˜์—ญ์—์„œ LLM ๊ธฐ๋ฐ˜ ๊ฐ€์„ค ์ƒ์„ฑ ๋ฐ ์„ค๊ณ„ ์ „๋žต ํ‰๊ฐ€๋ฅผ ์‹ค์ œ๋กœ ์ ์šฉํ•ด๋ด…๋‹ˆ๋‹ค.
์‘์šฉ ์‚ฌ๋ก€
418์€ ์†Œ์žฌ ๊ณผํ•™ ๋ถ„์•ผ์—์„œ LLM ๊ธฐ๋ฐ˜ ๊ฐ€์„ค์ƒ์„ฑ ๋ฐฉ๋ฒ•์„ ์‹ค์ œ๋กœ ์ ์šฉํ•œ ์‚ฌ๋ก€๋กœ, 031์˜ ์„œ๋ฒ ์ด ์ด๋ก ์ด ์‹ค์ œ๋กœ ์–ด๋–ป๊ฒŒ ํ™œ์šฉ๋˜๋Š”์ง€ ๋ณด์—ฌ์ค€๋‹ค.
← ๋ชฉ๋ก์œผ๋กœ ๋Œ์•„๊ฐ€๊ธฐ

๐ŸŽง Audio Overview

์ด ๋…ผ๋ฌธ ๋ฆฌ๋ทฐ๋ฅผ ํŒŸ์บ์ŠคํŠธํ˜• ์˜ค๋””์˜ค๋กœ ์ƒ์„ฑํ•ฉ๋‹ˆ๋‹ค. (Gemini ยท ํ‚ค๋Š” ๋ธŒ๋ผ์šฐ์ €์—๋งŒ ์ €์žฅ ยท ์™„์„ฑ๋ณธ์€ ์ด๋ฉ”์ผ๋กœ๋„ ์ „์†ก)
โ–ธ ๊ณ ๊ธ‰: ๊ตฌ์„ฑ ๋ฐฉํ–ฅ(๋Œ€๋ณธ ์ž‘์„ฑ ์ง€์นจ) ์ง์ ‘ ์ˆ˜์ •