Efficient Evolutionary Search Over Chemical Space with Large Language Models

์ €์ž: Haorui Wang, Marta Skreta, C. Ser, Wenhao Gao, Lingkai Kong | ๋‚ ์งœ: 2024 | DOI: 10.48550/arXiv.2406.16976 📄 PDF


Essence

Figure 1

MOLLEO ํ”„๋ ˆ์ž„์›Œํฌ ๊ฐœ์š”: ์ดˆ๊ธฐ ๋ถ„์ž ํ’€์—์„œ ์ถœ๋ฐœํ•˜์—ฌ LLM์„ ๊ต์ฐจ(crossover) ๋ฐ ๋Œ์—ฐ๋ณ€์ด(mutation) ์—ฐ์‚ฐ์ž๋กœ ํ™œ์šฉํ•˜๋Š” ์ง„ํ™” ์•Œ๊ณ ๋ฆฌ์ฆ˜

๋Œ€๊ทœ๋ชจ ์–ธ์–ด๋ชจ๋ธ(LLM)์„ ์ง„ํ™” ์•Œ๊ณ ๋ฆฌ์ฆ˜(EA)์˜ ์œ ์ „ ์—ฐ์‚ฐ์ž๋กœ ํ†ตํ•ฉํ•˜์—ฌ ํ™”ํ•™ ๊ณต๊ฐ„ ํƒ์ƒ‰์˜ ํšจ์œจ์„ฑ์„ ํš๊ธฐ์ ์œผ๋กœ ํ–ฅ์ƒ์‹œํ‚ค๋Š” MOLLEO ํ”„๋ ˆ์ž„์›Œํฌ๋ฅผ ์ œ์•ˆํ•œ๋‹ค. ์ด๋Š” ๊ฒ€์€ ์ƒ์ž ๋ถ„์ž ์ตœ์ ํ™” ๋ฌธ์ œ์—์„œ ํ•„์š”ํ•œ ๋ชฉ์  ํ•จ์ˆ˜ ํ‰๊ฐ€ ํšŸ์ˆ˜๋ฅผ ๋Œ€ํญ ๊ฐ์†Œ์‹œํ‚จ๋‹ค.

Motivation

Achievement

Figure 1 (์ƒ์„ธ)

LLM ๊ธฐ๋ฐ˜ ๋Œ์—ฐ๋ณ€์ด/๊ต์ฐจ ์—ฐ์‚ฐ: ํ…์ŠคํŠธ ํ”„๋กฌํ”„ํŠธ๋ฅผ ํ†ตํ•ด ๋ชฉ์  ํ•จ์ˆ˜ ์ •๋ณด๋ฅผ ์ „๋‹ฌํ•˜๊ณ  ๊ฐœ์„ ๋œ ๋ถ„์ž ํ›„๋ณด ์ƒ์„ฑ

  1. ํšจ์œจ์„ฑ ๊ฐœ์„ : ๋ชจ๋“  ๋‹จ์ผ-๋ชฉ์  ๋ฐ ๋‹ค์ค‘-๋ชฉ์  ์ตœ์ ํ™” ๊ณผ์ œ์—์„œ ๊ธฐ์ค€ EA, ๊ฐ•ํ™”ํ•™์Šต(RL), ๋ฒ ์ด์ง€์•ˆ ์ตœ์ ํ™”(BO) ๋ฐฉ๋ฒ• ๋Œ€๋น„ ์šฐ์ˆ˜ํ•œ ์„ฑ๋Šฅ ๋‹ฌ์„ฑ. ๋™์ผํ•œ ํ‰๊ฐ€ ์˜ˆ์‚ฐ ๋‚ด์—์„œ ์ˆ˜๋ ด ์†๋„ ๊ฐ€์†ํ™”.
  2. ํ™”ํ•™์  ์œ ํšจ์„ฑ: ๋‹จ์ˆœ LLM ๊ธฐ๋ฐ˜ ๋ถ„์ž ์ƒ์„ฑ๊ณผ ๋‹ฌ๋ฆฌ, EA ํ”„๋ ˆ์ž„์›Œํฌ์™€์˜ ํ†ตํ•ฉ์œผ๋กœ ์œ ํšจํ•œ SMILES ์ƒ์„ฑ๋ฅ  ์ฆ๊ฐ€ ๋ฐ ๋ฌผ๋ฆฌ์  ์ ‘์ง€(physical grounding) ํ–ฅ์ƒ.
  3. ์‹ค๋ฌด ์ ์šฉ์„ฑ: JNK3 ์–ต์ œ์ œ ์ตœ์ ํ™” ์‚ฌ๋ก€์—์„œ ZINC 250K ๋ฐ์ดํ„ฐ๋ฒ ์ด์Šค์˜ ๊ธฐ์กด ์ตœ๊ณ  ๋ถ„์ž๋ณด๋‹ค ๊ฐœ์„ ๋œ ํ›„๋ณด ์ œ์‹œ, ์‹ ์•ฝ ๋ฐœ๊ฒฌ ์‹œ๋‚˜๋ฆฌ์˜ค์˜ ์‹คํ˜„ ๊ฐ€๋Šฅ์„ฑ ์ž…์ฆ.

How

Figure 1 (ํ”„๋กœ์„ธ์Šค)

๋ฐ˜๋ณต์  ์ง„ํ™”: ๋ถ„์ž ํ’€ ์„ ํƒ โ†’ LLM ๊ธฐ๋ฐ˜ ์œ ์ „ ์—ฐ์‚ฐ โ†’ ์˜ค๋ผํด ํ‰๊ฐ€ โ†’ ํ’€ ์—…๋ฐ์ดํŠธ โ†’ ์ข…๋ฃŒ ์กฐ๊ฑด๊นŒ์ง€ ๋ฐ˜๋ณต

Originality

Limitation & Further Study

Evaluation

Novelty: 4.5/5 Technical Soundness: 4.5/5 Significance: 4.5/5 Clarity: 4/5 Overall: 4.4/5

์ดํ‰: MOLLEO๋Š” LLM๊ณผ EA์˜ ์‹œ๋„ˆ์ง€๋ฅผ ์ฒด๊ณ„์ ์œผ๋กœ ์ž…์ฆํ•œ ํ˜์‹ ์  ์—ฐ๊ตฌ๋กœ, ๋ถ„์ž ์ตœ์ ํ™” ๋ถ„์•ผ์˜ ์ƒ˜ํ”Œ ํšจ์œจ์„ฑ ๋ฌธ์ œ๋ฅผ ์‹ค์งˆ์ ์œผ๋กœ ํ•ด๊ฒฐํ•˜๋ฉฐ ICLR 2025 ๊ฒŒ์žฌ ๊ธฐ์ค€์˜ ๋†’์€ ์ˆ˜์ค€์„ ์ถฉ์กฑํ•œ๋‹ค. ๋‹ค๋งŒ ์‹ค์ œ ์‚ฐ์—… ์ ์šฉ์„ ์œ„ํ•œ ๊ฒฝ์ œ์„ฑ ๋ถ„์„๊ณผ ํ”„๋กฌํ”„ํŠธ ์ตœ์ ํ™” ์ „๋žต์˜ ์‹ฌํ™”๊ฐ€ ํ›„์† ๊ณผ์ œ๋กœ ๋‚จ์•„์žˆ๋‹ค.

๊ฐ™์ด ๋ณด๋ฉด ์ข‹์€ ๋…ผ๋ฌธ

๊ธฐ๋ฐ˜ ์—ฐ๊ตฌ
469๋ฒˆ ๋…ผ๋ฌธ์€ ๋Œ€๊ทœ๋ชจ ์–ธ์–ด๋ชจ๋ธ ๊ธฐ๋ฐ˜ ์ง„ํ™” ์ตœ์ ํ™”์˜ ์ด๋ก ์  ๋ฐฐ๊ฒฝ์„ ์ œ๊ณตํ•˜๋ฉฐ, 305์˜ MOLLEO ํ”„๋ ˆ์ž„์›Œํฌ์™€ ๊ธด๋ฐ€ํ•˜๊ฒŒ ์—ฐ๊ด€๋œ๋‹ค.
๊ธฐ๋ฐ˜ ์—ฐ๊ตฌ
305๋Š” ๋„๋ฉ”์ธ ํŠนํ™” ์–ธ์–ด ๋ชจ๋ธ์˜ ์‚ฌ์ „ํ•™์Šต์ด๋‚˜ ํŒŒ์ธํŠœ๋‹์„ ์œ„ํ•œ ๋ฐฉ๋ฒ•๋ก ์  ๊ธฐ๋ฐ˜์„ ์ œ๊ณตํ•˜์—ฌ ChemDFM ๊ฐœ๋ฐœ์— ํ™œ์šฉ๋œ๋‹ค.
๊ธฐ๋ฐ˜ ์—ฐ๊ตฌ
Efficient Evolutionary Search Over Chemical Space ๋…ผ๋ฌธ์€ ๋ณต์žกํ•œ ๊ธˆ์†-์œ ๊ธฐ๊ณจ๊ฒฉ ์„ค๊ณ„ ๋ฐ ์ตœ์ ํ™”์— ๊ด€ํ•œ ์ง„ํ™”์  ํƒ์ƒ‰ ๊ธฐ๋ฒ•์„ ํ†ตํ•ด, ChatMOF์˜ ๊ตฌ์กฐ ์ƒ์„ฑ ์ „๋žต์„ ์ง€์›ํ•œ๋‹ค.
๊ธฐ๋ฐ˜ ์—ฐ๊ตฌ
305 Efficient Evolutionary Search ๋…ผ๋ฌธ์€ LLM๊ณผ ํƒ์ƒ‰ ๊ธฐ๋ฐ˜ ์•ฝ๋ฌผ/๋ถ„์ž ์ตœ์ ํ™” ๋ฐฉ์‹์„ ์ œ์‹œํ•˜์—ฌ 461 ๋…ผ๋ฌธ์˜ ์—์ด์ „ํŠธ ํƒ์ƒ‰ ์ปจ์…‰์— ์ด๋ก ์  ๊ธฐ๋ฐ˜์„ ์ œ๊ณตํ•ฉ๋‹ˆ๋‹ค.
๊ธฐ๋ฐ˜ ์—ฐ๊ตฌ
305 ๋…ผ๋ฌธ์€ ๋Œ€ํ˜•์–ธ์–ด๋ชจ๋ธ์„ ์ด์šฉํ•œ ํ™”ํ•™๊ณต๊ฐ„ ํƒ์ƒ‰ ๋ฐ ๋ถ„์ž ์ƒ์„ฑ์—์„œ ์ˆ˜์—ด ํ† ํฌ๋‚˜์ด์ œ์ด์…˜์˜ ํšจ๊ณผ์  ์„ค๊ณ„ ํ•„์š”์„ฑ์„ ๊ฐ•์กฐํ•ฉ๋‹ˆ๋‹ค.
๊ธฐ๋ฐ˜ ์—ฐ๊ตฌ
305๋ฒˆ ๋…ผ๋ฌธ์€ LLM ๊ธฐ๋ฐ˜ ํ™”ํ•™ ๊ณต๊ฐ„ ํƒ์ƒ‰ ๋ฐ de novo ๋ถ„์ž ์„ค๊ณ„ ๋ฐฉ๋ฒ•์˜ ์ด๋ก ์ ยท๊ธฐ์ˆ ์  ๊ธฐ๋ฐ˜์„ ์ œ๊ณตํ•ฉ๋‹ˆ๋‹ค.
๊ธฐ๋ฐ˜ ์—ฐ๊ตฌ
ํ™”ํ•™ ํƒ์ƒ‰ ๋ถ„์•ผ์—์„œ LLM์„ ํ™œ์šฉํ•˜์—ฌ ์‹คํ—˜์  ๋ฐ์ดํ„ฐ ์ž๋™ํ™”ยท์ถ”์ถœ ๊ธฐ๋ฒ•์˜ ๊ธฐ๋ฐ˜์„ ๊ตฌ์ถ•ํ•œ ์‚ฌ๋ก€๋กœ nanoMINER ์‹œ์Šคํ…œ์˜ ์—ฐ๊ตฌ ๋งฅ๋ฝ์„ ์ œ์‹œํ•œ๋‹ค.
๊ธฐ๋ฐ˜ ์—ฐ๊ตฌ
Efficient Evolutionary Search Over Chemical Space ๋…ผ๋ฌธ์€ ํ•ฉ์„ฑ ๊ฒฝ๋กœ/ํ™”ํ•™ ๊ณต๊ฐ„ ํƒ์ƒ‰์—์„œ ํšจ์œจ์  ์ˆœ์„œยทํ† ํฌ๋‚˜์ด์ œ์ด์…˜ ์ด์Šˆ๋ฅผ ์ œ๊ธฐํ•ด RetroDiT ๋…ผ๋ฌธ์˜ ์›์ž ์ˆœ์„œ ๊ธฐ๋ฐ˜ ์ ‘๊ทผ์˜ ๋ฐฐ๊ฒฝ์„ค๋ช…์— ์ ํ•ฉํ•˜๋‹ค.
๊ธฐ๋ฐ˜ ์—ฐ๊ตฌ
305 ๋…ผ๋ฌธ์€ ๋Œ€๊ทœ๋ชจ ํ™”ํ•™๊ณต๊ฐ„ ํƒ์ƒ‰์˜ ํšจ์œจํ™”๋ฅผ ์œ„ํ•œ ์ง„ํ™”์  ์ ‘๊ทผ์˜ ์ด๋ก ์  ๊ธฐ๋ฐ˜์„ ์ œ๊ณตํ•ฉ๋‹ˆ๋‹ค.
๊ธฐ๋ฐ˜ ์—ฐ๊ตฌ
์œ ์ „์ž-๋‹จ๋ฐฑ์งˆ ๊ตฌ์กฐ ๋ฐ ์ƒํ˜ธ์ž‘์šฉ ์˜ˆ์ธก์—์„œ ์–ธ์–ด ๋ชจ๋ธ๊ณผ ๋จธ์‹ ๋Ÿฌ๋‹ ๊ธฐ๋ฐ˜์˜ ์ง„ํ™”์  ํƒ์ƒ‰ ๊ธฐ๋ฒ•์ด ํšจ์†Œ ํ™œ์„ฑ ์˜ˆ์ธก์— ๊ธฐ๋ฐ˜์„ ์ œ๊ณตํ•œ๋‹ค.
๊ธฐ๋ฐ˜ ์—ฐ๊ตฌ
๋ฐ˜์‘ํ™”ํ•™ ์‹œ์Šคํ…œ์—์„œ MLIP ๋Šฅ๋™ํ•™์Šต์˜ ๊ธฐ๋ฐ˜์ด ๋˜๋Š” ๋ฐฉ๋ฒ•๋ก ์  ํ† ๋Œ€๋ฅผ ์ œ๊ณตํ•˜๋Š” ์—ฐ๊ตฌ์ด๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
๋‘˜ ๋‹ค ํ™”ํ•™ยท์žฌ๋ฃŒ ์ตœ์ ํ™” ๊ณผ์ œ๋ฅผ ์ž๋™ํ™”ํ•˜์ง€๋งŒ, 305๋Š” LLM ๊ธฐ๋ฐ˜ ํšจ์œจ์  ํ™”ํ•™ ํƒ์ƒ‰ ์•Œ๊ณ ๋ฆฌ์ฆ˜์„, 788์€ Bayesian ์•Œ๊ณ ๋ฆฌ์ฆ˜ ์‹คํ–‰ ํ”„๋ ˆ์ž„์›Œํฌ๋ฅผ ์‚ฌ์šฉํ•ด ๋น„๊ต์  ๋‹ค๋ฅธ ์ตœ์ ํ™” ๋ฐฉ๋ฒ•์„ ์ œ์‹œํ•ฉ๋‹ˆ๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
305 ๋…ผ๋ฌธ์€ 212์™€ ๊ฐ™์ด ํ™”ํ•™ ํ•ฉ์„ฑ ์ž๋™ํ™” ๋ฌธ์ œ๋ฅผ LLM ๊ธฐ๋ฐ˜์œผ๋กœ ์ ‘๊ทผํ•˜์ง€๋งŒ, ์ง„ํ™”์  ํƒ์ƒ‰์„ ํ†ตํ•ฉํ•œ ์ƒˆ๋กœ์šด ํ”„๋ ˆ์ž„์›Œํฌ๋ฅผ ํƒ๊ตฌํ•ฉ๋‹ˆ๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
305๋ฒˆ ๋…ผ๋ฌธ๋„ LLM ๊ธฐ๋ฐ˜์˜ ์ง„ํ™”์ ์ธ ํ™”ํ•™ ํƒ์ƒ‰์„ ๋‹ค๋ฃจ์–ด, ์œ ์‚ฌ ์ฃผ์ œ๋ฅผ ๋‹ค๋ฅธ ํ”„๋ ˆ์ž„์›Œํฌ๋กœ ์ ‘๊ทผํ•ฉ๋‹ˆ๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
291๋ฒˆ ๋…ผ๋ฌธ์€ ์•ฝ๋ฌผ ํƒ์ƒ‰์— LLM ๊ธฐ๋ฐ˜ ๋Œ€๋ฆฌ๋ชจ๋ธ ์ตœ์ ํ™” ์ ‘๊ทผ๋ฒ•์„ ์จ์„œ, 305์™€์˜ ํšจ์œจ์„ฑ ๋ฐ ๋ฐฉ์‹ ๋น„๊ต์— ์œ ์ตํ•˜๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
557๋ฒˆ ๋…ผ๋ฌธ๋„ LLM์œผ๋กœ ์•Œ๋ ค์ง€์ง€ ์•Š์€ ํ™”ํ•™ ๊ทœ์น™ ๋ฐ ๋ถ„์ž ์ตœ์ ํ™”๋ฅผ ๋‹ค๋ค„, 305์™€ ๋‹ค์–‘ํ•œ LLM-๊ธฐ๋ฐ˜ ํ™”ํ•™ ๊ณต๊ฐ„ ํƒ์ƒ‰๋ฒ• ๋น„๊ต๊ฐ€ ๊ฐ€๋Šฅํ•˜๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
A Multi-agent Framework for Physical Laws Discovery๋Š” ๊ณผํ•™์  ๋ฐœ๊ฒฌ์„ ์œ„ํ•œ ๋ฉ€ํ‹ฐ ์—์ด์ „ํŠธ ์ ‘๊ทผ์„ ํ†ตํ•ด, LLM ๊ธฐ๋ฐ˜ ํ™”ํ•™ ์ตœ์ ํ™”(MOLLEO)์™€ ๋‹ค๋ฅธ ํ•ด๊ฒฐ์ฑ…์„ ์ œ์‹œํ•ฉ๋‹ˆ๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
LLM ๊ธฐ๋ฐ˜ ํ™”ํ•™ ์‹คํ—˜ ์ž๋™ํ™” ์ ์šฉ ์˜ˆ์‹œ๋กœ, ์‹คํ—˜ ํ”„๋กœํ† ์ฝœ ์ถ”์ถœ์„ ํ™”ํ•™ ํƒ์ƒ‰์— ์ ์šฉํ•˜๋Š” ๋Œ€์•ˆ์„ ๋ณด์—ฌ์ค€๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
305๋ฒˆ ๋…ผ๋ฌธ ์—ญ์‹œ LLM์„ ํ™œ์šฉํ•œ ๋ถ„์ž ๋ฐ ๊ณ ๋ถ„์ž ์ตœ์ ํ™” ๋ฌธ์ œ์— ๋Œ€ํ•œ ๋Œ€์•ˆ์  ์†”๋ฃจ์…˜์„ ๋ณด์—ฌ์ค๋‹ˆ๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
LLM์„ ๋ถ„์ž ์ตœ์ ํ™” ๋˜๋Š” ํ™”ํ•™ ๊ณต๊ฐ„ ํƒ์ƒ‰์— ํ™œ์šฉํ•˜๋Š” ์œ ์‚ฌํ•œ ์ ‘๊ทผ๋ฒ•์„ ์ œ์‹œํ•˜๋Š” ์—ฐ๊ตฌ์ด๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
305์™€ 096 ๋ชจ๋‘ ํ™”ํ•™/๋ถ„์ž ์„ค๊ณ„์— LLM์„ ํ†ตํ•ฉํ•ด ์ตœ์ ํ™” ํšจ์œจ์„ ๋†’์ด๊ณ ์ž ํ•˜์ง€๋งŒ, 305๋Š” EA ์œตํ•ฉ, 096์€ LLM ๊ธฐ๋ฐ˜ end-to-end ์ž๋™ํ™”์— ์ค‘์ ์„ ๋‘”๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
์ง„ํ™” ์•Œ๊ณ ๋ฆฌ์ฆ˜ ๊ธฐ๋ฐ˜ ๋ถ„์ž ์ตœ์ ํ™”๋ฅผ ์œ„ํ•œ ๋Œ€์•ˆ์  ๋ฐฉ๋ฒ•๋ก ์„ ์ œ์•ˆํ•˜๋Š” ๊ด€๋ จ ์—ฐ๊ตฌ์ด๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
ํ™”ํ•™ ๊ณต๊ฐ„ ํƒ์ƒ‰ ๋ฐ ๋ถ„์ž ์ƒ์„ฑ์„ ์œ„ํ•œ ์œ ์‚ฌํ•œ ์ตœ์ ํ™” ํ”„๋ ˆ์ž„์›Œํฌ๋ฅผ ๋‹ค๋ฃจ๋Š” ์—ฐ๊ตฌ์ด๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
Efficient Evolutionary Search Over Chemical Space ๋…ผ๋ฌธ์€ ํ™”ํ•™ ๋ฐ˜์‘ ํƒ์ƒ‰/์˜ˆ์ธก์˜ ์ค‘์‹ฌ ๋ฌธ์ œ๋ฅผ ์ง„ํ™”์  ํƒ์ƒ‰ ๊ธฐ๋ฐ˜ ML ๋ฐฉ์‹์œผ๋กœ ํ•ด๊ฒฐํ•˜๋Š” ์ƒ‰๋‹ค๋ฅธ ๊ด€์ ์„ ์ œ์‹œํ•œ๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
305๋ฒˆ์€ ๋ฌผ์งˆ ํƒ์ƒ‰์—์„œ LLM๊ธฐ๋ฐ˜ ๋ฒค์น˜๋งˆํฌ ๋ฐ ํ™”ํ•™ ๊ณต๊ฐ„ ํƒ๊ตฌ ๋ฌธ์ œ๋ฅผ ๋‹ค๋ฃจ๋ฉฐ, 696๋ฒˆ๊ณผ ์œ ์‚ฌํ•˜๊ฒŒ ๋„๋ฉ”์ธ ๋ฐ์ดํ„ฐ-LLM ์œตํ•ฉ์„ ํƒ์ƒ‰ํ•œ๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
๋ถ„์ž ๋ถ€๋ถ„๊ตฐ ๋ณ€ํ™˜ ๋ฐ ์•ฝ๋ฌผ ์ตœ์ ํ™”๋ฅผ ์œ„ํ•œ ์œ ์‚ฌํ•œ ์ ‘๊ทผ๋ฒ•์„ ์ œ์‹œํ•˜๋Š” ์—ฐ๊ตฌ์ด๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
ํ™”ํ•™ ๊ณต๊ฐ„์˜ ํšจ์œจ์  ํƒ์ƒ‰์„ ์œ„ํ•œ ๋‹ค์–‘ํ•œ ์ƒ์„ฑ์  AIยท๊ฒ€์ƒ‰ ์ ‘๊ทผ ๋น„๊ต๊ฐ€ ๊ฐ€๋Šฅํ•ฉ๋‹ˆ๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
๋Œ€๊ทœ๋ชจ ์–ธ์–ด๋ชจ๋ธ์„ ํ™œ์šฉํ•œ ํ™”ํ•™ ๊ณต๊ฐ„ ํƒ์ƒ‰์˜ ๋Œ€์•ˆ์  ์ ‘๊ทผ๋ฒ•์„ ์ œ์‹œํ•˜๋Š” ์—ฐ๊ตฌ์ด๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
Efficient Evolutionary Search Over Chemical Space with Large Language Models ๋…ผ๋ฌธ์€ ํ™”ํ•™ ํ˜ผํ•ฉ๋ฌผ ๋ฌผ์„ฑ ์˜ˆ์ธก์—์„œ LLM ๊ธฐ๋ฐ˜ ํƒ์ƒ‰์  ์ ‘๊ทผ์œผ๋กœ, ChemFlow์˜ ๊ณ„์ธต์  GNN๋ฐฉ์‹๊ณผ ์ƒํ˜ธ ๋ณด๊ฐ• ๋น„๊ต๊ฐ€ ๊ฐ€๋Šฅํ•ฉ๋‹ˆ๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
ํšจ์œจ์ ์ธ ํ™”ํ•™ ๊ณต๊ฐ„ ํƒ์ƒ‰์„ ์œ„ํ•œ ๊ฐ•ํ™”ํ•™์Šต ๊ธฐ๋ฐ˜ ์ ‘๊ทผ์œผ๋กœ, ๋ฏธํ•™์Šต ํ™”ํ•™ ๊ตฌ์กฐ ์˜ˆ์ธก ๋ฌธ์ œ์— ๋Œ€ํ•œ ์ƒ์ดํ•œ ๋ฐฉ๋ฒ•๋ก ์„ ์ œ์‹œํ•ฉ๋‹ˆ๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
305 ๋…ผ๋ฌธ์€ LLM ๊ธฐ๋ฐ˜ ํ™”ํ•™ ๊ณต๊ฐ„ ํƒ์ƒ‰ ํšจ์œจํ™”์— ์ดˆ์ ์„ ๋งž์ถ”์–ด, 3034์˜ ๋ฒ ์ด์ง€์•ˆ ์ตœ์ ํ™” ๊ธฐ๋ฐ˜ ๋ถ„์ž ํƒ์ƒ‰๊ณผ ๋‹ค๋ฅธ ๊ธฐํš ๋ชจ๋ธ์„ ๋ณด์—ฌ์ค€๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
๋Œ€๊ทœ๋ชจ ํ™”ํ•™ ์œ ์ „์  ๋ณ€ํ™” ์˜ˆ์ธก์—์„œ ํšจ์œจ์  ํƒ์ƒ‰ ๋ฐ ํ‰๊ฐ€๋ฅผ ์œ„ํ•œ LLM ๊ธฐ๋ฐ˜ ์ ‘๊ทผ๋ฒ•์„ ์ œ์‹œํ•˜์—ฌ QTL ๋งคํ•‘์˜ ํ•œ๊ณ„๋ฅผ ๋‹ค๋ฅธ ๊ด€์ ์—์„œ ํ•ด๊ฒฐํ•ฉ๋‹ˆ๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
์•ฝ๋ฌผ ๋ฐœ๊ฒฌ์„ ์œ„ํ•œ ๋ถ„์ž ์ตœ์ ํ™” ๋ฒค์น˜๋งˆํ‚น ๋ฐ ๋น„๊ต ์—ฐ๊ตฌ๋กœ MOLLEO์™€ ์œ ์‚ฌํ•œ ๋งฅ๋ฝ์„ ๊ณต์œ ํ•œ๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
LLM ๊ธฐ๋ฐ˜ ๋Œ€๊ทœ๋ชจ ํ™”ํ•™๊ณต๊ฐ„ ํƒ์ƒ‰๊ณผ ์ง„ํ™”์  ๋ถ„์ž ์ƒ์„ฑ์˜ ๋Œ€์•ˆ์  ๋ฐฉ๋ฒ•์ž…๋‹ˆ๋‹ค.
ํ›„์† ์—ฐ๊ตฌ
555(MolGAN)์˜ ๋ถ„์ž ๊ทธ๋ž˜ํ”„ ์ƒ์„ฑ ๋ชจ๋ธ์„ 305์—์„œ ํšจ์œจ์  ์ง„ํ™”์  ํƒ์ƒ‰ ๋ฐ ์ตœ์ ํ™”์— ์ ์šฉํ•œ ์‹ค์ œ ์‚ฌ๋ก€๋ฅผ ํ™•์ธํ•  ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค.
ํ›„์† ์—ฐ๊ตฌ
305์˜ LLM-์ง„ํ™” ์ตœ์ ํ™”๋Š” 466์—์„œ LLM์„ ์ด์šฉํ•œ ๋‹ค์–‘ํ•œ ์ตœ์ ํ™” ์ „๋žต๊ณผ ๋…ผ์˜๊ฐ€ ํ™•์žฅ๋˜์–ด ์†Œ๊ฐœ๋œ๋‹ค.
ํ›„์† ์—ฐ๊ตฌ
LLM์„ ํ™œ์šฉํ•œ ํ™”ํ•™ ํ˜„์žฅ(์ž๋™ ํ•ฉ์„ฑ, ์‹คํ—˜ ์ž๋™ํ™”)์—์„œ ์‹ค์งˆ์ ์ธ ๋ถ„์ž/ํ™”ํ•ฉ๋ฌผ ๋ฐœ๊ฒฌ ๊ณผ์ •์„ ์ง„์ผ๋ณด์‹œํ‚ต๋‹ˆ๋‹ค.
ํ›„์† ์—ฐ๊ตฌ
305๋Š” ๋Œ€๊ทœ๋ชจ ์–ธ์–ด๋ชจ๋ธ์„ ํ™œ์šฉํ•œ ํ™”ํ•™ ํƒ์ƒ‰๊ณผ ์ง„ํ™”์  ์ ‘๊ทผ์„ ๋‹ค๋ฃจ์–ด, 856์˜ ํ† ํฐํ™”์™€ ๊ณ„์ธต ์ •๋ณด ํ™œ์šฉ์„ ์‹ค์ œ ์„ค๊ณ„์— ๋ฐ˜์˜ํ•œ๋‹ค.
ํ›„์† ์—ฐ๊ตฌ
ํ™”ํ•™ ๊ณต๊ฐ„์—์„œ ๋Œ€ํ˜•์–ธ์–ด๋ชจ๋ธ์„ ํ™œ์šฉํ•œ ํƒ์ƒ‰ ๋ฐฉ์‹์ด, M2UMol์˜ ์‹ค์ œ ๋ถ„์ž ์†์„ฑ ์˜ˆ์ธก ์ ์šฉ์— ์ง์ ‘ ์—ฐ๊ฒฐ๋œ๋‹ค.
ํ›„์† ์—ฐ๊ตฌ
Evolutionary exploration of drug-like chemical space utilizing LLM๊ณผ EA ์กฐํ•ฉ์ด ๋‹จ๋ฐฑ์งˆ/์•ฝ๋ฌผ ์˜์—ญ์—์„œ ๋‹ค์–‘ํ•œ ํ™œ์šฉ ๊ฐ€๋Šฅ์„ฑ์„ ์‹ค์ฆํ•ฉ๋‹ˆ๋‹ค.
ํ›„์† ์—ฐ๊ตฌ
Efficient Evolutionary Search Over Chemical Space with Large Language Models๋Š” ๊ณ ์ฒ˜๋ฆฌ๋Ÿ‰ ๋ถ„์žยท์†Œ์žฌ ์Šคํฌ๋ฆฌ๋‹ ์›Œํฌํ”Œ๋กœ์šฐ์™€ ์—ฐ๊ฒฐ, 3129์˜ workflow๋ฅผ ํ™•์žฅํ•˜๊ณ  ์ž๋™ํ™”ํ•œ๋‹ค.
ํ›„์† ์—ฐ๊ตฌ
LMM ๊ธฐ๋ฐ˜ ํ™”ํ•™์  ๊ตฌ์กฐ ํƒ์ƒ‰ ๊ณต๊ฐ„์—์„œ ํšจ์œจ์  ํƒ์ƒ‰ ์ „๋žต์„ ์ œ์‹œํ•˜์—ฌ, activity cliffs ๊ฒฐ์ •์  ๋ณ€์ด์˜ ํƒ์ƒ‰ ํšจ์œจ ํ–ฅ์ƒ ๊ฒฐ๊ณผ์™€ ์—ฐ๊ณ„๋œ๋‹ค.
์‘์šฉ ์‚ฌ๋ก€
305์˜ LLM-guided optimization ๊ฐœ๋…์€ 306์˜ ๋‹จ์ผ์„ธํฌ ์˜ˆ์ธก ์ž‘์—… ๋“ฑ ์ƒ๋ช…๊ณผํ•™ ์‹ค์ œ ์‘์šฉ์— ์ ์šฉ ๊ฐ€๋Šฅํ•˜๋‹ค.
์‘์šฉ ์‚ฌ๋ก€
Efficient Evolutionary Search Over Chemical Space ๋…ผ๋ฌธ์€ ๊ตฌ์กฐ์  ํ™˜๊ฐ์ด ์‹ค์ œ ๋ถ„์ž ํŠน์„ฑ ์˜ˆ์ธก ๋ฐ ์‹ ์•ฝ ํƒ์ƒ‰ ๋‹ค์–‘ํ•œ ๋ฌธ์ œ์—์„œ ์–ด๋–ค ํšจ๊ณผ๋ฅผ ๋‚ด๋Š”์ง€ ์‚ฌ๋ก€ ์ค‘์‹ฌ์œผ๋กœ ํ™œ์šฉํ•œ๋‹ค.
์‘์šฉ ์‚ฌ๋ก€
FlashPPI์˜ ์„ ํ˜• ์‹œ๊ฐ„ ๋ณต์žก๋„ ํ”„๋ ˆ์ž„์›Œํฌ๋ฅผ ์‹ค์ œ ํ™”ํ•™/์ƒ๋ฌผ ์ •๋ณด ์˜ˆ์ธก์— ์ ์šฉํ•œ ์—ฐ๊ตฌ๋กœ ์‹œ๋„ˆ์ง€๊ฐ€ ์žˆ์Šต๋‹ˆ๋‹ค.
๋ฐ˜๋ก /๋น„ํŒ
๋Œ€ํ˜• ๋ชจ๋ธ์˜ ๋ถ„์ž ์ตœ์ ํ™” ์šฐ์›”์„ฑ์„ ์ฃผ์žฅํ•˜๋Š” ์—ฐ๊ตฌ์— ๋ฐ˜ํ•ด ๋ชจ๋ธ ๊ทœ๋ชจ๋ณด๋‹ค ๋‹ค๋ฅธ ์š”์ธ์ด ์ค‘์š”ํ•จ์„ ์‹ค์ฆํ•˜๋Š” ์—ฐ๊ตฌ์ด๋‹ค.
← ๋ชฉ๋ก์œผ๋กœ ๋Œ์•„๊ฐ€๊ธฐ

๐ŸŽง Audio Overview

์ด ๋…ผ๋ฌธ ๋ฆฌ๋ทฐ๋ฅผ ํŒŸ์บ์ŠคํŠธํ˜• ์˜ค๋””์˜ค๋กœ ์ƒ์„ฑํ•ฉ๋‹ˆ๋‹ค. (Gemini ยท ํ‚ค๋Š” ๋ธŒ๋ผ์šฐ์ €์—๋งŒ ์ €์žฅ ยท ์™„์„ฑ๋ณธ์€ ์ด๋ฉ”์ผ๋กœ๋„ ์ „์†ก)
โ–ธ ๊ณ ๊ธ‰: ๊ตฌ์„ฑ ๋ฐฉํ–ฅ(๋Œ€๋ณธ ์ž‘์„ฑ ์ง€์นจ) ์ง์ ‘ ์ˆ˜์ •