From intention to implementation: automating biomedical research via LLMs

์ €์ž: Yi Luo, Linghang Shi, Yihao Li, Aobo Zhuang, Yeyun Gong, Ling Liu, Chen Lin | ๋‚ ์งœ: 2024 | DOI: 10.1007/s11432-024-4485-0 📄 PDF


Essence

๋ณธ ๋…ผ๋ฌธ์€ ๋Œ€๊ทœ๋ชจ ์–ธ์–ด๋ชจ๋ธ(LLM)์„ ํ™œ์šฉํ•˜์—ฌ ๋ฐ”์ด์˜ค๋ฉ”๋””์ปฌ ์—ฐ๊ตฌ์˜ ์ „์ฒด ํŒŒ์ดํ”„๋ผ์ธ์„ ์ž๋™ํ™”ํ•˜๋Š” ์ฒซ ๋ฒˆ์งธ end-to-end ์‹œ์Šคํ…œ์ธ BioResearcher๋ฅผ ์ œ์‹œํ•œ๋‹ค. ๋ชจ๋“ˆํ˜• ๋ฉ€ํ‹ฐ-์—์ด์ „ํŠธ ์•„ํ‚คํ…์ฒ˜๋ฅผ ํ†ตํ•ด ๋ฌธํ—Œ ๊ฒ€์ƒ‰, ๋ฐ์ดํ„ฐ ์ฒ˜๋ฆฌ, ์‹คํ—˜ ์„ค๊ณ„, ํ”„๋กœ๊ทธ๋ž˜๋ฐ์„ ํ†ตํ•ฉํ•˜์—ฌ ์ž๋™ํ™”๋œ ๋“œ๋ผ์ด๋žฉ(dry lab) ๋ฐ”์ด์˜ค๋ฉ”๋””์ปฌ ์—ฐ๊ตฌ๋ฅผ ๊ตฌํ˜„ํ•œ๋‹ค.

Motivation

Achievement

Figure 1

๋™์ผํ•œ ์ž…๋ ฅ์— ๋Œ€ํ•ด GPT-4o (a)์™€ BioResearcher (b)๊ฐ€ ์ƒ์„ฑํ•œ ์‹คํ—˜ ํ”„๋กœํ† ์ฝœ ๋น„๊ต. BioResearcher๋Š” ๊ตฌ์ฒด์  ๋ฐ์ดํ„ฐ์…‹ ID, ๋ฐฉ๋ฒ•๋ก , ํ‘œ์ค€์„ ์ œ์‹œ.

  1. ๋†’์€ ์‹คํ–‰ ์„ฑ๊ณต๋ฅ : ์‹œ๋‹ˆ์–ด ์—ฐ๊ตฌ์ž๊ฐ€ ์ž‘์„ฑํ•œ 8๊ฐœ ๋ฏธ์ถฉ์กฑ ์—ฐ๊ตฌ ๋ชฉํ‘œ์— ๋Œ€ํ•ด ํ‰๊ท  63.07%์˜ ์‹คํ–‰ ์„ฑ๊ณต๋ฅ  ๋‹ฌ์„ฑ
  2. ์šฐ์ˆ˜ํ•œ ํ”„๋กœํ† ์ฝœ ํ’ˆ์งˆ: 5๊ฐœ ํ’ˆ์งˆ ์ง€ํ‘œ(์™„์ „์„ฑ, ์„ธ๋ถ€ ์ˆ˜์ค€, ์ •ํ™•์„ฑ, ๋…ผ๋ฆฌ์  ๊ฑด์ „์„ฑ, ๊ตฌ์กฐ์  ๊ฑด์ „์„ฑ)์—์„œ ๊ธฐ์กด ์—์ด์ „ํŠธ ์‹œ์Šคํ…œ ๋Œ€๋น„ ํ‰๊ท  22.0% ์šฐ์›” ์„ฑ๋Šฅ
  3. End-to-end ์ž๋™ํ™”: ์—ฐ๊ตฌ ๋ชฉํ‘œ ์ž…๋ ฅ โ†’ ๋ฌธํ—Œ ์กฐ์‚ฌ โ†’ ์‹คํ—˜ ํ”„๋กœํ† ์ฝœ ์„ค๊ณ„ โ†’ ํ”„๋กœ๊ทธ๋ž˜๋ฐ โ†’ ๊ฒฐ๋ก  ๋„์ถœ๊นŒ์ง€ ์ „์ฒด ํŒŒ์ดํ”„๋ผ์ธ ์ž๋™ํ™”

How

Originality

Limitation & Further Study

Evaluation

Novelty: 5/5 Technical Soundness: 4/5 Significance: 4/5 Clarity: 4/5 Overall: 4/5

์ดํ‰: BioResearcher๋Š” ๋ฐ”์ด์˜ค๋ฉ”๋””์ปฌ ์—ฐ๊ตฌ ์ž๋™ํ™”์— ์ƒˆ๋กœ์šด ํŒจ๋Ÿฌ๋‹ค์ž„์„ ์ œ์‹œํ•˜๋Š” ํ˜์‹ ์  ์‹œ์Šคํ…œ์œผ๋กœ, ๋ฉ€ํ‹ฐ-์—์ด์ „ํŠธ ์•„ํ‚คํ…์ฒ˜์™€ ์ƒˆ๋กœ์šด ํ‰๊ฐ€ ์ง€ํ‘œ๊ฐ€ ํŠนํžˆ ์ฃผ๋ชฉํ•  ๋งŒํ•˜๋‹ค. ๋‹ค๋งŒ ํ‰๊ฐ€ ๊ทœ๋ชจ ํ™•๋Œ€, ์Šต๋žฉ ํ™•์žฅ, ๊ทธ๋ฆฌ๊ณ  ์‹ค๋ฌด ์ ์šฉ์„ฑ์— ๋Œ€ํ•œ ์ถ”๊ฐ€ ๊ฒ€์ฆ์ด ํ•„์š”ํ•˜๋‹ค.

๊ฐ™์ด ๋ณด๋ฉด ์ข‹์€ ๋…ผ๋ฌธ

๊ธฐ๋ฐ˜ ์—ฐ๊ตฌ
โ€˜What ChatGPT and generative AI mean for scienceโ€™ ๋…ผ๋ฌธ์€ LLM ๊ธฐ๋ฐ˜ ์—ฐ๊ตฌ ์ž๋™ํ™”์˜ ๋Œ€์ „ํ™˜์  ์˜๋ฏธ๋ฅผ ๋…ผ์˜ํ•˜์—ฌ BioResearcher ์‹œ์Šคํ…œ์˜ ์‚ฌํšŒ์  ํ•จ์˜๋ฅผ ์ดํ•ดํ•˜๋Š” ๋ฐ ๊ธฐ๋ฐ˜์ด ๋œ๋‹ค.
๊ธฐ๋ฐ˜ ์—ฐ๊ตฌ
์ƒ์˜ํ•™ ๋ถ„์•ผ์—์„œ LLM ๊ธฐ๋ฐ˜ ์—์ด์ „ํŠธ ๋„์ž… ํ˜„ํ™ฉ๊ณผ ์ž๋™ํ™” ๋ฒ”์œ„์— ๋Œ€ํ•œ ์ƒ์„ธ ๋ฆฌ๋ทฐ๋กœ, BioResearcher์˜ ์˜๋ฏธ ๋ฐ ํ•œ๊ณ„๋ฅผ ์ด๋ก ์ ์œผ๋กœ ๋ณด์™„ํ•ฉ๋‹ˆ๋‹ค.
๊ธฐ๋ฐ˜ ์—ฐ๊ตฌ
๋ฐ”์ด์˜ค๋ฉ”๋””์ปฌ ๋ถ„์•ผ ์—ฐ๊ตฌ ์ž๋™ํ™”์—์„œ LLM ์—์ด์ „ํŠธ ๊ธฐ๋ฐ˜ ๋ฐ์ดํ„ฐ ๋ถ„์„ยท์‹คํ—˜ ์„ค๊ณ„ ์‚ฌ๋ก€๊ฐ€, BioResearcher ํŒŒ์ดํ”„๋ผ์ธ์˜ ์ด๋ก ์  ๋ฐฐ๊ฒฝ์ด ๋œ๋‹ค.
๊ธฐ๋ฐ˜ ์—ฐ๊ตฌ
LLM ๋ฐ ์—์ด์ „ํŠธ ๊ธฐ๋ฐ˜ ๊ณผํ•™ ์ž๋™ํ™”์˜ ๋Œ€๊ทœ๋ชจ ๋™ํ–ฅยท๊ฐ€๋Šฅ์„ฑ๊ณผ ๊ตฌํ˜„ ๋ฐฉ๋ฒ•๋ก ์„ ์ง„๋‹จํ•˜์—ฌ BioResearcher์™€ ์œ ๊ด€ํ•œ ์ „์ฒด ์ƒํƒœ๊ณ„๋ฅผ ์กฐ๋งํ•ฉ๋‹ˆ๋‹ค.
๊ธฐ๋ฐ˜ ์—ฐ๊ตฌ
AutoBio๋Š” ๋กœ๋ด‡ ์ž๋™ํ™” ๊ธฐ๋ฐ˜ ๋ฐ”์ด์˜ค ์‹คํ—˜ ํŒŒ์ดํ”„๋ผ์ธ์„ ๋‹ค๋ฃจ๋ฉฐ, LLM ๊ธฐ๋ฐ˜ ๋ฐ”์ด์˜ค ์ž๋™ํ™” ์‹œ์Šคํ…œ์˜ ์‹คํ—˜์  ์ถœ๋ฐœ์ ์ด ๋ฉ๋‹ˆ๋‹ค.
๊ธฐ๋ฐ˜ ์—ฐ๊ตฌ
์•ฝ๋ฌผ ๋ฐ์ดํ„ฐ์˜ ํ‘œ์ค€ํ™”๋œ ํ‘œํ˜„ ํ•™์Šต์„ ์œ„ํ•œ ๋ฐฉ๋ฒ•๋ก ์  ๊ธฐ์ดˆ๋ฅผ ์ œ๊ณตํ•œ๋‹ค.
๊ธฐ๋ฐ˜ ์—ฐ๊ตฌ
์ž๋™ํ™” ์‹คํ—˜์‹ค๊ณผ AI ๋ชจ๋ธ ํ†ตํ•ฉ์˜ ์ด๋ก ์  ๊ธฐ๋ฐ˜์„ ์ œ๊ณตํ•˜๋Š” ์—ฐ๊ตฌ์ด๋‹ค.
๊ธฐ๋ฐ˜ ์—ฐ๊ตฌ
์ƒ๋ฌผยท์ œ์•ฝ ์‹คํ—˜์‹ค ์šด์˜ ์ž๋™ํ™”์™€ ๋ณ‘๋ชฉ ํ•ด์†Œ ๋ฌธ์ œ์— ๋Œ€ํ•ด ๋” ๋„“์€ AI ๊ธฐ๋ฐ˜ ์ž๋™ํ™” ์ „๋žต์„ ํƒ๊ตฌํ•ฉ๋‹ˆ๋‹ค.
๊ธฐ๋ฐ˜ ์—ฐ๊ตฌ
์—์ด์ „ํŠธ ๊ธฐ๋ฐ˜ ๋Œ€๊ทœ๋ชจ ์–ธ์–ด๋ชจ๋ธ์˜ ์ž๋™ํ™” ์—ฐ๊ตฌ ๋Šฅ๋ ฅ ์„œ๋ฒ ์ด๋กœ, ์ „์ฒด ํŒŒ์ดํ”„๋ผ์ธ ์ž๋™ํ™”์˜ ์ด๋ก ์  ๊ธฐ๋ฐ˜์„ ์ œ๊ณตํ•œ๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
Biomni๋Š” ๋ฒ”์šฉ ๋ฐ”์ด์˜ค ์—ฐ๊ตฌ ์—์ด์ „ํŠธ๋ฅผ ํ†ตํ•ด BioResearcher์˜ ๋ชจ๋“ˆํ˜• ์ž๋™ํ™” ์‹œ์Šคํ…œ๊ณผ ๊ธฐ๋Šฅ์ƒ ๋น„๊ตํ•  ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
From intention to implementation ๋…ผ๋ฌธ์€ LLM ๊ธฐ๋ฐ˜ ๋ฐ”์ด์˜ค๋ฉ”๋””์ปฌ ์—ฐ๊ตฌ ์ž๋™ํ™” end-to-end ์•„ํ‚คํ…์ฒ˜๋ฅผ ๊ตฌํ˜„ํ•˜์—ฌ, InternAgent์˜ ๊ฐ ์—ฐ๊ตฌ ์—…๋ฌด ๋‹จ๊ณ„ ์ž๋™ํ™” ๋ชจ๋ธ๊ณผ ๋น„๊ตํ•  ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
LLM ๊ธฐ๋ฐ˜ ์—์ด์ „ํŠธ๋กœ ์‹คํ—˜ ์ž๋™ํ™”(air sensing ๋ถ„์•ผ)๋ฅผ ๋‹ค๋ฃจ๋ฉฐ, BioResearcher์˜ ๋ฐ”์ด์˜ค ๋‹ด๋‹น dry lab ์ž๋™ํ™” ์ ‘๊ทผ๊ณผ ๋Œ€์กฐ๋ฉ๋‹ˆ๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
From intention to implementation ๋…ผ๋ฌธ์€ ์‹ ๊ฒฝ๋ง์ด ์•„๋‹Œ Agentic ๊ธฐ๋ฐ˜ ์ƒ๋ฌผ/์–‘์ž ์‹œ์Šคํ…œ ์ž๋™ํ™”๋ฅผ ๋‹ค๋ฃจ๋ฉฐ, ์œ ์‚ฌ ์‘์šฉ ๋ถ„์•ผ์˜ ๋Œ€์•ˆ ์ „๋žต์„ ์ œ์‹œํ•œ๋‹ค.
ํ›„์† ์—ฐ๊ตฌ
์ธ๊ฐ„ ์ค‘์‹ฌ์˜ ๊ณผํ•™ ๋ฐœ์ „ ๋ฉ”์ปค๋‹ˆ์ฆ˜์„ ํฌ์ฐฉํ•˜๋Š” AI ๋ชจ๋ธ ์—ฐ๊ตฌ๋ฅผ ํ™•์žฅํ•œ ์‘์šฉ ์‚ฌ๋ก€์ด๋‹ค.
ํ›„์† ์—ฐ๊ตฌ
โ€˜Forecasting the future of artificial intelligence with machine learningโ€™ ๋…ผ๋ฌธ์€ LLM ๋ฐœ์ „์ด ๊ณผํ•™์  ์›Œํฌํ”Œ๋กœ์šฐ ์ž๋™ํ™”์ฒ˜๋Ÿผ ์˜ˆ์ธก ๊ฐ€๋Šฅํ•œ ๋ฏธ๋ž˜ ํ˜์‹ ์„ ๋…ผ์˜ํ•œ๋‹ค.
ํ›„์† ์—ฐ๊ตฌ
From intention to implementation ๋…ผ๋ฌธ์€ ์ƒ์˜ํ•™ ์—ฐ๊ตฌ์—์„œ AI์˜ ์‹คํ—˜ ๊ตฌํ˜„ ์ œํ•œ์„ ๋ถ„์„ํ•˜์—ฌ, AI Scientist์˜ ๊ตฌํ˜„๋ ฅ ๋ถ€์กฑ ์ฃผ์žฅ๊ณผ ์ง์ ‘์ ์œผ๋กœ ์—ฐ๊ฒฐ๋ฉ๋‹ˆ๋‹ค.
ํ›„์† ์—ฐ๊ตฌ
๋‹ค์ค‘ ์—์ด์ „ํŠธ ํ”„๋ ˆ์ž„์›Œํฌ ๊ธฐ๋ฐ˜์œผ๋กœ ๊ณผํ•™์—ฐ๊ตฌ ์ž๋™ํ™” ๋ฃจํ”„์˜ ์™„์„ฑ๋„์™€ ๋ฒ”์œ„๋ฅผ ๋„“ํ˜”์œผ๋ฏ€๋กœ, End-to-End ์ž๋™ํ™” ๋ฐ”์ด์˜ค ์—ฐ๊ตฌ ๊ณ ๋„ํ™”์— ํ•„์ˆ˜์ ์ด๋‹ค.
ํ›„์† ์—ฐ๊ตฌ
๋ฐ”์ด์˜ค๋ฉ”๋””์ปฌ AI ์—ฐ๊ตฌ ์ž๋™ํ™”์—์„œ ๋‹ค์˜์—ญ ์‹คํ—˜/๋ถ„์„ ๋ฒค์น˜๋งˆํ‚น ์‚ฌ๋ก€๋ฅผ ์ œ์‹œํ•ด, BioResearcher์˜ ๋„๊ตฌ ํ™œ์šฉ ๋ฐ ์„ฑ๋Šฅ ๊ฒ€์ฆ ํ”„๋ ˆ์ž„์›Œํฌ๋กœ ํ™•์žฅํ•œ๋‹ค.
← ๋ชฉ๋ก์œผ๋กœ ๋Œ์•„๊ฐ€๊ธฐ

๐ŸŽง Audio Overview

์ด ๋…ผ๋ฌธ ๋ฆฌ๋ทฐ๋ฅผ ํŒŸ์บ์ŠคํŠธํ˜• ์˜ค๋””์˜ค๋กœ ์ƒ์„ฑํ•ฉ๋‹ˆ๋‹ค. (Gemini ยท ํ‚ค๋Š” ๋ธŒ๋ผ์šฐ์ €์—๋งŒ ์ €์žฅ ยท ์™„์„ฑ๋ณธ์€ ์ด๋ฉ”์ผ๋กœ๋„ ์ „์†ก)
โ–ธ ๊ณ ๊ธ‰: ๊ตฌ์„ฑ ๋ฐฉํ–ฅ(๋Œ€๋ณธ ์ž‘์„ฑ ์ง€์นจ) ์ง์ ‘ ์ˆ˜์ •