Toward a Team of AI-made Scientists for Scientific Discovery from Gene Expression Data

์ €์ž: Haoyang Liu, Yijiang Li, Jinglin Jian, Yuxuan Cheng, Jianrong Lu | ๋‚ ์งœ: 2024 | DOI: 10.48550/arXiv.2402.12391 📄 PDF


Essence

Figure 1

TAIS์˜ ๊ฐœ์š”: ํ”„๋กœ์ ํŠธ ๋งค๋‹ˆ์ €, ๋ฐ์ดํ„ฐ ์—”์ง€๋‹ˆ์–ด, ํ†ต๊ณ„ํ•™์ž, ๋„๋ฉ”์ธ ์ „๋ฌธ๊ฐ€, ์ฝ”๋“œ ๋ฆฌ๋ทฐ์–ด์˜ 5๊ฐœ ์—ญํ• ์ด ํ˜‘์—…ํ•˜์—ฌ ์œ ์ „์ž ๋ฐœํ˜„ ๋ฐ์ดํ„ฐ์—์„œ ์งˆ๋ณ‘ ์˜ˆ์ธก ์œ ์ „์ž๋ฅผ ์‹๋ณ„

๋Œ€๊ทœ๋ชจ ์–ธ์–ด๋ชจ๋ธ(LLM)์„ ๊ธฐ๋ฐ˜์œผ๋กœ ํ•œ AI ๊ณผํ•™์ž ํŒ€(TAIS)์ด ๋ฐ์ดํ„ฐ ์„ ํƒ, ์ „์ฒ˜๋ฆฌ, ํ˜ผ์žฌ ์ธ์ž ๋ณด์ •, ์กฐ๊ฑด ์˜ˆ์ธก์„ ์ž๋™ํ™”ํ•˜์—ฌ ์งˆ๋ณ‘ ๊ด€๋ จ ์œ ์ „์ž ๋ฐœ๊ฒฌ ํŒŒ์ดํ”„๋ผ์ธ์„ ํšจ์œจํ™”ํ•˜๋Š” ์‹œ์Šคํ…œ์„ ์ œ์•ˆํ•œ๋‹ค.

Motivation

Achievement

Figure 2

๋ฐ์ดํ„ฐ ์—”์ง€๋‹ˆ์–ด์™€ ์ฝ”๋“œ ๋ฆฌ๋ทฐ์–ด ๊ฐ„์˜ ์“ฐ๊ธฐ-์‹คํ–‰-๊ฐ์‹œ ๋ฃจํ”„: ์ฝ”๋“œ ์ƒ์„ฑ ํ›„ ํ‘œ์ค€์ถœ๋ ฅ/ํ‘œ์ค€์—๋Ÿฌ๋ฅผ ๊ฒ€์ฆํ•˜๊ณ  ํ”ผ๋“œ๋ฐฑ ๋ฐ˜๋ณต

Figure 3

๋ฐ์ดํ„ฐ ์—”์ง€๋‹ˆ์–ด์™€ ๋„๋ฉ”์ธ ์ „๋ฌธ๊ฐ€ ๊ฐ„์˜ ํ˜‘์˜: ์ƒ๋ฌผ์˜ํ•™ ๊ฒฐ์ •(์ž„์ƒ ๋ผ๋ฒจ ์ถ”์ถœ, ์œ ์ „์ž ์‹๋ณ„์ž ํ†ตํ•ฉ ๋“ฑ)์— ๋Œ€ํ•œ ์ง€์‹ ๊ธฐ๋ฐ˜ ์ง€๋„

  1. TAIS ์‹œ์Šคํ…œ ๊ฐœ๋ฐœ: ํ”„๋กœ์ ํŠธ ๋งค๋‹ˆ์ €(์กฐ์ •), ๋ฐ์ดํ„ฐ ์—”์ง€๋‹ˆ์–ด(์ „์ฒ˜๋ฆฌ ์ฝ”๋“œ ์ž‘์„ฑ), ํ†ต๊ณ„ํ•™์ž(ํšŒ๊ท€๋ถ„์„), ๋„๋ฉ”์ธ ์ „๋ฌธ๊ฐ€(์ƒ๋ฌผ์˜ํ•™ ํŒ๋‹จ), ์ฝ”๋“œ ๋ฆฌ๋ทฐ์–ด(ํ’ˆ์งˆ ๋ณด์ฆ)๋กœ ๊ตฌ์„ฑ๋œ ๊ฒฝ๋Ÿ‰ ๋ฉ€ํ‹ฐ์—์ด์ „ํŠธ ์‹œ์Šคํ…œ ๊ตฌ์ถ•
  2. ๊ณ ๊ธ‰ ๋ถ„์„ ๊ธฐ๋Šฅ: ํ˜ผ์žฌ ์ธ์ž(confounding factor) ๋ณด์ •๊ณผ ๋‘ ๋‹จ๊ณ„ ํšŒ๊ท€(two-step regression)๋ฅผ ๋„์ž…ํ•˜์—ฌ ๋ˆ„๋ฝ๋œ ์กฐ๊ฑด ์˜ˆ์ธก ๋ฐ ๊ฑฐ์ง“ ๋ฐœ๊ฒฌ ์ตœ์†Œํ™”
  3. ๋ฒค์น˜๋งˆํฌ ๊ฐœ๋ฐœ: 457๊ฐœ์˜ ์งˆ๋ณ‘-์กฐ๊ฑด ์Œ์œผ๋กœ ๊ตฌ์„ฑ๋œ ๊ธˆ๋ณธ์œ„ ๋ฒค์น˜๋งˆํฌ ๊ตฌ์ถ•์œผ๋กœ TAIS์˜ ์œ ์ „์ž ์‹๋ณ„ ์„ฑ๋Šฅ ํ‰๊ฐ€ ๊ฐ€๋Šฅํ•˜๊ฒŒ ํ•จ
  4. ์‹ค์ฆ์  ๊ฒ€์ฆ: ์‹๋ณ„๋œ ์œ ์ „์ž๊ฐ€ ์ƒ๋ฌผ์˜ํ•™ ๋ฌธํ—Œ๊ณผ ์ผ์น˜ํ•จ์„ ์‚ฌ๋ก€ ์—ฐ๊ตฌ๋กœ ํ™•์ธ

How

Originality

Limitation & Further Study

Evaluation

์ดํ‰: ๋ณธ ๋…ผ๋ฌธ์€ LLM ๊ธฐ๋ฐ˜ ๋ฉ€ํ‹ฐ์—์ด์ „ํŠธ ์‹œ์Šคํ…œ์„ ์œ ์ „์ž ๋ฐœํ˜„ ๋ฐ์ดํ„ฐ ๋ถ„์„์— ์ฐฝ์˜์ ์œผ๋กœ ์ ์šฉํ•˜๊ณ , ํ˜ผ์žฌ ์ธ์ž ๋ณด์ •๊ณผ ํ˜„์‹ค ์—ฐ๊ตฌํŒ€ ๋ชจ์˜๋ฅผ ํ†ตํ•ด ์ž๋™ํ™”๋œ ๊ณผํ•™์  ๋ฐœ๊ฒฌ์˜ ์ƒˆ๋กœ์šด ๊ฐ€๋Šฅ์„ฑ์„ ๋ณด์—ฌ์ฃผ๋Š” ์˜๋ฏธ ์žˆ๋Š” ์—ฐ๊ตฌ์ด๋‹ค. ๋‹ค๋งŒ ์ž„์ƒ ๊ฒ€์ฆ, ํ™•์žฅ์„ฑ, ๋Œ€๊ทœ๋ชจ ๋ฒค์น˜๋งˆํฌ๋ฅผ ํ†ตํ•œ ๊ฐ•ํ™”๊ฐ€ ํ›„์† ๋‹จ๊ณ„์—์„œ ํ•„์ˆ˜์ ์ด๋‹ค.

๊ฐ™์ด ๋ณด๋ฉด ์ข‹์€ ๋…ผ๋ฌธ

๊ธฐ๋ฐ˜ ์—ฐ๊ตฌ
774๋Š” ์…€ํ”„-์—๋ณผ๋น™ ๋ฉ€ํ‹ฐ๋ชจ๋‹ฌ ๋ฐ”์ด์˜ค์˜ํ•™ ์—์ด์ „ํŠธ ํ”„๋ ˆ์ž„์›Œํฌ๋ฅผ ํ†ตํ•ด, 817์˜ ์ž๋™ ์œ ์ „์ž ๋ฐœ๊ฒฌ ์‹œ์Šคํ…œ์˜ ์„ค๊ณ„ ์ด๋ก ์„ ์‹ฌํ™”ํ•ฉ๋‹ˆ๋‹ค.
๊ธฐ๋ฐ˜ ์—ฐ๊ตฌ
Toward a Team of AI-made Scientists for Scientific Discovery ๋…ผ๋ฌธ์€ AI๊ฐ€ ๋„๋ฉ”์ธ ์ „๋ฌธ๊ฐ€ ๊ฐ๋…ํ•˜์— frontier ์—ฐ๊ตฌ๋ฅผ ์ˆ˜ํ–‰ํ•˜๋Š” ์ ‘๊ทผ์„ ๊ตฌ์กฐํ™”๋œ 'AI ํŒ€' ๊ฐœ๋…์œผ๋กœ ๋ถ„์„, 922์˜ ์‚ฌ๋ก€๋ฅผ ๊ฐœ๋…์ ์œผ๋กœ ์„ค๋ช…ํ•œ๋‹ค.
๊ธฐ๋ฐ˜ ์—ฐ๊ตฌ
835๋Š” LLM ๊ธฐ๋ฐ˜ AI ๊ณผํ•™์ž ํ”„๋ ˆ์ž„์›Œํฌ์˜ ๊ธฐ์ˆ ์  ๋ฉ”ํƒ€์„œ๋ฒ ์ด๋กœ, 817์˜ AI-made scientist ํŒ€ ๊ตฌ์ถ•์— ํ•„์ˆ˜์  ๊ฐœ๋…์„ ์ œ๊ณตํ•ฉ๋‹ˆ๋‹ค.
๊ธฐ๋ฐ˜ ์—ฐ๊ตฌ
ํ™”ํ•™ ๋ฐ ์ƒ๋ช…๊ณผํ•™ ๋ถ„์•ผ์—์„œ์˜ ํŒŒ์šด๋ฐ์ด์…˜ ๋ชจ๋ธ ์—ญํ• ๊ณผ ๋„์ „๊ณผ์ œ๋ฅผ ๋‹ค๋ฃฌ ๊ด€์  ๋…ผ๋ฌธ์œผ๋กœ, LLM ๊ธฐ๋ฐ˜ AI ๊ณผํ•™์žํŒ€์˜ ๊ธฐ๋ฐ˜ ์ด๋ก ์„ ์ดํ•ดํ•˜๋Š”๋ฐ ๋„์›€์ด ๋ฉ๋‹ˆ๋‹ค.
๊ธฐ๋ฐ˜ ์—ฐ๊ตฌ
681์€ ๊ณ„์ธต์  ์—์ด์ „ํŠธ ๊ธฐ๋ฐ˜ ์œ ์ „์ž ๊ธฐ๋Šฅ ์ถ”๋ก ์„ ํ†ตํ•ด, 817์— ์ œ์‹œ๋œ LLM ํŒ€์˜ ์‹ค์ œ ๊ตฌํ˜„ ๋ฐ ํ‰๊ฐ€ ๋ฐฉ๋ฒ•๋ก ์„ ์ œ๊ณตํ•œ๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
705๋ฒˆ ๋…ผ๋ฌธ์€ ์ƒ๋ช…๊ณผํ•™ ๋ฐ์ดํ„ฐ ๊ธฐ๋ฐ˜ ๋ฐ”์ด์˜ค ์—ฐ๊ตฌ ์ „์ฒด๋ฅผ ์ž๋™ํ™”ํ•˜๋Š” ๋ฐ”์ด์˜ค์˜๊ฐ์„ ๋ฐ›์€ ์—์ด์ „ํŠธ ์‹œ์Šคํ…œ์˜ ์ ‘๊ทผ๋ฒ•์„ ๋ณด์—ฌ์ค๋‹ˆ๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
DrugAgent๋Š” ์•ฝ๋ฌผ ๋ฐœ๊ฒฌ ํ”„๋กœ๊ทธ๋ž˜๋ฐ์„ ์ž๋™ํ™”ํ•˜๋Š” LLM ๊ธฐ๋ฐ˜ ์‹œ์Šคํ…œ์œผ๋กœ, ์œ ์ „์ž ๊ธฐ๋ฐ˜ ์—ฐ๊ตฌ ์ž๋™ํ™”์™€ ์ ‘๊ทผ ๋ฐฉ์‹ ๋น„๊ต์— ๋„์›€์ด ๋œ๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
์ƒ๋ฌผ์ •๋ณดํ•™ ๋ฐ์ดํ„ฐ ๋ถ„์„์„ ์ž๋™ํ™”ํ•˜๋Š” LLM ๊ธฐ๋ฐ˜ ์‹œ์Šคํ…œ์˜ ์œ ์‚ฌํ•œ ์ ‘๊ทผ ๋ฐฉ์‹์ด๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
817์€ ์ž์œจ์  AI ๊ณผํ•™์ž ํŒ€์„ ํ†ตํ•œ ๊ณผํ•™์  ๋ฐœ๊ฒฌ์„ ๋‹ค๋ฃจ๋ฉฐ, 059์˜ Agent Laboratory์™€ ์œ ์‚ฌํ•˜๊ฒŒ ์‹คํ—˜-๋ณด๊ณ ์„œ ์ž๋™ํ™”์— ์ค‘์ ์„ ๋‘”๋‹ค.
ํ›„์† ์—ฐ๊ตฌ
292๋Š” LLM ๊ธฐ๋ฐ˜ ํŒŒ๋ผ๋ฏธํ„ฐ ์ถ”๋ก ๊ณผ ์•ฝ๋ฌผ ๋ฐœ๊ฒฌ ๋“ฑ ๋‹ค์–‘ํ•œ ์ƒ๋ช…๊ณผํ•™ ๋ฌธ์ œ์— ๋Œ€ํ•œ ์‹ค์งˆ์  ์ ์šฉ์‚ฌ๋ก€๋ฅผ ๋ณด์ธ๋‹ค.
ํ›„์† ์—ฐ๊ตฌ
351๋ฒˆ ๋…ผ๋ฌธ์€ ์•ฝ๋ฌผ ๋””์ž์ธ์šฉ ๋ฉ€ํ‹ฐ์—์ด์ „ํŠธ ์‹œ์Šคํ…œ์˜ ์ „์ฒด ํŒŒ์ดํ”„๋ผ์ธ์„ ๊ตฌํ˜„ํ•˜๊ณ , ์œ ์ „์ž ๋ฐœ๊ฒฌ ์ž๋™ํ™” ์‹œ์Šคํ…œ๊ณผ ์ง์ ‘์  ๊ธฐ์ˆ ์  ์‹œ๋„ˆ์ง€๊ฐ€ ์žˆ์Šต๋‹ˆ๋‹ค.
ํ›„์† ์—ฐ๊ตฌ
817์€ ๋‹ค์–‘ํ•œ ๋ถ„์•ผ์—์„œ LLM ๊ธฐ๋ฐ˜ ๊ณผํ•™ ๋ฐœ๊ฒฌ ํŒ€์„ ๊ตฌ์„ฑํ•˜๋Š” ์ ‘๊ทผ๋ฒ•์„ ๋…ผ์˜ํ•˜๋ฏ€๋กœ, ์ง€๊ตฌ ๊ด€์ธก ์ด์™ธ์˜ ์ ์šฉ ๋ฒ”์œ„๋„ ์ œ๊ณตํ•ฉ๋‹ˆ๋‹ค.
ํ›„์† ์—ฐ๊ตฌ
817์€ ์œ ์ „์ž-์งˆ๋ณ‘ ๋ฐœ๊ฒฌ ์ž๋™ํ™” ํŒŒ์ดํ”„๋ผ์ธ์„ ์‹ค์ œ ๊ตฌํ˜„ํ•˜์—ฌ, 774์—์„œ ์ œ์‹œํ•œ ๋™์  ๋„๊ตฌ ์‚ฌ์šฉ AI ์—์ด์ „ํŠธ์˜ ์‘์šฉ ์‚ฌ๋ก€๊ฐ€ ๋ฉ๋‹ˆ๋‹ค.
ํ›„์† ์—ฐ๊ตฌ
817์˜ AI-ํŒ€ ๊ธฐ๋ฐ˜ ๊ณผํ•™ ํƒ๊ตฌ ์‚ฌ๋ก€๋Š” 064๊ฐ€ ์ œ์‹œํ•œ ๋‹ค์–‘ํ•œ ํ”„๋ ˆ์ž„์›Œํฌ ์—ฐ๊ตฌ๋ฅผ ์‹ค์ œ๋กœ ํ™•์žฅํ•˜๋Š” ์‚ฌ๋ก€๊ฐ€ ๋ฉ๋‹ˆ๋‹ค.
ํ›„์† ์—ฐ๊ตฌ
817์€ ํŒ€ ๊ธฐ๋ฐ˜ AI ๊ณผํ•™์ž ๊ฐœ๋…์„ ํ™•์žฅํ•˜๋ฉฐ, 794์˜ ์›Œํฌ์ƒต ๋ ˆ๋ฒจ ์ž๋™ ๋ฐœ๊ฒฌ์„ ๋‹ค์ค‘ ์—์ด์ „ํŠธ ๊ด€์ ์—์„œ ๋ฐœ์ „์‹œํ‚ต๋‹ˆ๋‹ค.
์‘์šฉ ์‚ฌ๋ก€
225๋Š” ์ž„์ƒ ์ง„๋‹จ์— ํŠนํ™”๋œ LLM ๋ฐ ๋ณต์ˆ˜ ๋ฐ์ดํ„ฐ์…‹์„ ํ†ตํ•œ ์งˆ๋ณ‘ ์˜ˆ์ธก์„ ๋‹ค๋ฃจ์–ด, 817์ด ์ œ์•ˆํ•œ ์งˆ๋ณ‘ ์œ ์ „์ž ๋ฐœ๊ฒฌ ํŒŒ์ดํ”„๋ผ์ธ์˜ ์‹ค์ œ์  ์‘์šฉ์ด๋‹ค.
← ๋ชฉ๋ก์œผ๋กœ ๋Œ์•„๊ฐ€๊ธฐ

๐ŸŽง Audio Overview

์ด ๋…ผ๋ฌธ ๋ฆฌ๋ทฐ๋ฅผ ํŒŸ์บ์ŠคํŠธํ˜• ์˜ค๋””์˜ค๋กœ ์ƒ์„ฑํ•ฉ๋‹ˆ๋‹ค. (Gemini ยท ํ‚ค๋Š” ๋ธŒ๋ผ์šฐ์ €์—๋งŒ ์ €์žฅ ยท ์™„์„ฑ๋ณธ์€ ์ด๋ฉ”์ผ๋กœ๋„ ์ „์†ก)
โ–ธ ๊ณ ๊ธ‰: ๊ตฌ์„ฑ ๋ฐฉํ–ฅ(๋Œ€๋ณธ ์ž‘์„ฑ ์ง€์นจ) ์ง์ ‘ ์ˆ˜์ •