GeneAgent: self-verification language agent for gene-set analysis using domain databases

์ €์ž: Zhizheng Wang, Qiao Jin, Chih-Hsuan Wei, Shubo Tian | ๋‚ ์งœ: 2025 | DOI: 10.1038/s41592-025-02748-6 📄 PDF


Essence

Figure 1

GeneAgent์˜ 4๋‹จ๊ณ„ ํŒŒ์ดํ”„๋ผ์ธ: ์ƒ์„ฑ(Generation), ์ž๊ธฐ๊ฒ€์ฆ(Self-verification), ์ˆ˜์ •(Modification), ์š”์•ฝ(Summarization). ์ž๊ธฐ๊ฒ€์ฆ ๋‹จ๊ณ„์—์„œ ๋„๋ฉ”์ธ ํŠนํ™” ๋ฐ์ดํ„ฐ๋ฒ ์ด์Šค์™€ ์ƒํ˜ธ์ž‘์šฉํ•˜์—ฌ ํ™˜๊ฐ์„ ๊ฐ์ง€ํ•˜๊ณ  ๊ฒ€์ฆ ๋ณด๊ณ ์„œ๋ฅผ ์ƒ์„ฑํ•จ.

๋Œ€๊ทœ๋ชจ ์–ธ์–ด๋ชจ๋ธ(LLM)์˜ ํ™˜๊ฐ(hallucination) ๋ฌธ์ œ๋ฅผ ์ž๊ธฐ๊ฒ€์ฆ ๋ฉ”์ปค๋‹ˆ์ฆ˜์œผ๋กœ ํ•ด๊ฒฐํ•˜๋Š” ์œ ์ „์ž ์ง‘ํ•ฉ ๋ถ„์„ AI ์—์ด์ „ํŠธ๋ฅผ ์ œ์‹œํ•˜๋ฉฐ, GPT-4 ๋Œ€๋น„ ํ˜„์ €ํžˆ ๋†’์€ ์ •ํ™•๋„๋ฅผ ๋‹ฌ์„ฑํ•œ๋‹ค.

Motivation

Achievement

Figure 2

์„ธ ๋ฐ์ดํ„ฐ์…‹(GO, NeST, MSigDB)์— ๊ฑธ์นœ ROUGE ์ ์ˆ˜ ๋ฐ ์˜๋ฏธ ์œ ์‚ฌ๋„(semantic similarity) ๋น„๊ต. GeneAgent์ด ๋ชจ๋“  ๋ฉ”ํŠธ๋ฆญ์—์„œ GPT-4๋ฅผ ์ผ๊ด€๋˜๊ฒŒ ์ƒํšŒํ•จ.

  1. ๋ฒค์น˜๋งˆํฌ ์„ฑ๋Šฅ ํ–ฅ์ƒ: 1,106๊ฐœ ์œ ์ „์ž ์ง‘ํ•ฉ ํ‰๊ฐ€์—์„œ GeneAgent์ด GPT-4 ๋Œ€๋น„ ROUGE-L ์ ์ˆ˜ 0.239โ†’0.310 (MSigDB), MedCPT ๊ธฐ๋ฐ˜ ์˜๋ฏธ ์œ ์‚ฌ๋„ 0.689โ†’0.705 (GO dataset) ๋‹ฌ์„ฑ. 90% ์ด์ƒ ์œ ์‚ฌ๋„ ์ƒ์„ฑ ์ผ€์ด์Šค 104โ†’170๊ฐœ ์ฆ๊ฐ€.
  2. ์‹ค๋ฌด ์ ์šฉ์„ฑ ๊ฒ€์ฆ: ๋งˆ์šฐ์Šค B2905 ๋ฉœ๋ผ๋…ธ๋งˆ ์„ธํฌ์ฃผ ์œ ๋ž˜ 7๊ฐœ ์‹ ๊ทœ ์œ ์ „์ž ์ง‘ํ•ฉ ๋ถ„์„์—์„œ ์ „๋ฌธ๊ฐ€ ๊ฒ€ํ†  ๊ฒฐ๊ณผ GPT-4 ๋Œ€๋น„ ๋”์šฑ ๊ด€๋ จ์„ฑ ๋†’๊ณ  ํฌ๊ด„์ ์ธ ๊ธฐ๋Šฅ ์„ค๋ช… ์ƒ์„ฑ. ๋‹ค์ค‘ ์ข…(species) ๊ฐ„ ์•ˆ์ •์„ฑ ํ™•๋ณด.

How

Figure 1c

selfVeri-Agent์˜ ๋™์ž‘ ์˜ˆ์‹œ: RTK signaling ๊ด€๋ จ ํด๋ ˆ์ž„์ด ๋ฐ์ดํ„ฐ๋ฒ ์ด์Šค ์ฟผ๋ฆฌ๋ฅผ ํ†ตํ•ด MAPK signaling pathway์™€๋งŒ ๊ด€๋ จ ์žˆ์Œ์„ ํ™•์ธํ•˜๊ณ  "๋ถ€๋ถ„ ์ง€์ง€๋จ(partially supported)" ํŒ์ •.

Originality

Limitation & Further Study

Evaluation

์ดํ‰: GeneAgent๋Š” ๋„๋ฉ”์ธ ๋ฐ์ดํ„ฐ๋ฒ ์ด์Šค ํ™œ์šฉ ์ž๊ธฐ๊ฒ€์ฆ์œผ๋กœ LLM์˜ ํ™˜๊ฐ ๋ฌธ์ œ๋ฅผ ์ฐฝ์˜์ ์œผ๋กœ ํ•ด๊ฒฐํ•˜๋ฉฐ, ๋Œ€๊ทœ๋ชจ ๋ฒค์น˜๋งˆํฌ์™€ ์‹ค๋ฌด ๊ฒ€์ฆ์„ ํ†ตํ•ด ์ƒ๋ฌผ์ •๋ณดํ•™ ๋ถ„์•ผ์˜ ์‹ ๋ขฐ๋„ ์žˆ๋Š” AI ํ™œ์šฉ์„ ์„ ๋„ํ•˜๋Š” ์˜๋ฏธ ์žˆ๋Š” ์—ฐ๊ตฌ์ด๋‹ค. ๋‹ค๋งŒ ๋ฏธ์ง€์˜ ์œ ์ „์ž ๊ธฐ๋Šฅ ๋ฐœ๊ฒฌ ๋Šฅ๋ ฅ๊ณผ ๋‹ค์–‘ํ•œ ์ƒ๋ฌผ์ข… ์ ์šฉ์„ฑ ํ™•๋Œ€๊ฐ€ ํ–ฅํ›„ ๊ณผ์ œ์ด๋‹ค.

๊ฐ™์ด ๋ณด๋ฉด ์ข‹์€ ๋…ผ๋ฌธ

๊ธฐ๋ฐ˜ ์—ฐ๊ตฌ
LLM์˜ ์ž๊ธฐ๊ฒ€์ฆ ๋ฐ ์Šคํ…๋ณ„ ๊ฒ€์ฆ ๊ธฐ๋ฒ•์ด GeneAgent์˜ ํ™˜๊ฐ ์ €๊ฐ ์ž๊ธฐํ™•์ธ ๋ฐฉ์‹์— ์ด๋ก ์  ๊ทผ๊ฑฐ๋ฅผ ์ œ๊ณตํ•œ๋‹ค.
๊ธฐ๋ฐ˜ ์—ฐ๊ตฌ
์ž๊ธฐ ๊ฒ€์ฆ, ๊ท€๋‚ฉ/์—ฐ์—ญ/๊ท€์ถ”์  ์ถ”๋ก  ๊ตฌ์กฐ ๋“ฑ LLM ๊ธฐ๋ฐ˜ ๊ณผํ•™์  ๋ฐœ๊ฒฌ ํ”„๋ ˆ์ž„์›Œํฌ์˜ ์ด๋ก ์  ๊ธฐ๋ฐ˜์ด ๋œ๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
์ƒ๋ฌผ์˜ํ•™ ๋ถ„์•ผ์—์„œ LLM์˜ ํ™˜๊ฐ ๋ฌธ์ œ๋ฅผ ํ•ด๊ฒฐํ•˜๋Š” ๋‹ค๋ฅธ ์ ‘๊ทผ๋ฒ•์„ ์ œ์‹œํ•œ๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
์ž๊ธฐ๊ฒ€์ฆ ๋ฉ”์ปค๋‹ˆ์ฆ˜์„ ํ™œ์šฉํ•œ LLM ์—์ด์ „ํŠธ์˜ ๋‹ค๋ฅธ ์ ์šฉ ์‚ฌ๋ก€๋ฅผ ์ œ์‹œํ•œ๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
LLM4GRN ๋…ผ๋ฌธ์€ ์œ ์ „์ž ๊ทœ์ œ ๋„คํŠธ์›Œํฌ์˜ ์ถ”๋ก ๊ณผ์ •์— LLM ๊ธฐ๋ฐ˜ ์—์ด์ „ํŠธ๋ฅผ ๋„์ž…ํ•ด, GeneAgent์™€ ์œ ์‚ฌ ๊ณผ์ œ์—์„œ ๋ฌธ์ œ์™€ ์†”๋ฃจ์…˜์˜ ์ฐจ์ด๋ฅผ ๋ณด์—ฌ์ค๋‹ˆ๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
GeneAgent๋Š” ์œ ์ „์ž ์„ธํŠธ ๋ถ„์„์„ ์œ„ํ•œ ์…€ํ”„-๊ฒ€์ฆ ์—์ด์ „ํŠธ๋กœ, ๋‹จ๋ฐฑ์งˆ/์ƒ๋ฌผํ•™์  ์‹œํ€€์Šค ๋ถ„์•ผ์—์„œ AutoProteinEngine๊ณผ ๋‹ค๋ฅธ ์ ‘๊ทผ์œผ๋กœ ์ž๋™ํ™”๋œ ๊ณผํ•™ ์‹คํ—˜์„ ์ง€์›ํ•ฉ๋‹ˆ๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
์œ ์ „์ฒด ๋ถ„์„์„ ์œ„ํ•œ AI ์—์ด์ „ํŠธ์˜ ๋‹ค๋ฅธ ๊ตฌํ˜„ ๋ฐฉ๋ฒ•์„ ๋‹ค๋ฃจ๋Š” ๊ด€๋ จ ์—ฐ๊ตฌ์ด๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
์ƒ๋ฌผ์˜ํ•™ ๋ฐ์ดํ„ฐ ๋ถ„์„์— LLM์„ ์ ์šฉํ•˜๋Š” ์œ ์‚ฌํ•œ ์—ฐ๊ตฌ์ด๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
๊ณผํ•™ ์—ฐ๊ตฌ์—์„œ LLM ์—์ด์ „ํŠธ์˜ ์ •ํ™•๋„ ํ–ฅ์ƒ ๋ฐฉ๋ฒ•์„ ๋‹ค๋ฃจ๋Š” ๊ด€๋ จ ์—ฐ๊ตฌ์ด๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
GeneAgent ๋…ผ๋ฌธ์€ ์œ ์ „์ž ์ง‘ํ•ฉ ๋ถ„์„์—์„œ ์ž๊ธฐ ๊ฒ€์ฆ ์ถ”๋ก ์„ ๊ฐ•์กฐํ•˜์—ฌ BioMaze์˜ ์ƒ๋ฌผํ•™ ๊ฒฝ๋กœ ์ถ”๋ก  ํ•œ๊ณ„์™€ ๊ทน๋ณต๋ฒ•์„ ๋น„๊ตํ•  ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
์˜ค๋ฏน์Šค ๋ฐ์ดํ„ฐ ๊ธฐ๋ฐ˜ ์ƒ๋ฌผํ•™์  ๋ฐœ๊ฒฌ ์ž๋™ํ™”์˜ ๊ด€๋ จ ์—ฐ๊ตฌ์ด๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
LLM ๊ธฐ๋ฐ˜ ์ œ๋„คํ‹ฑ ๋ถ„์„์ด ์•„๋‹Œ, gene-set ๋ถ„์„์„ ์œ„ํ•œ self-verification language agent ์ ‘๊ทผ์„ ์ œ์‹œํ•˜๋ฏ€๋กœ ๋‹ค๋ฅธ ๋ฐฉ์‹์˜ ์œ ์ „์ž ๋ถ„์„ ์ž๋™ํ™”์ž…๋‹ˆ๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
371๋ฒˆ ๋…ผ๋ฌธ์€ LLM์˜ ์ž๊ธฐ ๊ฒ€์ฆ ๋ฉ”์ปค๋‹ˆ์ฆ˜์„ ์ด์šฉํ•ด ์œ ์ „์ž ์„ธํŠธ ๋ถ„์„์„ ํ•˜๋ฉฐ, 681๋ฒˆ์—์„œ ๋‹ค์ค‘ AI ๊ธฐ๋ฐ˜ ์ƒ๋ฌผ์ง€์‹ ์ถ”์ถœ๋ฒ•๊ณผ ๋น„๊ตํ•ด๋ณผ ๋งŒํ•œ ๋Œ€์•ˆ์  ์ „๋žต์„ ์ œ๊ณตํ•œ๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
๋‹จ๋ฐฑ์งˆ/์œ ์ „ ์ •๋ณด ๋ถ„์„์—์„œ ์—์ด์ „ํŠธ ํ”„๋ ˆ์ž„์›Œํฌ๊ฐ€ ๋ฐ์ดํ„ฐ ๋™์—ญํ•™์„ ํ•ด์„ํ•˜๋Š” ๋ฐฉ์‹๊ณผ ๋น„๊ตํ•  ์ˆ˜ ์žˆ์Œ.
๋‹ค๋ฅธ ์ ‘๊ทผ
์ž๊ธฐ๊ฒ€์ฆ ๋ฉ”์ปค๋‹ˆ์ฆ˜์„ ํ†ตํ•ด ๋„๋ฉ”์ธ ํŠนํ™” ๊ณผํ•™ ๋ถ„์„์— ์ ‘๊ทผํ•˜๋Š” GeneAgent๋Š” Co-Scientist์˜ ์ž๊ธฐ๋น„ํŒ ๋ฃจํ”„์™€ ๋Œ€์กฐ์ ์ธ ๋ฐฉ์‹์œผ๋กœ ๋ณผ ์ˆ˜ ์žˆ๋‹ค.
ํ›„์† ์—ฐ๊ตฌ
371๋ฒˆ ๋…ผ๋ฌธ์€ PaperRobot์ด ๋‹ค๋ฃฌ ์ž๋™ ๋…ผ๋ฌธ ์ƒ์„ฑ๊ณผ ์œ ์‚ฌํ•˜๊ฒŒ, LLM ๊ธฐ๋ฐ˜์˜ ์œ ์ „์ž ์ •๋ณด ๋ถ„์„์„ ์ž๋™ํ™”ํ•˜๋Š” ์ƒˆ๋กœ์šด ์‘์šฉ ์‚ฌ๋ก€๋ฅผ ์ œ์‹œํ•ฉ๋‹ˆ๋‹ค.
ํ›„์† ์—ฐ๊ตฌ
์ƒ๋ช…๊ณผํ•™ ๋ถ„์•ผ์—์„œ LLM์˜ ์ธ์šฉ ๊ธฐ๋ฐ˜ ์‚ฌ์‹คํ™•์ธยท๊ฒ€์ฆ ๋ฉ”์ปค๋‹ˆ์ฆ˜์„ ์ข…ํ•ฉ์ ์œผ๋กœ ๋ถ„์„ํ•œ๋‹ค.
ํ›„์† ์—ฐ๊ตฌ
Agent K ์—ญ์‹œ ์ž๊ธฐ๊ฒ€์ฆ, ์ž๊ธฐ์กฐ์งํ™” ๋ฉ”์ปค๋‹ˆ์ฆ˜์„ ๋„์ž…ํ•œ LLM ๊ธฐ๋ฐ˜ ๋ฐ์ดํ„ฐ์‚ฌ์ด์–ธ์Šค ์—์ด์ „ํŠธ๋กœ, GeneAgent ์‹œ์Šคํ…œ์˜ ํ™•์žฅ์  ๋…ผ์˜๋ฅผ ์ œ๊ณตํ•ฉ๋‹ˆ๋‹ค.
ํ›„์† ์—ฐ๊ตฌ
Co-Scientist์˜ ๋ฐ˜๋ณต์  ๊ฐ€์„ค ํ‰๊ฐ€์™€ ์ž๊ธฐ๋น„ํŒ ๋ฃจํ”„์™€ ์œ ์‚ฌํ•˜๊ฒŒ, GeneAgent๋Š” ์ž๊ธฐ๊ฒ€์ฆ ๊ธฐ๋ฐ˜ ๊ณผํ•™ ๋ฐœ๊ฒฌ์˜ ์‹ค์ œ ๊ตฌํ˜„์„ ๋ณด์—ฌ์ค€๋‹ค.
์‘์šฉ ์‚ฌ๋ก€
371๋ฒˆ๊ณผ ๊ฐ™์ด LLM ๊ธฐ๋ฐ˜ ๊ณผํ•™ ๋„๊ตฌ ์ž๋™ํ™” ๋ฐ ์˜๋ฃŒ ์‹œ๋‚˜๋ฆฌ์˜ค ์ ์šฉ ์—ฐ๊ตฌ๋Š” 624๋ฒˆ์˜ ํ˜„์‹ค ์ž„์ƒ ์ ์šฉ์„ฑ์— ์‹ค์งˆ์  ์ฐธ๊ณ ์ž๋ฃŒ๊ฐ€ ๋œ๋‹ค.
์‘์šฉ ์‚ฌ๋ก€
๊ฐ€์„ค ๊ฒ€์ฆ๊ณผ ์ž๊ธฐ๊ฒ€์ฆ ๋ฉ”์ปค๋‹ˆ์ฆ˜ ์ ์šฉ์ด ์‹ค์ œ ์œ ์ „์ž ์ง‘ํ•ฉ ๋ถ„์„์— ์–ด๋–ป๊ฒŒ ์ ์šฉ๋˜๋Š”์ง€ ๊ตฌ์ฒด์  ์‚ฌ๋ก€๋กœ ์ฐธ๊ณ ๋œ๋‹ค.
์‘์šฉ ์‚ฌ๋ก€
371๋ฒˆ SciAgent ๋…ผ๋ฌธ์—์„œ๋„ ๋‹ค์ค‘ ์—์ด์ „ํŠธ LLM ๊ธฐ๋ฐ˜ ์ƒ๋ฌผ์˜๋ฃŒ ๋„๊ตฌ ์ž๋™ํ™”๊ฐ€ ์ฃผ์š” ๋‚ด์šฉ์œผ๋กœ, 606๋ฒˆ๊ณผ ๊ฐ™์€ ์‹ค ์ž„์ƒ ์‹œ๋‚˜๋ฆฌ์˜ค์— ์ ์šฉ ๊ฐ€๋Šฅํ•˜๋‹ค.
← ๋ชฉ๋ก์œผ๋กœ ๋Œ์•„๊ฐ€๊ธฐ

๐ŸŽง Audio Overview

์ด ๋…ผ๋ฌธ ๋ฆฌ๋ทฐ๋ฅผ ํŒŸ์บ์ŠคํŠธํ˜• ์˜ค๋””์˜ค๋กœ ์ƒ์„ฑํ•ฉ๋‹ˆ๋‹ค. (Gemini ยท ํ‚ค๋Š” ๋ธŒ๋ผ์šฐ์ €์—๋งŒ ์ €์žฅ ยท ์™„์„ฑ๋ณธ์€ ์ด๋ฉ”์ผ๋กœ๋„ ์ „์†ก)
โ–ธ ๊ณ ๊ธ‰: ๊ตฌ์„ฑ ๋ฐฉํ–ฅ(๋Œ€๋ณธ ์ž‘์„ฑ ์ง€์นจ) ์ง์ ‘ ์ˆ˜์ •