Essence
GeneAgent์ 4๋จ๊ณ ํ์ดํ๋ผ์ธ: ์์ฑ(Generation), ์๊ธฐ๊ฒ์ฆ(Self-verification), ์์ (Modification), ์์ฝ(Summarization). ์๊ธฐ๊ฒ์ฆ ๋จ๊ณ์์ ๋๋ฉ์ธ ํนํ ๋ฐ์ดํฐ๋ฒ ์ด์ค์ ์ํธ์์ฉํ์ฌ ํ๊ฐ์ ๊ฐ์งํ๊ณ ๊ฒ์ฆ ๋ณด๊ณ ์๋ฅผ ์์ฑํจ.
๋๊ท๋ชจ ์ธ์ด๋ชจ๋ธ(LLM)์ ํ๊ฐ(hallucination) ๋ฌธ์ ๋ฅผ ์๊ธฐ๊ฒ์ฆ ๋ฉ์ปค๋์ฆ์ผ๋ก ํด๊ฒฐํ๋ ์ ์ ์ ์งํฉ ๋ถ์ AI ์์ด์ ํธ๋ฅผ ์ ์ํ๋ฉฐ, GPT-4 ๋๋น ํ์ ํ ๋์ ์ ํ๋๋ฅผ ๋ฌ์ฑํ๋ค.
Evaluation
์ดํ: GeneAgent๋ ๋๋ฉ์ธ ๋ฐ์ดํฐ๋ฒ ์ด์ค ํ์ฉ ์๊ธฐ๊ฒ์ฆ์ผ๋ก LLM์ ํ๊ฐ ๋ฌธ์ ๋ฅผ ์ฐฝ์์ ์ผ๋ก ํด๊ฒฐํ๋ฉฐ, ๋๊ท๋ชจ ๋ฒค์น๋งํฌ์ ์ค๋ฌด ๊ฒ์ฆ์ ํตํด ์๋ฌผ์ ๋ณดํ ๋ถ์ผ์ ์ ๋ขฐ๋ ์๋ AI ํ์ฉ์ ์ ๋ํ๋ ์๋ฏธ ์๋ ์ฐ๊ตฌ์ด๋ค. ๋ค๋ง ๋ฏธ์ง์ ์ ์ ์ ๊ธฐ๋ฅ ๋ฐ๊ฒฌ ๋ฅ๋ ฅ๊ณผ ๋ค์ํ ์๋ฌผ์ข
์ ์ฉ์ฑ ํ๋๊ฐ ํฅํ ๊ณผ์ ์ด๋ค.
๊ฐ์ด ๋ณด๋ฉด ์ข์ ๋
ผ๋ฌธ
๊ธฐ๋ฐ ์ฐ๊ตฌ
LLM์ ์๊ธฐ๊ฒ์ฆ ๋ฐ ์คํ
๋ณ ๊ฒ์ฆ ๊ธฐ๋ฒ์ด GeneAgent์ ํ๊ฐ ์ ๊ฐ ์๊ธฐํ์ธ ๋ฐฉ์์ ์ด๋ก ์ ๊ทผ๊ฑฐ๋ฅผ ์ ๊ณตํ๋ค.
๊ธฐ๋ฐ ์ฐ๊ตฌ
์๊ธฐ ๊ฒ์ฆ, ๊ท๋ฉ/์ฐ์ญ/๊ท์ถ์ ์ถ๋ก ๊ตฌ์กฐ ๋ฑ LLM ๊ธฐ๋ฐ ๊ณผํ์ ๋ฐ๊ฒฌ ํ๋ ์์ํฌ์ ์ด๋ก ์ ๊ธฐ๋ฐ์ด ๋๋ค.
๋ค๋ฅธ ์ ๊ทผ
์๋ฌผ์ํ ๋ถ์ผ์์ LLM์ ํ๊ฐ ๋ฌธ์ ๋ฅผ ํด๊ฒฐํ๋ ๋ค๋ฅธ ์ ๊ทผ๋ฒ์ ์ ์ํ๋ค.
๋ค๋ฅธ ์ ๊ทผ
์๊ธฐ๊ฒ์ฆ ๋ฉ์ปค๋์ฆ์ ํ์ฉํ LLM ์์ด์ ํธ์ ๋ค๋ฅธ ์ ์ฉ ์ฌ๋ก๋ฅผ ์ ์ํ๋ค.
๋ค๋ฅธ ์ ๊ทผ
LLM4GRN ๋
ผ๋ฌธ์ ์ ์ ์ ๊ท์ ๋คํธ์ํฌ์ ์ถ๋ก ๊ณผ์ ์ LLM ๊ธฐ๋ฐ ์์ด์ ํธ๋ฅผ ๋์
ํด, GeneAgent์ ์ ์ฌ ๊ณผ์ ์์ ๋ฌธ์ ์ ์๋ฃจ์
์ ์ฐจ์ด๋ฅผ ๋ณด์ฌ์ค๋๋ค.
๋ค๋ฅธ ์ ๊ทผ
GeneAgent๋ ์ ์ ์ ์ธํธ ๋ถ์์ ์ํ ์
ํ-๊ฒ์ฆ ์์ด์ ํธ๋ก, ๋จ๋ฐฑ์ง/์๋ฌผํ์ ์ํ์ค ๋ถ์ผ์์ AutoProteinEngine๊ณผ ๋ค๋ฅธ ์ ๊ทผ์ผ๋ก ์๋ํ๋ ๊ณผํ ์คํ์ ์ง์ํฉ๋๋ค.
๋ค๋ฅธ ์ ๊ทผ
์ ์ ์ฒด ๋ถ์์ ์ํ AI ์์ด์ ํธ์ ๋ค๋ฅธ ๊ตฌํ ๋ฐฉ๋ฒ์ ๋ค๋ฃจ๋ ๊ด๋ จ ์ฐ๊ตฌ์ด๋ค.
๋ค๋ฅธ ์ ๊ทผ
์๋ฌผ์ํ ๋ฐ์ดํฐ ๋ถ์์ LLM์ ์ ์ฉํ๋ ์ ์ฌํ ์ฐ๊ตฌ์ด๋ค.
๋ค๋ฅธ ์ ๊ทผ
๊ณผํ ์ฐ๊ตฌ์์ LLM ์์ด์ ํธ์ ์ ํ๋ ํฅ์ ๋ฐฉ๋ฒ์ ๋ค๋ฃจ๋ ๊ด๋ จ ์ฐ๊ตฌ์ด๋ค.
๋ค๋ฅธ ์ ๊ทผ
GeneAgent ๋
ผ๋ฌธ์ ์ ์ ์ ์งํฉ ๋ถ์์์ ์๊ธฐ ๊ฒ์ฆ ์ถ๋ก ์ ๊ฐ์กฐํ์ฌ BioMaze์ ์๋ฌผํ ๊ฒฝ๋ก ์ถ๋ก ํ๊ณ์ ๊ทน๋ณต๋ฒ์ ๋น๊ตํ ์ ์์ต๋๋ค.
๋ค๋ฅธ ์ ๊ทผ
์ค๋ฏน์ค ๋ฐ์ดํฐ ๊ธฐ๋ฐ ์๋ฌผํ์ ๋ฐ๊ฒฌ ์๋ํ์ ๊ด๋ จ ์ฐ๊ตฌ์ด๋ค.
๋ค๋ฅธ ์ ๊ทผ
LLM ๊ธฐ๋ฐ ์ ๋คํฑ ๋ถ์์ด ์๋, gene-set ๋ถ์์ ์ํ self-verification language agent ์ ๊ทผ์ ์ ์ํ๋ฏ๋ก ๋ค๋ฅธ ๋ฐฉ์์ ์ ์ ์ ๋ถ์ ์๋ํ์
๋๋ค.
๋ค๋ฅธ ์ ๊ทผ
371๋ฒ ๋
ผ๋ฌธ์ LLM์ ์๊ธฐ ๊ฒ์ฆ ๋ฉ์ปค๋์ฆ์ ์ด์ฉํด ์ ์ ์ ์ธํธ ๋ถ์์ ํ๋ฉฐ, 681๋ฒ์์ ๋ค์ค AI ๊ธฐ๋ฐ ์๋ฌผ์ง์ ์ถ์ถ๋ฒ๊ณผ ๋น๊ตํด๋ณผ ๋งํ ๋์์ ์ ๋ต์ ์ ๊ณตํ๋ค.
๋ค๋ฅธ ์ ๊ทผ
๋จ๋ฐฑ์ง/์ ์ ์ ๋ณด ๋ถ์์์ ์์ด์ ํธ ํ๋ ์์ํฌ๊ฐ ๋ฐ์ดํฐ ๋์ญํ์ ํด์ํ๋ ๋ฐฉ์๊ณผ ๋น๊ตํ ์ ์์.
๋ค๋ฅธ ์ ๊ทผ
์๊ธฐ๊ฒ์ฆ ๋ฉ์ปค๋์ฆ์ ํตํด ๋๋ฉ์ธ ํนํ ๊ณผํ ๋ถ์์ ์ ๊ทผํ๋ GeneAgent๋ Co-Scientist์ ์๊ธฐ๋นํ ๋ฃจํ์ ๋์กฐ์ ์ธ ๋ฐฉ์์ผ๋ก ๋ณผ ์ ์๋ค.
ํ์ ์ฐ๊ตฌ
371๋ฒ ๋
ผ๋ฌธ์ PaperRobot์ด ๋ค๋ฃฌ ์๋ ๋
ผ๋ฌธ ์์ฑ๊ณผ ์ ์ฌํ๊ฒ, LLM ๊ธฐ๋ฐ์ ์ ์ ์ ์ ๋ณด ๋ถ์์ ์๋ํํ๋ ์๋ก์ด ์์ฉ ์ฌ๋ก๋ฅผ ์ ์ํฉ๋๋ค.
ํ์ ์ฐ๊ตฌ
์๋ช
๊ณผํ ๋ถ์ผ์์ LLM์ ์ธ์ฉ ๊ธฐ๋ฐ ์ฌ์คํ์ธยท๊ฒ์ฆ ๋ฉ์ปค๋์ฆ์ ์ข
ํฉ์ ์ผ๋ก ๋ถ์ํ๋ค.
ํ์ ์ฐ๊ตฌ
Agent K ์ญ์ ์๊ธฐ๊ฒ์ฆ, ์๊ธฐ์กฐ์งํ ๋ฉ์ปค๋์ฆ์ ๋์
ํ LLM ๊ธฐ๋ฐ ๋ฐ์ดํฐ์ฌ์ด์ธ์ค ์์ด์ ํธ๋ก, GeneAgent ์์คํ
์ ํ์ฅ์ ๋
ผ์๋ฅผ ์ ๊ณตํฉ๋๋ค.
ํ์ ์ฐ๊ตฌ
Co-Scientist์ ๋ฐ๋ณต์ ๊ฐ์ค ํ๊ฐ์ ์๊ธฐ๋นํ ๋ฃจํ์ ์ ์ฌํ๊ฒ, GeneAgent๋ ์๊ธฐ๊ฒ์ฆ ๊ธฐ๋ฐ ๊ณผํ ๋ฐ๊ฒฌ์ ์ค์ ๊ตฌํ์ ๋ณด์ฌ์ค๋ค.
์์ฉ ์ฌ๋ก
371๋ฒ๊ณผ ๊ฐ์ด LLM ๊ธฐ๋ฐ ๊ณผํ ๋๊ตฌ ์๋ํ ๋ฐ ์๋ฃ ์๋๋ฆฌ์ค ์ ์ฉ ์ฐ๊ตฌ๋ 624๋ฒ์ ํ์ค ์์ ์ ์ฉ์ฑ์ ์ค์ง์ ์ฐธ๊ณ ์๋ฃ๊ฐ ๋๋ค.
์์ฉ ์ฌ๋ก
๊ฐ์ค ๊ฒ์ฆ๊ณผ ์๊ธฐ๊ฒ์ฆ ๋ฉ์ปค๋์ฆ ์ ์ฉ์ด ์ค์ ์ ์ ์ ์งํฉ ๋ถ์์ ์ด๋ป๊ฒ ์ ์ฉ๋๋์ง ๊ตฌ์ฒด์ ์ฌ๋ก๋ก ์ฐธ๊ณ ๋๋ค.
์์ฉ ์ฌ๋ก
371๋ฒ SciAgent ๋
ผ๋ฌธ์์๋ ๋ค์ค ์์ด์ ํธ LLM ๊ธฐ๋ฐ ์๋ฌผ์๋ฃ ๋๊ตฌ ์๋ํ๊ฐ ์ฃผ์ ๋ด์ฉ์ผ๋ก, 606๋ฒ๊ณผ ๊ฐ์ ์ค ์์ ์๋๋ฆฌ์ค์ ์ ์ฉ ๊ฐ๋ฅํ๋ค.