์ ์: Eser Aygรผn, Anastasiya Belyaeva, Gheorghe Comanici, Marc Coram, Hao Cui, Jake Garrison, Renee Johnston, Anton Kast, Cory Y. McLean, Peter Norgaard, Zahra Shamsi, David Smalling, James Thompson, Subhashini Venugopalan, Brian P. Williams, Chujun He, Sarah Martinson, Martyna Plomecka, Lai Wei, Yuchen Zhou, Qian-Ze Zhu, Matthew Abraham, Erica Brand, Anna Bulanova, Jeffrey A. Cardille, Chris Co, Scott Ellsworth, Grace Joseph, Malcolm Kane, Ryan Krueger, Johan Kartiwa, Dan Liebling, Jan-Matthis Lueckmann, Paul Raccuglia, Xuefei Julie Wang, Katherine Chou, James Manyika, Yossi Matias, John C. Platt, Lizzie Dorfman, Shibl Mourad, Michael P. Brenner | ๋ ์ง: 2026-05-19 | DOI: 10.1038/s41586-026-10658-6 📄 PDF
Essence
Figure 1 | Schematic and performance of ERA. a, Schematic of ERA algorithm. A scorable task,
ERA๋ LLM๊ณผ Tree Search๋ฅผ ๊ฒฐํฉํ์ฌ ๊ณผํ์ ๊ณ์ฐ ์คํ์ ์ํ ์ ๋ฌธ๊ฐ ์์ค์ ์ํํธ์จ์ด๋ฅผ ์๋์ผ๋ก ์์ฑํ๋ AI ์์คํ
์ผ๋ก, ์ฐ๊ตฌ ์์ด๋์ด๋ฅผ ํตํฉํ์ฌ ๋ค์ํ ๊ณผํ ๋ถ์ผ์์ ์ต์ฒจ๋จ ์ฑ๋ฅ์ ๋ฌ์ฑํ๋ค.
Evaluation
Novelty: 4/5 Technical Soundness: 3/5 Significance: 4/5 Clarity: 4/5 Overall: 4/5
์ดํ: ERA๋ LLM๊ณผ Tree Search๋ฅผ ๊ฒฐํฉํ์ฌ ๊ฒฝํ์ ์ํํธ์จ์ด ๊ฐ๋ฐ์ ์๋ํํ๋ ํ์ ์ ์์คํ
์ผ๋ก, ์๋ฌผ์ ๋ณดํ๋ถํฐ ์ญํ๊น์ง ๋ค์ํ ๊ณผํ ๋ถ์ผ์์ ์ต์ฒจ๋จ ์ฑ๋ฅ์ ๋ฌ์ฑํจ์ผ๋ก์จ ๊ณผํ์ ๋ฐ๊ฒฌ ์ฌ์ดํด์ ๊ฐ์ํํ ์ ์๋ ์ค์ํ ๋ฐ์ ์ ์ ์ํ๋ค.
๊ฐ์ด ๋ณด๋ฉด ์ข์ ๋
ผ๋ฌธ
๊ธฐ๋ฐ ์ฐ๊ตฌ
469๋ LLM์ ์งํ์ ์ต์ ํ์ ํต์ฌ ์ฐ์ฐ์๋ก ํ์ฉํ๋ ๊ธฐ๋ณธ ์์ด๋์ด๋ฅผ ์ ์ํ๋ฉฐ, ERA ์์คํ
์ ์ํ์ ์คํ์๋ํ ์ ๊ทผ์ ํต์ฌ ์ด๋ก ์ ๊ธฐ๋ฐ์ด ๋๋ค.
๊ธฐ๋ฐ ์ฐ๊ตฌ
230์ ์คํ์์ค ์ฝ๋ ๋ผ๋ง(LLM ๊ธฐ์ด ๋ชจ๋ธ)๋ฅผ ์๊ฐํด, 3288์ LLM+ํธ๋ฆฌ์์น ๊ธฐ๋ฐ ์ํํธ์จ์ด ์์ฑ AI์ ๊ธฐ์ ์ ยท๋ฐ์ดํฐ์ ๊ธฐ๋ฐ์ ์ ๊ณตํ๋ค.
๊ธฐ๋ฐ ์ฐ๊ตฌ
LLM ๊ธฐ๋ฐ ์์ด์ ํธ์ ์ฝ๋ ์์ฑ ๋ฐ ์คํ ์๋ํ ๋ฅ๋ ฅ ํ๋ณด์ ํ์ํ ํต์ฌ ์ด๋ก ๊ณผ ํ๊ฐ ๋ฐฉ๋ฒ์ ์ ์ํด 3288 ์์คํ
์ ๊ธฐ์ด๊ฐ ๋ฉ๋๋ค.
๊ธฐ๋ฐ ์ฐ๊ตฌ
AI๊ฐ ์ ๋ฌธ์ ์ธ ๊ฒฝํ์ ์ฐ๊ตฌ ๊ฒฐ๊ณผ ์์ธก ๋
ผ๋ฌธ ์ด์ ์์ฑ ๋ฐ ํ๊ฐ ์ง์์ ์ด๋ป๊ฒ ํ์ฉ๋ ์ ์๋์ง ์ค์ฆ ์ฐ๊ตฌ๋ก, outcome prediction ์๋ํ ๋งฅ๋ฝ์ ๊ธฐ์ด๊ฐ ๋ฉ๋๋ค.
๋ค๋ฅธ ์ ๊ทผ
๊ณผํโง๊ณตํ ์ฝ๋ ์์ฑ ๋ณด์กฐ๋ฅผ ์ํ LLM ์ฝํ์ผ๋ฟ์ ๋ค๊ฐ์ ๊ธฐ๋ฅ๊ณผ ์ค์ ์ฌ๋ก๋ฅผ ๋น๊ตํด๋ณผ ์ ์์.
๋ค๋ฅธ ์ ๊ทผ
362๋ SW ์์ง๋์ด๋ง์ ์ํ LLM ๊ธฐ๋ฐ ์์ด์ ํธ ์ ๋ฐ์ ๋ฆฌ๋ทฐํ์ฌ, 3288์ ๊ณผํ SW ์์ฑ AI ์ฌ๋ก์ ๋ค์ํ ์๋ํ ์์คยท์ ๋ต ๋น๊ต๋ฅผ ๊ฐ๋ฅ์ผ ํ๋ค.
๋ค๋ฅธ ์ ๊ทผ
AI ์ฝ๋ ์๋์์ฑ ๋ฐ ๊ฒ์ฆ ์์คํ
์ ํ์ง๊ณผ ์ฑ์ฅ ๋ถ์ ๋
ผ๋ฌธ์ผ๋ก, ์ ๋ฌธ๊ฐ ์์ค ์คํ ์ํํธ์จ์ด ์์ฑ ์ฐ๊ตฌ์ ๊ฒฐ๊ณผ ๋น๊ต๊ฐ ๊ฐ๋ฅํฉ๋๋ค.
๋ค๋ฅธ ์ ๊ทผ
3288์ LLM์ ๊ทธ๋ํ ๊ด๋ จ ์ถ๋ก ๋ฅ๋ ฅ์ ํ๊ฐํ๋ ๋ค๋ฅธ ๋ฒค์น๋งํฌ๋ฅผ ์ ์ํ์ฌ GraphInstruct์ ๋์์ ์ผ๋ก ๋น๊ต๋๋ค.
ํ์ ์ฐ๊ตฌ
LLM ๊ธฐ๋ฐ ์๋ ๊ณผํ ์คํยท๋ฐ๊ฒฌ์ ์๋ํฌ์๋ ์๋ํ ์์คํ
์ ๋ฐ์ ๋ฐฉํฅ์ ๋ณด์ฌ์ค.
ํ์ ์ฐ๊ตฌ
LLM ์ถ๋ก ์์ ์ค์ ์์จ ์์ด์ ํธ๋ก์ ํ์ฅ ๋ฐ ์๋ฆฌ ์ฐจ์ด๋ฅผ ์ข
ํฉ์ ์ผ๋ก ๋ถ์ํ๋ฏ๋ก, 3288์ ์ค์ ์์ฉ ๋ฐ ๋ฐ์ ๋ฐฉํฅ์ ๋ชจ์ํ ์ ์์ต๋๋ค.
์์ฉ ์ฌ๋ก
344์์ ์๊ฐํ๋ ์ฝ๋ฉ, ์คํ ์๋ํ ๋ฑ ๋ฐ์ด์ค์ธํฌ๋ฉํฑ์ค ๊ธฐ์ด๋ชจ๋ธ ํ์ฉ ์ฌ๋ก๋ ERA ์์คํ
์ด ๋ค์ํ ๋๋ฉ์ธ ์คํ ์๋ํ์ ์ ์ฉ๋์ด ์ต์ฒจ๋จ ์ฑ๋ฅ์ ๋ด๋ ์ค์ ์ปจํ
์คํธ๋ฅผ ์ ๊ณตํ๋ค.