Essence
Figure 2. The components of the Deep Thought agentic system. The optional agents are colored gray. The arrows
๋ณธ ๋
ผ๋ฌธ์ AI ์์ด์ ํธ๊ฐ ์ฝ๋ฌผ ๋ฐ๊ฒฌ ํ์ดํ๋ผ์ธ์ ์ค๊ณํ๊ณ ๊ตฌํํ ์ ์๋์ง ํ๊ฐํ๊ธฐ ์ํด DO Challenge๋ผ๋ ๋ฒค์น๋งํฌ๋ฅผ ์ ์ํ๋ค. ์ด๋ ๋ฐฑ๋ง ๊ฐ์ ๋ถ์ ๊ตฌ์กฐ ์ค์์ ์ ๋งํ ํ๋ณด๋ฅผ ์๋ณํ๋ virtual screening ๊ณผ์ ๋ฅผ ํตํด ์์ด์ ํธ์ ์ ๋ต์ ์์ฌ๊ฒฐ์ , ๋ชจ๋ธ ์ ํ, ์ฝ๋ ๊ฐ๋ฐ ๋ฅ๋ ฅ์ ์ข
ํฉ์ ์ผ๋ก ํ๊ฐํ๋ค.
Evaluation
Novelty: 4/5 Technical Soundness: 4/5 Significance: 4/5 Clarity: 4/5 Overall: 4/5
์ดํ: ๋ณธ ๋
ผ๋ฌธ์ ์ฝ๋ฌผ ๋ฐ๊ฒฌ์์ AI ์์ด์ ํธ์ ์ข
ํฉ์ ๋ฅ๋ ฅ์ ํ๊ฐํ๋ ์ฒซ ๋ฒ์งธ ๋ฒค์น๋งํฌ๋ฅผ ์ ์ํ๊ณ competitive deep thought agentic system์ ๊ตฌํํ์ฌ ์๋ฏธ ์๋ ๊ธฐ์ฌ๋ฅผ ํ๋ค. ๋ค๋ง ์๊ฐ ๋ฌด์ ํ ์กฐ๊ฑด์์์ ํ์ ํ ์ฑ๋ฅ ๊ฒฉ์ฐจ, ๋์ ๋ถ์์ ์ฑ, ๋จ์ผ ๋ฌธ์ ๊ธฐ๋ฐ ํ๊ฐ์ ํ๊ณ๊ฐ ์ค๋ฌด ์ ์ฉ ๊ฐ๋ฅ์ฑ์ ์ ํํ๋ค. ๊ทธ๋ผ์๋ ๋ถ๊ตฌํ๊ณ ์ด ์ฐ๊ตฌ๋ agentic AI์ ๊ณผํ ์์ฉ ๊ฐ๋ฅ์ฑ์ ๊ตฌ์ฒด์ ์ผ๋ก ๋ณด์ฌ์ฃผ๋ ์ ๋์ ์์
์ด๋ค.
๊ฐ์ด ๋ณด๋ฉด ์ข์ ๋
ผ๋ฌธ
๋ค๋ฅธ ์ ๊ทผ
์์ํ ์ฐ๊ตฌ ์๋ํ๋ฅผ ์ํ AI ์์ด์ ํธ์ ์ค๊ณ ์์น๊ณผ ํ๊ฐ๋ฅผ ๋ค๋ฃจ๋ ์ ์ฌํ ์ฐ๊ตฌ์ด๋ค.
๋ค๋ฅธ ์ ๊ทผ
๊ฐ ๋
ผ๋ฌธ ๋ชจ๋ LLM ๊ธฐ๋ฐ ๋ฉํฐ์์ด์ ํธ ์ฐ๊ตฌ ์๋ํ(๋ฐ์ดํฐ ๊ณผํ vs. ์ ์ฝ ๊ฐ๋ฐ)๋ฅผ ์ค์ ๋ฐ์ดํฐ๋ก ์
์ฆํ๋ฉฐ ๋ฌธ์ ์ ์ฉ ๋ถ์ผ๋ง ๋ค๋ฆ
๋๋ค.
๋ค๋ฅธ ์ ๊ทผ
์ ์ฝ ๋ฐ๊ฒฌ์ ํฌํจํ ์์ํ ์ฐ๊ตฌ ์ํฌํ๋ก์ฐ ์๋ํ๋ฅผ ์ํ ํฌ๊ด์ AI ์์ด์ ํธ ์์คํ
์ ์ ์ํ๋ค.
๋ค๋ฅธ ์ ๊ทผ
๋ณต์กํ ์ ์ฝ ๋ฐ๊ฒฌ ๊ณผ์ ์์ LLM ์์ด์ ํธ์ ์ถ๋ก ๋ฐ ๊ณํ ๋ฅ๋ ฅ์ ํ๊ฐํ๋ ๊ด๋ จ ๋
ผ๋ฌธ์ด๋ค.
๋ค๋ฅธ ์ ๊ทผ
์ ์ฝ ๊ฐ๋ฐ ํ์ดํ๋ผ์ธ์ ์๋ํํ๊ธฐ ์ํ ์ ์ฒด ์คํ์ค ์ค์ผ์คํธ๋ ์ด์
ํ๋ซํผ์ ๋ํ ์ ๊ทผ์ผ๋ก Deep Thought์ ๋น๊ต ์ฐ๊ตฌํ ์ ์์ต๋๋ค.
๋ค๋ฅธ ์ ๊ทผ
177์ LLM ๊ธฐ๋ฐ ์ฝ๋ฌผ๊ฐ๋ฐ ์๋ํ์ 351์ ์ ๊ณผ์ ์๋ํ ์ ์ฝ์ค๊ณ ๋ฉํฐ์์ด์ ํธ ์์คํ
์ ๋ชฉํ๋ ๋น์ทํ์ง๋ง, ์ค์ ๊ตฌํ ๋ฐฉ๋ฒ๊ณผ ํ์ดํ๋ผ์ธ ์ค์ผ์ผ์ ์ฐจ์ด๊ฐ ์์ต๋๋ค.
๋ค๋ฅธ ์ ๊ทผ
AI ์์ด์ ํธ๊ฐ ์ ์ฝ๊ฐ๋ฐ ํ์ดํ๋ผ์ธ์ ์ค์ค๋ก ์ค๊ณยท์คํํ๋ ์ ๊ทผ์ผ๋ก, ์ธ๋ฌธ์ฌํ ๋ถ์ผ๊ฐ ์๋ ์์ฐ๊ณผํ ๋ฌธ์ ์ ์ฉ์ ์ฌ๋ก์ ๋์์
๋๋ค.
๋ค๋ฅธ ์ ๊ทผ
์๋ฃ ์ฐ๊ตฌ ๋
ผ๋ฌธ ์์ฑ๊ณผ ์ ์ฝ๋ฐ๊ฒฌ ์๋ํ๋ผ๋ ๊ฐ๊ฐ LLM ๊ธฐ๋ฐ ๋ฉํฐ์์ด์ ํธ ์์คํ
์ ์ ์ฉ ์ฌ๋ก๋ฅผ ์๋ก ๋น๊ตํ ์ ์์ต๋๋ค.
๋ค๋ฅธ ์ ๊ทผ
์ ์ฝ ๋ฐ๊ฒฌ ๊ณผ์ ์์ ๋ฉํฐ-์์ด์ ํธ ์์คํ
์ ์ฑ๋ฅ๊ณผ ์์จ์ฑ์ ํ๊ฐํ๋ ๊ด๋ จ ๋ฒค์น๋งํฌ ์ฐ๊ตฌ์ด๋ค.
๋ค๋ฅธ ์ ๊ทผ
Virtual Lab ๋
ผ๋ฌธ์ ์ ์ฝ ํ๋ณด(Nanobody) ์ค๊ณ ๋ฑ ์ค์ ๋ฌธ์ ํ๊ฒฝ์์ LLM์์ด์ ํธ์ ํ์
๊ฒฐ๊ณผ๋ฅผ ๊ฒ์ฆํ๋ ๋์ฒด์ ์์ฉ ์ฐ๊ตฌ์
๋๋ค.
๋ค๋ฅธ ์ ๊ทผ
LLM ๊ธฐ๋ฐ ์์จ ์์ด์ ํธ๊ฐ ์ ์ฝ ๋ฐ๊ฒฌ ํ์ดํ๋ผ์ธ์ ๋
๋ฆฝ์ ์ผ๋ก ์ค๊ณํ๋ ์ ์ฌํ ์ ๊ทผ๋ฒ์ ์ฐ๊ตฌํ๋ค.
๋ค๋ฅธ ์ ๊ทผ
Can AI agents design and implement drug discovery pipelines? ๋
ผ๋ฌธ์ ๊ธ๋ก๋ฒ ์ ์ฝ ๋ฐ๊ตด ํ์ดํ๋ผ์ธ์ ์๋ํ์ ์ง์ญ์ ํ๊ณ๋ฅผ ๋์ด์ AI ์ ์ฉ์ ๋ค๋ฃจ์ด, Hunt Globally์ ์ค์ ํ์ฅ ์ฌ๋ก์ ๋ง๋ฟ์ ์์ต๋๋ค.
๋ค๋ฅธ ์ ๊ทผ
AI๊ฐ ์ฝ๋ฌผ ํ์ ๋ฐ ์คํ ์๋ํ ํ์ดํ๋ผ์ธ์ ์ค๊ณยท๊ตฌํํ๋ ์ฐ๊ตฌ๋ก, ์์จ ์คํ์ค์ ๊ตฌ์ฑ์์ ์ค๊ณ ์ธก๋ฉด์์ ๋น๊ต ์ฐ๊ตฌ๊ฐ ๊ฐ๋ฅํฉ๋๋ค.
ํ์ ์ฐ๊ตฌ
177์์ ์ ์ํ DO Challenge ๋ฐ Deep Thought์ ์คํจ์ฑ์ 290 ๋
ผ๋ฌธ์ ์๋ํ๋ LLM ๊ธฐ๋ฐ ์ ์ฝ ๋ฐ๊ฒฌ ์์คํ
์ฌ๋ก์์ ํ์ฅ์ ์ผ๋ก ๊ฒํ ๋ฉ๋๋ค.
ํ์ ์ฐ๊ตฌ
์ฝ๋ฌผ ๋ฐ๊ฒฌ ๋ถ์ผ์์ LLM ๊ธฐ๋ฐ ํ์
(๋๊ตฌํฉ์ฑ) ์์คํ
์ ํ๊ตฌํ๋ฉฐ AI ์ฐ๊ตฌ์์ ์ค์ ํ์ฉ ๋ฐฉ์์ ํ์ฅํฉ๋๋ค.
์์ฉ ์ฌ๋ก
177์์ ์ ์๋ ์ฝ๋ฌผ ๊ฐ๋ฐ ์๋ํ ํ์ดํ๋ผ์ธ ๋ฌธ์ ์ ์ค์ ํ๋์จ์ด์ ์คํ์ด 3265์ ์ง๋ฅํ ์ํ ์ฝ๋ฌผ์ ๋ฌ์ฅ์น ์ฐ๊ตฌ๋ก ์ด์ด์ง๋๋ค.
์์ฉ ์ฌ๋ก
177๋ฒ ๋
ผ๋ฌธ์ AI ์์ด์ ํธ๋ฅผ ์ด์ฉํด ์ ์ฝ ๊ฐ๋ฐ ํ์ดํ๋ผ์ธ์ ์๋ ์ค๊ณํ๋ ํ๋ ์์ํฌ๋ฅผ ์ ์ํด, 3269๋ฒ์ ์๋ํฐ์ค์ ํ์ฑ ์์ธก์ด ์ค์ ์ฒจ๋จ ์์ฝํํ ์ค๊ณ์ ์ฐ์ผ ์ ์์์ ๋ณด์ฌ์ค๋๋ค.