์ ์: Tony Feng, Trieu H. Trinh, Garrett Bingham, Dawsen Hwang, Yuri Chervonyi, Junehyuk Jung, Joonkyung Lee, Carlo Pagano, Sang-hyun Kim, Federico Pasqualotto, Sergei Gukov, Demis Hassabis, Quoc V. Le, Thang Luong | ๋ ์ง: 2026-02-10 | DOI: arXiv:2602.10177 📄 PDF
Essence
์ด ๋
ผ๋ฌธ์ LLM ๊ธฐ๋ฐ์ ์์จ์ ์ํ ์ฐ๊ตฌ ์์ด์ ํธ์ธ Aletheia๋ฅผ ์๊ฐํ๋ฉฐ, AI๊ฐ IMO ์์ค์ ๋ฌธ์ ํด๊ฒฐ์ ๋์ด ์ ๋ฌธ ์ฐ๊ตฌ ์์ค์ ์๋ก์ด ์ํ์ ์ ๋ฆฌ๋ฅผ ๋
๋ฆฝ์ ์ผ๋ก ๋ฐ๊ฒฌํ๊ณ ์ฆ๋ช
ํ ์ ์์์ ์์ฐํ๋ค.
Evaluation
์ดํ: ๋ณธ ๋
ผ๋ฌธ์ ๊ฒฝ์ ์ํ ํด๊ฒฐ์์ ์์จ์ ์ฐ๊ตฌ ๋ฐ๊ฒฌ์ผ๋ก์ ์๋ฏธ ์๋ ์ ํ์ ๋ณด์ฌ์ฃผ๋ฉฐ, ํนํ ํฌ๋ช
ํ ํ๊ฐ ๊ธฐ์ค ์ ์๋ผ๋ ๋ฉํ์ ๊ธฐ์ฌ๊ฐ ์ค์ํ๋ค. ๋ค๋ง ํด๊ฒฐ๋ ๋ฌธ์ ๋ค์ ์ํ์ ์ค์๋๊ฐ ์ ํ์ ์ด๊ณ ํ๊ฐ ๋ฌธ์ ์ ๊ทผ๋ณธ์ ํด๊ฒฐ์ด ๋ฏธํกํ์ฌ, ์ง์ ํ "์ฐ๊ตฌ ์์จ์ฑ"์ ์ฃผ์ฅ์ด ๋ถ๋ถ์ ์ผ๋ก ๊ฒฝ๊ณ๋์ด์ผ ํ๋ค.
๊ฐ์ด ๋ณด๋ฉด ์ข์ ๋
ผ๋ฌธ
๊ธฐ๋ฐ ์ฐ๊ตฌ
์ํ, ๊ณผํ ๋ฑ ์ ๋ฌธ ์ฐ๊ตฌ ์์ญ์์ ๋๊ท๋ชจ ์ธ์ด๋ชจ๋ธ์ ํ์ฉํ๋ ๊ธฐ๋ฐ ๊ธฐ์ ์ด Galactica๋ก๋ถํฐ ๋ฐ์ ๋ ๋งฅ๋ฝ์ ์ดํดํ ์ ์๋ค.
๊ธฐ๋ฐ ์ฐ๊ตฌ
๋ฅ๋ฌ๋์ ํ์ฉํ ์ฆ๋ช
ํ์์ ๋ํ ์ด๋ก ์ ยท๊ธฐ์ ์ ๋ฐฐ๊ฒฝ์ ์ ๊ณตํ์ฌ ์์จ ์ํ ์ฐ๊ตฌ์ ๊ธฐ์ด๋ฅผ ์ดํดํ๋ ๋ฐ ๋์์ด ๋ฉ๋๋ค.
๊ธฐ๋ฐ ์ฐ๊ตฌ
POETRY์ ์๋ ์ ๋ฆฌ ์ฆ๋ช
๋ฐฉ์์ด Aletheia์ ์์จ ์ํ ํ๊ตฌ AI์ ์ํ์ ์ฆ๋ช
๋ฅ๋ ฅ์ ์ด๋ก ์ ๊ธฐ๋ฐ์ ํ์ฑํฉ๋๋ค.
๊ธฐ๋ฐ ์ฐ๊ตฌ
Towards Autonomous Mathematics Research ๋
ผ๋ฌธ์ ์์จ ๊ณผํ ์ฐ๊ตฌ ์์คํ
์ ์ธ๊ฐ-์์ด์ ํธ ์ํธ์์ฉ ๋ฐ ์๋ํ ์์ค์ ๋ํด ์ด๋ก ์ ๋ฐํ์ ์ ๊ณตํ๋ค.
๋ค๋ฅธ ์ ๊ทผ
AI ๊ธฐ๋ฐ ์ํ ์ ๋ฆฌ ์ฆ๋ช
์๋ํ์ ๋์์ ์๋๋ก, AI-๊ตฌ๋ ๊ณต์ ์ฆ๋ช
ํ๋ ์์ํฌ๋ฅผ ๋ค๋ฃน๋๋ค.
๋ค๋ฅธ ์ ๊ทผ
์์จ ์ํ ์ฐ๊ตฌ AI์ ์ค๊ณ ์๋ฆฌ์ ์ค์ ๊ตฌํ, ๋ฏธํด๊ฒฐ ์ ๋ฆฌ ์ฐฝ์ถ ์ฌ๋ก ๋ฑ ๊ฐ๊ธฐ ๋ค๋ฅธ ํ๋ ์์ํฌ๋ฅผ ๋น๊ตํ ์ ์์ต๋๋ค.
ํ์ ์ฐ๊ตฌ
์์จ ์ํ ์ฐ๊ตฌ AI(Aletheia)๋ฅผ ํตํด ์๋ ์ ๋ฆฌ ์ฆ๋ช
๋ชจ๋ธ์ ์ค์ง์ ์ฐ๊ตฌ ์์ฉ์ด ํ์ฅ๋ฉ๋๋ค.
ํ์ ์ฐ๊ตฌ
AI co-scientist ์ฒ ํ๊ณผ ์ค์ ์ ์ํ ์ฐ๊ตฌ ์๋ํ์ ๊ตฌ์ฒด์ ๋ฐ์ ๋ฐฉํฅ ๋ฐ ์คํ ๋ฐฉ๋ฒ์ ์ฌ๋ ์๊ฒ ํ์
ํ ์ ์์ต๋๋ค.
ํ์ ์ฐ๊ตฌ
AI๊ฐ ์ํ ๋ฑ ํน์ ํ๋ฌธ ๋ถ์ผ์์ ๋
๋ฆฝ์ ์ผ๋ก ์ฐ๊ตฌ ํ์ ์ ๋ฌ์ฑํ๋ ์ค์ ์ฌ๋ก๊ฐ AI ๊ธฐ๋ฐ ์ ์ฒด ๊ณผํ ์ฐ๊ตฌํ์ ๋
ผ์์ ์ฐ๊ฒฐ๋๋ค.
ํ์ ์ฐ๊ตฌ
์ด ๋
ผ๋ฌธ ์ญ์ ์ธ๊ณต์ง๋ฅ์ ํตํ ์์จ ์ํ ์ฐ๊ตฌ์ ์ ๋ฐ์ ํ๋ ์์ํฌ๋ฅผ ์ ์ํ๋ฉฐ, 3372์ ์๋ ์ฆ๋ช
ํ์์ ์ํ ์ ์ฒด๋ก ํ์ฅํ๋ค.
์์ฉ ์ฌ๋ก
์ํ, ๊ณผํ ๋ฑ ๊ธฐ์ด๋ถ์ผ์ ์ธ๊ณผ์ ์ถ๋ก ๊ณผ LLM์ ์ฐฝ์์ ์ ์ฉ์ด ์ด๋ป๊ฒ ์ด๋ฃจ์ด์ง๋์ง ์ค์ฌ๋ก์ ํจ๊ป ์ฑ์ฐฐํ ์ ์๋ค.
์์ฉ ์ฌ๋ก
Towards Autonomous Mathematics Research ๋
ผ๋ฌธ์ ์ํ์ ์๋ํ์ ์ค์ ์ฐ๊ตฌ๋ฌธ์ ์ ์ฉ ์ฌ๋ก๋ฅผ ๋ด๊ณ ์์ด, ํฉ๊ธ ์ค๊ณ ์๋ํ์ ์ค์ ์ ์ฉ๊ณผ ๊ต์ฐจ ์ฐธ๊ณ ๋ ์ ์๋ค.
์์ฉ ์ฌ๋ก
LLM์ ๊ณผํ ๋ถ์ผ๋ณ ์ค์ ์์ฉ์ฌ๋ก(์ํ์ ๋ฐ๊ฒฌ ์๋ํ)๊ฐ ์ข
ํฉ ์๋ฒ ์ด์์ ๋ค๋ฃจ๋ ํ์ ์ ์ฐ๊ตฌ ๋ฐฉํฅ๊ณผ ์ฐ๊ฒฐ๋ฉ๋๋ค.
์์ฉ ์ฌ๋ก
Towards Autonomous Mathematics Research ๋
ผ๋ฌธ์ ์ ์ ํ๋ก๊ทธ๋๋ฐ ๋ฐ LLM์ ํตํ ์์ ๋ฐ๊ฒฌ์ ์์จํ ์ฐ๊ตฌ ์ค์ ์ฌ๋ก๋ฅผ ์ ๊ณตํฉ๋๋ค.