Towards Autonomous Mathematics Research

์ €์ž: Tony Feng, Trieu H. Trinh, Garrett Bingham, Dawsen Hwang, Yuri Chervonyi, Junehyuk Jung, Joonkyung Lee, Carlo Pagano, Sang-hyun Kim, Federico Pasqualotto, Sergei Gukov, Demis Hassabis, Quoc V. Le, Thang Luong | ๋‚ ์งœ: 2026-02-10 | DOI: arXiv:2602.10177 📄 PDF


Essence

์ด ๋…ผ๋ฌธ์€ LLM ๊ธฐ๋ฐ˜์˜ ์ž์œจ์  ์ˆ˜ํ•™ ์—ฐ๊ตฌ ์—์ด์ „ํŠธ์ธ Aletheia๋ฅผ ์†Œ๊ฐœํ•˜๋ฉฐ, AI๊ฐ€ IMO ์ˆ˜์ค€์˜ ๋ฌธ์ œ ํ•ด๊ฒฐ์„ ๋„˜์–ด ์ „๋ฌธ ์—ฐ๊ตฌ ์ˆ˜์ค€์˜ ์ƒˆ๋กœ์šด ์ˆ˜ํ•™์  ์ •๋ฆฌ๋ฅผ ๋…๋ฆฝ์ ์œผ๋กœ ๋ฐœ๊ฒฌํ•˜๊ณ  ์ฆ๋ช…ํ•  ์ˆ˜ ์žˆ์Œ์„ ์‹œ์—ฐํ•œ๋‹ค.

Motivation

Achievement

Figure 1

Figure 1: Aletheia์˜ ์‹œ๊ฐ์  ๊ฐœ์š” - Generator, Verifier, Reviser์˜ ๋ฐ˜๋ณต์  ์ƒํ˜ธ์ž‘์šฉ

Figure 2

Figure 2: 2026๋…„ 1์›” advanced ๋ฒ„์ „์˜ Deep Think๋Š” (a) IMO ์ˆ˜์ค€๊ณผ (b) ๋ฐ•์‚ฌ ์ˆ˜์ค€ ๋ฌธ์ œ์—์„œ ์šฐ์ˆ˜ํ•œ ์Šค์ผ€์ผ๋ง ๋ฒ•์น™์„ ๋ณด์ž„

  1. ์™„์ „ ์ž์œจ์  ์—ฐ๊ตฌ ๋…ผ๋ฌธ: ์ธ๊ฐ„ ๊ฐœ์ž… ์—†์ด ์‚ฐ์ˆ  ๊ธฐํ•˜ํ•™์˜ ๊ณ ์œ ๊ฐ€์ค‘(eigenweights) ๊ณ„์‚ฐ์— ๋Œ€ํ•œ ์ถœํŒ ๊ฐ€๋Šฅํ•œ ๋…ผ๋ฌธ(Feng26) ์ƒ์„ฑ
  2. Erdล‘s ๋ฌธ์ œ ํ•ด๊ฒฐ: Bloom's Erdล‘s Conjectures ๋ฐ์ดํ„ฐ๋ฒ ์ด์Šค์˜ 700๊ฐœ ๋ฏธํ•ด๊ฒฐ ๋ฌธ์ œ ์ค‘ 4๊ฐœ์˜ Erdล‘s ๋ฌธ์ œ๋ฅผ ์ž์œจ์ ์œผ๋กœ ํ•ด๊ฒฐ(์˜ˆ: Erdล‘s-1051), ์„ธ ์ˆ˜์‹ญ ๋…„๊ฐ„ ๋ฏธํ•ด๊ฒฐ์ด์—ˆ๋˜ ๋ฌธ์ œ๋“ค์„ ํฌํ•จ
  3. ํ•˜์ด๋ธŒ๋ฆฌ๋“œ ํ˜‘๋ ฅ: ์ธ๊ฐ„ ์ˆ˜ํ•™์ž์™€์˜ ํ˜‘๋ ฅ์„ ํ†ตํ•ด ๋‹ค์ค‘ ๋…ผ๋ฌธ์— ๊ธฐ์—ฌ(LeeSeo26, FYZ26, ACGKMP26), ์ด์ „ ์ฆ๋ช…์„ ๊ฐœ์„ ํ•˜๋Š” ์ค‘๊ฐ„ ๋ช…์ œ(intermediate propositions) ๋„์ถœ
  4. FirstProof ๋ฒค์น˜๋งˆํฌ: ์ˆ˜ํ•™์ž๋“ค์ด ์ œ์•ˆํ•œ 10๊ฐœ์˜ ์—ฐ๊ตฌ ์ˆ˜์ค€ ๋ฌธ์ œ ์ง‘ํ•ฉ์—์„œ ์ตœ๊ณ  ์„ฑ๋Šฅ ๋‹ฌ์„ฑ

How

Figure 1

Originality

Limitation & Further Study

Evaluation

์ดํ‰: ๋ณธ ๋…ผ๋ฌธ์€ ๊ฒฝ์Ÿ ์ˆ˜ํ•™ ํ•ด๊ฒฐ์—์„œ ์ž์œจ์  ์—ฐ๊ตฌ ๋ฐœ๊ฒฌ์œผ๋กœ์˜ ์˜๋ฏธ ์žˆ๋Š” ์ „ํ™˜์„ ๋ณด์—ฌ์ฃผ๋ฉฐ, ํŠนํžˆ ํˆฌ๋ช…ํ•œ ํ‰๊ฐ€ ๊ธฐ์ค€ ์ œ์‹œ๋ผ๋Š” ๋ฉ”ํƒ€์  ๊ธฐ์—ฌ๊ฐ€ ์ค‘์š”ํ•˜๋‹ค. ๋‹ค๋งŒ ํ•ด๊ฒฐ๋œ ๋ฌธ์ œ๋“ค์˜ ์ˆ˜ํ•™์  ์ค‘์š”๋„๊ฐ€ ์ œํ•œ์ ์ด๊ณ  ํ™˜๊ฐ ๋ฌธ์ œ์˜ ๊ทผ๋ณธ์  ํ•ด๊ฒฐ์ด ๋ฏธํกํ•˜์—ฌ, ์ง„์ •ํ•œ "์—ฐ๊ตฌ ์ž์œจ์„ฑ"์˜ ์ฃผ์žฅ์ด ๋ถ€๋ถ„์ ์œผ๋กœ ๊ฒฝ๊ณ„๋˜์–ด์•ผ ํ•œ๋‹ค.

๊ฐ™์ด ๋ณด๋ฉด ์ข‹์€ ๋…ผ๋ฌธ

๊ธฐ๋ฐ˜ ์—ฐ๊ตฌ
์ˆ˜ํ•™, ๊ณผํ•™ ๋“ฑ ์ „๋ฌธ ์—ฐ๊ตฌ ์˜์—ญ์—์„œ ๋Œ€๊ทœ๋ชจ ์–ธ์–ด๋ชจ๋ธ์„ ํ™œ์šฉํ•˜๋Š” ๊ธฐ๋ฐ˜ ๊ธฐ์ˆ ์ด Galactica๋กœ๋ถ€ํ„ฐ ๋ฐœ์ „๋œ ๋งฅ๋ฝ์„ ์ดํ•ดํ•  ์ˆ˜ ์žˆ๋‹ค.
๊ธฐ๋ฐ˜ ์—ฐ๊ตฌ
๋”ฅ๋Ÿฌ๋‹์„ ํ™œ์šฉํ•œ ์ฆ๋ช… ํƒ์ƒ‰์— ๋Œ€ํ•œ ์ด๋ก ์ ยท๊ธฐ์ˆ ์  ๋ฐฐ๊ฒฝ์„ ์ œ๊ณตํ•˜์—ฌ ์ž์œจ ์ˆ˜ํ•™ ์—ฐ๊ตฌ์˜ ๊ธฐ์ดˆ๋ฅผ ์ดํ•ดํ•˜๋Š” ๋ฐ ๋„์›€์ด ๋ฉ๋‹ˆ๋‹ค.
๊ธฐ๋ฐ˜ ์—ฐ๊ตฌ
POETRY์˜ ์ž๋™ ์ •๋ฆฌ ์ฆ๋ช… ๋ฐฉ์‹์ด Aletheia์˜ ์ž์œจ ์ˆ˜ํ•™ ํƒ๊ตฌ AI์˜ ์ˆ˜ํ•™์  ์ฆ๋ช… ๋Šฅ๋ ฅ์˜ ์ด๋ก ์  ๊ธฐ๋ฐ˜์„ ํ˜•์„ฑํ•ฉ๋‹ˆ๋‹ค.
๊ธฐ๋ฐ˜ ์—ฐ๊ตฌ
Towards Autonomous Mathematics Research ๋…ผ๋ฌธ์€ ์ž์œจ ๊ณผํ•™ ์—ฐ๊ตฌ ์‹œ์Šคํ…œ์˜ ์ธ๊ฐ„-์—์ด์ „ํŠธ ์ƒํ˜ธ์ž‘์šฉ ๋ฐ ์ž๋™ํ™” ์ˆ˜์ค€์— ๋Œ€ํ•ด ์ด๋ก ์  ๋ฐ”ํƒ•์„ ์ œ๊ณตํ•œ๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
AI ๊ธฐ๋ฐ˜ ์ˆ˜ํ•™ ์ •๋ฆฌ ์ฆ๋ช… ์ž๋™ํ™”์˜ ๋Œ€์•ˆ์  ์‹œ๋„๋กœ, AI-๊ตฌ๋™ ๊ณต์‹ ์ฆ๋ช… ํ”„๋ ˆ์ž„์›Œํฌ๋ฅผ ๋‹ค๋ฃน๋‹ˆ๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
์ž์œจ ์ˆ˜ํ•™ ์—ฐ๊ตฌ AI์˜ ์„ค๊ณ„ ์›๋ฆฌ์™€ ์‹ค์ œ ๊ตฌํ˜„, ๋ฏธํ•ด๊ฒฐ ์ •๋ฆฌ ์ฐฝ์ถœ ์‚ฌ๋ก€ ๋“ฑ ๊ฐ๊ธฐ ๋‹ค๋ฅธ ํ”„๋ ˆ์ž„์›Œํฌ๋ฅผ ๋น„๊ตํ•  ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค.
ํ›„์† ์—ฐ๊ตฌ
์ž์œจ ์ˆ˜ํ•™ ์—ฐ๊ตฌ AI(Aletheia)๋ฅผ ํ†ตํ•ด ์ž๋™ ์ •๋ฆฌ ์ฆ๋ช… ๋ชจ๋ธ์˜ ์‹ค์งˆ์  ์—ฐ๊ตฌ ์‘์šฉ์ด ํ™•์žฅ๋ฉ๋‹ˆ๋‹ค.
ํ›„์† ์—ฐ๊ตฌ
AI co-scientist ์ฒ ํ•™๊ณผ ์‹ค์ œ์  ์ˆ˜ํ•™ ์—ฐ๊ตฌ ์ž๋™ํ™”์˜ ๊ตฌ์ฒด์  ๋ฐœ์ „ ๋ฐฉํ–ฅ ๋ฐ ์‹คํ˜„ ๋ฐฉ๋ฒ•์„ ์‹ฌ๋„ ์žˆ๊ฒŒ ํŒŒ์•…ํ•  ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค.
ํ›„์† ์—ฐ๊ตฌ
AI๊ฐ€ ์ˆ˜ํ•™ ๋“ฑ ํŠน์ • ํ•™๋ฌธ ๋ถ„์•ผ์—์„œ ๋…๋ฆฝ์ ์œผ๋กœ ์—ฐ๊ตฌ ํ˜์‹ ์„ ๋‹ฌ์„ฑํ•˜๋Š” ์‹ค์ œ ์‚ฌ๋ก€๊ฐ€ AI ๊ธฐ๋ฐ˜ ์ „์ฒด ๊ณผํ•™ ์—ฐ๊ตฌํ˜์‹  ๋…ผ์˜์™€ ์—ฐ๊ฒฐ๋œ๋‹ค.
ํ›„์† ์—ฐ๊ตฌ
์ด ๋…ผ๋ฌธ ์—ญ์‹œ ์ธ๊ณต์ง€๋Šฅ์„ ํ†ตํ•œ ์ž์œจ ์ˆ˜ํ•™ ์—ฐ๊ตฌ์˜ ์ „๋ฐ˜์  ํ”„๋ ˆ์ž„์›Œํฌ๋ฅผ ์ œ์‹œํ•˜๋ฉฐ, 3372์˜ ์ž๋™ ์ฆ๋ช… ํƒ์ƒ‰์„ ์ˆ˜ํ•™ ์ „์ฒด๋กœ ํ™•์žฅํ•œ๋‹ค.
์‘์šฉ ์‚ฌ๋ก€
์ˆ˜ํ•™, ๊ณผํ•™ ๋“ฑ ๊ธฐ์ดˆ๋ถ„์•ผ์— ์ธ๊ณผ์  ์ถ”๋ก ๊ณผ LLM์˜ ์ฐฝ์˜์  ์ ์šฉ์ด ์–ด๋–ป๊ฒŒ ์ด๋ฃจ์–ด์ง€๋Š”์ง€ ์‹ค์‚ฌ๋ก€์™€ ํ•จ๊ป˜ ์„ฑ์ฐฐํ•  ์ˆ˜ ์žˆ๋‹ค.
์‘์šฉ ์‚ฌ๋ก€
Towards Autonomous Mathematics Research ๋…ผ๋ฌธ์€ ์ˆ˜ํ•™์  ์ž๋™ํ™”์™€ ์‹ค์ œ ์—ฐ๊ตฌ๋ฌธ์ œ ์ ์šฉ ์‚ฌ๋ก€๋ฅผ ๋‹ด๊ณ  ์žˆ์–ด, ํ•ฉ๊ธˆ ์„ค๊ณ„ ์ž๋™ํ™”์˜ ์‹ค์ œ ์ ์šฉ๊ณผ ๊ต์ฐจ ์ฐธ๊ณ ๋  ์ˆ˜ ์žˆ๋‹ค.
์‘์šฉ ์‚ฌ๋ก€
LLM์˜ ๊ณผํ•™ ๋ถ„์•ผ๋ณ„ ์‹ค์ œ ์‘์šฉ์‚ฌ๋ก€(์ˆ˜ํ•™์  ๋ฐœ๊ฒฌ ์ž๋™ํ™”)๊ฐ€ ์ข…ํ•ฉ ์„œ๋ฒ ์ด์—์„œ ๋‹ค๋ฃจ๋Š” ํ˜์‹ ์  ์—ฐ๊ตฌ ๋ฐฉํ–ฅ๊ณผ ์—ฐ๊ฒฐ๋ฉ๋‹ˆ๋‹ค.
์‘์šฉ ์‚ฌ๋ก€
Towards Autonomous Mathematics Research ๋…ผ๋ฌธ์€ ์œ ์ „ ํ”„๋กœ๊ทธ๋ž˜๋ฐ ๋ฐ LLM์„ ํ†ตํ•œ ์ˆ˜์‹ ๋ฐœ๊ฒฌ์˜ ์ž์œจํ™” ์—ฐ๊ตฌ ์‹ค์ œ ์‚ฌ๋ก€๋ฅผ ์ œ๊ณตํ•ฉ๋‹ˆ๋‹ค.
← ๋ชฉ๋ก์œผ๋กœ ๋Œ์•„๊ฐ€๊ธฐ

๐ŸŽง Audio Overview

์ด ๋…ผ๋ฌธ ๋ฆฌ๋ทฐ๋ฅผ ํŒŸ์บ์ŠคํŠธํ˜• ์˜ค๋””์˜ค๋กœ ์ƒ์„ฑํ•ฉ๋‹ˆ๋‹ค. (Gemini ยท ํ‚ค๋Š” ๋ธŒ๋ผ์šฐ์ €์—๋งŒ ์ €์žฅ ยท ์™„์„ฑ๋ณธ์€ ์ด๋ฉ”์ผ๋กœ๋„ ์ „์†ก)
โ–ธ ๊ณ ๊ธ‰: ๊ตฌ์„ฑ ๋ฐฉํ–ฅ(๋Œ€๋ณธ ์ž‘์„ฑ ์ง€์นจ) ์ง์ ‘ ์ˆ˜์ •