MerLean: An Agentic Framework for Autoformalization in Quantum Computation

์ €์ž: Yuanjie Ren, Jinzheng Li, Yidi Qi | ๋‚ ์งœ: 2026-02-18 | DOI: ๋ฏธ์ œ๊ณต 📄 PDF


Essence

Figure 1

MerLean ์•„ํ‚คํ…์ฒ˜: LaTeX ๋…ผ๋ฌธ์—์„œ ๋ช…์ œ๋ฅผ ์ถ”์ถœํ•˜๊ณ  Lean 4๋กœ ํ˜•์‹ํ™”ํ•œ ํ›„ ๋‹ค์‹œ LaTeX๋กœ ๋ณ€ํ™˜ํ•˜๋Š” ์–‘๋ฐฉํ–ฅ ์ž๋™ํ˜•์‹ํ™” ํ”„๋ ˆ์ž„์›Œํฌ

๋ณธ ๋…ผ๋ฌธ์€ ์–‘์ž๊ณ„์‚ฐ ์ด๋ก  ๋…ผ๋ฌธ์„ ์ž๋™์œผ๋กœ ๊ธฐ๊ณ„๊ฒ€์ฆ ๊ฐ€๋Šฅํ•œ Lean 4 ์ฝ”๋“œ๋กœ ๋ณ€ํ™˜ํ•˜๋Š” ์™„์ „ ์ž๋™ํ™” ์—์ด์ „ํŠธ ํ”„๋ ˆ์ž„์›Œํฌ MerLean์„ ์ œ์‹œํ•œ๋‹ค. 3๊ฐœ ์–‘์ž๊ณ„์‚ฐ ๋…ผ๋ฌธ์—์„œ 114๊ฐœ ๋ช…์ œ๋กœ๋ถ€ํ„ฐ 2,050๊ฐœ Lean ์„ ์–ธ์„ ์ƒ์„ฑํ•˜๋ฉฐ ์ „์ฒด ๋…ผ๋ฌธ์˜ ์ž๋™ํ˜•์‹ํ™”์— ์„ฑ๊ณตํ–ˆ๋‹ค.

Motivation

Achievement

Figure 2

๋ช…์ œ๋ณ„ ์ปดํŒŒ์ผ ์‹œ๋„ ํšŸ์ˆ˜ ๋ถ„ํฌ: ๋Œ€๋ถ€๋ถ„์˜ ๋ช…์ œ๋Š” 1-10ํšŒ ์‹œ๋„๋กœ ํ•ด๊ฒฐ๋˜์ง€๋งŒ ์žฅ๊ธฐ ๊ผฌ๋ฆฌ๋ฅผ ํ˜•์„ฑํ•˜๋Š” '์–ด๋ ค์šด' ๋ช…์ œ๋“ค์ด ์กด์žฌ

  1. ์™„์ „ ์ž๋™ํ™” ์ „์ฒด ๋…ผ๋ฌธ ํ˜•์‹ํ™”: 3๊ฐœ ์ด์งˆ์  ์–‘์ž๊ณ„์‚ฐ ๋…ผ๋ฌธ(๊ท ํ˜• ๊ณฑ ์ฝ”๋“œ, ๋‚ด๊ฒฐํ•จ ์–‘์ž๊ณ„์‚ฐ, ์–‘์ž์œ„์ƒ์ˆ˜ํ•™)์—์„œ ์ธ๊ฐ„ ๊ฐœ์ž… ์—†์ด 114๊ฐœ ๋ช…์ œ๋ฅผ ๋ชจ๋‘ ํ˜•์‹ํ™” ์„ฑ๊ณต. ํŠนํžˆ ๊ณต๊ฐœ๋˜์ง€ ์•Š์€ ๋ฏธ๋ฐœํ‘œ ์›๊ณ  ํฌํ•จ์œผ๋กœ ํ›ˆ๋ จ ๋ฐ์ดํ„ฐ ์˜ค์—ผ ์™„์ „ ๋ฐฐ์ œ.
  2. ๊ทœ๋ชจ์žˆ๋Š” ํ˜•์‹ํ™” ๊ฒฐ๊ณผ: ์ด 42์‹œ๊ฐ„ ๋‚ด์— 2,050๊ฐœ Lean ์„ ์–ธ ์ƒ์„ฑ (๊ท ํ˜• ๊ณฑ ์ฝ”๋“œ: 14,997ํ–‰/730์„ ์–ธ, ๋‚ด๊ฒฐํ•จ QC: 18,557ํ–‰/923์„ ์–ธ, ์–‘์ž์œ„์ƒ: 7,761ํ–‰/397์„ ์–ธ).
  3. ํˆฌ๋ช…ํ•œ ๊ฐ€์ • ์ฒ˜๋ฆฌ: ๋ฏธํฌํ•จ๋œ Mathlib ๊ธฐ๋Šฅ(์ŠคํŽ™ํŠธ๋Ÿผ ์ˆ˜์—ด, Kรผnneth ๋™ํ˜•์‚ฌ์ƒ)์— ๋Œ€ํ•ด ๋ช…์‹œ์  ๊ณต๋ฆฌ๋กœ ์„ ์–ธํ•˜์—ฌ ์˜๋„์  ๊ฐ€์ •๊ณผ ๋ฏธ์™„์„ฑ ์ฆ๋ช…์„ ๊ตฌ๋ณ„. Balanced Product ๋…ผ๋ฌธ์˜ 9.1%๋งŒ ๊ณต๋ฆฌํ™” ํ•„์š”.
  4. ์–‘๋ฐฉํ–ฅ ๊ฒ€์ฆ ๊ฐ€๋Šฅ์„ฑ: ํ˜•์‹ํ™”๋œ Lean ์ฝ”๋“œ๋ฅผ ๋‹ค์‹œ ์ž์—ฐ์–ธ์–ด๋กœ ๋ณ€ํ™˜ํ•˜์—ฌ ์ธ๊ฐ„ ์ „๋ฌธ๊ฐ€๊ฐ€ ์˜๋ฏธ์  ์ผ๊ด€์„ฑ์„ ๊ฒ€ํ† ํ•  ์ˆ˜ ์žˆ๋Š” blueprint ์ œ๊ณต.

How

Originality

Limitation & Further Study

Evaluation

์ดํ‰: MerLean์€ LLM ์—์ด์ „ํŠธ๊ฐ€ ์ธ๊ฐ„ ๊ฐœ์ž… ์—†์ด ์‹ค์ œ ์—ฐ๊ตฌ ๋…ผ๋ฌธ์„ ๋Œ€๊ทœ๋ชจ๋กœ ํ˜•์‹ํ™”ํ•  ์ˆ˜ ์žˆ์Œ์„ ์ตœ์ดˆ๋กœ ์ž…์ฆํ•œ ์ฃผ๋ชฉํ•  ๋งŒํ•œ ์—ฐ๊ตฌ๋‹ค. ์–‘๋ฐฉํ–ฅ ์„ค๊ณ„๋กœ ๊ธฐ๊ณ„๊ฒ€์ฆ๊ณผ ์ธ๊ฐ„๊ฒ€์ฆ์„ ๊ฒฐํ•ฉํ•˜๋Š” ์‹ค์šฉ์  ์ ‘๊ทผ์ด ์ธ์ƒ์ ์ด๋ฉฐ, ์–‘์ž๊ณ„์‚ฐ์„ ๋„˜์–ด ์ˆ˜ํ•™ยท๋ฌผ๋ฆฌ ์ „๋ฐ˜์œผ๋กœ์˜ ํ™•์žฅ ๊ฐ€๋Šฅ์„ฑ๋„ ๋†’๋‹ค. ๋‹ค๋งŒ ์ƒˆ๋กœ์šด ์ •์˜/๊ณต๋ฆฌ์˜ ์ธ๊ฐ„ ๊ฒ€ํ†  ํ•„์š”์„ฑ, ์ œํ•œ๋œ ํ‰๊ฐ€ ๋ฒ”์œ„, ๋ฏธ๋ช…ํ™•ํ•œ ๊ธฐ์ˆ  ์ƒ์„ธ์‚ฌํ•ญ์ด ๋ณด์™„ ํ•„์š” ์˜์—ญ์ด๋‹ค.

๊ฐ™์ด ๋ณด๋ฉด ์ข‹์€ ๋…ผ๋ฌธ

๊ธฐ๋ฐ˜ ์—ฐ๊ตฌ
์ž๋™ํ™”๋œ ์ •๋ฆฌ ์ฆ๋ช… ๋ฐ LLM์˜ ์ž๋™ ํ˜•์‹ํ™” ๊ธฐ์ดˆ ์•Œ๊ณ ๋ฆฌ์ฆ˜์— ๋Œ€ํ•œ ์ด๋ก ์  ๋ฐ”ํƒ•์„ ์ œ๊ณตํ•ฉ๋‹ˆ๋‹ค.
๊ธฐ๋ฐ˜ ์—ฐ๊ตฌ
์–‘์ž๊ณ„์‚ฐ ๊ณผํ•™๋ฌธ์„œ์˜ ์ž๋™ํ˜•์‹ํ™”(Lean)์—์„œ ํ™•์žฅํ•˜์—ฌ, ์ „์ฒด ์–‘์ž์ƒํƒœ๊ตฐ์˜ ์„ค๊ณ„๋ฒ•์น™๊ณผ ๋ฉ”ํƒ€-์‹คํ—˜ ์ž๋™ํ™”๋ฅผ ์‹คํ˜„ํ•ฉ๋‹ˆ๋‹ค.
๊ธฐ๋ฐ˜ ์—ฐ๊ตฌ
313๋ฒˆ ๋…ผ๋ฌธ์€ AI Scientist์˜ ํ˜์‹  ์ธ์‹ ๋ฉ”์ปค๋‹ˆ์ฆ˜ ํ‰๊ฐ€๋ฅผ ๋‹ค๋ฃจ๋ฉฐ, ์ž๋™ํ˜•์‹ํ™” ๋…ผ๋ฌธ์˜ ๊ฐ€์น˜์™€ ๊ฒ€์ฆ ๊ธฐ์ค€ ๋…ผ์˜์— ์ด๋ก ์  ๋ฐฐ๊ฒฝ์„ ์ œ๊ณตํ•ฉ๋‹ˆ๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
๊ณผํ•™ ๋ฌธํ—Œ์—์„œ ๋ฏธ๋ž˜ ์—ฐ๊ตฌ ๋™ํ–ฅ์„ ์˜ˆ์ธกํ•˜๋Š” ๋‹ค๋ฅธ ๋ฐฉ๋ฒ•๋ก ์„ ์‚ฌ์šฉํ•œ ์—ฐ๊ตฌ์ด๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
532๋Š” ์–‘์ž์ปดํ“จํŒ… ๋…ผ๋ฌธ์˜ ์ž๋™ Lean ์ฝ”๋“œ ๋ณ€ํ™˜, 501์€ ์–‘์ž ์„ผ์„œ ์‹คํ—˜ ์ž๋™ํ™” ์‹œ์Šคํ…œ์œผ๋กœ, ๋ชจ๋‘ LLM ๊ธฐ๋ฐ˜์˜ ์–‘์ž๋ถ„์•ผ ๊ณผํ•™์ž๋™ํ™”์— ๋‹ค๋ฅธ ์‘์šฉ์‚ฌ๋ก€์ž…๋‹ˆ๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
๋ฉ€ํ‹ฐ LLM ๋˜๋Š” specialist ํ™œ์šฉํ•˜์—ฌ ๊ณต์‹ ์ˆ˜ํ•™(์ˆ˜๋ฆฌ ๋…ผ์ฆ) ์ž๋™ํ™” ๋ฌธ์ œ์— ์ ‘๊ทผํ•œ ๋Œ€์•ˆ์  ๋ฐฉ์‹์ž…๋‹ˆ๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
MerLean ๋…ผ๋ฌธ์€ ์ˆ˜ํ•™ ํ˜•์‹์ฃผ์˜์  ๋ฐฉ๋ฒ•์œผ๋กœ ๊ณผํ•™์  ๊ฐœ๋…๊ณผ ์—ฐ๊ตฌ์˜ ์ž๋™ํ™” ๋ฐ ์ž๊ธฐ-๊ณต์‹ํ™” ํ”„๋ ˆ์ž„์›Œํฌ๋ฅผ ์ œ์•ˆํ•˜์—ฌ, ๋ฒ”์ฃผ๋ก  ๊ธฐ๋ฐ˜ ๊ณผํ•™ ์ž๋™ํ™” ์ ‘๊ทผ ๋ฒ•๊ณผ ๋Œ€์กฐ์ ์œผ๋กœ ์‚ดํŽด๋ณผ ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
513๋ฒˆ ๋…ผ๋ฌธ์€ ์ˆ˜ํ•™ ๋…ผ๋ฌธ ์ž๋™ํ˜•์‹ํ™”(Mizar ๋“ฑ)์„ ๋‹ค๋ฃจ๋ฉฐ ๊ฑฐ์‹œ ๋ถ„์•ผ ์ฐจ์ด์—๋„ ๋ถˆ๊ตฌํ•˜๊ณ  ์ž๋™ํ™” ํ”„๋ ˆ์ž„์›Œํฌ์˜ ๊ธฐ์ˆ ์  ์ฐจ๋ณ„์ ์„ ์ œ์‹œํ•ฉ๋‹ˆ๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
AI๋ฅผ ์ด์šฉํ•œ ๋ฏธํ•ด๊ฒฐ ๊ณผํ•™ ๋ฌธ์ œ ์ ‘๊ทผ์„ ๋‹ค๋ฅธ ๋ถ„์•ผ์—์„œ ๋‹ค๋ฃจ๋Š” ์—ฐ๊ตฌ์ด๋‹ค.
ํ›„์† ์—ฐ๊ตฌ
LLM ๊ธฐ๋ฐ˜์˜ ์ž๋™ ํฌ๋ฉ€๋ผ์ด์ œ์ด์…˜ ํ”„๋ ˆ์ž„์›Œํฌ๋กœ, IMO ์ˆ˜์ค€ ๋ฌธ์ œ ์ฆ๋ช… ์ž๋™ํ™”์˜ ๋„์ „๊ณผ ์‹ค์ œ ๊ตฌํ˜„ ๋ฐœ์ „์„ ๋ณด์—ฌ์ค€๋‹ค.
ํ›„์† ์—ฐ๊ตฌ
์ˆ˜ํ•™ ์ž๋™ํ™” ๋ฐ ์ฆ๋ช… ๋ผ์ด๋ธŒ๋Ÿฌ๋ฆฌ ํ™•์žฅ์— ์ดˆ์ ์„ ๋งž์ถ˜ ํ”„๋ ˆ์ž„์›Œํฌ๋กœ, Lego-prover์˜ ํ™œ์šฉ๋„์™€ ๋ฒ”์œ„ ํ™•์žฅ ์‚ฌ๋ก€์— ํ•ด๋‹นํ•ฉ๋‹ˆ๋‹ค.
ํ›„์† ์—ฐ๊ตฌ
532๊ฐ€ ๋…ผ๋ฌธโ†’ํ˜•์‹ Lean ์ฝ”๋“œ ์ž๋™ํ™”๋ผ๋ฉด, 533์€ LLM์„ ํ†ตํ•œ ์–‘์ž์‹คํ—˜ ๋ฉ”ํƒ€-์†”๋ฃจ์…˜ ์ƒ์„ฑ๊ณผ ํ•ด๋ฒ• ํ™•์žฅ์„ฑ์— ์ค‘์ ์„ ๋‘” ํ›„์† ์ ‘๊ทผ์ž…๋‹ˆ๋‹ค.
ํ›„์† ์—ฐ๊ตฌ
834๋ฒˆ ๋…ผ๋ฌธ์€ ๊ณผํ•™ ๋ฐœ๊ฒฌ ์ž๋™ํ™”์—์„œ ์ˆ˜ํ•™ยท์ด๋ก ์  ์—„๋ฐ€์„ฑ์˜ ์—ญํ•  ๋ฐ ํ•œ๊ณ„๋ฅผ ํฌ๊ด„์ ์œผ๋กœ ๋…ผ์˜ํ•˜์—ฌ, 532๋ฒˆ์˜ ์˜๋ฏธ๋ฅผ ๋„“ํ˜€์ค๋‹ˆ๋‹ค.
์‘์šฉ ์‚ฌ๋ก€
์ˆ˜ํ•™ ๊ธฐ๋ฐ˜ ์งˆ์˜์‘๋‹ต(Automated Theorem-driven QA)์— ์—ญ๋Ÿ‰์ด ์‹ค์ œ ์ฆ๋ช… ์ž๋™ํ™” ํ”„๋ ˆ์ž„์›Œํฌ์—์„œ ์–ด๋–ป๊ฒŒ ํ‰๊ฐ€๋˜๋Š”์ง€ ํ™•์ธํ•  ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค.
← ๋ชฉ๋ก์œผ๋กœ ๋Œ์•„๊ฐ€๊ธฐ

๐ŸŽง Audio Overview

์ด ๋…ผ๋ฌธ ๋ฆฌ๋ทฐ๋ฅผ ํŒŸ์บ์ŠคํŠธํ˜• ์˜ค๋””์˜ค๋กœ ์ƒ์„ฑํ•ฉ๋‹ˆ๋‹ค. (Gemini ยท ํ‚ค๋Š” ๋ธŒ๋ผ์šฐ์ €์—๋งŒ ์ €์žฅ ยท ์™„์„ฑ๋ณธ์€ ์ด๋ฉ”์ผ๋กœ๋„ ์ „์†ก)
โ–ธ ๊ณ ๊ธ‰: ๊ตฌ์„ฑ ๋ฐฉํ–ฅ(๋Œ€๋ณธ ์ž‘์„ฑ ์ง€์นจ) ์ง์ ‘ ์ˆ˜์ •