A survey on deep learning for theorem proving

์ €์ž: Zhaoyu Li, Jialiang Sun, Logan Murphy, Qidong Su, Zenan Li, Xian Zhang, Kaiyu Yang, Xujie Si | ๋‚ ์งœ: 2024 | URL: https://arxiv.org/abs/2404.09939 📄 PDF


Essence

๋ณธ ๋…ผ๋ฌธ์€ ์ •๋ฆฌ ์ฆ๋ช…(Theorem Proving)์— ๋Œ€ํ•œ ์‹ฌ์ธตํ•™์Šต ๊ธฐ๋ฒ•๋“ค์„ ํฌ๊ด„์ ์œผ๋กœ ์กฐ์‚ฌํ•œ ์„œ๋ฒ ์ด ๋…ผ๋ฌธ์œผ๋กœ, ์ž๋™ํ˜•์‹ํ™”, ์ „์ œ ์„ ํƒ, ์ฆ๋ช… ๋‹จ๊ณ„ ์ƒ์„ฑ, ์ฆ๋ช… ํƒ์ƒ‰ ๋“ฑ ์ฃผ์š” ์ž‘์—…๋“ค๊ณผ ๋ฐฉ๋ฒ•๋ก , ๋ฐ์ดํ„ฐ์…‹, ํ‰๊ฐ€ ์ง€ํ‘œ๋ฅผ ์ฒด๊ณ„์ ์œผ๋กœ ์ •๋ฆฌํ•œ๋‹ค.

Motivation

Achievement

How

Figure 2

Figure 2: Top: The informal statement and proof of the Fundamental Theorem of Arithmetic

Originality

Limitation & Further Study

Evaluation

Novelty: 4/5 Technical Soundness: 3/5 Significance: 4/5 Clarity: 4/5 Overall: 4/5

์ดํ‰: ๋ณธ ๋…ผ๋ฌธ์€ ์ •๋ฆฌ ์ฆ๋ช… ๋ถ„์•ผ์˜ ๊นŠ์€ ํ•™์Šต ์‘์šฉ์— ๋Œ€ํ•œ ์ตœ์ดˆ์˜ ํฌ๊ด„์  ์„œ๋ฒ ์ด๋กœ, ๊ธ‰์„ฑ์žฅํ•˜๋Š” ์—ฐ๊ตฌ ๋ถ„์•ผ๋ฅผ ์ฒด๊ณ„์ ์œผ๋กœ ์ •๋ฆฌํ•˜๊ณ  ํ†ต์ผ๋œ ํ”„๋ ˆ์ž„์›Œํฌ๋ฅผ ์ œ๊ณตํ•˜๋Š” ์ค‘์š”ํ•œ ๊ธฐ์—ฌ๋ฅผ ํ•œ๋‹ค. ๋†’์€ ์™„์„ฑ๋„์™€ ๋ช…ํ™•ํ•œ ์„ค๋ช…์œผ๋กœ ํ•ด๋‹น ๋ถ„์•ผ ์—ฐ๊ตฌ์ž๋“ค์˜ ํ•„์ˆ˜ ์ฐธ๊ณ ์ž๋ฃŒ๊ฐ€ ๋  ๊ฒƒ์ด๋‹ค.

๊ฐ™์ด ๋ณด๋ฉด ์ข‹์€ ๋…ผ๋ฌธ

๊ธฐ๋ฐ˜ ์—ฐ๊ตฌ
์ •๋ฆฌ ์ฆ๋ช…์—์„œ ์‹ฌ์ธตํ•™์Šต ์ ‘๊ทผ๋ฒ•์˜ ๊ธฐ์ดˆ์ ์ธ ๋ฐฉ๋ฒ•๋ก ์„ ์ œ๊ณตํ•˜๋Š” ์—ฐ๊ตฌ์ด๋‹ค.
๊ธฐ๋ฐ˜ ์—ฐ๊ตฌ
๋”ฅ๋Ÿฌ๋‹ ๊ธฐ๋ฐ˜ ์ •๋ฆฌ ์ฆ๋ช… ์„œ๋ฒ ์ด ๋…ผ๋ฌธ์œผ๋กœ, POETRY์™€ ๊ฐ™์€ ์ƒˆ๋กœ์šด ์ฆ๋ช… ์‹œ์Šคํ…œ์˜ ์ด๋ก ์  ๊ธฐ๋ฐ˜์„ ์„ค๋ช…ํ•ฉ๋‹ˆ๋‹ค.
๊ธฐ๋ฐ˜ ์—ฐ๊ตฌ
030 ๋…ผ๋ฌธ์€ ๋”ฅ๋Ÿฌ๋‹ ๊ธฐ๋ฐ˜ ์ •๋ฆฌ ์ฆ๋ช…์˜ ์ „์ฒด ๋™ํ–ฅ๊ณผ ๊ธฐ๋ฐ˜ ์ด๋ก ์„ ์„œ์ˆ ํ•˜๋ฉฐ, 489 ๋…ผ๋ฌธ์—์„œ ์ œ์•ˆํ•˜๋Š” ์ƒˆ๋กœ์šด ๋…ผ๋ฆฌ ํ”„๋ ˆ์ž„์›Œํฌ์™€์˜ ์—ฐ๊ด€์„ฑ์„ ํŒŒ์•…ํ•˜๋Š” ๋ฐ ๋„์›€์„ ์ค๋‹ˆ๋‹ค.
๊ธฐ๋ฐ˜ ์—ฐ๊ตฌ
๋”ฅ๋Ÿฌ๋‹์„ ํ†ตํ•œ ์ •๋ฆฌ ์ฆ๋ช… ์ž๋™ํ™” ๊ด€๋ จ ์„œ๋ฒ ์ด๋กœ์„œ ๋ณธ ๋…ผ๋ฌธ์˜ ์ด๋ก ์  ํ† ๋Œ€๋ฅผ ์ œ๊ณตํ•ฉ๋‹ˆ๋‹ค.
๊ธฐ๋ฐ˜ ์—ฐ๊ตฌ
๋”ฅ๋Ÿฌ๋‹์„ ํ™œ์šฉํ•œ ์ฆ๋ช… ํƒ์ƒ‰์— ๋Œ€ํ•œ ์ด๋ก ์ ยท๊ธฐ์ˆ ์  ๋ฐฐ๊ฒฝ์„ ์ œ๊ณตํ•˜์—ฌ ์ž์œจ ์ˆ˜ํ•™ ์—ฐ๊ตฌ์˜ ๊ธฐ์ดˆ๋ฅผ ์ดํ•ดํ•˜๋Š” ๋ฐ ๋„์›€์ด ๋ฉ๋‹ˆ๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
030์˜ ๋”ฅ๋Ÿฌ๋‹ ์ฆ๋ช… ์ž๋™ํ™” ์„œ๋ฒ ์ด์™€ 379์˜ ์ฆ๋ช… ์ƒ์„ฑ ์–ธ์–ด๋ชจ๋ธ ์—ฐ๊ตฌ๋Š” ๊ฐ™์€ ๋ฌธ์ œ๋ฅผ ๊ฐ๊ธฐ ๋ฐฉ๋ฒ•๋ก ยท๋ชจ๋ธ ๊ฐœ๋ฐœ ๊ด€์ ์—์„œ ๋‹ค๋ฃน๋‹ˆ๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
์ž๋™ ์ •๋ฆฌ ์ฆ๋ช…์„ ์œ„ํ•œ ์‹ ๊ฒฝ๋ง ๊ธฐ๋ฐ˜ ์ ‘๊ทผ๋ฒ•์„ ๋‹ค๋ฃจ๋Š” ์œ ์‚ฌํ•œ ์—ฐ๊ตฌ์ด๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
๋”ฅ๋Ÿฌ๋‹์„ ํ™œ์šฉํ•œ ํ˜•์‹์  ์ˆ˜ํ•™ ์ฆ๋ช… ์ž๋™ํ™”๋ฅผ ๋‹ค๋ฃจ๋Š” ์œ ์‚ฌํ•œ ์—ฐ๊ตฌ์ด๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
LLM ๊ธฐ๋ฐ˜ ์ •๋ฆฌ ์ฆ๋ช… ๋ฐ ์ˆ˜ํ•™์  ์ถ”๋ก ์„ ๋‹ค๋ฃจ๋Š” ๊ด€๋ จ ์—ฐ๊ตฌ์ด๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
482๋ฒˆ ๋…ผ๋ฌธ์€ ์ฆ๋ช… ๊ณผ์ •์—์„œ ์‚ฌ๊ณ ์™€ ์ฆ๋ช…์˜ ๊ต์ฐจ์  ํƒ์ƒ‰ ์ „๋žต์„ ์ž๋™ํ™”ํ•˜๋Š” ๋ฐฉ์‹์œผ๋กœ 030์˜ ๋”ฅ๋Ÿฌ๋‹ ์ •๋ฆฌ์ฆ๋ช… ์„œ๋ฒ ์ด์™€ ๋Œ€์กฐ์ ์ž…๋‹ˆ๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
030 ๋…ผ๋ฌธ์€ ๋”ฅ๋Ÿฌ๋‹ ๊ธฐ๋ฐ˜ ์ •๋ฆฌ ์ž๋™ ์ฆ๋ช…(ATP)์˜ ๋‹ค์–‘ํ•œ ์ ‘๊ทผ๊ณผ 568์˜ ๊ณ ์ฐจ๋…ผ๋ฆฌ ์ •๋ฆฌ/์ฆ๋ช… ๋ฐ์ดํ„ฐ ํ•ฉ์„ฑ ๋ฐฉ์‹์˜ ์ฐจ์ด๋ฅผ ๋น„๊ตํ•  ์ˆ˜ ์žˆ๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
์ˆ˜ํ•™ ๊ณต์‹, ๋ฏธ์ง€์ˆ˜ ๋ฐœ๊ฒฌ ๋“ฑ์—์„œ ๋ฏธ๋ถ„๋ฐฉ์ •์‹ยท์ˆ˜๋ฆฌ์  ๊ณต์‹ ํƒ์ƒ‰ ๋“ฑ LLM/ML ๊ธฐ๋ฐ˜ ์ž๋™ํ™”์˜ formal proof ๋ถ„์•ผ ์ ์šฉ์„ ๋ณด์—ฌ์ค˜ 030์˜ ์ž๋™์ •๋ฆฌ์ฆ๋ช…๊ณผ ๋Œ€์•ˆ์  ์ ‘๊ทผ์„ ๋น„๊ตํ•จ.
ํ›„์† ์—ฐ๊ตฌ
808์ด ์ œ์‹œํ•˜๋Š” ๋ฒค์น˜๋งˆํฌ๋Š” 030์˜ ๋”ฅ๋Ÿฌ๋‹ ๊ธฐ๋ฐ˜ ์ •๋ฆฌ ์ฆ๋ช… ๋ฐฉ๋ฒ• ๋…ผ์˜์˜ ์‹ค์ฆ์  ํ‰๊ฐ€ ๋„๊ตฌ๊ฐ€ ๋  ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค.
ํ›„์† ์—ฐ๊ตฌ
513๋ฒˆ ๋…ผ๋ฌธ์€ ์ˆ˜ํ•™์  ๋ฌธํ—Œ์˜ ์ž๋™ ํ˜•์‹ํ™”๋ผ๋Š” ์‹ค์งˆ์  ์‘์šฉ์„ ๋‹ค๋ฃจ๋ฏ€๋กœ 030์˜ ์ด๋ก ์ ยท๊ธฐ๋ฒ• ์„œ๋ฒ ์ด์™€ ์—ฐ๊ณ„ํ•ด ์‹ค์ œ ์˜คํ”ˆ ๋ฌธ์ œ๋กœ์˜ ํ™•์žฅ์„ ๋ณด์—ฌ์ค๋‹ˆ๋‹ค.
์‘์šฉ ์‚ฌ๋ก€
030์—์„œ ์ •๋ฆฌ๋œ ์ฆ๋ช… AI ํ‰๊ฐ€ ๋ฐฉ๋ฒ•๋“ค์€ 808์˜ ์ •๋ฆฌ ์ค‘์‹ฌ ์งˆ์˜์‘๋‹ต ๋ฒค์น˜๋งˆํฌ์— ์‹ค์ œ์ ์œผ๋กœ ์ ์šฉํ•˜์—ฌ ์‹ฌ์ธต ๋น„๊ต๊ฐ€ ๊ฐ€๋Šฅํ•ฉ๋‹ˆ๋‹ค.
← ๋ชฉ๋ก์œผ๋กœ ๋Œ์•„๊ฐ€๊ธฐ

๐ŸŽง Audio Overview

์ด ๋…ผ๋ฌธ ๋ฆฌ๋ทฐ๋ฅผ ํŒŸ์บ์ŠคํŠธํ˜• ์˜ค๋””์˜ค๋กœ ์ƒ์„ฑํ•ฉ๋‹ˆ๋‹ค. (Gemini ยท ํ‚ค๋Š” ๋ธŒ๋ผ์šฐ์ €์—๋งŒ ์ €์žฅ ยท ์™„์„ฑ๋ณธ์€ ์ด๋ฉ”์ผ๋กœ๋„ ์ „์†ก)
โ–ธ ๊ณ ๊ธ‰: ๊ตฌ์„ฑ ๋ฐฉํ–ฅ(๋Œ€๋ณธ ์ž‘์„ฑ ์ง€์นจ) ์ง์ ‘ ์ˆ˜์ •