Scaling physical reasoning with the physics dataset

์ €์ž: Shenghe Zheng, Qianjia Cheng, Junchi Yao, Mengsong Wu, Haonan He, Ning Ding, Yu Cheng, Shuyue Hu, Lei Bai, Dongzhan Zhou, Ganqu Cui, Peng Ye | ๋‚ ์งœ: 2025 | DOI: arXiv:2506.00022v4 📄 PDF


Essence

Figure 1

PHYSICS ๋ฐ์ดํ„ฐ์…‹ ๊ตฌ์ถ• ํŒŒ์ดํ”„๋ผ์ธ(์ขŒ)๊ณผ ์ฃผ์š” ํŠน์„ฑ(์šฐ)

๋Œ€๊ทœ๋ชจ ์–ธ์–ด ๋ชจ๋ธ(LLM)์ด ๋ฌผ๋ฆฌํ•™ ์ถ”๋ก  ๋Šฅ๋ ฅ ๊ฐœ๋ฐœ์— ์ถฉ๋ถ„ํ•œ ์ฃผ๋ชฉ์„ ๋ฐ›์ง€ ๋ชปํ–ˆ๋˜ ๋ฌธ์ œ๋ฅผ ํ•ด๊ฒฐํ•˜๊ธฐ ์œ„ํ•ด, 100๊ฐœ ์ด์ƒ์˜ ๊ต๊ณผ์„œ๋กœ๋ถ€ํ„ฐ ์ •์ œ๋œ 16,568๊ฐœ์˜ ๊ณ ํ’ˆ์งˆ ๋ฌผ๋ฆฌ ๋ฌธ์ œ๋ฅผ ํฌํ•จํ•˜๋Š” PHYSICS ๋ฐ์ดํ„ฐ์…‹์„ ์†Œ๊ฐœํ•œ๋‹ค. ๋ฌผ๋ฆฌ ๋ถ„์•ผ์— ํŠนํ™”๋œ ํ‰๊ฐ€ ํ”„๋ ˆ์ž„์›Œํฌ(Rule+Model)๋ฅผ ์ตœ์ดˆ๋กœ ์ œ์•ˆํ•˜์—ฌ ๋‹จ์œ„ ๋ณ€ํ™˜, ์ˆ˜์น˜ ๊ฐ„๋‹จํžˆ ํ•˜๊ธฐ ๋“ฑ์˜ ๋ฌผ๋ฆฌ ๊ณ ์œ  ํŠน์„ฑ์„ ๋ฐ˜์˜ํ•œ ์ •ํ™•ํ•œ ํ‰๊ฐ€๋ฅผ ๊ฐ€๋Šฅํ•˜๊ฒŒ ํ•œ๋‹ค.

Motivation

Achievement

Figure 1

PHYSICS ๋ฐ์ดํ„ฐ์…‹์˜ ๊ตฌ์ถ• ํŒŒ์ดํ”„๋ผ์ธ๊ณผ ํŠน์ง•

  1. ์ตœ๋Œ€ ๊ทœ๋ชจ ๋ฌผ๋ฆฌ ๋ฐ์ดํ„ฐ์…‹: 16,568๊ฐœ ๋ฌธ์ œ(ํ•œ์˜ ์ด์ค‘์–ธ์–ด), 5๊ฐœ ๋ฌผ๋ฆฌ ๋ถ„์•ผ, 4๋‹จ๊ณ„ ๋‚œ์ด๋„ ์ˆ˜์ค€(๊ณ ๋“ฑํ•™๊ต~๋Œ€ํ•™์›), ๋ช…ํ™•ํ•œ ํ›ˆ๋ จ/ํ…Œ์ŠคํŠธ ๋ถ„ํ• (7:1 ๋น„์œจ)
  2. ๋ฌผ๋ฆฌ ํŠนํ™” ํ‰๊ฐ€ ํ”„๋ ˆ์ž„์›Œํฌ: Rule+Model ํ•˜์ด๋ธŒ๋ฆฌ๋“œ ๋ฐฉ์‹์œผ๋กœ ๋ฌผ๋ฆฌ ํŠน์œ ์˜ ํ‰๊ฐ€ ๋ฌธ์ œ(๋‹จ์œ„ ๋ณ€ํ™˜, ์ˆ˜์น˜ ๊ฐ„๋‹จํžˆ ํ•˜๊ธฐ, ์ •๋ฐ€๋„) ํ•ด๊ฒฐ. ์ธ๊ณต ์ฃผ์„ ํ…Œ์ŠคํŠธ์…‹์œผ๋กœ ๊ฐœ์„  ํšจ๊ณผ ๊ฒ€์ฆ
  3. ๊ด‘๋ฒ”์œ„ํ•œ ๋ชจ๋ธ ํ‰๊ฐ€: ์˜คํ”ˆ์†Œ์Šค/ํด๋กœ์ฆˆ๋“œ์†Œ์Šค ๋ชจ๋ธ ํ‰๊ฐ€ ๊ฒฐ๊ณผ, OpenAI-o3, Gemini-2.5-pro ๋“ฑ ์ตœ๊ฐ• ๋ชจ๋ธ๋„ ๋ฌผ๋ฆฌ ๋ฌธ์ œ์—์„œ ์„ฑ๋Šฅ ๋ถ€์กฑ ๋ช…์‹œ

How

Originality

Limitation & Further Study

Evaluation

Novelty: 4.5/5 Technical Soundness: 4/5 Significance: 4.5/5 Clarity: 4/5 Overall: 4.2/5

์ดํ‰: PHYSICS ๋ฐ์ดํ„ฐ์…‹์€ ๋ฌผ๋ฆฌํ•™์ด ๊ณผ์†Œํ‰๊ฐ€๋œ ๋ถ„์•ผ์ž„์„ ๋ช…ํ™•ํžˆ ํ•˜๊ณ , ์ฒด๊ณ„์ ์ธ ๊ตฌ์ถ• ํŒŒ์ดํ”„๋ผ์ธ๊ณผ ๋ฌผ๋ฆฌ ํŠนํ™” ํ‰๊ฐ€ ํ”„๋ ˆ์ž„์›Œํฌ๋กœ LLM์˜ ๋ฌผ๋ฆฌ ์ถ”๋ก  ๋Šฅ๋ ฅ ๋ฐœ์ „์„ ์œ„ํ•œ ๊ฒฌ๊ณ ํ•œ ๊ธฐ๋ฐ˜์„ ์ œ๊ณตํ•œ๋‹ค. ๋‹ค๋งŒ ๋น„์ „ ๋ฌธ์ œ ํฌํ•จ ๋ฐ ๋” ๋Œ€๊ทœ๋ชจ ํ…Œ์ŠคํŠธ์…‹ ํ™•๋ณด๋กœ ์‹ค์šฉ์„ฑ์„ ๋†’์ผ ์—ฌ์ง€๊ฐ€ ์žˆ๋‹ค.

๊ฐ™์ด ๋ณด๋ฉด ์ข‹์€ ๋…ผ๋ฌธ

๊ธฐ๋ฐ˜ ์—ฐ๊ตฌ
Physics-informed neural network(PI-NN) ๋“ฑ ๋ฌผ๋ฆฌ ๊ธฐ๋ฐ˜ AI ์ถ”๋ก  ๋ฒค์น˜๋งˆํฌ์— ๋Œ€ํ•œ ์‹ฌํ™” ํ•™์Šต์— ๋„์›€์ด ๋ฉ๋‹ˆ๋‹ค.
๊ธฐ๋ฐ˜ ์—ฐ๊ตฌ
697์˜ LLM ๋ฌผ๋ฆฌ์ถ”๋ก  ๋ถ„์•ผ ๋Šฅ๋ ฅํ‰๊ฐ€ ๋ฌธ์ œ์˜ ์ด๋ก ์  ๋ฐฐ๊ฒฝ์ด์ž ์ „์ฒด ํ˜„ํ™ฉ์„ 506์ด ์„œ๋ฒ ์ด ํ˜•ํƒœ๋กœ ํญ๋„“๊ฒŒ ๋‹ค๋ฃน๋‹ˆ๋‹ค.
๊ธฐ๋ฐ˜ ์—ฐ๊ตฌ
๋ฌผ๋ฆฌํ•™ LLM ํ‰๊ฐ€(697)์˜ ๊ทœ์น™ ๊ธฐ๋ฐ˜ ํ”„๋ ˆ์ž„์›Œํฌ ๋…ผ์˜๊ฐ€ ๊ณผํ•™ ์š”์•ฝ ์ผ๋ฐ˜ํ™” ํŽธํ–ฅ(373)๊ณผ LLM ํ‰๊ฐ€๋ฐฉ์‹ ๋Œ€๋น„์— ์ด๋ก ์  ํ† ๋Œ€๊ฐ€ ๋œ๋‹ค.
๊ธฐ๋ฐ˜ ์—ฐ๊ตฌ
Lang-PINN ๋…ผ๋ฌธ์€ ์–ธ์–ด๋ชจ๋ธ ๊ธฐ๋ฐ˜ ๋ฌผ๋ฆฌ ์ถ”๋ก ๊ณผ ๋ฌผ๋ฆฌํ•™ ๋ฌธ์ œ ํ•ด๊ฒฐ์˜ ์‹ ๊ฒฝ๋ง ๊ธฐ๋ฐ˜ ์›๋ฆฌ๋ฅผ ์ œ๊ณตํ•˜์—ฌ ์ด ๋…ผ๋ฌธ์˜ ์ด๋ก ์  ๊ธฐ๋ฐ˜์„ ๋งˆ๋ จํ•ฉ๋‹ˆ๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
์ˆ˜ํ•™ ๋ฐ ๋ฌผ๋ฆฌ ์ •๋ฆฌ ๊ธฐ๋ฐ˜์˜ QA ๋ฐ์ดํ„ฐ์…‹์„ ํ†ตํ•ด LLM์˜ ๋ฌผ๋ฆฌ ์ถ”๋ก ๋Šฅ๋ ฅ์„ ๋‹ค๋ฅธ ๋ฐ์ดํ„ฐ์…‹์œผ๋กœ ํ‰๊ฐ€ํ•  ์ˆ˜ ์žˆ๊ธฐ ๋•Œ๋ฌธ์ž…๋‹ˆ๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
MatPilot ๋…ผ๋ฌธ์€ ๋ฌผ๋ฆฌ์  ๋ฐ ์žฌ๋ฃŒ๊ณผํ•™์  ๋ฐ์ดํ„ฐ์— ๋Œ€ํ•œ AI ์—์ด์ „ํŠธ ๊ธฐ๋ฐ˜ ํ‰๊ฐ€์™€ ์ถ”์ฒœ์„ ์ ์šฉํ•˜์—ฌ, PHYSICS ๋ฐ์ดํ„ฐ์…‹์˜ ๋ชฉ์ ๊ณผ ๋ฐ€์ ‘ํ•˜๊ฒŒ ๋งž๋‹ฟ์•„ ์žˆ๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
697์ด ๋Œ€๊ทœ๋ชจ ๋ฌผ๋ฆฌ ์ถ”๋ก  ๋ฐ์ดํ„ฐ์…‹(PHYSICS)๊ณผ ํ‰๊ฐ€ ํ”„๋ ˆ์ž„์›Œํฌ๋ฅผ ์ œ๊ณตํ•œ๋‹ค๋ฉด, 142๋Š” PDE ๋ฌธ์ œ๋ฅผ ์œ„ํ•œ ์ž๋™ํ™” ๋ฉ€ํ‹ฐ์—์ด์ „ํŠธ ํŒŒ์ดํ”„๋ผ์ธ์œผ๋กœ ๋‹ค๋ฅธ ๋ฐฉ๋ฒ•๋ก  ์‚ฌ๋ก€์ž…๋‹ˆ๋‹ค.
์‘์šฉ ์‚ฌ๋ก€
LLM์˜ ์•ˆ์ „์„ฑ๊ณผ ์ •๋ ฌ ๋ฌธ์ œ๋ฅผ ์‹ค์ œ ๋ฌผ๋ฆฌ ์ถ”๋ก  ๋ฒค์น˜๋งˆํฌ์— ์–ด๋–ป๊ฒŒ ๋ฐ˜์˜ํ• ์ง€ ํƒ๊ตฌํ•  ๋•Œ ์ฐธ๊ณ ๊ฐ€ ๋ฉ๋‹ˆ๋‹ค.
์‘์šฉ ์‚ฌ๋ก€
๊ณผํ•™์  ๋ฐ์ดํ„ฐ ๋ถ„์„ ๋ฐ ์—ฐ๊ตฌ ์ž๋™ํ™”์— ๋Œ€ํ•ด VLM๊ณผ ์—์ด์ „ํŠธ ์‹œ์Šคํ…œ์„ ๊ฒฐํ•ฉํ•˜๋Š” ์‹คํ—˜์  ์‚ฌ๋ก€๋กœ, nanomaterial ์ •๋ณด ์ถ”์ถœ์˜ ์‘์šฉ ํ™•์žฅ์„ฑ์„ ํ™•์ธํ•  ์ˆ˜ ์žˆ๋‹ค.
← ๋ชฉ๋ก์œผ๋กœ ๋Œ์•„๊ฐ€๊ธฐ

๐ŸŽง Audio Overview

์ด ๋…ผ๋ฌธ ๋ฆฌ๋ทฐ๋ฅผ ํŒŸ์บ์ŠคํŠธํ˜• ์˜ค๋””์˜ค๋กœ ์ƒ์„ฑํ•ฉ๋‹ˆ๋‹ค. (Gemini ยท ํ‚ค๋Š” ๋ธŒ๋ผ์šฐ์ €์—๋งŒ ์ €์žฅ ยท ์™„์„ฑ๋ณธ์€ ์ด๋ฉ”์ผ๋กœ๋„ ์ „์†ก)
โ–ธ ๊ณ ๊ธ‰: ๊ตฌ์„ฑ ๋ฐฉํ–ฅ(๋Œ€๋ณธ ์ž‘์„ฑ ์ง€์นจ) ์ง์ ‘ ์ˆ˜์ •