LLM and Simulation as Bilevel Optimizers: A New Paradigm to Advance Physical Scientific Discovery

์ €์ž: Pingchuan Ma, Tsun-Hsuan Wang, Minghao Guo, Zhiqing Sun, J. B. Tenenbaum | ๋‚ ์งœ: 2024 | DOI: 10.48550/arXiv.2405.09783 📄 PDF


Essence

Figure 1

๊ทธ๋ฆผ 1: Scientific Generative Agent (SGA)์˜ ์ „์ฒด ํŒŒ์ดํ”„๋ผ์ธ. ์ˆœ์ˆ˜ ํƒ„์„ฑ ์žฌ๋ฃŒ๋กœ๋ถ€ํ„ฐ ์•ฝํ•œ ์••์ถ•์„ฑ ์œ ์ฒด๋กœ ์ตœ์ ํ™”๋˜๋Š” ๊ตฌ์„ฑ๋ฒ•์น™ ํƒ์ƒ‰ ๋ฌธ์ œ๋ฅผ ์˜ˆ์‹œ๋กœ ๋ณด์—ฌ์คŒ.

๋ณธ ๋…ผ๋ฌธ์€ ๋Œ€๊ทœ๋ชจ ์–ธ์–ด๋ชจ๋ธ(LLM)์˜ ์ถ”๋ก  ๋Šฅ๋ ฅ๊ณผ ๋ฌผ๋ฆฌ ์‹œ๋ฎฌ๋ ˆ์ด์…˜์˜ ๊ณ„์‚ฐ ์ •ํ™•์„ฑ์„ ๊ฒฐํ•ฉํ•œ ์ด๋‹จ๊ณ„ ์ตœ์ ํ™” ํ”„๋ ˆ์ž„์›Œํฌ(bilevel optimization)๋ฅผ ์ œ์•ˆํ•˜์—ฌ, ๋ฌผ๋ฆฌ ๊ณผํ•™ ๋ฐœ๊ฒฌ(๊ตฌ์„ฑ๋ฒ•์น™ ๋ฐœ๊ฒฌ, ๋ถ„์ž ์„ค๊ณ„)์—์„œ ์ธ๊ฐ„ ๊ธฐ๋Œ€๋ฅผ ์ดˆ์›”ํ•œ ์ƒˆ๋กœ์šด ํ•ด๋ฅผ ์ฐพ์„ ์ˆ˜ ์žˆ์Œ์„ ๋ณด์—ฌ์ค€๋‹ค.

Motivation

Achievement

Figure 2

๊ทธ๋ฆผ 2: ์†์‹ค๊ฐ’(loss) ์ถ”์ด ๋น„๊ต. ์ตœ๊ณ  ์„ฑ๋Šฅ ์†”๋ฃจ์…˜์˜ ์†์‹ค๊ฐ’์„ ๋ฐ˜๋ณต ํšŸ์ˆ˜์— ๋”ฐ๋ผ ํ‘œ์‹œ.

  1. ๊ตฌ์„ฑ๋ฒ•์น™ ๋ฐœ๊ฒฌ(Constitutive Law Discovery): ์šด๋™ ๊ถค์ ๋งŒ์œผ๋กœ๋ถ€ํ„ฐ ๋ณต์žกํ•œ ๋น„์„ ํ˜• ์žฌ๋ฃŒ ๊ตฌ์„ฑ ๋ฐฉ์ •์‹์„ ์ž๋™ ๋ฐœ๊ฒฌ. ์ดˆ๊ธฐ ์„ ํ˜• ํƒ„์„ฑ ๋ชจ๋ธ๋กœ๋ถ€ํ„ฐ ์•ฝํ•œ ์••์ถ•์„ฑ ์œ ์ฒด(weakly compressible fluid) ํ‘œํ˜„๊นŒ์ง€ ์ตœ์ ํ™”๋˜๋Š” ๊ณผ์ •์„ ํ†ตํ•ด ์†์‹ค๊ฐ’์„ 10.0์—์„œ 0.1๋กœ ๊ฐ์†Œ
  2. ๋ถ„์ž ์„ค๊ณ„(Molecular Design): ๋ถ„์ž ๊ตฌ์กฐ์™€ ์›์ž ์ขŒํ‘œ๋ฅผ ๋™์‹œ์— ์ตœ์ ํ™”ํ•˜์—ฌ ์ž…์ž์ž ์ˆ˜์ค€์˜ ์–‘์ž์—ญํ•™์  ์„ฑ์งˆ์„ ๋งŒ์กฑํ•˜๋Š” ๋ถ„์ž ๋ฐœ๊ฒฌ. ๊ธฐ์กด ํœด๋ฆฌ์Šคํ‹ฑ ๋ฐฉ๋ฒ•๊ณผ ๋น„๊ตํ•˜์—ฌ ์šฐ์›”ํ•œ ์„ฑ๋Šฅ ๋‹ฌ์„ฑ
  3. ์˜ˆ์ƒ์„ ์ดˆ์›”ํ•œ ํ•ด์˜ ๋ฐœ๊ฒฌ: ๊ธฐ์กด ์ธ๊ฐ„ ๊ธฐ๋Œ€์™€ ๋‹ค๋ฅด์ง€๋งŒ ๋„๋ฉ”์ธ ์ „๋ฌธ๊ฐ€์— ์˜ํ•ด ํ•ฉ๋ฆฌ์ ์œผ๋กœ ๊ฒ€์ฆ๋˜๋Š” ์ƒˆ๋กœ์šด ์†”๋ฃจ์…˜ ์ œ์‹œ

How

Figure 3

๊ทธ๋ฆผ 3: ์ด๋‹จ๊ณ„ ์ตœ์ ํ™”์— ๋Œ€ํ•œ ์ ˆ์ œ ์‹คํ—˜(ablation study). ์™ธ๋ถ€ ์ตœ์ ํ™”์™€ ๋‚ด๋ถ€ ์ตœ์ ํ™”์˜ ๊ธฐ์—ฌ๋„ ๋ถ„์„.

Figure 4

๊ทธ๋ฆผ 4: ๋ฐฑ๋ณธ LLM์— ๋Œ€ํ•œ ์ ˆ์ œ ์‹คํ—˜. ๋‹ค์–‘ํ•œ LLM ๋ชจ๋ธ ๊ฐ„ ์„ฑ๋Šฅ ๋น„๊ต.

Originality

Limitation & Further Study

Evaluation

์ดํ‰: ๋ณธ ๋…ผ๋ฌธ์€ LLM์˜ ์ถ”๋ก  ๋Šฅ๋ ฅ๊ณผ ์‹œ๋ฎฌ๋ ˆ์ด์…˜์˜ ๊ณ„์‚ฐ ์ •ํ™•์„ฑ์„ ์ด๋‹จ๊ณ„ ์ตœ์ ํ™”๋กœ ์šฐ์•„ํ•˜๊ฒŒ ๊ฒฐํ•ฉํ•˜์—ฌ ๋ฌผ๋ฆฌ ๊ณผํ•™ ๋ฐœ๊ฒฌ์„ ์ž๋™ํ™”ํ•˜๋Š” ์‹ค์งˆ์ ์ด๊ณ  ๋ฒ”์šฉ์ ์ธ ํ”„๋ ˆ์ž„์›Œํฌ๋ฅผ ์ œ์‹œํ•œ ๊ฒฌ๊ณ ํ•œ ์—ฐ๊ตฌ์ด๋‹ค. ํŠนํžˆ ๊ธฐ๋Œ€๋ฅผ ์ดˆ์›”ํ•œ ์ƒˆ๋กœ์šด ๊ณผํ•™์  ํ•ด๋ฅผ ๋ฐœ๊ฒฌํ•  ์ˆ˜ ์žˆ์Œ์„ ์‹ค์ฆ์ ์œผ๋กœ ๋ณด์—ฌ์ค€ ์ ์ด ์˜๋ฏธ ์žˆ์ง€๋งŒ, ์ด๋ก ์  ์ˆ˜๋ ด์„ฑ ๋ถ„์„๊ณผ ๋” ๋ณต์žกํ•œ ๋ฌธ์ œ๋กœ์˜ ํ™•์žฅ ๊ฒ€์ฆ์ด ํ•„์š”ํ•˜๋‹ค.

๊ฐ™์ด ๋ณด๋ฉด ์ข‹์€ ๋…ผ๋ฌธ

๊ธฐ๋ฐ˜ ์—ฐ๊ตฌ
LLM๊ณผ ์‹œ๋ฎฌ๋ ˆ์ด์…˜์„ ์ด์ค‘ ์ตœ์ ํ™”๊ธฐ๋กœ ์‚ฌ์šฉํ•˜๋Š” 497์€ 620์˜ LLM ๊ธฐ๋ฐ˜ ๋ฌผ๋ฆฌ ์ตœ์ ํ™” ์„ค๊ณ„ ์—์ด์ „ํŠธ ์ ‘๊ทผ์˜ ์ด๋ก ์  ๊ธฐ๋ฐ˜์ด ๋œ๋‹ค.
๊ธฐ๋ฐ˜ ์—ฐ๊ตฌ
497 ๋…ผ๋ฌธ์€ LLM๊ณผ ์‹œ๋ฎฌ๋ ˆ์ด์…˜์˜ ์ด์ค‘ ์ตœ์ ํ™” ๊ฐœ๋…์„ ์ œ์‹œํ•˜์—ฌ, 3034์˜ ์ €์ฐจ์› ์ตœ์ ํ™” ๊ณต๊ฐ„ ์ ‘๊ทผ์˜ ์ด๋ก  ๋ฐฐ๊ฒฝ์ด ๋œ๋‹ค.
๊ธฐ๋ฐ˜ ์—ฐ๊ตฌ
LLM๊ณผ ์‹œ๋ฎฌ๋ ˆ์ด์…˜์˜ ๋ฐ”์ด๋ ˆ๋ฒจ ์ตœ์ ํ™”๊ฐ€ density functional ๋ฐœ๊ฒฌ์˜ ์ž๋™ํ™”์— ์ด๋ก ์  ๊ธฐ๋ฐ˜์„ ์ œ๊ณตํ•ฉ๋‹ˆ๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
LLM์„ ํ™œ์šฉํ•œ ์–‘์ž ์‹คํ—˜ ์„ค๊ณ„ ๋“ฑ ์ด๋ก -์‹คํ—˜ ์œตํ•ฉ ์ตœ์ ํ™”์˜ ๋‹ค์–‘ํ•œ ๊ตฌํ˜„ ์‚ฌ๋ก€๋ฅผ ์ œ๊ณตํ•ฉ๋‹ˆ๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
535๋ฒˆ ๋…ผ๋ฌธ์€ LLM ๊ธฐ๋ฐ˜ ๋ฉ€ํ‹ฐ์—์ด์ „ํŠธ ํ”„๋ ˆ์ž„์›Œํฌ๋ฅผ CFD ์˜์—ญ์— ์ ์šฉํ•˜์—ฌ, ์‹œ๋ฎฌ๋ ˆ์ด์…˜ยทLLM ๊ฒฐํ•ฉ์˜ ๋‹ค๋ฅธ ํ™œ์šฉ ์‚ฌ๋ก€๋ฅผ ๋ณด์—ฌ์ค๋‹ˆ๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
LLM๊ณผ ์‹œ๋ฎฌ๋ ˆ์ด์…˜ ์—ฐ๊ณ„ ์ตœ์ ํ™” ๊ด€์ ์—์„œ ๋‰ด๋กœ์‹ฌ๋ณผ๋ฆญ ํ”„๋ ˆ์ž„์›Œํฌ์˜ ์žฅ๋‹จ์ ์„ ๋น„๊ตํ•  ์ˆ˜ ์žˆ์Œ.
๋‹ค๋ฅธ ์ ‘๊ทผ
346 ๋…ผ๋ฌธ์€ ํŒŒ์šด๋ฐ์ด์…˜-๋ชจ๋ธ ์„œ๋กœ๊ฒŒ์ดํŠธ๋ฅผ ํ†ตํ•œ ๋Šฅ๋™์  ์‹คํ—˜ ์„ค๊ณ„ ํ”„๋ ˆ์ž„์„ ์ œ์•ˆํ•˜์—ฌ, 497์˜ LLM+์‹œ๋ฎฌ๋ ˆ์ด์…˜ ์ด๋‹จ๊ณ„ ์ตœ์ ํ™”์˜ ๋Œ€์•ˆ์  ์—ฐ๊ตฌ ํ๋ฆ„์„ ์ œ๊ณตํ•œ๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
์ง€์‹๊ทธ๋ž˜ํ”„์™€ LLM์„ ๊ฒฐํ•ฉํ•œ ์„ค๋ช… ์ƒ์„ฑ์—์„œ ์œ ์‚ฌํ•œ ์ ‘๊ทผ๋ฒ•์„ ์‚ฌ์šฉํ•˜๋Š” ๋Œ€์•ˆ ์—ฐ๊ตฌ์ด๋‹ค.
ํ›„์† ์—ฐ๊ตฌ
LLM๊ณผ ์‹œ๋ฎฌ๋ ˆ์ด์…˜์˜ ๊ฒฐํ•ฉ์„ ๋ฐœ์ „์‹œํ‚จ ๋…ผ๋ฌธ์œผ๋กœ, AI-augmented ์‹คํ—˜๊ณผ ๋ฐœ๊ฒฌ์˜ ์‹ ๊ฒฝ๋ง ๊ธฐ๋ฐ˜ ๋ฐฉ๋ฒ•์„ ๋” ํ™•์žฅํ•ฉ๋‹ˆ๋‹ค.
ํ›„์† ์—ฐ๊ตฌ
825 ๋…ผ๋ฌธ์€ ์ž๋™ ๊ณผํ•™์—ฐ๊ตฌ/๋ฐœ๊ฒฌ ๋ถ„์•ผ์—์„œ LLM+๋ชจ๋“ˆ/์—์ด์ „ํŠธ ๊ฒฐํ•ฉ์„ ๊ฐ•์กฐํ•˜๋ฉฐ, 497์˜ ์ธ๊ฐ„์ถ”์›”์  ๋ฌผ๋ฆฌ๊ณผํ•™ ์ตœ์ ํ™” ์‚ฌ๋ก€๋ฅผ ๋ณด๋‹ค ์ผ๋ฐ˜ํ™”ํ•œ๋‹ค.
ํ›„์† ์—ฐ๊ตฌ
๋ฌผ๋ฆฌ-LLM ์ด๋‹จ๊ณ„ ์ตœ์ ํ™” ๊ฐœ๋…์„ ์‹ค์ œ ๋Œ€ํ˜• ๋ฌผ๋ฆฌ ๋ชจ๋ธ ํ˜‘๋ ฅ ํ™˜๊ฒฝ์œผ๋กœ ํ™•์žฅํ•˜๋Š” ๋…ผ๋ฌธ์ž…๋‹ˆ๋‹ค.
ํ›„์† ์—ฐ๊ตฌ
LLM and Simulation as Bilevel Optimizers๋Š” PLAD์™€ ์œ ์‚ฌํ•œ agentic-LLM ์‹œ์Šคํ…œ์˜ ๊ตฌ์ฒด์  AI/์‹œ๋ฎฌ๋ ˆ์ด์…˜ ์ƒํ˜ธ์ž‘์šฉ ๊ตฌํ˜„์„ ๋ณด์—ฌ์ค€๋‹ค.
← ๋ชฉ๋ก์œผ๋กœ ๋Œ์•„๊ฐ€๊ธฐ

๐ŸŽง Audio Overview

์ด ๋…ผ๋ฌธ ๋ฆฌ๋ทฐ๋ฅผ ํŒŸ์บ์ŠคํŠธํ˜• ์˜ค๋””์˜ค๋กœ ์ƒ์„ฑํ•ฉ๋‹ˆ๋‹ค. (Gemini ยท ํ‚ค๋Š” ๋ธŒ๋ผ์šฐ์ €์—๋งŒ ์ €์žฅ ยท ์™„์„ฑ๋ณธ์€ ์ด๋ฉ”์ผ๋กœ๋„ ์ „์†ก)
โ–ธ ๊ณ ๊ธ‰: ๊ตฌ์„ฑ ๋ฐฉํ–ฅ(๋Œ€๋ณธ ์ž‘์„ฑ ์ง€์นจ) ์ง์ ‘ ์ˆ˜์ •