Neural Ordinary Differential Equations

์ €์ž: Ricky T. Q. Chen, Yulia Rubanova, Jesse Bettencourt, David Duvenaud | ๋‚ ์งœ: 2018-06-19 | DOI: 10.48550/arXiv.1806.07366 📄 PDF


Essence

Figure 1

์ขŒ์ธก: ์ž”์ฐจ ๋„คํŠธ์›Œํฌ๋Š” ์ด์‚ฐ์  ์œ ํ•œ ๋ณ€ํ™˜ ์‹œํ€€์Šค ์ •์˜ / ์šฐ์ธก: ODE ๋„คํŠธ์›Œํฌ๋Š” ์—ฐ์†์ ์œผ๋กœ ์ƒํƒœ๋ฅผ ๋ณ€ํ™˜ํ•˜๋Š” ๋ฒกํ„ฐ์žฅ ์ •์˜

๊ธฐ์กด์˜ ์ด์‚ฐ ๊นŠ์ด(discrete depth) ์‹ ๊ฒฝ๋ง ๋Œ€์‹  ์ˆจ๊ฒจ์ง„ ์ƒํƒœ์˜ ๋„ํ•จ์ˆ˜๋ฅผ ์‹ ๊ฒฝ๋ง์œผ๋กœ ๋งค๊ฐœ๋ณ€์ˆ˜ํ™”ํ•˜๊ณ , ์ด๋ฅผ ์ƒ๋ฏธ๋ถ„๋ฐฉ์ •์‹(ODE) ์ดˆ๊ธฐ๊ฐ’ ๋ฌธ์ œ๋กœ ์ •์˜ํ•˜์—ฌ ๋ธ”๋ž™๋ฐ•์Šค ODE ์†”๋ฒ„๋กœ ๊ณ„์‚ฐํ•˜๋Š” ํ˜์‹ ์  ์—ฐ์†๊นŠ์ด(continuous-depth) ์‹ ๊ฒฝ๋ง ๋ชจ๋ธ์„ ์ œ์•ˆํ•œ๋‹ค.

Motivation

Achievement

Figure 2

์—ญ๋ชจ๋“œ ๋ฏธ๋ถ„(adjoint sensitivity method)์„ ํ†ตํ•œ ODE ์†”๋ฒ„์˜ ๋ธ”๋ž™๋ฐ•์Šค ๊ธฐ์šธ๊ธฐ ๊ณ„์‚ฐ. ์ฆ๊ฐ• ODE๋ฅผ ์—ญ์‹œ๊ฐ„์œผ๋กœ ํ•ด๊ฒฐํ•˜์—ฌ ์›๋ž˜ ์ƒํƒœ์™€ ์†์‹ค์— ๋Œ€ํ•œ ๋ฏผ๊ฐ๋„ ๋™์‹œ ๊ณ„์‚ฐ

  1. ๋ฉ”๋ชจ๋ฆฌ ํšจ์œจ์„ฑ: ๊นŠ์ด์— ๋ฌด๊ด€ํ•œ ์ƒ์ˆ˜ ๋ฉ”๋ชจ๋ฆฌ ๋น„์šฉ์œผ๋กœ ์ž„์˜์˜ ๊นŠ์ด ์‹ ๊ฒฝ๋ง ํ•™์Šต ๊ฐ€๋Šฅ (O(1) vs O(L))
  2. ์ ์‘ํ˜• ๊ณ„์‚ฐ: ์ตœ์‹  ODE ์†”๋ฒ„์˜ ์ ์‘ ๋‹จ๊ณ„ ํฌ๊ธฐ ์ œ์–ด๋กœ ์ž…๋ ฅ๊ณผ ๋ฌธ์ œ ๋ณต์žก๋„์— ๋”ฐ๋ผ ๊ณ„์‚ฐ ๋น„์šฉ ๋™์  ์กฐ์ ˆ ๊ฐ€๋Šฅ
Figure 3

ํ•™์Šต๋œ ODE-Net์˜ ํ†ต๊ณ„: (a) ์˜ค์ฐจ ์ œ์–ด ๊ฐ€๋Šฅ์„ฑ (b) ํ•จ์ˆ˜ ํ‰๊ฐ€ ํšŸ์ˆ˜์™€ ๊ณ„์‚ฐ ์‹œ๊ฐ„ ์„ ํ˜• ๊ด€๊ณ„ (c) ์—ญ์ „ํŒŒ ์‹œ ํ‰๊ฐ€ ํšŸ์ˆ˜๊ฐ€ ์ •๋ฐฉํ–ฅ์˜ ์•ฝ ์ ˆ๋ฐ˜ (d) ํ•™์Šต ์ง„ํ–‰์— ๋”ฐ๋ฅธ ํ•จ์ˆ˜ ํ‰๊ฐ€ ํšŸ์ˆ˜ ์ฆ๊ฐ€

  1. ์—ฐ์† ์ •๊ทœํ™” ํ๋ฆ„: ํ–‰๋ ฌ์‹ ๊ณ„์‚ฐ ๋Œ€์‹  ๋Œ€๊ฐํ•ฉ(trace) ์—ฐ์‚ฐ์œผ๋กœ O(Dยณ)์—์„œ O(D)๋กœ ๋ณต์žก๋„ ๊ฐœ์„ , ๋ฐ์ดํ„ฐ ์ฐจ์› ๋ถ„ํ• /์ˆœ์„œ ์ œ์•ฝ ์ œ๊ฑฐ
  2. ์—ฐ์† ์‹œ๊ณ„์—ด ๋ชจ๋ธ: ์ž„์˜ ์‹œ๊ฐ„ ๋„์ฐฉ ๋ฐ์ดํ„ฐ๋ฅผ ์ž์—ฐ์Šค๋Ÿฝ๊ฒŒ ์ฒ˜๋ฆฌ ๊ฐ€๋Šฅ

How

Figure 4

์ธ์Šคํ„ดํŠธ ๋ณ€์ˆ˜๋ณ€ํ™˜ ์ •๋ฆฌ: ์—ฐ์† ๋ณ€ํ™˜์—์„œ ๋กœ๊ทธ ํ™•๋ฅ  ๋ณ€ํ™”๊ฐ€ ์•ผ์ฝ”๋น„์•ˆ ๋Œ€๊ฐํ•ฉ์˜ ์Œ์ˆ˜๋กœ ํ‘œํ˜„๋˜์–ด ์ •๊ทœํ™” ํ๋ฆ„์˜ ๊ณ„์‚ฐ ๋น„์šฉ ๊ธ‰๊ฒฉํžˆ ๊ฐ์†Œ

ํ•ต์‹ฌ ๊ธฐ์ˆ :

Originality

Limitation & Further Study

Evaluation

์ดํ‰: ์ด ๋…ผ๋ฌธ์€ ์‹ ๊ฒฝ๋ง์„ ์—ฐ์† ๋™์—ญํ•™ ์‹œ์Šคํ…œ์œผ๋กœ ์žฌ๊ฐœ๋…ํ™”ํ•˜์—ฌ ๋ฉ”๋ชจ๋ฆฌ ํšจ์œจ์„ฑ, ์ ์‘ํ˜• ๊ณ„์‚ฐ, ์„ ํ˜• ๋ณต์žก๋„ ์ •๊ทœํ™” ํ๋ฆ„์ด๋ผ๋Š” ํ˜์‹ ์  ์ด์ ์„ ์ œ์‹œํ•œ ํš๊ธฐ์  ์ž‘์—…์ด๋‹ค. ์ˆ˜๋ฐ˜๋ฏผ๊ฐ๋„ ๋ฐฉ๋ฒ•์˜ ์šฐ์•„ํ•œ ์ ์šฉ๊ณผ ์ธ์Šคํ„ดํŠธ ๋ณ€์ˆ˜๋ณ€ํ™˜ ์ •๋ฆฌ์˜ ์ˆ˜ํ•™์  ๋ฐœ๊ฒฌ์€ ์ง„์ •ํ•œ ์›์ฐฝ์„ฑ์„ ๋ณด์—ฌ์ค€๋‹ค. ๋‹ค๋งŒ ์‹ค์ œ ๋ฒฝ์‹œ๊ณ„ ์‹œ๊ฐ„ ์„ฑ๋Šฅ, ๊ทน๋‹จ ์ผ€์ด์Šค์—์„œ์˜ ์ˆ˜์น˜ ์•ˆ์ •์„ฑ, ๋” ๋ณต์žกํ•œ ๋ฐ์ดํ„ฐ์…‹์—์„œ์˜ ๊ฒ€์ฆ ๋“ฑ์ด ๋ฏธํกํ•˜์—ฌ, ๊ฐœ๋…์ ์œผ๋กœ๋Š” 5์ ์— ๊ฐ€๊น์ง€๋งŒ ํ˜„์‹ค์  ๊ตฌํ˜„๊ณผ ๊ฒ€์ฆ์—์„œ 4์  ์ˆ˜์ค€์˜ ํ•œ๊ณ„๊ฐ€ ์žˆ๋‹ค. ์ด๋ก ์˜ ์šฐ์•„ํ•จ๊ณผ ์ž ์žฌ๋ ฅ๋งŒํผ์€ ๋งค์šฐ ๋†’์œผ๋ฉฐ, ์ดํ›„ ํ•™๊ณ„์˜ ๊ด‘๋ฒ”์œ„ํ•œ ์‘์šฉ๊ณผ ํ™•์žฅ์œผ๋กœ ์ด์–ด์ง„ ์ ์—์„œ ๊ทธ ์˜ํ–ฅ๋ ฅ์€ ์ธก์ • ๋ถˆ๊ฐ€๋Šฅํ•  ์ •๋„๋กœ ํฌ๋‹ค.

๊ฐ™์ด ๋ณด๋ฉด ์ข‹์€ ๋…ผ๋ฌธ

๊ธฐ๋ฐ˜ ์—ฐ๊ตฌ
Physics-Informed Deep Learning ๋ฐ ๋ฐ์ดํ„ฐ ๊ตฌ๋™ ์†”๋ฃจ์…˜์˜ ๋Œ€ํ‘œ์  ์ด๋ก ์  ๋ฐฐ๊ฒฝ์„ ์ œ์‹œํ•˜์—ฌ 572 ๋…ผ๋ฌธ์˜ ๊ฐœ๋…์  ํ† ์ตœ๊ทผ๋„๋ฅผ ์ œ๊ณตํ•ฉ๋‹ˆ๋‹ค.
๊ธฐ๋ฐ˜ ์—ฐ๊ตฌ
Neural ODE ๋…ผ๋ฌธ์€ ์‹œ๋ฎฌ๋ ˆ์ด์…˜ ๊ธฐ๋ฐ˜ ์—ฐ์† ์‹œ๊ณ„์—ด ๋ฐ์ดํ„ฐ ์ถ”์ • ์ด๋ก ์˜ ๊ธฐ์ดˆ์  ๋ชจ๋ธ๋กœ, SBI๊ฐ€ ๋‹ค๋ฃจ๋Š” ์—ฐ์†์  ๋™์—ญํ•™ ํ•™์Šต๊ณผ ๋ฐ€์ ‘ํ•˜๊ฒŒ ์—ฐ๊ฒฐ๋ฉ๋‹ˆ๋‹ค.
๊ธฐ๋ฐ˜ ์—ฐ๊ตฌ
Neural ODE์˜ ์—ฐ์†๊นŠ์ด ์‹ ๊ฒฝ๋ง ๊ฐœ๋…์€ LLM ๊ธฐ๋ฐ˜ ๊ณผํ•™๋ฐฉ์ •์‹ ์ถ”๋ก  ๋ฐ PDE ์†”๋ฒ„ ์ƒ์„ฑ์˜ ์ด๋ก ์  ์ถœ๋ฐœ์ ์ด ๋œ๋‹ค.
๊ธฐ๋ฐ˜ ์—ฐ๊ตฌ
์‹ ๊ฒฝ ODE๋Š” ๋ฏธ๋ถ„๋ฐฉ์ •์‹์„ ์‹ ๊ฒฝ๋ง์œผ๋กœ ๋ชจ๋ธ๋งํ•˜๋Š” ๊ธฐ์ดˆ ๋ฐฉ๋ฒ•์œผ๋กœ, CodePDE๊ฐ€ LLM์œผ๋กœ ์ƒ์„ฑํ•˜๋Š” PDE ์†”๋ฒ„์˜ ์ด๋ก ์  ๋ฐฐ๊ฒฝ์„ ์ œ๊ณตํ•œ๋‹ค.
๊ธฐ๋ฐ˜ ์—ฐ๊ตฌ
์‹ ๊ฒฝ ODE๋Š” ์—ฐ์† ๋™์—ญํ•™๊ณ„๋ฅผ ์‹ ๊ฒฝ๋ง์œผ๋กœ ๋ชจ๋ธ๋งํ•˜๋Š” ๊ธฐ์ดˆ ๋ฐฉ๋ฒ•์œผ๋กœ, ๋ถˆ์•ˆ์ • ํŠน์ด์  ๋ฐœ๊ฒฌ์— ํ™œ์šฉ๋œ ML ๊ธฐ๋ฐ˜ ๋™์—ญํ•™ ํ•ด์„์˜ ํ† ๋Œ€๊ฐ€ ๋œ๋‹ค.
๊ธฐ๋ฐ˜ ์—ฐ๊ตฌ
Neural ODEs ๋“ฑ ์‹ ๊ฒฝ ์—ฐ์‚ฐ์ž ๊ณ„์—ด์˜ ์ด๋ก ์  ํ† ๋Œ€๋ฅผ ์ œ๊ณตํ•˜๋ฉฐ, ์•„ํ‚คํ…์ฒ˜ ๋ณ€ํ˜• ๋ฐ ์„ฑ๋Šฅ๋น„๊ต์˜ ๊ทผ๊ฑฐ๊ฐ€ ๋ฉ๋‹ˆ๋‹ค.
๊ธฐ๋ฐ˜ ์—ฐ๊ตฌ
Transformer ๊ธฐ๋ฐ˜ ์‹œ๊ณ„์—ด ๋™์—ญํ•™ ํ•™์Šต์˜ ๋ฐฉ๋ฒ•๋ก ์  ๊ธฐ์ดˆ๋ฅผ ์ œ๊ณตํ•˜๋Š” ์—ฐ๊ตฌ์ด๋‹ค
๊ธฐ๋ฐ˜ ์—ฐ๊ตฌ
์‹ ๊ฒฝ ๋ฏธ๋ถ„๋ฐฉ์ •์‹ ๊ธฐ๋ฐ˜ ์—ฐ์‚ฐ์ž ํ•™์Šต๊ณผ PINN ๊ด€๊ณ„๋ฅผ ๋‹ค๋ฃจ๋ฉฐ, ์ŠคํŒŒ์ดํ‚น ๋‰ด๋Ÿฐ ๊ธฐ๋ฐ˜ ๋ฌผ๋ฆฌ์  ์—ฐ์‚ฐ์ž ๋ฐœ์ „ ๋…ผ์˜์— ๊ทผ๊ฑฐ๋ฅผ ์ œ๊ณตํ•ฉ๋‹ˆ๋‹ค.
๊ธฐ๋ฐ˜ ์—ฐ๊ตฌ
๋‹จ์ผ์„ธํฌ RNA ์‹œํ€€์‹ฑ ๋ฐ์ดํ„ฐ ๋ถ„์„์˜ ๋ฐฉ๋ฒ•๋ก ์  ๊ธฐ๋ฐ˜์ด ๋˜๋Š” ์—ฐ๊ตฌ์ด๋‹ค.
๊ธฐ๋ฐ˜ ์—ฐ๊ตฌ
572์˜ Neural ODE ๋…ผ์˜๋Š” 3158์ฒ˜๋Ÿผ ๋ฏธ๋ถ„๋ฐฉ์ •์‹ ๊ธฐ๋ฐ˜ ๊ธฐ๊ณ„ํ•™์Šต ๋ชจ๋ธ์— ์ˆ˜ํ•™์  ๊ทผ๊ฑฐ๋ฅผ ์ œ๊ณตํ•ฉ๋‹ˆ๋‹ค.
๊ธฐ๋ฐ˜ ์—ฐ๊ตฌ
Neural ODE์™€ ๊ด€๋ จ๋œ ์‹œ๊ฐ„ ์ง€ํ–ฅ ์‹ ๊ฒฝ๋ง ์•„ํ‚คํ…์ฒ˜์˜ ์›๋ฆฌ๋ฅผ ์ œ์‹œํ•˜์—ฌ climt-paraformer์˜ ์‹œ๊ณ„์—ด ์•ˆ์ •์„ฑ ๊ฐ•ํ™” ๋งฅ๋ฝ์„ ์ œ๊ณตํ•ฉ๋‹ˆ๋‹ค.
๊ธฐ๋ฐ˜ ์—ฐ๊ตฌ
Neural ODEs ๊ธฐ๋ฐ˜์˜ ์‹œ๊ฐ„ ์ง„ํ™” ์—ฐ์‚ฐ์ž ํ•™์Šต ์›๋ฆฌ๊ฐ€ UNP ๋ฒ”์šฉ ์‹ ๊ฒฝ ์ถ”์ง„์ž ๊ตฌ์กฐ์™€ ์ง๊ฒฐ๋ฉ๋‹ˆ๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
Physics-Informed Neural Networks(PINNs)์™€ ์œ ์‚ฌํ•˜๊ฒŒ, ๋ฏธ๋ถ„๋ฐฉ์ •์‹์˜ ํ•ด๋ฅผ ์‹ฌ์ธตํ•™์Šต ๊ธฐ๋ฐ˜์œผ๋กœ ๊ตฌํ•˜๋Š” ์ƒˆ๋กœ์šด ์ ‘๊ทผ๋ฒ•์„ ์ œ์‹œํ•œ๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
Neural ODE์™€ Lagrangian Neural Networks๋Š” ๋ฐ์ดํ„ฐ ๊ธฐ๋ฐ˜ ๋™์—ญํ•™ ๋ฒ•์น™ ํ•™์Šต์—์„œ ์ƒํ˜ธ๋ณด์™„์  ์ ‘๊ทผ๋ฒ•์„ ์ œ๊ณตํ•œ๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
๋‘˜ ๋‹ค ๋ฏธ๋ถ„๋ฐฉ์ •์‹ ๊ณ„์—ด ๋ชจ๋ธ๋ง ๋ฐ ๋ฐ์ดํ„ฐ ๊ธฐ๋ฐ˜ ๋ฐฉ์ •์‹ ๋ฐœ๊ฒฌ์„ ๋‹ค๋ฃจ๋‚˜, 572๋Š” Neural ODE์˜ ์—ฐ์†์  ๊นŠ์ด ์‹ ๊ฒฝ๋ง์—, 289๋Š” LLM์˜ ๋ฐ์ดํ„ฐ๊ตฌ์กฐ ๋ถ„์„ ๋ฐ ์ด๋ ฅ ๋ฐ˜์˜์— ๊ธฐ๋ฐ˜ํ•ฉ๋‹ˆ๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
ํ•จ์ˆ˜๊ณต๊ฐ„ ๋ฏธ๋ถ„๋ฐฉ์ •์‹ ํ•™์Šต์—์„œ Neural ODE๊ฐ€ ์„ ํ˜•/๋น„์„ ํ˜• ๊ธฐ์ € ํ•™์Šต์— ๋Œ€ํ•œ ๋…๋ฆฝ์  ๋ฐฉ์‹์œผ๋กœ ๋ณ‘๋ ฌ์  ์ดํ•ด๊ฐ€ ๊ฐ€๋Šฅํ•˜๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
PDE ์‹œ๋ฎฌ๋ ˆ์ด์…˜์„ ์œ„ํ•œ ์ž ์žฌ ๊ณต๊ฐ„ ๊ธฐ๋ฐ˜ ๋‹ค๋ฅธ ์ƒ์„ฑ ๋ชจ๋ธ ์ ‘๊ทผ๋ฒ•์ด๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
๋Œ€๊ทœ๋ชจ ์ƒ๋ฌผํ•™ ๋ชจ๋ธ์˜ ํŠน์ง• ์ถ”์ถœ ๋ฐ ์ „์ดํ•™์Šต ์ „๋žต์˜ ๋Œ€์•ˆ์  ์—ฐ๊ตฌ์ด๋‹ค.
ํ›„์† ์—ฐ๊ตฌ
์‹ ๊ฒฝ ์—ฐ์‚ฐ์ž(neural operators)์™€ Neural ODE์˜ ๊ตฌ์กฐ์  ์ฐจ์ด ๋ฐ ํ™•์žฅ ๊ฐ€๋Šฅ์„ฑ์„ ๋น„๊ตํ•˜์—ฌ, ์—ฐ์†์  ์ƒ๋ฏธ๋ถ„๋ฐฉ์ •์‹ ํ‘œํ˜„์˜ ๋‹ค์–‘ํ•œ ๋ฐฉ๋ฒ•๋ก ์„ ๋…ผ์˜ํ•  ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค.
ํ›„์† ์—ฐ๊ตฌ
ODE/PDE ๊ธฐ๋ฐ˜์˜ ์—ฐ์†์  ๋ฌผ๋ฆฌ ๋ฌธ์ œ์— ๋Œ€ํ•œ ์ž ์žฌ ๋ณ€์ˆ˜ ์ƒ์„ฑ ๋ชจ๋ธ ์ ์šฉ ๋“ฑ, ์‹ค์ œ ๋ฌผ๋ฆฌ๊ณ„์˜ ์žฅ๊ธฐ์  ํ•ด ์ฐพ๊ธฐ์— 572์˜ ์ ‘๊ทผ์„ ํ™•์žฅํ•ด ์ ์šฉํ•ฉ๋‹ˆ๋‹ค.
ํ›„์† ์—ฐ๊ตฌ
๋ณต์žกํ•œ ๋™์—ญํ•™ ์‹œ์Šคํ…œ์˜ ์ œ๋กœ์ƒท ์ผ๋ฐ˜ํ™”๋ฅผ ์œ„ํ•œ ์‹ ๊ฒฝ ์—ฐ์‚ฐ์ž๋ฅผ ํ™•์žฅํ•˜๋Š” ์—ฐ๊ตฌ์ด๋‹ค
์‘์šฉ ์‚ฌ๋ก€
Neural ODE์™€ ๊ณผํ•™์  ๋ฐฉ์ •์‹ ๋ฐœ๊ฒฌ์˜ ์ ‘๋ชฉ์— ๋Œ€ํ•œ ๋ฒค์น˜๋งˆํ‚น ๋…ผ๋ฌธ์œผ๋กœ, ์‹ค์ œ ๋ฐฉ์ •์‹ ๋ฐœ๊ฒฌ ๋ฌธ์ œ์— Neural ODE ์ ์šฉ ๊ฐ€๋Šฅ์„ฑ์„ ์‚ดํŽด๋ณผ ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค.
← ๋ชฉ๋ก์œผ๋กœ ๋Œ์•„๊ฐ€๊ธฐ

๐ŸŽง Audio Overview

์ด ๋…ผ๋ฌธ ๋ฆฌ๋ทฐ๋ฅผ ํŒŸ์บ์ŠคํŠธํ˜• ์˜ค๋””์˜ค๋กœ ์ƒ์„ฑํ•ฉ๋‹ˆ๋‹ค. (Gemini ยท ํ‚ค๋Š” ๋ธŒ๋ผ์šฐ์ €์—๋งŒ ์ €์žฅ ยท ์™„์„ฑ๋ณธ์€ ์ด๋ฉ”์ผ๋กœ๋„ ์ „์†ก)
โ–ธ ๊ณ ๊ธ‰: ๊ตฌ์„ฑ ๋ฐฉํ–ฅ(๋Œ€๋ณธ ์ž‘์„ฑ ์ง€์นจ) ์ง์ ‘ ์ˆ˜์ •