State-Free Inference of State-Space Models: The Transfer Function Approach

์ €์ž: Rom N. Parnichkun, Stefano Massaroli, Alessandro Moro, Jimmy T. H. Smith, Ramin Hasani, Mathias Lechner, Qi An, Christopher Rรฉ, Hajime Asama, Stefano Ermon, Taiji Suzuki, Atsushi Yamashita, Michael Poli | ๋‚ ์งœ: 2024-05-10 📄 PDF


Essence

์ƒํƒœ๊ณต๊ฐ„๋ชจ๋ธ(State-Space Model, SSM)์„ ์ „๋‹ฌํ•จ์ˆ˜(Transfer Function) ํ‘œํ˜„์œผ๋กœ ์žฌ์„ค๊ณ„ํ•˜์—ฌ, ์ƒํƒœ ํฌ๊ธฐ์˜ ์ฆ๊ฐ€์—๋„ ๋ถˆ๊ตฌํ•˜๊ณ  ๋ฉ”๋ชจ๋ฆฌ์™€ ๊ณ„์‚ฐ ๋น„์šฉ์ด ์ฆ๊ฐ€ํ•˜์ง€ ์•Š๋Š” ์ƒํƒœ-์ž์œ (state-free) ๋ณ‘๋ ฌ ์ถ”๋ก  ์•Œ๊ณ ๋ฆฌ์ฆ˜์„ ์ œ์•ˆํ•œ๋‹ค. FFT(Fast Fourier Transform)๋ฅผ ๊ธฐ๋ฐ˜์œผ๋กœ ํ•œ ์ด ์ ‘๊ทผ๋ฒ•์€ ๊ธฐ์กด S4/S5 ๋Œ€๋น„ 35% ๋” ๋น ๋ฅธ ํ•™์Šต ์†๋„๋ฅผ ๋‹ฌ์„ฑํ•œ๋‹ค.

Motivation

Achievement

Figure 1

๋ฉ”๋ชจ๋ฆฌ ์†Œ๋น„ ์ธก๋ฉด์—์„œ S5(์Šค์บ” ๊ธฐ๋ฐ˜)๋Š” ์ƒํƒœ ํฌ๊ธฐ์— ๋”ฐ๋ผ ๋ฉ”๋ชจ๋ฆฌ๊ฐ€ ๊ธ‰์ฆํ•˜์ง€๋งŒ, RTF๋Š” ์„ ํ˜•์ ์œผ๋กœ ์ฆ๊ฐ€

  1. ์ƒํƒœ-์ž์œ  ๋ณต์žก๋„ ๋‹ฌ์„ฑ:
    • ๊ณต๊ฐ„ ๋ณต์žก๋„: O(โ„“) (์ƒํƒœ ๋…๋ฆฝ์ )
    • ์‹œ๊ฐ„ ๋ณต์žก๋„: O(โ„“log โ„“) (FFT ๊ธฐํ•œ)
    • ๊ธฐ์กด S4๋Š” O(โ„“+n), S5๋Š” O(โ„“n)
  2. ์™„์ „ํ•œ ํ‘œํ˜„๋ ฅ ๋ณด์กด:
    • ๋Œ€๊ฐ ํ–‰๋ ฌ ์ œ์•ฝ ์—†์ด ์ž„์˜์˜ ๋ฐ€์ง‘(dense) ์ƒํƒœ ์ „์ด ํ–‰๋ ฌ A์— ๋Œ€์‘ ๊ฐ€๋Šฅ
    • ์„ ํ˜• ์‹œ๋ถˆ๋ณ€ ์‹œ์Šคํ…œ์˜ ์™„์ „ํ•œ ํ•จ์ˆ˜ ๊ณต๊ฐ„ ํฌ๊ด„
  3. ์‹ค์ฆ ์„ฑ๋Šฅ:
    • Long Range Arena (LRA) ๋ฒค์น˜๋งˆํฌ์—์„œ S4 ๋Œ€๋น„ ํ‰๊ท  35% ํ•™์Šต ์†๋„ ๊ฐœ์„ 
    • ์–ดํ…์…˜-์ž์œ  ๋ชจ๋ธ ์ค‘ ์ตœ๊ณ  ์ˆ˜์ค€ ์ •ํ™•๋„ ๋‹ฌ์„ฑ
    • WikiText103 ์–ธ์–ด๋ชจ๋ธ๋ง์—์„œ Hyena ํ•„ํ„ฐ ๊ธฐ์ค€์„  ๋Œ€๋น„ ๊ฐœ์„ ๋œ ๋‹นํ˜น๋„(perplexity)

How

Figure 2

์ƒํƒœ-์ž์œ  ๋ณ‘๋ ฌ ์ถ”๋ก  ์•Œ๊ณ ๋ฆฌ์ฆ˜: (a) RTF ํ‘œํ˜„, (b) ์•Œ๊ณ ๋ฆฌ์ฆ˜ ํ๋ฆ„๋„(rFFTโ†’ํŒจ๋”ฉโ†’ํ•ฉ์„ฑ๊ณฑโ†’irFFT), (c) ๋‹จ์ผ ์Šคํ… ์ถ”๋ก ์šฉ ์žฌ๊ท€ ํ˜•ํƒœ

์ƒํƒœ๊ณต๊ฐ„ ํ‘œํ˜„ (A, B, C, hโ‚€)์€ ์œ ์‚ฌ๋ณ€ํ™˜์œผ๋กœ ๋ฌดํ•œํžˆ ๋งŽ์œผ๋‚˜, ์ „๋‹ฌํ•จ์ˆ˜ H(z)๋Š” ๊ณ ์œ ํ•˜๋ฏ€๋กœ ๋งค๊ฐœ๋ณ€์ˆ˜ํ™” ์•ˆ์ •์„ฑ ์ฆ๊ฐ€

์ž๋™ํšŒ๊ท€ ์ƒ์„ฑ ์‹œ์—๋Š” companion matrix ํ˜•ํƒœ์˜ ์žฌ๊ท€์‹ ์‚ฌ์šฉ์œผ๋กœ O(nยฒ) ๋‹จ์ผ ์Šคํ… ๊ณ„์‚ฐ ์œ ์ง€

๋ถ„๋ชจ ๊ณ„์ˆ˜ a๋กœ๋ถ€ํ„ฐ ํŠน์„ฑ ๋‹คํ•ญ์‹์˜ ๊ทผ(pole)์ด ๋‹จ์œ„์› ๋‚ด๋ถ€์— ์žˆ๋„๋ก ์ œ์•ฝํ•˜์—ฌ BIBO ์•ˆ์ •์„ฑ ๋ณด์žฅ

Originality

Limitation & Further Study

Evaluation

Novelty: 4.5/5 Technical Soundness: 4.5/5 Significance: 4/5 Clarity: 4/5 Overall: 4.25/5

์ดํ‰: ์ด ๋…ผ๋ฌธ์€ SSM์˜ ์ „๋‹ฌํ•จ์ˆ˜ ํ‘œํ˜„์„ ํ†ตํ•ด ์ƒํƒœ ํฌ๊ธฐ์™€ ๋ฌด๊ด€ํ•œ O(โ„“) ๋ฉ”๋ชจ๋ฆฌ ์ถ”๋ก ์„ ๋‹ฌ์„ฑํ•˜๋Š” ์šฐ์•„ํ•œ ์ด๋ก ์  ๊ธฐ์—ฌ์™€ 35% ํ•™์Šต ์†๋„ ๊ฐœ์„ ์ด๋ผ๋Š” ์‹ค์งˆ์  ์ด๋“์„ ์ œ๊ณตํ•œ๋‹ค. ๋‹ค๋งŒ ์ˆ˜์น˜ ์•ˆ์ •์„ฑ ๋ถ„์„ ๋ถ€์กฑ, ๋น„์„ ํ˜•์„ฑ ํ™•์žฅ์˜ ์ œํ•œ, MIMO ์‹œ์Šคํ…œ ์ง€์› ๋ฏธํก ๋“ฑ์ด ์‹ค๋ฌด ์ ์šฉ ๋ฒ”์œ„๋ฅผ ๋‹ค์†Œ ์ขํžŒ๋‹ค. ์„ ํ˜• ์‹œํ€€์Šค ๋ชจ๋ธ๋ง ๋ถ„์•ผ์—์„œ ์ค‘์š”ํ•œ ์ง„์ „์ด๋‚˜, ์ตœ๊ทผ ํ•˜์ด๋ธŒ๋ฆฌ๋“œ ์•„ํ‚คํ…์ฒ˜(์˜ˆ: Hyena+Mamba ๊ณ„์—ด) ๋Œ€๋น„ ์ƒ๋Œ€์  ์œ„์น˜ ์žฌํ‰๊ฐ€๊ฐ€ ํ•„์š”ํ•˜๋‹ค.

๊ฐ™์ด ๋ณด๋ฉด ์ข‹์€ ๋…ผ๋ฌธ

๊ธฐ๋ฐ˜ ์—ฐ๊ตฌ
Neural-POD ๋…ผ๋ฌธ์€ ์‹ ๊ฒฝ ์—ฐ์‚ฐ์ž ๊ธฐ๋ฐ˜์˜ ํšจ์œจ์  ์—ฐ์‚ฐ์ž ๊ทผ์‚ฌ์™€ SSM ํ•ด์„์— ๊ด€๋ จ๋œ ํ”„๋ ˆ์ž„์›Œํฌ๋ฅผ ์ œ๊ณตํ•ด ์ƒํƒœ-์ž์œ  ์ถ”๋ก ์— ์ด๋ก ์  ๊ธฐ๋ฐ˜์„ ์ œ๊ณตํ•ฉ๋‹ˆ๋‹ค.
๊ธฐ๋ฐ˜ ์—ฐ๊ตฌ
์ƒํƒœ๊ณต๊ฐ„ ๋ชจ๋ธ ์ด๋ก ์˜ ์‹ฌํ™”๋œ ํ•ด์„์„ ์ œ๊ณตํ•˜์—ฌ, Pairformer ๋ฐ SSM ๊ธฐ๋ฐ˜ ๋ถ„์ž๋™์—ญํ•™ ์ƒ์„ฑ ํ”„๋ ˆ์ž„์›Œํฌ์˜ ์ด๋ก ์  ์ดํ•ด๋ฅผ ๋„์™€์ค๋‹ˆ๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
Scaling Deep Learning for Materials Discovery ๋…ผ๋ฌธ์€ state-space model type์˜ ๊ณ„์‚ฐ ํšจ์œจ ๋ฌธ์ œ ๊ทน๋ณต์„ ์œ„ํ•œ ๋‹ค์–‘ํ•œ ์Šค์ผ€์ผ๋ง ๊ธฐ๋ฒ•์„ ์ œ์‹œํ•ฉ๋‹ˆ๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
๋‘˜ ๋‹ค ์–ธ์–ด ๋˜๋Š” ํ‘œํ˜„์˜ ์ „์ด์™€ ๋ณ‘๋ ฌ ์ฒ˜๋ฆฌ, ํŒŒ๋ผ๋ฏธํ„ฐ ํšจ์œจ์„ฑ์— ์ง‘์ค‘ํ•˜์ง€๋งŒ ์„ธ๋ถ€ ๋ฉ”์ปค๋‹ˆ์ฆ˜์ด ๋‹ค๋ฆ…๋‹ˆ๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
๋ฐ์ดํ„ฐ ๊ธฐ๋ฐ˜ ๊ธฐ๊ณ„ํ•™์Šต ๊ธฐ๋ฐ˜ ์ƒํ˜ธ์ž‘์šฉ ํผํ…์…œ ๊ตฌ์ถ• ๋…ผ๋ฌธ์€ ๊ณ ์ฐจ์› ๋ฐ ๋Œ€๊ทœ๋ชจ ์—ฐ์‚ฐ์˜ ํšจ์œจ์  ๋ณ‘๋ ฌํ™” ๋ฌธ์ œ ํ•ด๊ฒฐ ๊ด€์ ์—์„œ ๋Œ€์•ˆ์  ์ ‘๊ทผ์„ ์ œ์‹œํ•ฉ๋‹ˆ๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
๋‹ค์ˆ˜๊ณ„ ์ง„ํ™” ๋ฐฉ์ •์‹์˜ ์‹œ๊ฐ„ ์ง„ํ™”๋ฅผ ํšจ์œจ์ ์œผ๋กœ ํ•™์Šตํ•˜๋Š” ์ƒˆ๋กœ์šด ์‹ ๊ฒฝ ์—ฐ์‚ฐ์ž ๋ชจ๋ธ๋กœ, ์ƒํƒœ ๊ณต๊ฐ„ ์ถ”๋ก ๊ณผ ์œ ์‚ฌ ๋ฌธ์ œ๋ฅผ ๋‹ค๋ฃฌ๋‹ค.
ํ›„์† ์—ฐ๊ตฌ
Reward-Guided Iterative Refinement in Diffusion Models at Test Time ๋…ผ๋ฌธ์€ state-space approach์ฒ˜๋Ÿผ ๋ณ‘๋ ฌ ์ถ”๋ก  ์•Œ๊ณ ๋ฆฌ์ฆ˜์˜ ํšจ์œจ ํ–ฅ์ƒ ๋ฐ ์„ฑ๋Šฅ ๊ฐœ์„ ์„ ๋ชฉํ‘œ๋กœ ํ•ฉ๋‹ˆ๋‹ค.
ํ›„์† ์—ฐ๊ตฌ
3122์˜ GMT๋Š” ๋‹ค์–‘ํ•œ ๋งˆ์ดํฌ๋กœ ๊ตฌ์กฐ ์‹œ๋ฎฌ๋ ˆ์ด์…˜์—์„œ ์ƒํƒœ-๊ณต๊ฐ„ ๋ฐฉ์‹์˜ ํšจ์œจ์  ํ•ด๋ฒ•๊ณผ ์„ฑ๋Šฅ ํ™•์žฅ์„ ๋‹ค๋ฃจ์–ด, 772์—์„œ ์ œ์‹œํ•œ ๋ณ‘๋ ฌํ™”ยทFFT ๊ธฐ๋ฒ•์˜ ์‹ค์ œ ์‘์šฉ์„ ๋ณด์—ฌ์ค๋‹ˆ๋‹ค.
์‘์šฉ ์‚ฌ๋ก€
์‹ ๊ฒฝ ์—ฐ์‚ฐ์ž ๋ฐ SSM ๊ด€๋ จ ๊ธฐ๋ฒ•์„ ๊ณผํ•™์  PDE ํ•™์Šต ๋ฐ ๋‹ค์–‘ํ•œ ๋ฌผ๋ฆฌ ์‹œ์Šคํ…œ์—์„œ ์ง์ ‘์ ์œผ๋กœ ์ ์šฉํ•˜๋Š” ๋…ผ๋ฌธ์ž…๋‹ˆ๋‹ค.
← ๋ชฉ๋ก์œผ๋กœ ๋Œ์•„๊ฐ€๊ธฐ

๐ŸŽง Audio Overview

์ด ๋…ผ๋ฌธ ๋ฆฌ๋ทฐ๋ฅผ ํŒŸ์บ์ŠคํŠธํ˜• ์˜ค๋””์˜ค๋กœ ์ƒ์„ฑํ•ฉ๋‹ˆ๋‹ค. (Gemini ยท ํ‚ค๋Š” ๋ธŒ๋ผ์šฐ์ €์—๋งŒ ์ €์žฅ ยท ์™„์„ฑ๋ณธ์€ ์ด๋ฉ”์ผ๋กœ๋„ ์ „์†ก)
โ–ธ ๊ณ ๊ธ‰: ๊ตฌ์„ฑ ๋ฐฉํ–ฅ(๋Œ€๋ณธ ์ž‘์„ฑ ์ง€์นจ) ์ง์ ‘ ์ˆ˜์ •