์ ์: Shashank Subramanian, P. Harrington, K. Keutzer, W. Bhimji, D. Morozov, M. W. Mahoney, Amir Gholami | ๋ ์ง: 2023 | DOI: 10.48550/arXiv.2306.00258 📄 PDF
Essence
๋ค์ํ PDE ์์คํ
์ ๋ํ ์ฌ์ ํ์ต๊ณผ ๋ฏธ์ธ์กฐ์ ํ๋ ์์ํฌ
๋ณธ ๋
ผ๋ฌธ์ ์์ฐ์ธ์ด์ฒ๋ฆฌ(NLP)์ ์ปดํจํฐ๋น์ (CV) ๋ถ์ผ์์ ์ฑ๊ณต์ ์ผ๋ก ํ์ฉ๋ ํ์ด๋ฐ์ด์
๋ชจ๋ธ ํจ๋ฌ๋ค์(์ฌ์ ํ์ต-๋ฏธ์ธ์กฐ์ )์ ๊ณผํ ๋จธ์ ๋ฌ๋(Scientific Machine Learning, SciML) ๋ถ์ผ์ ์ ์ฉ ๊ฐ๋ฅํ์ง ์ฒด๊ณ์ ์ผ๋ก ๊ฒ์ฆํ๋ค. ํธ๋ฏธ๋ถ๋ฐฉ์ ์(PDE) ํ์ต ์์
์์ ์ ๊ฒฝ ์ฐ์ฐ์(Neural Operator)๋ฅผ ๋ค์ํ ๋ฌผ๋ฆฌ ์์คํ
์ผ๋ก ์ฌ์ ํ์ตํ ํ ๋ฏธ์ธ์กฐ์ ํ๋ฉด, ์ฒ์๋ถํฐ ํ์ตํ ๋ชจ๋ธ๋ณด๋ค ์ ์๋ฆฟ์ ์ ์ ๋ฐ์ดํฐ๋ก ๋ชฉํ ์ ํ๋์ ๋๋ฌํ ์ ์์์ ๋ณด์ธ๋ค.
Evaluation
Novelty: 4.5/5 Technical Soundness: 4/5 Significance: 4.5/5 Clarity: 4/5 Overall: 4.25/5
์ดํ: ๋ณธ ๋
ผ๋ฌธ์ SciML ๋ถ์ผ์์ ํ์ด๋ฐ์ด์
๋ชจ๋ธ ํจ๋ฌ๋ค์์ ๊ฐ๋ฅ์ฑ์ ์ฒ์์ผ๋ก ์ฒด๊ณ์ ์ผ๋ก ๊ฒ์ฆํ ์ค์ํ ์ฐ๊ตฌ๋ก, ๋ชจ๋ธ ํฌ๊ธฐ, ๋ฐ์ดํฐ ์ค์ผ์ผ, ๋ฌผ๋ฆฌ ํ๋ผ๋ฏธํฐ ๋ฒ์, ๋ค์ค ์ฐ์ฐ์ ๋ฑ ์ฌ๋ฌ ์ฐจ์์ ์ข
ํฉ ๋ถ์์ ํตํด ์ ์ดํ์ต์ ๊ฐ๋ ฅํ ์ด์ ์ ๋ช
ํํ ๋ณด์ธ๋ค. ๋ค๋ง ๋จ์ผ ์ํคํ
์ฒ์ ์๋์ ์ผ๋ก ๋จ์ํ PDE ์์คํ
์ ๊ตญํ๋์์ผ๋ฉฐ, ์ค์ ๊ณผํ ์์ฉ์ผ๋ก์ ํ์ฅ๊ณผ ๋ฌผ๋ฆฌ ๊ธฐ๋ฐ ์ ์ฝ์ ํตํฉ์ด ํฅํ ๊ณผ์ ์ด๋ค. SciML ์ปค๋ฎค๋ํฐ์ ์ค์ํ ๋ฒค์น๋งํฌ์ ๋ก๋๋งต์ ์ ์ํ๋ ์ ์์ ์์๊ฐ ํฌ๋ค.
๊ฐ์ด ๋ณด๋ฉด ์ข์ ๋
ผ๋ฌธ
๊ธฐ๋ฐ ์ฐ๊ตฌ
Galactica๋ ๊ณผํ ํนํ ๋น
ํ๋ฌ๋ค์ LLM์ผ๋ก, 829๋ฒ ๋
ผ๋ฌธ์ SciML ํ์ด๋ฐ์ด์
๋ชจ๋ธ ์คํ์ ๊ธฐ๋ฐ์ด ๋๋ ์ฌ๋ก์
๋๋ค.
๊ธฐ๋ฐ ์ฐ๊ตฌ
์ ๊ฒฝ ์ฐ์ฐ์์ ๊ธฐ๊ณํ์ต ๊ธฐ๋ฐ ๊ณผํ ๋ชจ๋ธ๋ง์ ๋ํ ๊ตฌ์กฐ ๋ฐ ์ฑ๋ฅ ๋ถ์์ ๋ค๋ฃฌ ๋
ผ๋ฌธ์ผ๋ก SciML ํ์ด๋ฐ์ด์
๋ชจ๋ธ ๋
ผ๋ฌธ์ ์ด๋ก ์ ๋ฐฐ๊ฒฝ์ ์ ๊ณตํฉ๋๋ค.
๊ธฐ๋ฐ ์ฐ๊ตฌ
829๋ ๊ณผํ๋ถ์ผ ํตํฉ foundation models์ ํ์์ฑ๊ณผ ๋ฏธ๋ ์ฒญ์ฌ์ง์ ์ ์ํ๋ฉฐ, 816์์ ์ ์ํ๋ AI-native ๊ฐ์๊ธฐ ๊ตฌํ์ ๊ธฐ๋ฐ์ด ๋ฉ๋๋ค.
๊ธฐ๋ฐ ์ฐ๊ตฌ
๊ณผํ ๊ธฐ๊ณํ์ต์ ์ํ ํ์ด๋ฐ์ด์
๋ชจ๋ธ ๊ฐ๋
์ด ์ ์ฐจ์ ๊ธฐ์ ์ ๊ธฐ๋ฐ ์ต์ ํ ๋ฐฉ๋ฒ๊ณผ ์ง์ ์ ์ผ๋ก ์ฐ๊ฒฐ๋๋ค.
๊ธฐ๋ฐ ์ฐ๊ตฌ
๊ณผํ์ ๋จธ์ ๋ฌ๋ ํ์ด๋ฐ์ด์
๋ชจ๋ธ์ ๋ถ์ผ๋ณ ํํฉ์ ์ฒด๊ณ์ ์ผ๋ก ์ ๋ฆฌํ์ฌ, RNA-๊ธฐ๋ฐ ํ์ด๋ฐ์ด์
๋ชจ๋ธ ์ฐ๊ตฌ์ ํฐ ํ ๊ทผ๊ฑฐ๋ฅผ ์ ๊ณตํฉ๋๋ค.
๊ธฐ๋ฐ ์ฐ๊ตฌ
๊ณผํ ๋ถ์ผ ํ์ด๋ฐ์ด์
๋ชจ๋ธ์ ์ ์ฌ๋ ฅ์ ๋
ผ์ํ๋ฏ๋ก, ๋ณธ ๋
ผ๋ฌธ์ ์ ๋๋ฒ์ค ๋จธ์ ๋ฌ๋ ํฌํ
์
๊ณผ ์ด๋ก ์ ์ฐ๊ฒฐ๊ณ ๋ฆฌ๋ฅผ ์ ๊ณตํฉ๋๋ค.
๊ธฐ๋ฐ ์ฐ๊ตฌ
์ฌ๋ฃ๊ณผํ ์ ๋ฐ์ ํ์ฉ ๊ฐ๋ฅํ ํ์ด๋ฐ์ด์
๋ชจ๋ธ ํ์ต, ๋๊ท๋ชจ ๊ตฌ์กฐ ๋ฐ์ดํฐ ์ฒ๋ฆฌ ๋ฑ์ ๋ํ ์ํคํ
์ฒ์ ๊ทผ๊ฑฐ ๋
ผ๋ฌธ์ด๋ค.
๋ค๋ฅธ ์ ๊ทผ
Scientific Machine Learning through Physics-Informed Neural Operator๋ ์ ๊ฒฝ ์ฐ์ฐ์์ ์ฌ์ ํ์ต ๊ธฐ๋ฐ์ SciML ๋ฉ์ปค๋์ฆ์ ์ค์ ํ์ต์ ์ ์ฉํ์ฌ ๋น๊ต ์ง์ ์ด ๋๋ค.
๋ค๋ฅธ ์ ๊ทผ
Foundation models in bioinformatics ๋
ผ๋ฌธ์ Bio ๋ถ์ผ์ ํนํ๋ ์ฌ์ ํ์ต-๋ฏธ์ธ์กฐ์ ๊ฐ๋
ํ์ฅ ๋ฐ ํ๊ฐ๋ฅผ ์งํํ์ฌ, 829 ๋
ผ๋ฌธ์ SciML ๊ด์ ์ ๋ณด์ํฉ๋๋ค.
๋ค๋ฅธ ์ ๊ทผ
๋ฒ ์ด์ง์ ์คํ ์ค๊ณ์ ์ ์ฌํ ๋ฌธ์ ๋ฅผ ๋ค๋ฅธ ๊ด์ ์์ ์ ๊ทผํ๋ค.
ํ์ ์ฐ๊ตฌ
๊ณผํํนํ LLM (Galactica)์ ๊ธฐ๋ฒ๊ณผ ์ฑ๋ฅ์, ๋ค์ํ SciML ํ์ด๋ฐ์ด์
๋ชจ๋ธ๋ก ํ์ฅยท๊ฒ์ฆํ๋ ์ค์ฆ ์ฐ๊ตฌ์
๋๋ค.
ํ์ ์ฐ๊ตฌ
์ฌ๋ฃ ๊ณผํ ๋ฑ ๋ค์ํ ๊ณผํ ๋ถ์ผ์์ ํ์ด๋ฐ์ด์
๋ชจ๋ธ ์ ์ฉ ์ฌ๋ก์ ๋น๊ต์ฐ๊ตฌ๋ฅผ ํตํด, ํ๊ฒฝ ์ํ๊ณ ๋ชจ๋ธ๋ง์ ํ์ ์ ๊ฐ๋ฅ์ฑ์ ํ์ธํ ์ ์์ต๋๋ค.
ํ์ ์ฐ๊ตฌ
๊ณผํ๋ถ์ผ ํ์ด๋ฐ์ด์
๋ชจ๋ธ ๋ฐ์ ์ ํตํฉ์ ๋ถ์์ ์ถ๊ฐ๋ก ์ ๊ณตํ์ฌ, AI4S์ ์ฅ๊ธฐ์ ์ ๋ง์ ๊ตฌ์ฒด์ ์ผ๋ก ์ดํดํ๋ ๋ฐ ๋์์ ์ค๋๋ค.
ํ์ ์ฐ๊ตฌ
377์ ๊ณผํ์ ํ์ด๋ฐ์ด์
๋ชจ๋ธ ์ ์ฒด ํ๋ฆ์ ์ต๊ทผ ๋ถ์ํ๋ฉฐ, SciML ๋ถ์ผ์์ 829๊ฐ ์ ๊ธฐํ ์ ๊ฒฝ ์ฐ์ฐ์ ์ค์ฌ๋ฐฉ๋ฒ์ ์ต์ ํธ๋ ๋ยท์ ์ฉ ์์๋ฅผ ๋ณด์ํฉ๋๋ค.
ํ์ ์ฐ๊ตฌ
๊ณผํ ML ํ๋ ์์ํฌ๊ฐ ๊ธฐ๊ณํ์ต ํผํ
์
์ ๋ฒ์ฉ์ฑ, ์ ์ด์ฑ ๋ฑ์ ์ด๋ค ํ๊ณ๋ฅผ ๊ฐ์ง ์ ์๋์ง ์ฌ๋ก๋ฅผ ๋ค์ด ๋
ผ์ํฉ๋๋ค.
ํ์ ์ฐ๊ตฌ
๊ณผํ ๋จธ์ ๋ฌ๋ ํ์ด๋ฐ์ด์
๋ชจ๋ธ์ ๋ํ ํํฉ ๋ฐ ๋์ ๊ณผ์ ๋ฅผ ๋จ๋ฐฑ์ง ๋์ญํ์ ํ์ ํ์ง ์๊ณ ๋ฒ์ฉ์ ์ผ๋ก ๋
ผ์ํฉ๋๋ค.
ํ์ ์ฐ๊ตฌ
๊ณผํ ๋จธ์ ๋ฌ๋์ ํ์ด๋ฐ์ด์
๋ชจ๋ธ ๋ฐฉํฅ์ฑ๊ณผ ๋ฐ์ดํฐ ํ์ฉ ์ ๋ต์ ๋
ผ์ํ์ฌ ๋ณธ๋ฌธ์ ๋ฐฉ๋ฒ๋ก ๊ณผ ํตํฉ์ ์ดํด๋ฅผ ์ ๊ณตํฉ๋๋ค.
์์ฉ ์ฌ๋ก
343์ ์์ฌ ๋ฐ๊ฒฌ ๋ถ์ผ์์ 829์ ํ์ด๋ฐ์ด์
๋ชจ๋ธ ๊ฐ๋
๊ณผ ํจ์ฉ์ ์ค์ ์ฐ๊ตฌ์ ์ด๋ป๊ฒ ์ ์ฉํ๊ณ ์๋์ง ์ฌ๋ก ์ค์ฌ์ผ๋ก ๋ค๋ฃน๋๋ค.