Foundation models in bioinformatics

์ €์ž: Fei Guo, Renchu Guan, Yaohang Li, Qi Liu, Xiaowo Wang, Can Yang, Jianxin Wang | ๋‚ ์งœ: 2025-03-07 | DOI: 10.1093/nsr/nwaf028 📄 PDF


Essence

Figure 1

๊ทธ๋ฆผ 1: ์ƒ๋ฌผ์ •๋ณดํ•™์˜ ๊ธฐ์ดˆ ๋ชจ๋ธ. ๊ณ ์ฒ˜๋ฆฌ๋Ÿ‰ ๋ฐ์ดํ„ฐ(DNA, RNA, ๋‹จ๋ฐฑ์งˆ, ๋ถ„์ž)๋กœ๋ถ€ํ„ฐ ๋‹ค์–‘ํ•œ ๋‹ค์šด์ŠคํŠธ๋ฆผ ์ž‘์—…(๊ฒŒ๋†ˆํ•™, ์ „์‚ฌ์ฒดํ•™, ๋‹จ๋ฐฑ์งˆํ•™, ์•ฝ๋ฌผ ๋ฐœ๊ฒฌ, ๋‹จ์ผ ์„ธํฌ ๋ถ„์„)์„ ์ˆ˜ํ–‰ํ•˜๋Š” ๊ธฐ์ดˆ ๋ชจ๋ธ์˜ ์ข…๋ฅ˜ ๋ฐ ํ™œ์šฉ.

๊ธฐ์ดˆ ๋ชจ๋ธ(FM)์ด ์ƒ๋ฌผ์ •๋ณดํ•™์— ๋„์ž…๋˜๋ฉด์„œ AI๋Š” ๋Œ€๊ทœ๋ชจ ๋ฏธํ‘œ์ง€ ๋ฐ์ดํ„ฐ ์ฒ˜๋ฆฌ, ์‚ฌ์ „ํ•™์Šต(pre-training) ํ”„๋ ˆ์ž„์›Œํฌ, ๋ชจ๋ธ ํ‰๊ฐ€ ๋ฐ ํ•ด์„ ๊ฐ€๋Šฅ์„ฑ ๋“ฑ ์—ญ์‚ฌ์  ๊ณผ์ œ๋“ค์„ ํ•ด๊ฒฐํ•˜๊ณ  ์žˆ๋‹ค. ๋ณธ ๋…ผ๋ฌธ์€ ์–ธ์–ด FM, ์‹œ๊ฐ FM, ๊ทธ๋ž˜ํ”„ FM, ๋‹ค์ค‘๋ชจ๋‹ฌ FM์˜ 4๊ฐ€์ง€ ์œ ํ˜•์œผ๋กœ ๋ถ„๋ฅ˜๋œ ๊ธฐ์ดˆ ๋ชจ๋ธ๋“ค์ด ๊ฒŒ๋†ˆํ•™, ์ „์‚ฌ์ฒดํ•™, ๋‹จ๋ฐฑ์งˆํ•™, ์•ฝ๋ฌผ ๋ฐœ๊ฒฌ, ๋‹จ์ผ ์„ธํฌ ๋ถ„์„ ๋“ฑ ๋‹ค์–‘ํ•œ ์ƒ๋ฌผ์ •๋ณดํ•™ ์‘์šฉ์—์„œ ๋‹ฌ์„ฑํ•œ ์ตœ๊ทผ ์„ฑ๊ณผ๋ฅผ ์ข…ํ•ฉ์ ์œผ๋กœ ๊ฒ€ํ† ํ•œ๋‹ค.

Motivation

Achievement

Figure 2

๊ทธ๋ฆผ 2: ์ƒ๋ฌผ์ •๋ณดํ•™์˜ ๊ธฐ์ดˆ ๋ชจ๋ธ ์ง„ํ™”. 2020๋…„๋ถ€ํ„ฐ 2024๋…„๊นŒ์ง€ ๊ฒŒ๋†ˆํ•™, ์ „์‚ฌ์ฒดํ•™, ๋‹จ๋ฐฑ์งˆํ•™, ์•ฝ๋ฌผ ๋ฐœ๊ฒฌ, ๋‹จ์ผ ์„ธํฌ ๋ถ„์„ ๋ถ„์•ผ์—์„œ ๊ฐœ๋ฐœ๋œ ์ฃผ์š” ๋ชจ๋ธ๋“ค์˜ ์‹œ๊ฐ„์  ์ง„ํ™” ๊ถค์ .

  1. ๊ตฌ์กฐํ™”๋œ ๋ถ„๋ฅ˜์ฒด๊ณ„: ์–ธ์–ด FM(DNABERT, RNABERT, ProteinBERT, ChemBERTa ๋“ฑ), ์‹œ๊ฐ FM(Enformer, AlphaFold ๋“ฑ), ๊ทธ๋ž˜ํ”„ FM(GNN ๊ธฐ๋ฐ˜ ๋ถ„์ž ํ‘œํ˜„ ํ•™์Šต), ๋‹ค์ค‘๋ชจ๋‹ฌ FM(๋ฉ€ํ‹ฐ ์˜ค๋ฏน์Šค ํ†ตํ•ฉ) ๋“ฑ 4๊ฐ€์ง€ ์œ ํ˜•๋ณ„ 20๊ฐœ ์ด์ƒ์˜ ์ฃผ์š” ๋ชจ๋ธ์„ ์ฒด๊ณ„์ ์œผ๋กœ ๋ถ„๋ฅ˜
  2. ์‘์šฉ ์˜์—ญ ํ™•๋Œ€: ๋‹จ์ˆœํ•œ ์„œ์—ด ๋ถ„๋ฅ˜์—์„œ ์ถœ๋ฐœํ•˜์—ฌ (1์„ธ๋Œ€), ๊ด‘๋ฒ”์œ„ํ•œ ์ „์ด ํ•™์Šต์ด ๊ฐ€๋Šฅํ•œ ์‚ฌ์ „ํ•™์Šต ๋ชจ๋ธ๋กœ ์ง„ํ™”(2์„ธ๋Œ€), ๋ฉ€ํ‹ฐํƒœ์Šคํฌ ํ•™์Šต์œผ๋กœ ํ™•์žฅ(3์„ธ๋Œ€), ์ตœ๊ทผ ๋‹ค์ค‘๋ชจ๋‹ฌ ํ†ตํ•ฉ ๋ถ„์„์œผ๋กœ ๋ฐœ์ „(4์„ธ๋Œ€) - ๋‹จ๋ฐฑ์งˆ ๊ตฌ์กฐ ์˜ˆ์ธก(AlphaFold โ†’ AlphaFold3)์˜ ์‚ฌ๋ก€๋กœ ์ž…์ฆ
  3. ์ƒ๋ฌผํ•™์  ๋ฌธ์ œ ํ•ด๊ฒฐ์˜ ๋‹ค์–‘ํ™”: ๋ฐ”์ด์˜ค๋งˆ์ปค ๋ฐœ๊ฒฌ, ํšจ์†Œ ์„ค๊ณ„, ํ•ญ์ฒด-ํ•ญ์› ์ธ์‹, ์•ฝ๋ฌผ ๋ฐœ๊ฒฌ, ์˜ค๋ฏน์Šค ๋ถ„์„, ์งˆ๋ณ‘ ์ง„๋‹จ ๋“ฑ ํญ๋„“์€ ์ƒ๋ฌผํ•™์  ๋„์ „์— ๋Œ€ํ•œ FM ์ ์šฉ ์„ฑ๊ณต ์‚ฌ๋ก€ ์ œ์‹œ

How

Originality

Limitation & Further Study

Evaluation

์ดํ‰: ๋ณธ ๋…ผ๋ฌธ์€ ๊ธ‰์†ํžˆ ๋ฐœ์ „ํ•˜๋Š” ์ƒ๋ฌผ์ •๋ณดํ•™ ๊ธฐ์ดˆ ๋ชจ๋ธ ๋ถ„์•ผ๋ฅผ ์ข…ํ•ฉ์ ์œผ๋กœ ์ •๋ฆฌํ•œ ์ค‘์š”ํ•œ ๋ฆฌ๋ทฐ๋กœ, 4๊ฐ€์ง€ FM ์œ ํ˜•๊ณผ 5๊ฐ€์ง€ ์‘์šฉ๋ถ„์•ผ์˜ ์ด์› ๋ถ„๋ฅ˜์ฒด๊ณ„๋ฅผ ํ†ตํ•ด ์‹ค๋ฌด์ž์˜ ๋ชจ๋ธ ์„ ํƒ์„ ๋•๋Š” ์‹ค์งˆ์  ๊ฐ€์น˜๊ฐ€ ์žˆ๋‹ค. ๋‹ค๋งŒ ํ•ด์„ ๊ฐ€๋Šฅ์„ฑ, ํ™˜๊ฐ ๋ฌธ์ œ, ๋ฒค์น˜๋งˆํฌ ํ‘œ์ค€ํ™” ๊ฐ™์€ ๊ฐœ๋ฐฉ๋œ ๊ณผ์ œ๋“ค์— ๋Œ€ํ•œ ๊ตฌ์ฒด์  ํ•ด๊ฒฐ ๋ฐฉ์•ˆ์ด ์ถ”๊ฐ€๋˜๋ฉด ๋…ผ๋ฌธ์˜ ์™„์„ฑ๋„๊ฐ€ ๋”์šฑ ๋†’์•„์งˆ ๊ฒƒ์œผ๋กœ ์˜ˆ์ƒ๋œ๋‹ค.

๊ฐ™์ด ๋ณด๋ฉด ์ข‹์€ ๋…ผ๋ฌธ

๊ธฐ๋ฐ˜ ์—ฐ๊ตฌ
์ƒ๋ฌผ์ •๋ณดํ•™ ๋ถ„์•ผ์˜ foundation model ์„œ๋ฒ ์ด(344)๋Š” 686๊ณผ ๊ฐ™์€ ๋‹จ๋ฐฑ์งˆ ์„ค๊ณ„ ์‹ฌํ™” ์—ฐ๊ตฌ์˜ ๊ธฐ๋ฐ˜์„ ์ œ๊ณตํ•œ๋‹ค.
๊ธฐ๋ฐ˜ ์—ฐ๊ตฌ
344 ๋…ผ๋ฌธ์€ foundation model๊ณผ ๋ฉ€ํ‹ฐ๋ชจ๋‹ฌ ์—ฐ๊ณ„ ๊ฐ€๋Šฅ์„ฑ์„ ์ œ์‹œํ•˜์—ฌ, ๊ณ ํ•ด์ƒ๋„ ๋‚ ์”จ ์˜ˆ์ธก ์‹œ์Šคํ…œ์—๋„ ์ด๋ก ์  ๊ธฐ๋ฐ˜์„ ๋ถ€์—ฌํ•  ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค.
๊ธฐ๋ฐ˜ ์—ฐ๊ตฌ
์ƒ๋ฌผํ•™ ํ…์ŠคํŠธ ๊ธฐ๋ฐ˜์˜ LLM ํ™œ์šฉ ํ˜„ํ™ฉ์„ ์ •๋ฆฌํ•˜์—ฌ, ESMFold ๊ฐ™์€ protein language model ์ ‘๊ทผ์˜ ์ด๋ก ์  ๋ฐฐ๊ฒฝ์„ ์ œ๊ณตํ•œ๋‹ค.
๊ธฐ๋ฐ˜ ์—ฐ๊ตฌ
344๋Š” ์ƒ๋ฌผ์ •๋ณดํ•™ ๋ถ„์•ผ์—์„œ์˜ ํŒŒ์šด๋ฐ์ด์…˜ ๋ชจ๋ธ ๊ฐœ๊ด„์„œ๋กœ, 256์˜ ๋‹จ๋ฐฑ์งˆ ์„ค๊ณ„ diffusion ๋ชจ๋ธ์˜ ๊ธฐ์ˆ ์  ๋ฐ ์ด๋ก ์  ๊ธฐ๋ฐ˜์ด ๋œ๋‹ค.
๊ธฐ๋ฐ˜ ์—ฐ๊ตฌ
271๊ณผ ๊ฐ™์ด ํ™”ํ•™๋ถ„์•ผ LLM์„ ๊ฐœ๋ฐœยท์‘์šฉํ•œ ๋…ผ๋ฌธ์€ 344์˜ ๋ฐ”์ด์˜ค/ํ™”ํ•™ ๋ถ„์•ผ foundation model ์„œ๋ฒ ์ด๋กœ ์ „์ฒด ํŠธ๋ Œ๋“œ๋ฅผ ์กฐ๋ช…ํ•  ์ˆ˜ ์žˆ๋‹ค.
๊ธฐ๋ฐ˜ ์—ฐ๊ตฌ
๋ฐ”์ด์˜ค ํŒŒ์šด๋ฐ์ด์…˜ ๋ชจ๋ธ์˜ ์ „๋ฐ˜์  ํ™œ์šฉ ํ”„๋ ˆ์ž„์›Œํฌ๊ฐ€ ๋ฌผ๋ฆฌ ์ œ์•ฝ ๊ธฐ๋ฐ˜ ์˜ˆ์ธก์˜ ์ดˆ์„์ด ๋ฉ๋‹ˆ๋‹ค.
๊ธฐ๋ฐ˜ ์—ฐ๊ตฌ
Scientific Large Language Models: A Survey on Biological & Chemical ๋ถ„์•ผ๋ณ„ FM ๋™ํ–ฅ์„ ์ข…ํ•ฉ์ •๋ฆฌ, ๋ณธ ๋…ผ๋ฌธ์˜ ๋ถ„์•ผ๋ณ„ ์‘์šฉ์‚ฌ๋ก€์— ์ด๋ก ์  ๊นŠ์ด๋ฅผ ๋”ํ•ฉ๋‹ˆ๋‹ค.
๊ธฐ๋ฐ˜ ์—ฐ๊ตฌ
713์˜ ๋„๋ฉ”์ธ๋ณ„ ๋ฐ”์ด์˜ค/ํ™”ํ•™/๋ฌผ์งˆ NER ๋ฒค์น˜๋งˆํฌ ์„ค๊ณ„๋Š” 344์˜ ๋ฐ”์ด์˜ค์ธํฌ ํŒŒ์šด๋ฐ์ด์…˜ ๋ชจ๋ธ์˜ ๊ธฐ๋ณธ ๊ฐœ๋…๊ณผ ์„ฑ๋Šฅํ‰๊ฐ€ ๋งฅ๋ฝ์„ ์ œ๊ณตํ•ฉ๋‹ˆ๋‹ค.
๊ธฐ๋ฐ˜ ์—ฐ๊ตฌ
์ƒ๋ช…๊ณผํ•™ ๋ฐ ํ™”ํ•™ ๋ถ„์•ผ์—์„œ ํŒŒ์šด๋ฐ์ด์…˜ ๋ชจ๋ธ์˜ ํ˜„ํ™ฉ์„ ์ •๋ฆฌํ•œ ๋…ผ๋ฌธ์œผ๋กœ, ๋ฉ€ํ‹ฐ๋ชจ๋‹ฌ ๊ธฐ๋ฐ˜ ํ™”ํ•™ ์ง€์‹ ํ™œ์šฉ์˜ ๊ธฐ์ˆ ์  ํ† ๋Œ€๋ฅผ ์ œ๊ณตํ•œ๋‹ค.
๊ธฐ๋ฐ˜ ์—ฐ๊ตฌ
Foundation models in bioinformatics ๋…ผ๋ฌธ์—์„œ Evo 2์™€ ๊ฐ™์€ ์ƒ๋ช…์ •๋ณด ํŒŒ์šด๋ฐ์ด์…˜๋ชจ๋ธ์˜ ํ˜„ํ™ฉ๊ณผ ํ•œ๊ณ„, ํ˜„์—… ์‘์šฉ์„ ์ข…ํ•ฉ์ ์œผ๋กœ ๋‹ค๋ฃน๋‹ˆ๋‹ค.
๊ธฐ๋ฐ˜ ์—ฐ๊ตฌ
๊ธฐ์ดˆ ์ƒ๋ฌผ์ •๋ณดํ•™ ๋ถ„์•ผ์—์„œ ํŒŒ์šด๋ฐ์ด์…˜ ๋ชจ๋ธ์ด ๋Œ€๊ทœ๋ชจ ์ƒ๋ฌผํ•™ ๋ฐ์ดํ„ฐ ๋ถ„์„์— ์–ด๋–ป๊ฒŒ ์ ์šฉ๋˜๋Š”์ง€ ๊ฐœ๊ด„์ ์œผ๋กœ ์„ค๋ช…ํ•˜๊ณ  ์žˆ๋‹ค.
๊ธฐ๋ฐ˜ ์—ฐ๊ตฌ
์ƒ๋ฌผ์ •๋ณด, ์žฌ๋ฃŒ๊ณผํ•™ ๋“ฑ์—์„œ ํŒŒ์šด๋ฐ์ด์…˜ ๋ชจ๋ธ ๋„์ž…์˜ ํ˜„ํ™ฉ๊ณผ ๋ฐ์ดํ„ฐ/๊ฒฐ๊ณผ ์‹ ๋ขฐ์„ฑ ํ™•๋ณด ๋ฐฉ๋ฒ• ๋“ฑ ํ”„๋ ˆ์ž„์›Œํฌ ๋…ผ์˜๊ฐ€ ์—ฐ๊ตฌ ๋ฌด๊ฒฐ์„ฑ ๋งฅ๋ฝ์—์„œ ์ค‘์š”ํ•˜๊ฒŒ ์ฐธ๊ณ ๋œ๋‹ค.
๊ธฐ๋ฐ˜ ์—ฐ๊ตฌ
๋ฐ”์ด์˜ค ํŒŒ์šด๋ฐ์ด์…˜ ๋ชจ๋ธ์˜ ๋‹ค์ค‘ ๋ชจ๋‹ฌ ์—ฐ๊ณ„ ๋ฐ state-space ๋ชจ๋ธ๋ง ์›๋ฆฌ์— ๋Œ€ํ•œ ์ด๋ก ์  ๊ธฐ๋ฐ˜์„ ์ œ๊ณตํ•ฉ๋‹ˆ๋‹ค.
๊ธฐ๋ฐ˜ ์—ฐ๊ตฌ
๋‹จ๋ฐฑ์งˆ ์–ธ์–ด๋ชจ๋ธ์˜ ๊ธฐ์ดˆ ๊ตฌ์กฐ ๋ฐ ์ž์—ฐ์–ด๋ชจ๋ธ๊ณผ์˜ ๋น„๊ต๋ฅผ ๋‹ค๋ฃจ์–ด 3221์˜ ๋‚ดยท์™ธ๋ถ€ ๋ฉ”์ปค๋‹ˆ์ฆ˜ ๋น„๊ต ์—ฐ๊ตฌ์— ์ด๋ก  ๋ฐฐ๊ฒฝ์„ ์ œ๊ณตํ•œ๋‹ค.
๊ธฐ๋ฐ˜ ์—ฐ๊ตฌ
์ƒ๋ฌผ์ •๋ณดํ•™์—์„œ ํŒŒ์šด๋ฐ์ด์…˜ ๋ชจ๋ธ์˜ ๊ตฌ์กฐ์  ์ „์ด์™€ ์‘์šฉ์„ ํฌ๊ด„ํ•ด ์ž๋ฃŒ ์ฆ๊ฐ• ๋ฐ ๊ฒ€์ƒ‰ ํ™œ์šฉ MMPT ํ”„๋ ˆ์ž„์›Œํฌ์˜ ๊ธฐ๋ฐ˜์ด ๋œ๋‹ค.
๊ธฐ๋ฐ˜ ์—ฐ๊ตฌ
ํŒŒ์šด๋ฐ์ด์…˜ ๋ชจ๋ธ ๊ธฐ๋ฐ˜ ์ƒ๋ช…๊ณผํ•™ ๋ถ„์„ ํ”„๋ ˆ์ž„ ์›Œํฌ๋ฅผ ์ข…ํ•ฉ์ ์œผ๋กœ ๋ฆฌ๋ทฐํ•˜์—ฌ ๋ณ€์ด ์„œ๋ช… ์ถ”์ถœ ๋”ฅ๋Ÿฌ๋‹ ๋ชจ๋ธ ๊ฐœ๋ฐœ์— ์ง์ ‘์  ๋ฐฐ๊ฒฝ์„ ์ œ๊ณตํ•ฉ๋‹ˆ๋‹ค.
๊ธฐ๋ฐ˜ ์—ฐ๊ตฌ
์ƒ๋ฌผ์ •๋ณดํ•™์—์„œ ํŒŒ์šด๋ฐ์ด์…˜ ๋ชจ๋ธ์˜ ๋‚ด๋ถ€ ํ‘œํ˜„์— ๋Œ€ํ•œ ์ „๋ฐ˜์  ํ˜„ํ™ฉ์„ ๋‹ค๋ฃจ๋ฏ€๋กœ ์œ„์ƒ ๋ฐ ๊ธฐํ•˜ ๊ตฌ์กฐ ๋ถ„์„ ๋…ผ๋ฌธ์˜ ๊ธฐ๋ฐ˜์ด ๋œ๋‹ค.
๊ธฐ๋ฐ˜ ์—ฐ๊ตฌ
344๋ฒˆ ๋…ผ๋ฌธ์€ ๋ฐ”์ด์˜ค/์†Œ์žฌ ๋ถ„์•ผ ํŒŒ์šด๋ฐ์ด์…˜ ๋ชจ๋ธ์˜ ๊ตฌ์กฐ์  ํ† ๋Œ€์™€ ๋ฐœ์ „ ๋ฐฉํ–ฅ์„ ์‹ฌ๋„ ๊นŠ๊ฒŒ ๋‹ค๋ค„ SpbNet ๊ธฐ์ดˆ ์ดํ•ด์— ๋„์›€์ด ๋ฉ๋‹ˆ๋‹ค.
๊ธฐ๋ฐ˜ ์—ฐ๊ตฌ
344์˜ ๋ฐ”์ด์˜ค ํŒŒ์šด๋ฐ์ด์…˜ ๋ชจ๋ธ ์ด์„ค์€ 3161์˜ message passing ๊ธฐ๋ฐ˜ ๋จธ์‹ ๋Ÿฌ๋‹์ด ์žฌ๋ฃŒยท๋ถ„์ž ๋ถ„์•ผ ํŠน์ด์  AI์™€ ์–ด๋–ป๊ฒŒ ์‹œ๋„ˆ์ง€๋ฅผ ๋‚ด๋Š”๊ฐ€๋ฅผ ์กฐ๋ช…ํ•ฉ๋‹ˆ๋‹ค.
๊ธฐ๋ฐ˜ ์—ฐ๊ตฌ
344 ๋…ผ๋ฌธ์€ ์ƒ๋ฌผ์ •๋ณดํ•™ ๋ถ„์•ผ์˜ ํŒŒ์šด๋ฐ์ด์…˜ ๋ชจ๋ธ์˜ ์ตœ์‹  ์—ญํ• ๊ณผ ์ด๋ก ์„ ์ •๋ฆฌํ•จ์œผ๋กœ์จ, 3179์˜ ์„ธํฌ ๋‹จ์ผ์œ ํ˜• ์ง€์‹ ๊ธฐํ•˜ ๋ถ„์„์— ๋ฐฐ๊ฒฝ ์ง€์‹์„ ์ œ๊ณตํ•ฉ๋‹ˆ๋‹ค.
๊ธฐ๋ฐ˜ ์—ฐ๊ตฌ
๋‹จ๋ฐฑ์งˆยท๋ถ„์ž ๋ถ„์•ผ foundation model์˜ ๋ฐ์ดํ„ฐ ํ™œ์šฉ๊ณผ ๋ฒค์น˜๋งˆํฌ ํ˜„ํ™ฉ์„ ์•Œ ์ˆ˜ ์žˆ์œผ๋ฏ€๋กœ, M2UMol์˜ ์‚ฌ์ „ํ•™์Šตยท์ „์ด ์ „๋žต ์ดํ•ด์— ์ฐธ๊ณ ๊ฐ€ ๋œ๋‹ค.
๊ธฐ๋ฐ˜ ์—ฐ๊ตฌ
์ƒ๋ช…์ •๋ณดํ•™์—์„œ ํ”„๋ผ์ด๋ฒ„์‹œ์™€ ๋ฐ์ดํ„ฐ ์œ ํ‹ธ๋ฆฌํ‹ฐ์˜ ๊ท ํ˜•์ ์„ ๋…ผ์˜ํ•˜๋ฉฐ, 3215์˜ ํŒฌ๊ฒŒ๋†ˆ ๊ทธ๋ž˜ํ”„ ๊ฐœ์ธ์ •๋ณด๋ณดํ˜ธ์™€ ๋ฐ€์ ‘ํžˆ ๊ด€๋ จ๋œ๋‹ค.
๊ธฐ๋ฐ˜ ์—ฐ๊ตฌ
344๋ฒˆ ๋…ผ๋ฌธ์€ ์ƒ๋ฌผ์ •๋ณดํ•™ ํŒŒ์šด๋ฐ์ด์…˜ ๋ชจ๋ธ์˜ ํ˜„ํ™ฉ์„ ๋‹ค๋ฃจ๋ฉฐ, ๋ฉ€ํ‹ฐ๋ชจ๋‹ฌ single-cell ๋ชจ๋ธ ์„ค๊ณ„์˜ ์ด๋ก ์  ๋ฐฐ๊ฒฝ์„ ์ œ๊ณตํ•ฉ๋‹ˆ๋‹ค.
๊ธฐ๋ฐ˜ ์—ฐ๊ตฌ
344๋ฒˆ ๋…ผ๋ฌธ์€ ์ƒ๋ฌผ์ •๋ณดํ•™ ํŒŒ์šด๋ฐ์ด์…˜ ๋ชจ๋ธ ๋ฐ ํ•ญ์ฒด ์˜ˆ์ธก AI์˜ ๊ธฐ์ˆ ์  ํ† ๋Œ€๋ฅผ ์ •๋ฆฌํ•˜์—ฌ, CALM์˜ ์„ค๊ณ„ยท์‘์šฉ ์ดํ•ด์— ๋„์›€์ด ๋ฉ๋‹ˆ๋‹ค.
๊ธฐ๋ฐ˜ ์—ฐ๊ตฌ
์ƒ๋ช…์ •๋ณดํ•™์—์„œ foundation models์˜ ์ ์šฉ์ด MoA signature ํ•ด์„ ๋“ฑ์—์„œ ์ค‘์š”ํ•œ ๊ธฐ๋ฐ˜์„ ์ œ๊ณตํ•œ๋‹ค.
๊ธฐ๋ฐ˜ ์—ฐ๊ตฌ
344๋ฒˆ ๋…ผ๋ฌธ์€ ๋ฐ”์ด์˜ค์ •๋ณดํ•™ ๊ด€๋ จ ํŒŒ์šด๋ฐ์ด์…˜ ๋ชจ๋ธ ํ™œ์šฉ์˜ ํ•œ๊ณ„์™€ ์ž ์žฌ๋ ฅ์— ๋Œ€ํ•œ ๊ทผ๊ฑฐ๋ฅผ ์ œ๊ณตํ•ด, ๋„๋ฉ”์ธ ์ ์‘ ์‹คํ—˜ ํ•ด์„์— ๋„์›€์„ ์ค๋‹ˆ๋‹ค.
๊ธฐ๋ฐ˜ ์—ฐ๊ตฌ
์ƒ์„ฑํ˜• ํŒŒ์šด๋ฐ์ด์…˜ ๋ชจ๋ธ์˜ ์†Œ์žฌ ๋ฐœ๊ฒฌ ์‘์šฉ์ด ์ฒ ์ €ํžˆ ๋…ผ์˜๋˜์–ด, cold metal ์—ญ์„ค๊ณ„ ๋ฒ•์— ์ด๋ก ์ /์‹คํ—˜์  ๊ทผ๊ฐ„์„ ์ œ๊ณตํ•ฉ๋‹ˆ๋‹ค.
๊ธฐ๋ฐ˜ ์—ฐ๊ตฌ
ํ•ต์‚ฐ ๊ตฌ์กฐ-๊ธฐ๋Šฅ ๊ด€๊ณ„ ์˜ˆ์ธก์˜ ๊ธฐ๋ฐ˜ ๋ชจ๋ธ์„ ์ œ๊ณตํ•œ๋‹ค.
๊ธฐ๋ฐ˜ ์—ฐ๊ตฌ
Foundation models in bioinformatics ๋…ผ๋ฌธ์€ ๋Œ€๊ทœ๋ชจ ๋ถ„์žยท์ƒ๋ฌผ ๋ฐ์ดํ„ฐ์—์„œ foundation model์˜ ์žฅ๋‹จ์ ๊ณผ ์‹ ๋ขฐ์„ฑ ๋…ผ์˜๋ฅผ ํฌ๊ด„์ ์œผ๋กœ ์ œ๊ณตํ•œ๋‹ค.
๊ธฐ๋ฐ˜ ์—ฐ๊ตฌ
์ƒ๋ฌผ์ •๋ณดํ•™์—์„œ์˜ ํŒŒ์šด๋ฐ์ด์…˜ ๋ชจ๋ธ ํ™œ์šฉ์„ ๋‹ค๋ฃจ๋ฏ€๋กœ, ์ „์‚ฐ ํ™”ํ•™ ๋ฐ ๋ฌผ์งˆ ์‹œ๋ฎฌ๋ ˆ์ด์…˜ ๋ถ„์•ผ์—์„œ ์ƒ์„ฑํ˜•/์˜ˆ์ธกํ˜• ๋ชจ๋ธ ์‚ฌ์šฉ์˜ ์ด๋ก ์  ๊ธฐ๋ฐ˜์„ ์ค€๋‹ค.
๊ธฐ๋ฐ˜ ์—ฐ๊ตฌ
๋ฐ”์ด์˜ค/์žฌ๋ฃŒ ๋ถ„์•ผ์—์„œ์˜ ํŒŒ์šด๋ฐ์ด์…˜ ๋ชจ๋ธ์ด ๊ตฌ์กฐ ๊ธฐ๋ฐ˜ ์˜ˆ์ธก์˜ ์ด๋ก ์  ํ† ๋Œ€๋ฅผ ์ œ์‹œํ•ฉ๋‹ˆ๋‹ค.
๊ธฐ๋ฐ˜ ์—ฐ๊ตฌ
๊ธฐ์ดˆ ๋ฐ”์ด์˜คํŒŒ์šด๋ฐ์ด์…˜ ๋ชจ๋ธ์˜ ํ˜„ํ™ฉ๊ณผ ๋„์ „๊ณผ์ œ๋ฅผ ๋‹ค๋ฃธ์œผ๋กœ์จ, Bi-TEAM๊ณผ ์œ ์‚ฌ ์—ฐ๊ตฌ์˜ ์ด๋ก ์  ๊ธฐ๋ฐ˜์„ ์ œ๊ณตํ•ฉ๋‹ˆ๋‹ค.
๊ธฐ๋ฐ˜ ์—ฐ๊ตฌ
์ƒ๋ฌผ์ •๋ณดํ•™ ๊ธฐ์ดˆ ๋ชจ๋ธ์˜ ์ถฉ์‹ค๋„์™€ ์œ ์šฉ์„ฑ ํ‰๊ฐ€ ๋…ผ์˜๊ฐ€ synthetic omics benchmarking์˜ ์ด๋ก ์  ๋ฐฐ๊ฒฝ์„ ์ œ๊ณตํ•œ๋‹ค.
๊ธฐ๋ฐ˜ ์—ฐ๊ตฌ
344๋ฒˆ ๋…ผ๋ฌธ์€ ๋ฐ”์ด์˜ค ๋ถ„์•ผ ํŒŒ์šด๋ฐ์ด์…˜ ๋ชจ๋ธ์ด ์‹ค์ œ ํ™˜์ž ์ฝ”ํ˜ธํŠธ ์˜ˆ์ธก ๋“ฑ ์ž„์ƒ ์‘์šฉ ํ™•์žฅ ์‚ฌ๋ก€๋กœ์„œ AetherCell์˜ ์œตํ•ฉ ์ „๋žต์„ ์ด๋ก ์ ์œผ๋กœ ๋’ท๋ฐ›์นจํ•ฉ๋‹ˆ๋‹ค.
๊ธฐ๋ฐ˜ ์—ฐ๊ตฌ
์ƒ๋ช…์ •๋ณดํ•™์—์„œ ํŒŒ์šด๋ฐ์ด์…˜ ๋ชจ๋ธ์ด ๋‹จ๋ฐฑ์งˆ ๋“ฑ ์ƒ๋ฌผํ•™์  ๊ตฌ์กฐ ์˜ˆ์ธก์— ์–ด๋–ป๊ฒŒ ์“ฐ์ด๋Š”์ง€ ์ฒด๊ณ„์ ์œผ๋กœ ๊ฒ€ํ† ํ•ด์ค€๋‹ค.
๊ธฐ๋ฐ˜ ์—ฐ๊ตฌ
344๋ฒˆ ๋…ผ๋ฌธ์€ ๋ฐ”์ด์˜ค์ •๋ณดํ•™์—์„œ ํŒŒ์šด๋ฐ์ด์…˜ ๋ชจ๋ธ ๋ฐ ๋‹จ๋ฐฑ์งˆ ์ž„๋ฒ ๋”ฉ ๋“ฑ ๊ด€๋ จ ํ•ต์‹ฌ ๊ธฐ์ˆ ์˜ ์ตœ์‹  ๋™ํ–ฅ์„ ์ œ์‹œํ•˜์—ฌ BioReason-Pro์˜ ๋งฅ๋ฝ์„ ์„ค๋ช…ํ•ฉ๋‹ˆ๋‹ค.
๊ธฐ๋ฐ˜ ์—ฐ๊ตฌ
์ƒ๋ฌผ์ •๋ณดํ•™์—์„œ ํŒŒ์šด๋ฐ์ด์…˜ ๋ชจ๋ธ์˜ ๊ตฌ์กฐ์  ์—ญํ• ์„ ์ •๋ฆฌํ•œ ์„œ๋ฒ ์ด๋กœ, ํ•ด๋‹น ์ธต๊ฐ„ ์ž„๋ฒ ๋”ฉ ๋ถ„์„ ์—ฐ๊ตฌ์˜ ์ด๋ก ์  ๊ธฐ๋ฐ˜์ด ๋œ๋‹ค.
๊ธฐ๋ฐ˜ ์—ฐ๊ตฌ
Bioinformatics foundation model ์„œ๋ฒ ์ด๋กœ Orthrus์˜ RNA ๊ธฐ๋ฐ˜ foundation model ๊ฐœ๋ฐœ ๋ฐ ๋ฒค์น˜๋งˆํฌ ๋ฐฉํ–ฅ์„ฑ์˜ ์ด๋ก ์  ํ† ๋Œ€๋ฅผ ์ œ๊ณตํ•œ๋‹ค.
๊ธฐ๋ฐ˜ ์—ฐ๊ตฌ
344๋ฒˆ ๋…ผ๋ฌธ์€ ๋ฐ”์ด์˜ค์ธํฌ๋งคํ‹ฑ์Šค์—์„œ foundation model์˜ ์ ์šฉ๊ณผ ํ•œ๊ณ„๋ฅผ ๋…ผ์˜ํ•˜๋ฏ€๋กœ, 3085์˜ ๋ถ„์žํŠน์„ฑ ๋ฐ ์ „์ž๊ตฌ์กฐ ์˜ˆ์ธก์— ์žˆ์–ด foundation model ์ ์šฉ ๊ฐ€๋Šฅ์„ฑ๊ณผ ์ ‘์ ์„ ํ™•์ธํ•  ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค.
๊ธฐ๋ฐ˜ ์—ฐ๊ตฌ
๋ฐ”์ด์˜คํŒŒ์šด๋ฐ์ด์…˜ ๋ชจ๋ธ์˜ ์ด๋ก ์  ๊ตฌ์กฐ ๋ฐ ๋‹ค์ค‘ ๋ชจ๋‹ฌ ํ†ตํ•ฉ ๊ด€์ ์—์„œ ๋ณธ ๋…ผ๋ฌธ์— ๊ธฐ์ดˆ ์ง€์‹์„ ์ œ๊ณตํ•ฉ๋‹ˆ๋‹ค.
๊ธฐ๋ฐ˜ ์—ฐ๊ตฌ
Bioinformatics ๋ถ„์•ผ์˜ ๋Œ€ํ˜• ์–ธ์–ด๋ชจ๋ธ, ๋ฐ์ดํ„ฐ, ๋‹ค์ค‘๋ชจ๋‹ฌ ์ฒ˜๋ฆฌ ์ด๋ก ์ด BioMiner์˜ ์‹œ์Šคํ…œ ๋ฐ ๋ฒค์น˜๋งˆํ‚น ๊ตฌ์กฐ์˜ ๊ธฐ๋ฐ˜์ด ๋ฉ๋‹ˆ๋‹ค.
๊ธฐ๋ฐ˜ ์—ฐ๊ตฌ
์ƒ๋ช…๊ณผํ•™ ๋ฐ ์ด๋ฏธ์ง• ์˜์—ญ์—์„œ ํŒŒ์šด๋ฐ์ด์…˜ ๋ชจ๋ธ ์ ์šฉ์˜ ์ „๋ฐ˜์  ๋ฐฐ๊ฒฝ์„ ์ œ๊ณตํ•˜๋ฏ€๋กœ, ๋ผ๋ฒจ ๋ถ€์กฑ ํ™˜๊ฒฝ์˜ ์„ธํฌ๋ถ„๋ฅ˜ ๋ฐฉ๋ฒ• ์ดํ•ด๋ฅผ ์ด‰์ง„ํ•œ๋‹ค.
๊ธฐ๋ฐ˜ ์—ฐ๊ตฌ
ํŒŒ์šด๋ฐ์ด์…˜ ๋ชจ๋ธ์˜ ํŒŒ๊ธ‰๋ ฅ๊ณผ ์ ์šฉ ํ•œ๊ณ„๋ฅผ ๊ฒ€ํ† ํ•˜๋ฏ€๋กœ ์ž๋™ TS ํƒ์ƒ‰ ์›Œํฌํ”Œ๋กœ์šฐ์—๋„ ์ตœ์‹  AI ํŠธ๋ Œ๋“œ ๊ด€์ ์—์„œ ์ ‘๊ทผํ•  ์ˆ˜ ์žˆ๋‹ค.
๊ธฐ๋ฐ˜ ์—ฐ๊ตฌ
์ƒ๋ฌผํ•™์  ํŒŒ์šด๋ฐ์ด์…˜ ๋ชจ๋ธ์˜ ๊ตฌ์กฐ์™€ ์›๋ฆฌ๋ฅผ ์ด๊ด„์ ์œผ๋กœ ๋‹ค๋ฃจ๋ฉฐ ViraHinter์™€ ๊ฐ™์€ ๋ชจ๋ธ๋“ค์˜ ์ด๋ก ์  ๊ธฐ๋ฐ˜์ด ๋ฉ๋‹ˆ๋‹ค.
๊ธฐ๋ฐ˜ ์—ฐ๊ตฌ
344๋Š” bioinformatics์—์„œ์˜ foundation model ์ ์šฉ ์ „๋ฐ˜์„ ๋‹ค๋ฃจ๋ฉฐ, 3245์˜ ๋‹จ๋ฐฑ์งˆ ์„œ์—ด-๊ตฌ์กฐ ์œตํ•ฉ ๋ชจ๋ธ์˜ ์ „๋ฐ˜์  ๋งฅ๋ฝ๊ณผ ํ•œ๊ณ„ ๋ถ„์„์— ์ด๋ก ์  ๋ฐฐ๊ฒฝ์„ ์ค๋‹ˆ๋‹ค.
๊ธฐ๋ฐ˜ ์—ฐ๊ตฌ
์ƒ๋ฌผ์ •๋ณดํ•™ ๋ถ„์•ผ์—์„œ ํŒŒ์šด๋ฐ์ด์…˜ ๋ชจ๋ธ์˜ ๋„์ž…๊ณผ ๋‚ด๋ถ€ ํ‘œํ˜„ ๋ถ„์„ ๋ฐฉ๋ฒ•์„ ์ข…ํ•ฉ์ ์œผ๋กœ ์†Œ๊ฐœํ•ด, AIRR ๋น„์ง€๋„ ํ•™์Šต ํ”„๋ ˆ์ž„์›Œํฌ์˜ ๋ฐฐ๊ฒฝ์„ ์ œ๊ณตํ•ฉ๋‹ˆ๋‹ค.
๊ธฐ๋ฐ˜ ์—ฐ๊ตฌ
Foundation models in bioinformatics ๋…ผ๋ฌธ์€ ProtiCelli์™€ ๊ฐ™์€ ๋‹จ๋ฐฑ์งˆ/์ƒ๋ช…์ •๋ณด๋ชจ๋ธ์˜ ๊ทผ๊ฐ„์ด ๋˜๋Š” ๋ฐ”์ด์˜ค ํŒŒ์šด๋ฐ์ด์…˜๋ชจ๋ธ ํ˜„ํ™ฉ๊ณผ ์‘์šฉ์„ ์ •๋ฆฌํ•ฉ๋‹ˆ๋‹ค.
๊ธฐ๋ฐ˜ ์—ฐ๊ตฌ
344๋ฒˆ ๋…ผ๋ฌธ์€ ์ƒ๋ฌผ์ •๋ณดํ•™ ํŒŒ์šด๋ฐ์ด์…˜ ๋ชจ๋ธ์˜ ๊ตฌ์กฐ์™€ ๋ฐœ์ „์— ์ดˆ์ ์„ ๋งž์ถฐ, ๋ฌผ๋ฆฌ/๋”ฅ๋Ÿฌ๋‹ hybrid ์„ค๊ณ„ ์›Œํฌํ”Œ๋กœ์šฐ์˜ ์‹œ๋Œ€์  ์˜์˜๋ฅผ ์„ค๋ช…ํ•ด์ค๋‹ˆ๋‹ค.
๊ธฐ๋ฐ˜ ์—ฐ๊ตฌ
344 ๋…ผ๋ฌธ์€ ๋ถ„์ž ์ƒ๋ฌผํ•™ ๋‚ด ์ƒ์„ฑํ˜• ํŒŒ์šด๋ฐ์ด์…˜ ๋ชจ๋ธ ์—ฐ๊ตฌ๋“ค์„ ๋ฆฌ๋ทฐํ•˜์—ฌ, 3022์˜ ViDa ๋ฐ Struc2mapGAN ์ ‘๊ทผ์˜ ์ด๋ก ์  ๊ธฐ๋ฐ˜์„ ์ œ๊ณตํ•ฉ๋‹ˆ๋‹ค.
๊ธฐ๋ฐ˜ ์—ฐ๊ตฌ
๋ฉ€ํ‹ฐ๋ชจ๋‹ฌ ๋ฐ”์ด์˜ค ํŒŒ์šด๋ฐ์ด์…˜ ๋ชจ๋ธ์˜ ์›๋ฆฌ์™€ ๋ฐ์ดํ„ฐ ์ค‘๋ณต์„ฑ, ์ผ๋ฐ˜ํ™” ๋ฌธ์ œ ๋“ฑ ๋Œ€๊ทœ๋ชจ ๋ชจ๋ธ ์„ค๊ณ„ ์ฒ ํ•™์„ ํ•จ๊ป˜ ์ดํ•ดํ•  ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค.
๊ธฐ๋ฐ˜ ์—ฐ๊ตฌ
์ƒ์ฒด๋ถ„์ž ์ƒํ˜ธ์ž‘์šฉ์˜ ํ™”ํ•™ ์–ธ์–ด ๋ฐ ํŒŒ์šด๋ฐ์ด์…˜ ๋ชจ๋ธ์˜ ์ด๋ก ์  ๊ด€์ ์„ ์ œ๊ณตํ•˜์—ฌ, ๋ฏธ์„ธ ๊ตฌ์กฐ ํ•ด์„ ๋งฅ๋ฝ์„ ํ™•์žฅํ•ด์ค๋‹ˆ๋‹ค.
๊ธฐ๋ฐ˜ ์—ฐ๊ตฌ
๋ฉ€ํ‹ฐ๋ชจ๋‹ฌ ํŒŒ์šด๋ฐ์ด์…˜ ๋ชจ๋ธ ๊ธฐ๋ฐ˜ ๋‹จ๋ฐฑ์งˆ ๊ธฐ๋Šฅ ์˜ˆ์ธก์˜ ์ด๋ก ์  ํ† ๋Œ€๋ฅผ ์ œ๊ณตํ•ฉ๋‹ˆ๋‹ค.
๊ธฐ๋ฐ˜ ์—ฐ๊ตฌ
344๋ฒˆ ๋…ผ๋ฌธ์€ ์ƒ๋ฌผ์ •๋ณดํ•™์—์„œ ๊ธฐ์ดˆ ๋ชจ๋ธ ํ™œ์šฉ์˜ ํ•œ๊ณ„๋ฅผ ๋ถ„์„ํ•˜์—ฌ, ์ƒ์„ฑํ˜• AI ๊ธฐ๋ฐ˜ ํ˜์‹ ์  ๋‹จ๋ฐฑ์งˆ ์„ค๊ณ„๋ฅผ ๋‹ค๋ฃจ๋Š” 3262๋ฒˆ ๋…ผ๋ฌธ์˜ ์ด๋ก ์  ๋ฐฐ๊ฒฝ์„ ์ œ๊ณตํ•ฉ๋‹ˆ๋‹ค.
๊ธฐ๋ฐ˜ ์—ฐ๊ตฌ
์ƒ๋ฌผ์ •๋ณดํ•™ ํŒŒ์šด๋ฐ์ด์…˜ ๋ชจ๋ธ ํ™œ์šฉ ์„œ๋ฒ ์ด ๋…ผ๋ฌธ์œผ๋กœ, multi-modal LLM ๊ธฐ๋ฐ˜ ๋‹จ๋ฐฑ์งˆ ์„ค๊ณ„ ์ „๋žต์˜ ์ „๋ฐ˜์  ๋ฐฐ๊ฒฝ์„ ์ œ๊ณตํ•œ๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
Foundation models in bioinformatics๋Š” ์•ฝ๋ฌผ, ๋‹จ๋ฐฑ์งˆ, ์œ ์ „์ฒด ๋“ฑ ๋‹ค์–‘ํ•œ bio ํŒŒ์šด๋ฐ์ด์…˜ ๋ชจ๋ธ์„ ์ข…ํ•ฉ์ ์œผ๋กœ ๋น„๊ตํ•˜์—ฌ AlphaFold ๊ธฐ๋ฐ˜/๋น„๊ต ๋ชจ๋ธ์„ ํ•œ๋ˆˆ์— ์กฐ๋งํ•  ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
Foundation models in bioinformatics ๋…ผ๋ฌธ์€ Bio ๋ถ„์•ผ์— ํŠนํ™”๋œ ์‚ฌ์ „ํ•™์Šต-๋ฏธ์„ธ์กฐ์ • ๊ฐœ๋… ํ™•์žฅ ๋ฐ ํ‰๊ฐ€๋ฅผ ์ง„ํ–‰ํ•˜์—ฌ, 829 ๋…ผ๋ฌธ์˜ SciML ๊ด€์ ์„ ๋ณด์™„ํ•ฉ๋‹ˆ๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
Foundation models in bioinformatics ๋…ผ๋ฌธ์€ ์ƒ๋ช…์ •๋ณดํ•™์—์„œ ๊ธฐ์ดˆ ๋ชจ๋ธ ๊ธฐ๋ฐ˜ ๋ฐ์ดํ„ฐ ํ•ด์„ ๋ฐ ์„ค๊ณ„ ์ž๋™ํ™”๋ฅผ ํญ๋„“๊ฒŒ ๋‹ค๋ค„, AtomAgents์˜ ๋„๋ฉ”์ธ ํ™•์žฅ์„ ๋…ผ์˜ํ•  ์ˆ˜ ์žˆ๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
Foundation models in bioinformatics ๋…ผ๋ฌธ์€ BioMedLM๊ณผ ๊ฐ™์€ ๋ฐ”์ด์˜ค ํŠนํ™” ๋Œ€ํ˜•๋ชจ๋ธ์˜ ์ „๋ฐ˜์  ์„ฑ๋Šฅ, ํŒŒ๊ธ‰ํšจ๊ณผ๋ฅผ ๋น„๊ตํ•˜๋Š” ๋ฆฌ๋ทฐ์ž…๋‹ˆ๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
004๋ฒˆ ๋…ผ๋ฌธ์€ ๊ณผํ•™ ์ „๋ฐ˜์—์„œ์˜ ๋Œ€ํ˜• ์–ธ์–ด๋ชจ๋ธ ํ™œ์šฉ์„ ์ •๋ฆฌํ•ด, 344๋ฒˆ์˜ ์ƒ๋ฌผ์ •๋ณดํ•™ ํŠนํ™” ๊ธฐ์ดˆ ๋ชจ๋ธ ๋…ผ์˜์™€ ์„œ๋กœ ๋ณด์™„์  ์‹œ๊ฐ์„ ์ œ๊ณตํ•ฉ๋‹ˆ๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
344๋Š” ๋ฐ”์ด์˜ค์ •๋ณดํ•™์—์„œ ํŒŒ์šด๋ฐ์ด์…˜ ๋ชจ๋ธ์˜ ์—ญํ• ๊ณผ ๊ตฌ์กฐ์  ํŠน์ง•์„ ๋…ผ์˜ํ•ด, 856์ด ์ œ์‹œํ•˜๋Š” ๋ฉ”ํƒ€๋Ÿฌ๋‹/๊ณ„์ธต์  ํ‘œํ˜„ ํ•™์Šต๊ณผ ์ ‘๊ทผ๋ฒ•์„ ๋น„๊ตํ•  ์ˆ˜ ์žˆ๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
Foundation models in bioinformatics ๋…ผ๋ฌธ์€ ๋‹ค์–‘ํ•œ ์ƒ๋ช…์ •๋ณด ํŒŒ์šด๋ฐ์ด์…˜ ๋ชจ๋ธ์˜ ์—ญํ• ๊ณผ ๋‹จ์ผ๋ชจ๋‹ฌ/๋‹ค์ค‘๋ชจ๋‹ฌ ์˜ˆ์ธก ํ”„๋ ˆ์ž„์›Œํฌ๋ฅผ ๋น„๊ตํ•ด, AlphaGenome์˜ ๋‹ค์ค‘ ๋ชจ๋‹ฌ๋ฆฌํ‹ฐ ์˜ˆ์ธก๊ณผ ๋น„๊ต ํ‰๊ฐ€๊ฐ€ ๊ฐ€๋Šฅํ•ฉ๋‹ˆ๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
359 ๋…ผ๋ฌธ๊ณผ 344 ๋ชจ๋‘ ๋ฐ”์ด์˜ค/์˜๋ฃŒ ๋ฉ€ํ‹ฐ๋ชจ๋‹ฌ AI ์ง„ํ™”๋ฅผ ๋‹ค๋ฃจ์ง€๋งŒ, 344๋Š” ์ƒ๋ช…์ •๋ณดํ•™, 359๋Š” ์œตํ•ฉ AI ์ฒด๊ณ„ ์ „๋ฐ˜์„ ๊ด‘๋ฒ”์œ„ํ•˜๊ฒŒ ์กฐ๋งํ•ฉ๋‹ˆ๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
344๋Š” ํ™˜๊ฒฝ๊ณผํ•™์ด ์•„๋‹Œ ๋ฐ”์ด์˜ค ๋ถ„์•ผ์—์„œ ํŒŒ์šด๋ฐ์ด์…˜ ๋ชจ๋ธ์˜ ์ตœ์‹  ๋™ํ–ฅ์„ ์ฒด๊ณ„์ ์œผ๋กœ ์ •๋ฆฌํ•˜์—ฌ 342์˜ ํ™˜๊ฒฝ๊ณผํ•™ ์ „๋ฌธ ๋ฆฌ๋ทฐ์™€ ์ƒํ˜ธ๋ณด์™„์ ์ด๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
๋‹จ๋ฐฑ์งˆ ๋„๋ฉ”์ธ ๊ธฐ๋Šฅ ์˜ˆ์ธก์„ ์œ„ํ•œ ๋‹ค๋ฅธ ์–ธ์–ด๋ชจ๋ธ ๊ธฐ๋ฐ˜ ๋ฐฉ๋ฒ•์ด๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
Foundation models in bioinformatics ๋…ผ๋ฌธ์€ ๋ถ„์ž ํ‘œํ˜„ยท์ƒ์„ฑ์˜ foundation model ์ ‘๊ทผ์„ ๋‹ค๋ฃจ์–ด MolHIT์™€ ๋Œ€์กฐ์ ์œผ๋กœ ์ฝ์„ ์ˆ˜ ์žˆ๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
์ƒ๋ฌผ์ •๋ณดํ•™ ๋ถ„์•ผ์—์„œ foundation model์˜ ๊ฐ€๋Šฅ์„ฑ ๋ฐ ๋„์ „๊ณผ์ œ๋ฅผ ์ด๊ด„์ ์œผ๋กœ ๋‹ค๋ฃจ๊ณ  ์žˆ์–ด MolX์˜ position์„ ์ดํ•ดํ•˜๋Š” ๋ฐ ๋„์›€์„ ์ค€๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
๋‹ค์ค‘์˜ค๋ฏน์Šค ๋ฐ์ดํ„ฐ์˜ ๋ฐฐ์น˜ ํšจ๊ณผ ๋ณด์ • ๋ฐ ํ†ตํ•ฉ์„ ์œ„ํ•œ ์œ ์‚ฌํ•œ ๋”ฅ๋Ÿฌ๋‹ ์ ‘๊ทผ๋ฒ•์„ ๋‹ค๋ฃจ๋Š” ์—ฐ๊ตฌ์ด๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
๋‹จ๋ฐฑ์งˆ-ํƒ„์ˆ˜ํ™”๋ฌผ ์ƒํ˜ธ์ž‘์šฉ ์˜ˆ์ธก์„ ์œ„ํ•œ ๋‹ค๋ฅธ ๊ณ„์‚ฐ ๋ฐฉ๋ฒ•์ด๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
344๋ฒˆ ๋…ผ๋ฌธ์€ ์ƒ๋ฌผ์ •๋ณดํ•™ foundation model์˜ ์ „์ด์™€ ์ผ๋ฐ˜ํ™” ๋ฌธ์ œ๋ฅผ ๋‹ค๋ค„, 3096์ด RNA ์˜ˆ์ธก๊ธฐ ๋ถ„ํฌ ๋‚ด/์™ธ ์„ฑ๋Šฅ ํ•œ๊ณ„๋ฅผ ๋ถ„์„ํ•œ ๋งฅ๋ฝ๊ณผ ๋น„๊ตํ•  ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
์ƒ๋ช…์ •๋ณดํ•™ ๊ด€๋ จ ๋Œ€๊ทœ๋ชจ ๋ฐ์ดํ„ฐ ๋ฐ ๋ชจ๋ธ ํ™•์žฅ ๋…ผ์˜๋กœ, 3237์˜ ๋‹จ์ผ์„ธํฌ ๋ชจ๋ธ๊ณผ์˜ ์ ‘๊ทผ๋ฒ• ์ฐจ์ด๋ฅผ ๋น„๊ตํ•  ์ˆ˜ ์žˆ๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
344 ๋…ผ๋ฌธ์€ ๋ฐ”์ด์˜ค์ธํฌ๋งคํ‹ฑ์Šค ๋ถ„์•ผ์—์„œ ํŒŒ์šด๋ฐ์ด์…˜ ๋ชจ๋ธ์˜ ์ „๋ฐ˜์„ ๋‹ค๋ฃจ๋ฉฐ, 3032์˜ ๋ฐ•ํ…Œ๋ฆฌ์•„ ํ”„๋กœํ…Œ์˜ด ๋ชจ๋ธ์˜ ์„ฑ๊ณผ์™€ ํƒ€์‘์šฉ ๋ถ„์•ผ๋ฅผ ๋น„๊ตํ•ด๋ณผ ์ˆ˜ ์žˆ๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
๋‹จ๋ฐฑ์งˆ ๊ธฐ๋Šฅ ์˜ˆ์ธก์„ ์œ„ํ•œ ๋‹ค๋ฅธ ๋ฒค์น˜๋งˆํ‚น ๋ฐ ํ‰๊ฐ€ ํ”„๋ ˆ์ž„์›Œํฌ์ด๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
๊ธฐ๋ณธ ๋ชจ๋ธ์ด ๋ฐ”์ด์˜ค์™€ ๋ฌด๊ธฐ์†Œ์žฌ ๊ณตํ†ต๊ธฐ๋ฐ˜์œผ๋กœ ํ™œ์šฉ๋˜๋Š” ๋งฅ๋ฝ์„ ๋น„๊ต ๋ถ„์„ํ•  ์ˆ˜ ์žˆ์–ด, ๋ฌด๊ธฐ ์†Œ์žฌ ์ƒ์„ฑ ๋””์ž์ธ์˜ ํŒŒ์šด๋ฐ์ด์…˜ ์ ‘๊ทผ๋ฒ• ์ฐจ์ด๋ฅผ ๋…ผํ•  ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
344๋Š” ๋ฐ”์ด์˜ค ๋ถ„์•ผ์˜ ์ „๋ฐ˜์ ์ธ ํŒŒ์šด๋ฐ์ด์…˜ ๋ฐ ์ƒ์„ฑ ๋ชจ๋ธ ๋™ํ–ฅ์„ ์ข…ํ•ฉ์ ์œผ๋กœ ์กฐ๋งํ•ด 3151์ด ์ •๋ฆฌํ•˜๋Š” ๊ตฌ์กฐยท์—๋„ˆ์ง€ยท๋™์—ญํ•™ ํ˜„ํ™ฉ๊ณผ ๊ฒฌ์ค„ ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
๋‹จ๋ฐฑ์งˆ-๋‹จ๋ฐฑ์งˆ ์ƒํ˜ธ์ž‘์šฉ ์˜ˆ์ธก์— foundation model์„ ํ™œ์šฉํ•˜๋Š” ์ ‘๊ทผ๋ฒ•์œผ๋กœ, ๋ฉ€ํ‹ฐ๋ชจ๋‹ฌยท๊ณ„์ธต์  ํ”„๋ ˆ์ž„์›Œํฌ ์ฐจ์ด๋ฅผ ๋ณผ ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
344 ๋…ผ๋ฌธ์€ bioinformatics ํŠนํ™” foundation model์˜ ์ „๋ฐ˜์  ๋ถ„๋ฅ˜ ๋ฐ ๋ฒค์น˜๋งˆํฌ ํ”„๋ ˆ์ž„์„ ์ œ์‹œํ•ด, 2997์˜ ๋ถ„์ž์„ฑ์งˆ ์˜ˆ์ธก ๋ฒค์น˜๋งˆํ‚น๊ณผ ๋งฅ๋ฝ์ ์œผ๋กœ ๋Œ€์กฐ๋ฉ๋‹ˆ๋‹ค.
ํ›„์† ์—ฐ๊ตฌ
์ƒ๋ฌผ์ •๋ณดํ•™์—์„œ ํŒŒ์šด๋ฐ์ด์…˜ ๋ชจ๋ธ์˜ ์ตœ์‹  ์ง„ํ™” ๋ฐ ์ดํ•ด, symmetry/๋“ฑ๋ณ€์„ฑ ๋“ฑ AI4Science์—์„œ ๊ฐ•์กฐ๋œ ์›๋ฆฌ ์ ์šฉ ์‚ฌ๋ก€๋ฅผ ํญ๋„“๊ฒŒ ๋‹ค๋ฃฌ๋‹ค.
ํ›„์† ์—ฐ๊ตฌ
BioInformatics Agent(BIA)๋Š” ๊ธฐ์ดˆ๋ชจ๋ธ FM ๊ธฐ๋ฐ˜ ์ƒ๋ฌผ์ •๋ณด ์‹œ์Šคํ…œ์„ ํ™•์žฅํ•˜์—ฌ, Foundation models in bioinformatics ๋…ผ๋ฌธ์˜ ์ตœ๊ทผ ์‹ค์šฉ์  ์ง„์ „์„ ๋ณด์—ฌ์ค๋‹ˆ๋‹ค.
ํ›„์† ์—ฐ๊ตฌ
Foundation models in bioinformatics(344)๋Š” Evo(749)๊ฐ€ ๋‹ค๋ฃจ๋Š” genomic foundation model์˜ ์ด๋ก ์  ๋ฐ ์‹ค์šฉ์  ๋ฐœ์ „์‚ฌ๋ก€๋กœ, ๋‹ค์–‘ํ•œ ์ƒ๋ฌผํ•™์  ์‚ฐ์ถœ๋ฌผ ์˜ˆ์ธก์˜ ๋ฐฐ๊ฒฝ์„ ์ด๋ฃน๋‹ˆ๋‹ค.
ํ›„์† ์—ฐ๊ตฌ
๋ฐ”์ด์˜ค์ธํฌ๋งคํ‹ฑ์Šค์—์„œ ํŒŒ์šด๋ฐ์ด์…˜ ๋ฉ€ํ‹ฐ๋ชจ๋‹ฌ ๋ชจ๋ธ๋“ค์ด ์ƒ๋ฌผ๋ถ„์ž ํ‘œํ˜„์„ ๋„˜๋‚˜๋“œ๋Š” ์‚ฌ๋ก€ ์—ฐ๊ตฌ๊ฐ€ ๊นŠ์ด ์žˆ๊ฒŒ ๋‹ค๋ฃจ์–ด์ง‘๋‹ˆ๋‹ค.
ํ›„์† ์—ฐ๊ตฌ
์ƒ๋ช…๊ณผํ•™ ๋„๋ฉ”์ธ์—์„œ LLM์˜ ๋ถ„์ž ์„ค๊ณ„ยท์˜ˆ์ธก ์—ญ๋Ÿ‰์„ ์ „๋ฐฉ์œ„์ ์œผ๋กœ ๋‹ค๋ฃจ๋ฉฐ, 472์˜ ๊ฑฐ๋Œ€๋ถ„์ž ์„ค๊ณ„ ์‘์šฉ์„ ๋„“ํžŒ๋‹ค.
ํ›„์† ์—ฐ๊ตฌ
344 ๋…ผ๋ฌธ์€ ๋ฐ”์ด์˜ค์ธํฌ๋งคํ‹ฑ์Šค ๋ถ„์•ผ์˜ ํŒŒ์šด๋ฐ์ด์…˜ ๋ชจ๋ธ ํ™•์‚ฐ๊ณผ ๋‹ค์–‘ํ™” ์‚ฌ๋ก€๋ฅผ ๊ตฌ์ฒด์ ์œผ๋กœ ๋ณด์—ฌ์ฃผ์–ด 720 ๋…ผ๋ฌธ์˜ ๋ถ„์„์„ ์‹ฌํ™”์‹œํ‚จ๋‹ค.
ํ›„์† ์—ฐ๊ตฌ
Foundation models in bioinformatics ๋…ผ๋ฌธ์€ Boltz-1๊ณผ ๊ฐ™์€ ์˜คํ”ˆ์†Œ์Šค ํŒŒ์šด๋ฐ์ด์…˜ ๋ชจ๋ธ์˜ ๋‹ค์–‘์„ฑ๊ณผ ์ ์šฉ์„ ํญ๋„“๊ฒŒ ๋น„๊ตํ•  ์ˆ˜ ์žˆ๋„๋ก ๋ฐฐ๊ฒฝ ์ •๋ณด๋ฅผ ์ œ๊ณตํ•ฉ๋‹ˆ๋‹ค.
ํ›„์† ์—ฐ๊ตฌ
1072๋ฒˆ ๋…ผ๋ฌธ์€ ๊ณผํ•™ ๋ถ„์•ผ ๋Œ€ํ˜• ๊ธฐ์ดˆ ๋ชจ๋ธ ์ „๋ง์„ ๋‹ค๋ฃจ๋ฉฐ, 344๋ฒˆ์˜ ์ƒ๋ฌผ์ •๋ณดํ•™ FM ๋ฆฌ๋ทฐ์˜ ๋ฏธ๋ž˜ ์ง€ํ–ฅ์  ๋…ผ์˜์™€ ํ™•์žฅ์„ ์ƒ์— ์žˆ์Šต๋‹ˆ๋‹ค.
ํ›„์† ์—ฐ๊ตฌ
์ƒ๋ฌผ์ •๋ณด ๋ฐ ์žฌ๋ฃŒ ๋ฐ์ดํ„ฐ๋กœ๋ถ€ํ„ฐ ์ž๋™ ์ •๋ณด์ถ”์ถœ์„ ํ†ตํ•œ AI ๊ธฐ๋ฐ˜ ๋ฐ์ดํ„ฐ์…‹ ๊ตฌ์ถ• ๋ฐ ํ™œ์šฉ์ด๋ผ๋Š” ํ๋ฆ„์—์„œ, ์†Œ์žฌ๊ณผํ•™ ํŒŒ์šด๋ฐ์ด์…˜ ๋ชจ๋ธ ์—ฐ๊ตฌ์˜ ์ ์šฉ์„ฑ์„ ๋„“ํžŒ๋‹ค.
ํ›„์† ์—ฐ๊ตฌ
015์˜ ํ™”ํ•™ ํŒŒ์šด๋ฐ์ด์…˜ ๋ชจ๋ธ ๋™ํ–ฅ ์ •๋ฆฌ๋Š” 344์˜ ๋ฐ”์ด์˜ค์ธํฌ๋งคํ‹ฑ์Šค foundation model ์ง„ํ™” ๋ฐ ์ ์šฉ๊ณผ ๋งž๋‹ฟ์•„ ํ™•์žฅ์ ์œผ๋กœ ์ฐธ๊ณ ๋  ๋งŒํ•ฉ๋‹ˆ๋‹ค.
ํ›„์† ์—ฐ๊ตฌ
์žฌ๋ฃŒยทํ™”ํ•™ ๋ถ„์•ผ ํŒŒ์šด๋ฐ์ด์…˜ ๋ชจ๋ธ์˜ ๊ธฐ์ˆ ์  ํ˜„ํ™ฉ๊ณผ ํ•œ๊ณ„๋ฅผ ์ •๋ฆฌํ•œ ๋…ผ๋ฌธ์œผ๋กœ 025์˜ ๋ฒ”์šฉ์  AI ์‹œ์Šคํ…œ ๊ตฌํ˜„ ๋…ผ์˜์— ์‹ค์ œ์  ๊ด€์ ์„ ์ œ๊ณตํ•œ๋‹ค.
ํ›„์† ์—ฐ๊ตฌ
ํŒŒ์šด๋ฐ์ด์…˜ ๋ชจ๋ธ์ด ์ธ์ฝ”๋”ฉํ•œ ๊ตฌ์กฐ์  ํŠน์ง•์— ๋Œ€ํ•œ ์‹ค์ œ ๋ถ„์„, ์‹คํ—˜์  ๊ฒ€์ฆ์„ ์ˆ˜ํ–‰ํ•œ ๋…ผ๋ฌธ์œผ๋กœ, ์ด๋ก ์  ๋…ผ์˜์˜ ์ ์šฉ ์‚ฌ๋ก€์ด๋‹ค.
ํ›„์† ์—ฐ๊ตฌ
AlphaFold Database ๊ด€๋ จ ๋…ผ๋ฌธ์€ ๋Œ€ํ˜• ์ƒ๋ฌผ์ •๋ณดํ•™ ํŒŒ์šด๋ฐ์ด์…˜ ๋ชจ๋ธ์˜ ์‹ค์ œ ์‘์šฉ ์‚ฌ๋ก€๋ฅผ ๋ณด์—ฌ์ค๋‹ˆ๋‹ค.
ํ›„์† ์—ฐ๊ตฌ
๋ฐ”์ด์˜ค์ธํฌ๋งคํ‹ฑ์Šค ๋ถ„์•ผ์—์„œ ํŒŒ์šด๋ฐ์ด์…˜ ๋ชจ๋ธ์ด ๋‹จ๋ฐฑ์งˆยทํ™”ํ•ฉ๋ฌผ ์ƒํ˜ธ์ž‘์šฉ ์˜ˆ์ธก์— ์–ด๋–ป๊ฒŒ ์ ์šฉ๋˜๋Š”์ง€, PLL ๊ธฐ๋ฐ˜ ๋ฐฉ๋ฒ•๊ณผ์˜ ์ƒํ˜ธ๋ณด์™„์„ฑ ๋ฐ ํ•œ๊ณ„๋ฅผ ๋ณด์—ฌ์ค€๋‹ค.
ํ›„์† ์—ฐ๊ตฌ
์ƒ๋ฌผ์ •๋ณดํ•™ ๊ธฐ๋ฐ˜์˜ ํŒŒ์šด๋ฐ์ด์…˜ ๋ชจ๋ธ ์„œ๋ฒ ์ด๋กœ, ๊ฐ•ํ™”ํ•™์Šต ๊ฐ€์ด๋“œ PLM์˜ ํ•ด์„/ํ™•์žฅ ์ ์šฉ ๋ฒ”์œ„๋ฅผ ๋งฅ๋ฝํ™”ํ•˜์—ฌ ์ดํ•ดํ•  ์ˆ˜ ์žˆ๋‹ค.
ํ›„์† ์—ฐ๊ตฌ
Bioinformatics ๋ถ„์•ผ์—์„œ์˜ foundation model ์ „์ด ์‚ฌ๋ก€์™€ ํŠน์ด์  ๋…ผ์˜๊ฐ€, ํ™”ํ•™๊ณผ ์—๋„ˆ์ง€ ๋„๋ฉ”์ธ ๊ฐ„ ํ™•์žฅ ๋ฐ ์ œํ•œ์  ๋…ผ์˜์— ์‹ค์งˆ์  ์ฐธ๊ณ ๊ฐ’์„ ์ œ๊ณตํ•ฉ๋‹ˆ๋‹ค.
ํ›„์† ์—ฐ๊ตฌ
344๋Š” ์ƒ๋ฌผ์ •๋ณด ๋ถ„์•ผ์—์„œ ํŒŒ์šด๋ฐ์ด์…˜ ๋ชจ๋ธ์˜ ์—ญํ• ์„ ์„œ๋ฒ ์ดํ•˜์—ฌ 3281์˜ ์„ธ๋ฐ€ํ•œ ๋‚ด๋ถ€ ๊ณ„์ธต ํ•ด์„์„ ์‹ค์ œ ์ƒ๋ฌผํ•™์  ์˜๋ฏธ๋กœ ์—ฐ๊ฒฐํ•˜๋Š” ํ™•์žฅ ์‚ฌ๋ก€๊ฐ€ ๋ฉ๋‹ˆ๋‹ค.
ํ›„์† ์—ฐ๊ตฌ
344 ๋…ผ๋ฌธ์€ ๋ฉ€ํ‹ฐ๋ชจ๋‹ฌ ์ƒ๋ช…๊ณผํ•™ ํŒŒ์šด๋ฐ์ด์…˜ ๋ชจ๋ธ์˜ ์‚ฌ๋ก€์™€ ์›๋ฆฌ๋ฅผ ์‹ฌ์ธต ๋ฆฌ๋ทฐํ•˜์—ฌ, 3024์˜ AROMA ํ”„๋ ˆ์ž„์›Œํฌ๊ฐ€ ์‹ค์ œ ์ƒ๋ช…์ •๋ณด ํ•ด์„์— ์–ด๋–ป๊ฒŒ ์ ์šฉ๋˜๋Š”์ง€ ์ดํ•ด๋ฅผ ํ™•์žฅํ•ฉ๋‹ˆ๋‹ค.
ํ›„์† ์—ฐ๊ตฌ
๋ฐ”์ด์˜คยท์žฌ๋ฃŒ ํŒŒ์šด๋ฐ์ด์…˜ ๋ชจ๋ธ์„ ํ™œ์šฉํ•œ ์†Œ์žฌ ๋ฐœ๊ฒฌ ์‘์šฉ ๊ฐ€๋Šฅ์„ฑ์„ ์‹ฌ๋„ ์žˆ๊ฒŒ ๋ถ„์„ํ•œ ๋…ผ๋ฌธ์ž…๋‹ˆ๋‹ค.
ํ›„์† ์—ฐ๊ตฌ
์ƒ๋ฌผ์ •๋ณดํ•™ ๋ถ„์•ผ์—์„œ ํŒŒ์šด๋ฐ์ด์…˜ ๋ชจ๋ธ ํ™œ์šฉ ํ˜„ํ™ฉ์„ ์ •๋ฆฌํ•˜์—ฌ, [3123]์˜ GNN ๊ธฐ๋ฐ˜ ์˜ˆ์ธก ๋ชจ๋ธ๊ณผ LLM์„ ์—ฐ๊ฒฐ์ง“๋Š” ์—ฐ๊ตฌ ๋ฒ”์œ„๋ฅผ ๋„“ํž™๋‹ˆ๋‹ค.
์‘์šฉ ์‚ฌ๋ก€
ํŒŒ์šด๋ฐ์ด์…˜ ๋ชจ๋ธ ๊ธฐ๋ฐ˜ ๋ฐ”์ด์˜ค์ •๋ณด ๋ถ„์„์ด ๋‹จ์ผ์„ธํฌ ๋“ฑ ์‹คํ—˜์ •๋ณด ํ†ตํ•ฉ์˜ ๋ฏธ๋ž˜ ๋ฐฉํ–ฅ์— ์ฐธ๊ณ ๊ฐ€ ๋œ๋‹ค.
์‘์šฉ ์‚ฌ๋ก€
Autocap ๋…ผ๋ฌธ์€ ๋‹จ๋ฐฑ์งˆ/์œ ์ „์ž ๋“ฑ ์ƒ๋ช…๊ณผํ•™ ๋ฐ์ดํ„ฐ์˜ ํฌ๋กœ์Šค๋ง๊ตฌ์–ผ alignment์— ์ดˆ์ ์„ ๋งž์ถ”์–ด ํŒŒ์šด๋ฐ์ด์…˜ ๋ชจ๋ธ์˜ ์‹ค์งˆ์  ํ™œ์šฉ ์˜ˆ์‹œ๋ฅผ ์ œ๊ณตํ•ฉ๋‹ˆ๋‹ค.
์‘์šฉ ์‚ฌ๋ก€
ํ™”ํ•™์  ๋ฐ˜์‘ ์˜ˆ์ธก ๋ฐ ๊ตฌ์กฐ ์ตœ์ ํ™” ๋“ฑ ์‹ค์งˆ์  ๋ฐ”์ด์˜ค๋ฉ”๋””์ปฌ ์‘์šฉ์—์„œ FM์˜ ์‹ค์ œ ์„ฑ๋Šฅ ๋ฐ ๋ฌธ์ œ์ ์„ ๋…ผ์˜ํ•œ๋‹ค.
์‘์šฉ ์‚ฌ๋ก€
344๋ฒˆ ๋…ผ๋ฌธ์€ ์ƒ๋ฌผ์ •๋ณดํ•™ ๋ถ„์•ผ ๋“ฑ์—์„œ ํŒŒ์šด๋ฐ์ด์…˜ ๋ชจ๋ธ์˜ ์‹ค์ œ ์ ์šฉ ์‚ฌ๋ก€๋ฅผ ๋‹ค๋ฃจ์–ด, 340๋ฒˆ์˜ ์ด๋ก ์  ๋…ผ์˜๋ฅผ ์‹ค์šฉ ๋งฅ๋ฝ์— ์—ฐ๊ฒฐํ•ด์ค๋‹ˆ๋‹ค.
์‘์šฉ ์‚ฌ๋ก€
Foundation models in bioinformatics ๋…ผ๋ฌธ์€ ๋ฐ”์ด์˜ค๋ฉ”๋””์ปฌ ๋ฐ์ดํ„ฐ์— ํŒŒ์šด๋ฐ์ด์…˜ ๋ชจ๋ธ ์ ์šฉ ์‚ฌ๋ก€๋ฅผ ๋‹ค๋ฃจ๋ฉฐ, 3D ๋‡Œ MRI์™€ ์—ฐ๊ด€๋œ ์‹ค์ œ ํ™œ์šฉ ์˜ˆ๋กœ ์—ฐ๊ฒฐ๋œ๋‹ค.
์‘์šฉ ์‚ฌ๋ก€
NMR/๋‹จ๋ฐฑ์งˆ ๊ตฌ์กฐ ํ‰๊ฐ€ ์„ฑ๋Šฅ ๋ฐ SCIndex ๋“ฑ ์•™์ƒ๋ธ” ๊ตฌ์กฐ ์ผ๊ด€์„ฑ ์ง€ํ‘œ๊ฐ€ ์ƒ๋ช…์ •๋ณดํ•™ ์ „์ฒด์— ์–ด๋–ป๊ฒŒ ์‘์šฉ๋˜๋Š”์ง€ ์„ค๋ช…ํ•ฉ๋‹ˆ๋‹ค.
์‘์šฉ ์‚ฌ๋ก€
์ƒ๋ฌผ์ •๋ณดํ•™ ํŒŒ์šด๋ฐ์ด์…˜ ๋ชจ๋ธ์˜ ๋Œ€ํ‘œ์  ์‘์šฉ ์‚ฌ๋ก€๋กœ AlphaFold์˜ ํ™œ์šฉ ๋ฐ ๊ตฌ์กฐ ์ƒ์„ฑ์— ๊ด€ํ•œ ๋น„์Šทํ•œ ์˜์—ญ์„ ๋‹ค๋ฃฌ๋‹ค.
์‘์šฉ ์‚ฌ๋ก€
344์—์„œ ์†Œ๊ฐœํ•˜๋Š” ์ฝ”๋”ฉ, ์‹คํ—˜ ์ž๋™ํ™” ๋“ฑ ๋ฐ”์ด์˜ค์ธํฌ๋ฉ”ํ‹ฑ์Šค ๊ธฐ์ดˆ๋ชจ๋ธ ํ™œ์šฉ ์‚ฌ๋ก€๋Š” ERA ์‹œ์Šคํ…œ์ด ๋‹ค์–‘ํ•œ ๋„๋ฉ”์ธ ์‹คํ—˜ ์ž๋™ํ™”์— ์ ์šฉ๋˜์–ด ์ตœ์ฒจ๋‹จ ์„ฑ๋Šฅ์„ ๋‚ด๋Š” ์‹ค์ œ ์ปจํ…์ŠคํŠธ๋ฅผ ์ œ๊ณตํ•œ๋‹ค.
← ๋ชฉ๋ก์œผ๋กœ ๋Œ์•„๊ฐ€๊ธฐ

๐ŸŽง Audio Overview

์ด ๋…ผ๋ฌธ ๋ฆฌ๋ทฐ๋ฅผ ํŒŸ์บ์ŠคํŠธํ˜• ์˜ค๋””์˜ค๋กœ ์ƒ์„ฑํ•ฉ๋‹ˆ๋‹ค. (Gemini ยท ํ‚ค๋Š” ๋ธŒ๋ผ์šฐ์ €์—๋งŒ ์ €์žฅ ยท ์™„์„ฑ๋ณธ์€ ์ด๋ฉ”์ผ๋กœ๋„ ์ „์†ก)
โ–ธ ๊ณ ๊ธ‰: ๊ตฌ์„ฑ ๋ฐฉํ–ฅ(๋Œ€๋ณธ ์ž‘์„ฑ ์ง€์นจ) ์ง์ ‘ ์ˆ˜์ •