Molgan: An implicit generative model for small molecular graphs

์ €์ž: Nicola De Cao, Thomas Kipf | ๋‚ ์งœ: 2018 | DOI: arXiv:1805.11973 📄 PDF


Essence

Figure 1

MolGAN์˜ ์ „์ฒด ๊ตฌ์กฐ: ์ž ์žฌ๋ณ€์ˆ˜ z๋กœ๋ถ€ํ„ฐ ์ƒ์„ฑ๊ธฐ๊ฐ€ ๋ถ„์ž ๊ทธ๋ž˜ํ”„๋ฅผ ์ƒ์„ฑํ•˜๊ณ , ํŒ๋ณ„๊ธฐ๋Š” ์‹ค์ œ/์ƒ์„ฑ ๋ฐ์ดํ„ฐ ๋ถ„๋ฅ˜, ๋ณด์ƒ๋ง์€ ํ™”ํ•™์  ์„ฑ์งˆ์„ ํ‰๊ฐ€ํ•œ๋‹ค.

๋ณธ ๋…ผ๋ฌธ์€ ๊ทธ๋ž˜ํ”„ ๊ตฌ์กฐ ๋ฐ์ดํ„ฐ์— ์ง์ ‘ ์ž‘๋™ํ•˜๋Š” GAN ๊ธฐ๋ฐ˜ ์•”๋ฌต์ (implicit) ์ƒ์„ฑ ๋ชจ๋ธ์„ ์ œ์•ˆํ•˜์—ฌ, ๋ถ„์ž ์„ค๊ณ„์—์„œ ๋น„์šฉ์ด ํฐ ๊ทธ๋ž˜ํ”„ ๋งค์นญ ์ ˆ์ฐจ์™€ ๋…ธ๋“œ ์ˆœ์„œ ํœด๋ฆฌ์Šคํ‹ฑ์„ ์šฐํšŒํ•˜๊ณ  ๋†’์€ ์œ ํšจ์„ฑ์˜ ํ™”ํ•™ ํ™”ํ•ฉ๋ฌผ์„ ์ƒ์„ฑํ•œ๋‹ค.

Motivation

Achievement

Figure 2

MolGAN ์•„ํ‚คํ…์ฒ˜: ์ƒ์„ฑ๊ธฐ๋Š” ์ธ์ ‘ ํ–‰๋ ฌ A์™€ ์ฃผ์„ ํ–‰๋ ฌ X๋ฅผ ์ƒ์„ฑํ•œ ํ›„ ์นดํ…Œ๊ณ ๋ฆฌ ์ƒ˜ํ”Œ๋ง์œผ๋กœ ์ด์‚ฐํ™”ํ•˜์—ฌ ๋ถ„์ž ๊ทธ๋ž˜ํ”„๋ฅผ ์™„์„ฑํ•œ๋‹ค.

  1. ๋†’์€ ์œ ํšจ์„ฑ: QM9 ๋ฐ์ดํ„ฐ์…‹์—์„œ ๊ฑฐ์˜ 100%์— ๊ฐ€๊นŒ์šด ์œ ํšจํ•œ ํ™”ํ•™ ํ™”ํ•ฉ๋ฌผ ์ƒ์„ฑ ๋‹ฌ์„ฑ
  2. ์šฐ์ˆ˜ํ•œ ๋น„๊ต ์„ฑ๋Šฅ: SMILES ๊ธฐ๋ฐ˜ ๋ฐฉ๋ฒ•๋“ค(RNN-VAE, ORGAN)๊ณผ likelihood ๊ธฐ๋ฐ˜ ๊ทธ๋ž˜ํ”„ ์ƒ์„ฑ ๋ฐฉ๋ฒ•๋ณด๋‹ค ์šฐ์ˆ˜ํ•œ ์„ฑ๋Šฅ ์ž…์ฆ
  3. ํ™”ํ•™์  ํŠน์„ฑ ์ตœ์ ํ™”: ๊ฐ•ํ™”ํ•™์Šต(RL) ๋ชฉํ‘œ์™€ ๊ฒฐํ•ฉํ•˜์—ฌ ์•ฝ๋ฌผ ์œ ์‚ฌ์„ฑ(druglikeness, QED) ๋“ฑ ํŠน์ • ํ™”ํ•™ ์„ฑ์งˆ ์ตœ์ ํ™” ๊ฐ€๋Šฅ

How

Figure 3

QM9 ๋ฐ์ดํ„ฐ์…‹ ์ƒ˜ํ”Œ(์ขŒ)๊ณผ ์•ฝ๋ฌผ ์œ ์‚ฌ์„ฑ(QED)์œผ๋กœ ์ตœ์ ํ™”๋œ MolGAN ์ƒ์„ฑ ๋ถ„์ž(์šฐ)

Originality

Limitation & Further Study

Evaluation

์ดํ‰: MolGAN์€ ๊ทธ๋ž˜ํ”„ ๊ธฐ๋ฐ˜ ๋ถ„์ž ์ƒ์„ฑ์— GAN์„ ์„ฑ๊ณต์ ์œผ๋กœ ์ ์šฉํ•œ ์„ ๊ตฌ์  ์—ฐ๊ตฌ๋กœ, ๋…ธ๋“œ ์ˆœ์„œ ๋ถˆ๋ณ€์„ฑ ๋ฌธ์ œ๋ฅผ ์šฐ์•„ํ•˜๊ฒŒ ํ•ด๊ฒฐํ•˜๊ณ  ๋†’์€ ์œ ํšจ์„ฑ์˜ ํ™”ํ•ฉ๋ฌผ์„ ์ƒ์„ฑํ•˜๋‚˜, ๋ชจ๋“œ ๋ถ•๊ดด ์ทจ์•ฝ์„ฑ๊ณผ ์†Œ๋ถ„์ž ์ œํ•œ์ด๋ผ๋Š” ๊ทผ๋ณธ์  ๊ณผ์ œ๋ฅผ ์•ˆ๊ณ  ์žˆ๋‹ค.

๊ฐ™์ด ๋ณด๋ฉด ์ข‹์€ ๋…ผ๋ฌธ

๊ธฐ๋ฐ˜ ์—ฐ๊ตฌ
Molgan์˜ ๋ถ„์ž ๊ทธ๋ž˜ํ”„ ์ƒ์„ฑ ์•„์ด๋””์–ด๊ฐ€ QH9 ๋ฐ์ดํ„ฐ์…‹ ๊ธฐ๋ฐ˜์˜ ์ƒˆ๋กœ์šด ํ™”ํ•™ ๊ตฌ์กฐ ์ƒ์„ฑ ๋ฐ ์˜ˆ์ธก ๋ชจ๋ธ ๊ฐœ๋ฐœ์— ์ด๋ก ์  ๊ธฐ๋ฐ˜์„ ์ œ๊ณตํ•œ๋‹ค.
๊ธฐ๋ฐ˜ ์—ฐ๊ตฌ
MolGAN์€ ๋ถ„์ž ๊ตฌ์กฐ ์ƒ์„ฑ์— ๋Œ€ํ•œ ์ดˆ๊ธฐ implicit generative model๋กœ, ๋ถ„์ž ๊ทธ๋ž˜ํ”„ ๋ฌธ๋ฒ• ๋ฐ ๋ฉ€ํ‹ฐ๋ชจ๋‹ฌ ํ•™์Šต ํ”„๋ ˆ์ž„์›Œํฌ์˜ ๋ฐœ์ „์  ๋ฐฐ๊ฒฝ์„ ์ดํ•ดํ•  ์ˆ˜ ์žˆ๋‹ค.
๊ธฐ๋ฐ˜ ์—ฐ๊ตฌ
MolGAN์˜ ๋ถ„์ž ๊ทธ๋ž˜ํ”„ ์ƒ์„ฑ ๋ฐฉ์‹์ด ์ฃผ๊ธฐ์  ๊ฒฐ์ • ๊ตฌ์กฐ ์˜ˆ์ธก์„ ์œ„ํ•œ ๊ทผ๋ณธ์  ์ƒ์„ฑ๋ชจ๋ธ๋กœ ์ž‘๋™ํ•ฉ๋‹ˆ๋‹ค.
๊ธฐ๋ฐ˜ ์—ฐ๊ตฌ
MolGAN์€ ๋ถ„์ž๊ทธ๋ž˜ํ”„ ์ƒ์„ฑ์˜ ๊ณ ์ „์ ์ธ generative ๋ชจ๋ธ๋กœ, MolHIT์˜ ๊ณ„์ธต์  diffusive modeling๊ณผ ๋น„๊ต ๊ฐ€๋Šฅํ•œ ์ด๋ก ์  ๊ธฐ๋ฐ˜์ด๋‹ค.
๊ธฐ๋ฐ˜ ์—ฐ๊ตฌ
MolGAN ๋…ผ๋ฌธ์€ ๊ทธ๋ž˜ํ”„ ๊ธฐ๋ฐ˜ ๋ถ„์ž ์ƒ์„ฑ์˜ ์ดˆ๊ธฐ ๊ทผ๊ฐ„์„ ์ œ๊ณตํ•˜์—ฌ FlashSchNet์˜ GNN ์ ‘๊ทผ๋ฒ•์— ์ด๋ก ์  ํ† ๋Œ€๋ฅผ ์ œ๊ณตํ•ฉ๋‹ˆ๋‹ค.
๊ธฐ๋ฐ˜ ์—ฐ๊ตฌ
์ž‘์€ ๋ถ„์ž ๊ทธ๋ž˜ํ”„ ์ƒ์„ฑ ๋ฐ ๋ถ„์ž๋™์—ญํ•™ ์‹œ๋ฎฌ๋ ˆ์ด์…˜์— ํ™œ์šฉ๋˜๋Š” generative ๋ชจ๋ธ๋กœ, transfer learning ๋ฐ ์ž„๋ฒ ๋”ฉ ์ ‘๊ทผ์˜ ๊ธฐ๋ฐ˜ ์—ญํ• ์„ ํ•ฉ๋‹ˆ๋‹ค.
๊ธฐ๋ฐ˜ ์—ฐ๊ตฌ
์ƒ์„ฑ์  ๋ถ„์ž ๋ชจ๋ธ๊ณผ ์ƒํ˜ธ์ž‘์šฉ ํฌํ…์…œ ํ•™์Šต์—์„œ ๋ถ„์ž๊ฐ„ ์ƒํ˜ธ์ž‘์šฉ ๋ฐ ๊ตฌ์กฐ ์˜ˆ์ธก์˜ ๊ธฐ์ดˆ ์ด๋ก ์„ ์ œ๊ณตํ•œ๋‹ค.
๊ธฐ๋ฐ˜ ์—ฐ๊ตฌ
555๋ฒˆ ๋…ผ๋ฌธ(Molgan)์€ ๋ถ„์ž ๊ตฌ์กฐ ์ƒ์„ฑ์„ ์œ„ํ•œ implicit ๋ชจ๋ธ์„ ์ œ์‹œํ•˜๋ฏ€๋กœ, 3089์˜ ํ•ฉ์„ฑ ์ ‘๊ทผ ๊ธฐ๋ฐ˜ ์ƒ์„ฑ ๋ชจ๋ธ ๊ฐ•ํ™”์— ๋ฐ€์ ‘ํ•œ ์ด๋ก ์  ๊ธฐ๋ฐ˜์ด ๋ฉ๋‹ˆ๋‹ค.
๊ธฐ๋ฐ˜ ์—ฐ๊ตฌ
์†Œ๋ถ„์ž ๊ตฌ์กฐ-๋ฐ˜์‘ ๊ด€๊ณ„์˜ ์‹ฌ์ธต ์ƒ์„ฑ ๋ฐ ์˜ˆ์ธก ํ”„๋ ˆ์ž„์›Œํฌ๋กœ, ViDa ๋ฐ CryoSAMU๊ฐ€ ๊ธฐ๋ฐ˜์œผ๋กœ ์‚ผ์€ ๊ธฐ์ดˆ ์ด๋ก ์„ ์ œ๊ณตํ•ฉ๋‹ˆ๋‹ค.
๊ธฐ๋ฐ˜ ์—ฐ๊ตฌ
๋ถ„์ž ๊ทธ๋ž˜ํ”„ ์ƒ์„ฑ ๋ชจ๋ธ์˜ ๋ฐฉ๋ฒ•๋ก ์  ๊ธฐ์ดˆ๋ฅผ ์ œ๊ณตํ•˜๋Š” ์—ฐ๊ตฌ์ด๋‹ค
๊ธฐ๋ฐ˜ ์—ฐ๊ตฌ
Molgan์€ ๋ถ„์ž๊ตฌ์กฐ ์ƒ์„ฑ์„ ์œ„ํ•œ ์ƒ์„ฑํ˜• ๋ชจ๋ธ์˜ ์ดˆ๊ธฐ ๋ฐœ์ „์„ ๋ณด์—ฌ์ฃผ๋ฉฐ, ์ด๊ฒƒ์ด 3118์˜ ํŒŒ๋ผ๋ฏธํ„ฐ ํšจ์œจ์  ์ƒ์„ฑ ๋ชจ๋ธ๋ง ๊ธฐ์ดˆ๊ฐ€ ๋œ๋‹ค.
๊ธฐ๋ฐ˜ ์—ฐ๊ตฌ
MolGAN ๋“ฑ ๋ถ„์ž ๊ทธ๋ž˜ํ”„ ์ง์ ‘ ์ƒ์„ฑ ๋ฐ ์˜ˆ์ธก ๋ชจ๋ธ๋“ค์ด ๋ณธ๋ฌธ์˜ GNN ๊ณ„์ˆ˜ ์˜ˆ์ธก ๋ฐฉ๋ฒ•๊ณผ ์›๋ฆฌ์ ์œผ๋กœ ์—ฐ๊ฒฐ๋ฉ๋‹ˆ๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
๋‹ค์ค‘ ๋ทฐ ๊ธฐ๋ฐ˜ ๋ถ„์ž ๊ทธ๋ž˜ํ”„ ์ƒ์„ฑ ๋ฐฉ๋ฒ•์„ ํ†ตํ•ด ๋Œ€๊ทœ๋ชจ ๋ฉ€ํ‹ฐ๋ทฐ ํด๋Ÿฌ์Šคํ„ฐ๋ง ๋ฐ ์ •๋ ฌ์— ๋Œ€ํ•œ ๋ฐ์ดํ„ฐ ๊ณผํ•™์  ๋Œ€์•ˆ์„ ์ œ์‹œํ•œ๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
555๊ฐ€ GAN ๊ธฐ๋ฐ˜์ด๋ผ๋ฉด 296์€ diffusion ๋ชจ๋ธ์—์„œ inference alignment๋กœ ๋ถ„์ž ์ƒ์„ฑ ์„ฑ๋Šฅ์„ ๋†’์ด๋Š” ๋˜๋‹ค๋ฅธ ์ตœ์‹  ์ ‘๊ทผ์„ ์†Œ๊ฐœํ•ฉ๋‹ˆ๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
555 ๋…ผ๋ฌธ์€ ๋ถ„์ž ๊ทธ๋ž˜ํ”„ ์ƒ์„ฑ์„ ์œ„ํ•œ GAN ๊ธฐ๋ฐ˜ ์ ‘๊ทผ๋ฒ•์„ ์ œ์•ˆํ•˜์—ฌ, ํ™•์‚ฐ๋ชจ๋ธ ๊ธฐ๋ฐ˜ ์„ค๊ณ„์™€ ๋Œ€์กฐ์ ์œผ๋กœ ์ฐธ๊ณ ํ•  ์ˆ˜ ์žˆ๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
555์˜ MolGAN์€ ์ƒ์„ฑ ๋ชจ๋ธ ๊ธฐ๋ฐ˜ ๋ถ„์ž ๊ทธ๋ž˜ํ”„ ์„ค๊ณ„๋ฅผ ์ œ์‹œํ•˜์—ฌ 682์˜ ๋””ํ“จ์ „ ๊ธฐ๋ฐ˜ ๋ฐ˜๋ณต ์ตœ์ ํ™”์™€ ๋น„๊ต๋˜๋Š” ๋Œ€์•ˆ์ด๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
282์˜ DMFlow๋Š” flow ๊ธฐ๋ฐ˜์œผ๋กœ ๋น„์ •์งˆ ๋ฌผ์งˆ ๊ตฌ์กฐ ์ƒ์„ฑ์— ์ดˆ์ ์„ ๋‘” ๋ฐ˜๋ฉด, 555์˜ MolGAN์€ GAN์„ ํ†ตํ•œ ์†Œ๋ถ„์ž ๊ทธ๋ž˜ํ”„ ์ƒ์„ฑ์— ์ฃผ๋ ฅํ•œ๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
์†Œ๋ถ„์ž์™€ ๋‹จ๋ฐฑ์งˆ์„ ํ†ตํ•ฉํ•˜๋Š” all-atom ๋ถ„์ž ํ‘œํ˜„ ํ•™์Šต์˜ ๋Œ€์•ˆ์  ์ ‘๊ทผ๋ฒ•์„ ์ œ์‹œํ•œ๋‹ค
๋‹ค๋ฅธ ์ ‘๊ทผ
๋ถ„์ž ํ‘œํ˜„์˜ ๊ตฌ์กฐ์  ์ผ๊ด€์„ฑ์„ ๊ฐœ์„ ํ•˜๊ธฐ ์œ„ํ•œ ๋Œ€์•ˆ์  ๋Œ€์กฐ ํ•™์Šต ๋ฐฉ๋ฒ•์„ ์ œ์‹œํ•˜๋Š” ์—ฐ๊ตฌ์ด๋‹ค.
ํ›„์† ์—ฐ๊ตฌ
555(MolGAN)์˜ ๋ถ„์ž ๊ทธ๋ž˜ํ”„ ์ƒ์„ฑ ๋ชจ๋ธ์„ 305์—์„œ ํšจ์œจ์  ์ง„ํ™”์  ํƒ์ƒ‰ ๋ฐ ์ตœ์ ํ™”์— ์ ์šฉํ•œ ์‹ค์ œ ์‚ฌ๋ก€๋ฅผ ํ™•์ธํ•  ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค.
ํ›„์† ์—ฐ๊ตฌ
682๋Š” ๋ถ„์ž ์„ค๊ณ„์— ํ™œ์šฉํ•  ์ˆ˜ ์žˆ๋Š” ๋ณด์ƒ ์œ ๋„ ํ…Œ์ŠคํŠธํƒ€์ž„ ๋””ํ“จ์ „ ๋ชจ๋ธ ์ตœ์ ํ™”๋กœ, 555์˜ GAN ๊ธฐ๋ฐ˜ ์ƒ์„ฑ ํ•œ๊ณ„๋ฅผ ๊ทน๋ณตํ•˜๋Š” ๋Œ€์•ˆ์„ ์ œ์‹œํ•œ๋‹ค.
ํ›„์† ์—ฐ๊ตฌ
์‹ ๊ทœ ์†Œ์žฌ ๋ฐœ๊ฒฌ์„ ์œ„ํ•œ ํ”„๋ ˆ์ž„์›Œํฌ ๋“ฑ ์—ฌ๋Ÿฌ ์ข…๋ฅ˜์˜ ์ƒ์„ฑํ˜• ๋ถ„์ž ๋ชจ๋ธ๋ง์˜ ํ˜„์ฃผ์†Œ ๋ฐ Molgan ๋ฐฉ์‹์˜ ํ•œ๊ณ„๋ฅผ ์ •๋ฆฌํ•ฉ๋‹ˆ๋‹ค.
์‘์šฉ ์‚ฌ๋ก€
Molgan์˜ ๋ถ„์ž๊ทธ๋ž˜ํ”„ ์ƒ์„ฑ ๋Šฅ๋ ฅ์ด DeepCRE ๋“ฑ ์‹ ์•ฝ๊ฐœ๋ฐœ ์ ์‘์ฆ ํ‰๊ฐ€๋ฅผ ์œ„ํ•œ ์•ฝ๋ฌผ ํ›„๋ณด ์ƒ์„ฑ์— ํ•ต์‹ฌ์ ์œผ๋กœ ํ™œ์šฉ๋  ์ˆ˜ ์žˆ๋‹ค.
์‘์šฉ ์‚ฌ๋ก€
์•”๋ฌต์  ์ƒ์„ฑ ๋ชจ๋ธ(Molgan)๋กœ ์ƒ์„ฑ๋œ ๊ฒฐ๊ณผ์˜ ๊ธฐ๊ณ„ํ•™์Šต ๊ธฐ๋ฐ˜ ํ•ด์„๊ณผ ์„ค๋ช…๊ฐ€๋Šฅ์„ฑ ํ™•๋ณด๋ฅผ ์‹ค์ œ ์‚ฌ๋ก€ ์ ์šฉ์œผ๋กœ ๋ณด์—ฌ์ค๋‹ˆ๋‹ค.
← ๋ชฉ๋ก์œผ๋กœ ๋Œ์•„๊ฐ€๊ธฐ

๐ŸŽง Audio Overview

์ด ๋…ผ๋ฌธ ๋ฆฌ๋ทฐ๋ฅผ ํŒŸ์บ์ŠคํŠธํ˜• ์˜ค๋””์˜ค๋กœ ์ƒ์„ฑํ•ฉ๋‹ˆ๋‹ค. (Gemini ยท ํ‚ค๋Š” ๋ธŒ๋ผ์šฐ์ €์—๋งŒ ์ €์žฅ ยท ์™„์„ฑ๋ณธ์€ ์ด๋ฉ”์ผ๋กœ๋„ ์ „์†ก)
โ–ธ ๊ณ ๊ธ‰: ๊ตฌ์„ฑ ๋ฐฉํ–ฅ(๋Œ€๋ณธ ์ž‘์„ฑ ์ง€์นจ) ์ง์ ‘ ์ˆ˜์ •