Bolek: A Multimodal Language Model for Molecular Reasoning

์ €์ž: Frederic Grabowski, Jacek Szczerbiล„ski, Maciej Jaล›kowski, Kalina Jasiล„ska-Kobus, Paweล‚ Dฤ…browski-Tumaล„ski, Tomasz Jetka, Bartosz Topolski | ๋‚ ์งœ: 2026-05-04 | URL: https://arxiv.org/abs/2605.02745 📄 PDF


Essence

Figure 1

Figure 1: Groundedness of CoT rationales. (A) BOLEK mentions the canonical physicochemical descriptors (TPSA,

Morgan fingerprint ์ž„๋ฒ ๋”ฉ์„ instruction-tuned LLM์— ์ฃผ์ž…ํ•˜๋Š” compact multimodal ๋ถ„์ž ์–ธ์–ด ๋ชจ๋ธ BOLEK์„ ์ œ์•ˆํ•˜๋ฉฐ, ํ™”ํ•™์ ์œผ๋กœ ๊ฒ€์ฆ ๊ฐ€๋Šฅํ•œ ์ถ”๋ก ์„ ํ†ตํ•ด ๋ถ„์ž ๋ฌผ์„ฑ ์˜ˆ์ธก์˜ ํ•ด์„๊ฐ€๋Šฅ์„ฑ์„ ํ™•๋ณดํ•œ๋‹ค.

Motivation

Achievement

Figure 1

Figure 1: Groundedness of CoT rationales. (A) BOLEK mentions the canonical physicochemical descriptors (TPSA,

How

Originality

Limitation & Further Study

Evaluation

Novelty: 4/5 Technical Soundness: 3/5 Significance: 4/5 Clarity: 4/5 Overall: 4/5

์ดํ‰: BOLEK์€ minimal multimodal ์„ค๊ณ„์™€ ๊ฒ€์ฆ ๊ฐ€๋Šฅํ•œ ํ™”ํ•™์  ํŠน์ง• ๊ธฐ๋ฐ˜ alignment ๊ฐ๋…์ด๋ผ๋Š” ํ•ต์‹ฌ ํ˜์‹ ์œผ๋กœ, ํ•ด์„๊ฐ€๋Šฅ์„ฑ๊ณผ ์„ฑ๋Šฅ์„ ๋ชจ๋‘ ๊ฐ–์ถ˜ compact ๋ถ„์ž ์ถ”๋ก  ๋ชจ๋ธ์˜ ์‹คํ˜„ ๊ฐ€๋Šฅ์„ฑ์„ ์ž…์ฆํ•œ๋‹ค. ํŠนํžˆ ๋‹ค๋ฅธ LLM ๋Œ€๋น„ 10โ€“100๋ฐฐ ๋†’์€ descriptor ์ธ์šฉ๋ฅ ๊ณผ ์•ฝ 90% ์ˆ˜์ค€์˜ ์ผ์น˜๋„๋Š” ๊ณ ์œ„ํ—˜ ์˜์•ฝ ์‘์šฉ์— ํ•„์ˆ˜์ ์ธ '๊ฒ€์ฆ ๊ฐ€๋Šฅํ•œ ์„ค๋ช…'์„ ์ฒ˜์Œ์œผ๋กœ ์ฒด๊ณ„์ ์œผ๋กœ ๋‹ฌ์„ฑํ•˜์˜€์Œ์„ ๋ณด์—ฌ์ค€๋‹ค.

๊ฐ™์ด ๋ณด๋ฉด ์ข‹์€ ๋…ผ๋ฌธ

๊ธฐ๋ฐ˜ ์—ฐ๊ตฌ
210๋ฒˆ ๋…ผ๋ฌธ์€ LLM์„ ํ™œ์šฉํ•œ ํ™”ํ•™ ์‹คํ—˜ ๋ฐ ํ•ฉ์„ฑ ์ž๋™ํ™”์˜ ๋„๊ตฌ์œตํ•ฉ ์ „๋žต์„ ์ œ์‹œํ•ด, BOLEK์˜ ๋ฉ€ํ‹ฐ๋ชจ๋‹ฌยท๋„๋ฉ”์ธ ์œตํ•ฉ ์•„์ด๋””์–ด์— ๋Œ€ํ•œ ์ด๋ก ์  ํ† ๋Œ€๋ฅผ ์ œ๊ณตํ•ฉ๋‹ˆ๋‹ค.
๊ธฐ๋ฐ˜ ์—ฐ๊ตฌ
๋ถ„์ž ์ง€๋ฌธ(fingerprint) ๊ธฐ๋ฐ˜ ํ‘œํ˜„ ํ•™์Šต์˜ ์ด๋ก ์  ๊ธฐ๋ฐ˜์„ ์ œ๊ณตํ•˜๋Š” ์„ ํ–‰ ์—ฐ๊ตฌ์ด๋‹ค.
๊ธฐ๋ฐ˜ ์—ฐ๊ตฌ
๋ถ„์ž geometry์™€ fragment ๊ธฐ๋ฐ˜ ํ† ํฌ๋‚˜์ด์ง• ์—ฐ๊ตฌ๊ฐ€, Bolek์˜ fingerprint ๊ธฐ๋ฐ˜ ๋ฉ€ํ‹ฐ๋ชจ๋‹ฌ ์ž…์ถœ๋ ฅ ์ž„๋ฒ ๋”ฉ์˜ ์ด๋ก ์  ๊ธฐ๋ฐ˜์ด ๋œ๋‹ค.
๊ธฐ๋ฐ˜ ์—ฐ๊ตฌ
3046์€ ๋ถ„์ž ๋ฉ€ํ‹ฐ๋ชจ๋‹ฌ ์ถ”๋ก ์˜ ์ตœ์‹  ์–ธ์–ด ๋ชจ๋ธ ๊ตฌ์กฐ์™€ ํ‰๊ฐ€ ๋ฐฉ๋ฒ•์„ ๊ฐœ๊ด€ํ•˜์—ฌ, 3138์˜ ํ•ต์‚ฐ LLM ํ†ตํ•ฉ ์ ‘๊ทผ์˜ ์ด๋ก ์  ํ† ๋Œ€๋ฅผ ์ œ๊ณตํ•ฉ๋‹ˆ๋‹ค.
๊ธฐ๋ฐ˜ ์—ฐ๊ตฌ
3046๋ฒˆ ๋…ผ๋ฌธ์€ ๋ถ„์ž/๋‹จ๋ฐฑ์งˆ reasoning์„ ์œ„ํ•œ ๋ฉ€ํ‹ฐ๋ชจ๋‹ฌ LLM ์•„ํ‚คํ…์ฒ˜๋ฅผ ์ œ์‹œํ•˜๋ฏ€๋กœ, 3113์˜ multi-property ๋ถ„์ž ์ƒ์„ฑ์—์„œ ๋ฐฉ๋ฒ•๋ก ์  ๋ฐฐ๊ฒฝ์ด ๋ฉ๋‹ˆ๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
๋ฉ€ํ‹ฐ๋ชจ๋‹ฌ ๋ถ„์ž ํ‘œํ˜„ ํ•™์Šต์„ ํ†ตํ•ด ํ™”ํ•™ ๋ฌผ์„ฑ ์˜ˆ์ธก์˜ ์„ฑ๋Šฅ์„ ํ–ฅ์ƒ์‹œํ‚ค๋Š” ๊ด€๋ จ ์—ฐ๊ตฌ์ด๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
LLM์„ ๋ถ„์ž ๋ฌผ์„ฑ ์˜ˆ์ธก ๋ฐ ํ™”ํ•™ ์ถ”๋ก ์— ์ ์šฉํ•˜๋Š” ์œ ์‚ฌํ•œ ์ ‘๊ทผ๋ฒ•์„ ์ œ์‹œํ•˜๋Š” ์—ฐ๊ตฌ์ด๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
๋ถ„์ž ์–ธ์–ด ๋ชจ๋ธ์„ ํ™œ์šฉํ•œ ํ™”ํ•™์  ์ถ”๋ก  ๋ฐ ๋ฌผ์„ฑ ์˜ˆ์ธก์„ ๋‹ค๋ฃจ๋Š” ์œ ์‚ฌํ•œ ์—ฐ๊ตฌ์ด๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
์–ธ์–ด ๋ชจ๋ธ์˜ ๋‚ด๋ถ€ ์ž‘๋™ ๋ฉ”์ปค๋‹ˆ์ฆ˜ ๋ถ„์„ ๋ฐ ํšจ์œจํ™”์— ๋Œ€ํ•œ ๋Œ€์•ˆ์  ๊ด€์ ์„ ์ œ์‹œํ•˜๋Š” ์—ฐ๊ตฌ์ด๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
๊ตฌ์กฐ ๊ธฐ๋ฐ˜ ๋ถ„์ž ํ™œ์„ฑ ์˜ˆ์ธก์— ๋Œ€ํ•ด ๋ฉ€ํ‹ฐ๋ชจ๋‹ฌ ๋ถ„์ž ์–ธ์–ด ๋ชจ๋ธ ์ ‘๊ทผ๋ฒ•์„ ํ†ตํ•ด ํ™œ์„ฑ/๊ฒฐํ•ฉ ์˜ˆ์ธก์„ ์ˆ˜ํ–‰ํ•˜๋ฉฐ, high-throughput ์Šคํฌ๋ฆฌ๋‹์— ๋Œ€ํ•œ ๋Œ€์•ˆ์  ๋ฐฉ๋ฒ•์ด๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
554๋ฒˆ ๋…ผ๋ฌธ์€ ํ™”ํ•™ ๊ตฌ์กฐ-์†์„ฑ ์˜ˆ์ธก์—์„œ ์—ฌ๋Ÿฌ ํƒœ์Šคํฌ๋ฅผ ๋‹ค๋ฃจ๋Š” ๋ฉ€ํ‹ฐํƒœ์Šคํฌ LLM ๊ธฐ๋ฐ˜ ๋ถ„์ž ์—์ด์ „ํŠธ๋ฅผ ์†Œ๊ฐœํ•˜์—ฌ, BOLEK๊ณผ ๋ฐฉ๋ฒ•๋ก  ๋ฐ ์ ์šฉ ๋ฒ”์œ„ ๋น„๊ต๊ฐ€ ๊ฐ€๋Šฅํ•ฉ๋‹ˆ๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
3046 ๋…ผ๋ฌธ์€ ๋‹จ๋ฐฑ์งˆ ๊ธฐ๋Šฅ ์˜ˆ์ธก์„ ์œ„ํ•œ ๋ฉ€ํ‹ฐ๋ชจ๋‹ฌ ํ•™์Šต ๋ฐฉ์‹์„ ์ œ์•ˆํ•˜๋ฉฐ, 3139์˜ ํ†ตํ•ฉ ๋ชจ๋ธ๋ง๊ณผ ์ƒํ˜ธ ์ฐธ์กฐ๊ฐ€ ์œ ์ตํ•ฉ๋‹ˆ๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
Bolek ๋…ผ๋ฌธ์€ ๋ถ„์žยท๋ฆฌ๊ฐ„๋“œ reasoning์—์„œ ๋ฉ€ํ‹ฐ๋ชจ๋‹ฌ ๋ชจ๋ธ์„ ์‚ฌ์šฉํ•˜์—ฌ, ๊ฒฐํ•ฉ ์นœํ™”๋„ ์˜ˆ์ธก์˜ SOTA์™€ Boltz-2 ๋ชจ๋ธ์˜ ํ•œ๊ณ„ ๋น„๊ต์— ๋„์›€์ด ๋œ๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
๋ฉ€ํ‹ฐ๋ชจ๋‹ฌ ๋ถ„์ž ์ถ”๋ก  ์–ธ์–ด๋ชจ๋ธ๋กœ, ๋ถ„์ž ์„ ํ˜•ํ™” ๋ถˆ์ผ์น˜ ๋ฐ ๋‹ค์ค‘ ํ‘œํ˜„ ๋ฌธ์ œ์— ๋Œ€ํ•œ ๋‹ค๋ฅธ ์ ‘๊ทผ๋ฒ•์„ ์ œ์‹œํ•œ๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
Mol-Debate๋Š” ๋‹ค์ค‘์—์ด์ „ํŠธ ๊ตฌ์กฐ์ถ”๋ก  ํ† ๋ก  ํ”„๋ ˆ์ž„์›Œํฌ๋กœ, Bolek์˜ ๋ถ„์ž๋ฌผ์„ฑ ์˜ˆ์ธก ๋ฐ ํ•ด์„๊ฐ€๋Šฅ์„ฑ ์ ‘๊ทผ๊ณผ ๋น„๊ต๋œ๋‹ค.
ํ›„์† ์—ฐ๊ตฌ
599 ๋…ผ๋ฌธ์€ ๊ณผํ•™๋…ผ๋ฌธ์—์„œ ํ…์ŠคํŠธยท๊ทธ๋ž˜ํ”ฝ ์—ฐ๋™ ๊ธฐ๋ฐ˜ ํฌ์Šคํ„ฐ ์ž๋™ ์ƒ์„ฑ ํ”„๋ ˆ์ž„์›Œํฌ๋ฅผ ์ œ์•ˆํ•˜์—ฌ, 3046์˜ ๋ฉ€ํ‹ฐ๋ชจ๋‹ฌ ๋ถ„์ž ์ถ”๋ก ํ˜• LLM๊ณผ ์‘์šฉ์ ‘์ ์„ ์ œ๊ณตํ•œ๋‹ค.
← ๋ชฉ๋ก์œผ๋กœ ๋Œ์•„๊ฐ€๊ธฐ

๐ŸŽง Audio Overview

์ด ๋…ผ๋ฌธ ๋ฆฌ๋ทฐ๋ฅผ ํŒŸ์บ์ŠคํŠธํ˜• ์˜ค๋””์˜ค๋กœ ์ƒ์„ฑํ•ฉ๋‹ˆ๋‹ค. (Gemini ยท ํ‚ค๋Š” ๋ธŒ๋ผ์šฐ์ €์—๋งŒ ์ €์žฅ ยท ์™„์„ฑ๋ณธ์€ ์ด๋ฉ”์ผ๋กœ๋„ ์ „์†ก)
โ–ธ ๊ณ ๊ธ‰: ๊ตฌ์„ฑ ๋ฐฉํ–ฅ(๋Œ€๋ณธ ์ž‘์„ฑ ์ง€์นจ) ์ง์ ‘ ์ˆ˜์ •