์ ์: Frederic Grabowski, Jacek Szczerbiลski, Maciej Jaลkowski, Kalina Jasiลska-Kobus, Paweล Dฤ
browski-Tumaลski, Tomasz Jetka, Bartosz Topolski | ๋ ์ง: 2026-05-04 | URL: https://arxiv.org/abs/2605.02745 📄 PDF
Essence
Figure 1: Groundedness of CoT rationales. (A) BOLEK mentions the canonical physicochemical descriptors (TPSA,
Morgan fingerprint ์๋ฒ ๋ฉ์ instruction-tuned LLM์ ์ฃผ์
ํ๋ compact multimodal ๋ถ์ ์ธ์ด ๋ชจ๋ธ BOLEK์ ์ ์ํ๋ฉฐ, ํํ์ ์ผ๋ก ๊ฒ์ฆ ๊ฐ๋ฅํ ์ถ๋ก ์ ํตํด ๋ถ์ ๋ฌผ์ฑ ์์ธก์ ํด์๊ฐ๋ฅ์ฑ์ ํ๋ณดํ๋ค.
Evaluation
Novelty: 4/5 Technical Soundness: 3/5 Significance: 4/5 Clarity: 4/5 Overall: 4/5
์ดํ: BOLEK์ minimal multimodal ์ค๊ณ์ ๊ฒ์ฆ ๊ฐ๋ฅํ ํํ์ ํน์ง ๊ธฐ๋ฐ alignment ๊ฐ๋
์ด๋ผ๋ ํต์ฌ ํ์ ์ผ๋ก, ํด์๊ฐ๋ฅ์ฑ๊ณผ ์ฑ๋ฅ์ ๋ชจ๋ ๊ฐ์ถ compact ๋ถ์ ์ถ๋ก ๋ชจ๋ธ์ ์คํ ๊ฐ๋ฅ์ฑ์ ์
์ฆํ๋ค. ํนํ ๋ค๋ฅธ LLM ๋๋น 10โ100๋ฐฐ ๋์ descriptor ์ธ์ฉ๋ฅ ๊ณผ ์ฝ 90% ์์ค์ ์ผ์น๋๋ ๊ณ ์ํ ์์ฝ ์์ฉ์ ํ์์ ์ธ '๊ฒ์ฆ ๊ฐ๋ฅํ ์ค๋ช
'์ ์ฒ์์ผ๋ก ์ฒด๊ณ์ ์ผ๋ก ๋ฌ์ฑํ์์์ ๋ณด์ฌ์ค๋ค.
๊ฐ์ด ๋ณด๋ฉด ์ข์ ๋
ผ๋ฌธ
๊ธฐ๋ฐ ์ฐ๊ตฌ
210๋ฒ ๋
ผ๋ฌธ์ LLM์ ํ์ฉํ ํํ ์คํ ๋ฐ ํฉ์ฑ ์๋ํ์ ๋๊ตฌ์ตํฉ ์ ๋ต์ ์ ์ํด, BOLEK์ ๋ฉํฐ๋ชจ๋ฌยท๋๋ฉ์ธ ์ตํฉ ์์ด๋์ด์ ๋ํ ์ด๋ก ์ ํ ๋๋ฅผ ์ ๊ณตํฉ๋๋ค.
๊ธฐ๋ฐ ์ฐ๊ตฌ
๋ถ์ ์ง๋ฌธ(fingerprint) ๊ธฐ๋ฐ ํํ ํ์ต์ ์ด๋ก ์ ๊ธฐ๋ฐ์ ์ ๊ณตํ๋ ์ ํ ์ฐ๊ตฌ์ด๋ค.
๊ธฐ๋ฐ ์ฐ๊ตฌ
๋ถ์ geometry์ fragment ๊ธฐ๋ฐ ํ ํฌ๋์ด์ง ์ฐ๊ตฌ๊ฐ, Bolek์ fingerprint ๊ธฐ๋ฐ ๋ฉํฐ๋ชจ๋ฌ ์
์ถ๋ ฅ ์๋ฒ ๋ฉ์ ์ด๋ก ์ ๊ธฐ๋ฐ์ด ๋๋ค.
๊ธฐ๋ฐ ์ฐ๊ตฌ
3046์ ๋ถ์ ๋ฉํฐ๋ชจ๋ฌ ์ถ๋ก ์ ์ต์ ์ธ์ด ๋ชจ๋ธ ๊ตฌ์กฐ์ ํ๊ฐ ๋ฐฉ๋ฒ์ ๊ฐ๊ดํ์ฌ, 3138์ ํต์ฐ LLM ํตํฉ ์ ๊ทผ์ ์ด๋ก ์ ํ ๋๋ฅผ ์ ๊ณตํฉ๋๋ค.
๊ธฐ๋ฐ ์ฐ๊ตฌ
3046๋ฒ ๋
ผ๋ฌธ์ ๋ถ์/๋จ๋ฐฑ์ง reasoning์ ์ํ ๋ฉํฐ๋ชจ๋ฌ LLM ์ํคํ
์ฒ๋ฅผ ์ ์ํ๋ฏ๋ก, 3113์ multi-property ๋ถ์ ์์ฑ์์ ๋ฐฉ๋ฒ๋ก ์ ๋ฐฐ๊ฒฝ์ด ๋ฉ๋๋ค.
๋ค๋ฅธ ์ ๊ทผ
๋ฉํฐ๋ชจ๋ฌ ๋ถ์ ํํ ํ์ต์ ํตํด ํํ ๋ฌผ์ฑ ์์ธก์ ์ฑ๋ฅ์ ํฅ์์ํค๋ ๊ด๋ จ ์ฐ๊ตฌ์ด๋ค.
๋ค๋ฅธ ์ ๊ทผ
LLM์ ๋ถ์ ๋ฌผ์ฑ ์์ธก ๋ฐ ํํ ์ถ๋ก ์ ์ ์ฉํ๋ ์ ์ฌํ ์ ๊ทผ๋ฒ์ ์ ์ํ๋ ์ฐ๊ตฌ์ด๋ค.
๋ค๋ฅธ ์ ๊ทผ
๋ถ์ ์ธ์ด ๋ชจ๋ธ์ ํ์ฉํ ํํ์ ์ถ๋ก ๋ฐ ๋ฌผ์ฑ ์์ธก์ ๋ค๋ฃจ๋ ์ ์ฌํ ์ฐ๊ตฌ์ด๋ค.
๋ค๋ฅธ ์ ๊ทผ
์ธ์ด ๋ชจ๋ธ์ ๋ด๋ถ ์๋ ๋ฉ์ปค๋์ฆ ๋ถ์ ๋ฐ ํจ์จํ์ ๋ํ ๋์์ ๊ด์ ์ ์ ์ํ๋ ์ฐ๊ตฌ์ด๋ค.
๋ค๋ฅธ ์ ๊ทผ
๊ตฌ์กฐ ๊ธฐ๋ฐ ๋ถ์ ํ์ฑ ์์ธก์ ๋ํด ๋ฉํฐ๋ชจ๋ฌ ๋ถ์ ์ธ์ด ๋ชจ๋ธ ์ ๊ทผ๋ฒ์ ํตํด ํ์ฑ/๊ฒฐํฉ ์์ธก์ ์ํํ๋ฉฐ, high-throughput ์คํฌ๋ฆฌ๋์ ๋ํ ๋์์ ๋ฐฉ๋ฒ์ด๋ค.
๋ค๋ฅธ ์ ๊ทผ
554๋ฒ ๋
ผ๋ฌธ์ ํํ ๊ตฌ์กฐ-์์ฑ ์์ธก์์ ์ฌ๋ฌ ํ์คํฌ๋ฅผ ๋ค๋ฃจ๋ ๋ฉํฐํ์คํฌ LLM ๊ธฐ๋ฐ ๋ถ์ ์์ด์ ํธ๋ฅผ ์๊ฐํ์ฌ, BOLEK๊ณผ ๋ฐฉ๋ฒ๋ก ๋ฐ ์ ์ฉ ๋ฒ์ ๋น๊ต๊ฐ ๊ฐ๋ฅํฉ๋๋ค.
๋ค๋ฅธ ์ ๊ทผ
3046 ๋
ผ๋ฌธ์ ๋จ๋ฐฑ์ง ๊ธฐ๋ฅ ์์ธก์ ์ํ ๋ฉํฐ๋ชจ๋ฌ ํ์ต ๋ฐฉ์์ ์ ์ํ๋ฉฐ, 3139์ ํตํฉ ๋ชจ๋ธ๋ง๊ณผ ์ํธ ์ฐธ์กฐ๊ฐ ์ ์ตํฉ๋๋ค.
๋ค๋ฅธ ์ ๊ทผ
Bolek ๋
ผ๋ฌธ์ ๋ถ์ยท๋ฆฌ๊ฐ๋ reasoning์์ ๋ฉํฐ๋ชจ๋ฌ ๋ชจ๋ธ์ ์ฌ์ฉํ์ฌ, ๊ฒฐํฉ ์นํ๋ ์์ธก์ SOTA์ Boltz-2 ๋ชจ๋ธ์ ํ๊ณ ๋น๊ต์ ๋์์ด ๋๋ค.
๋ค๋ฅธ ์ ๊ทผ
๋ฉํฐ๋ชจ๋ฌ ๋ถ์ ์ถ๋ก ์ธ์ด๋ชจ๋ธ๋ก, ๋ถ์ ์ ํํ ๋ถ์ผ์น ๋ฐ ๋ค์ค ํํ ๋ฌธ์ ์ ๋ํ ๋ค๋ฅธ ์ ๊ทผ๋ฒ์ ์ ์ํ๋ค.
๋ค๋ฅธ ์ ๊ทผ
Mol-Debate๋ ๋ค์ค์์ด์ ํธ ๊ตฌ์กฐ์ถ๋ก ํ ๋ก ํ๋ ์์ํฌ๋ก, Bolek์ ๋ถ์๋ฌผ์ฑ ์์ธก ๋ฐ ํด์๊ฐ๋ฅ์ฑ ์ ๊ทผ๊ณผ ๋น๊ต๋๋ค.
ํ์ ์ฐ๊ตฌ
599 ๋
ผ๋ฌธ์ ๊ณผํ๋
ผ๋ฌธ์์ ํ
์คํธยท๊ทธ๋ํฝ ์ฐ๋ ๊ธฐ๋ฐ ํฌ์คํฐ ์๋ ์์ฑ ํ๋ ์์ํฌ๋ฅผ ์ ์ํ์ฌ, 3046์ ๋ฉํฐ๋ชจ๋ฌ ๋ถ์ ์ถ๋ก ํ LLM๊ณผ ์์ฉ์ ์ ์ ์ ๊ณตํ๋ค.