Essence
HHEM-2.1-Open ๋ชจ๋ธ์ ์ฌ์ฉํ ์ฌ์ค์ ์ผ๊ด์ฑ ์ ์. ๋๋ถ๋ถ์ LLM์ด MolT5 ๊ธฐ์ค ์ค๋ช
๊ณผ ๋ฎ์ ์ผ๊ด์ฑ์ ๋ณด์ฌ ๊ด๋ฒ์ํ ํ๊ฐ์ ๋ํ๋
์ผ๋ฐ์ ์ผ๋ก ๋ฌธ์ ๋ก ๊ฐ์ฃผ๋๋ ๋๊ท๋ชจ ์ธ์ด๋ชจ๋ธ(LLM)์ ํ๊ฐ(hallucinations)์ด ์คํ๋ ค ์ฝ๋ฌผ ๋ฐ๊ฒฌ์ ๋ถ์ ํน์ฑ ์์ธก ๊ณผ์ ์์ ๋ชจ๋ธ์ ์ฑ๋ฅ์ ํฅ์์ํฌ ์ ์๋ค๋ ์ญ์ค์ ์ธ ๋ฐ๊ฒฌ์ ์ ์ํ๋ค. ๊ตฌ์กฐ์ ์ค๊ธฐ์ (structural misdescription)๊ณผ ๊ฐ์ ํน์ ์ ํ์ ํ๊ฐ์ด ๋ชจ๋ธ์ ์ผ๋ฐํ ๋ฅ๋ ฅ์ ์ฆ๋์ํค๋ ์๋ฌต์ ๋ฐ์ฌ์ค(implicit counterfactual)๋ก ์๋ํจ์ ๋ณด์ฌ์ค๋ค.
Evaluation
Novelty: 4/5 Technical Soundness: 4/5 Significance: 4/5 Clarity: 4/5 Overall: 4/5
์ดํ: ํ๊ฐ์ ์ญ์ค์ ์ ์ต์ฑ์ ์ค์ฆ์ ์ผ๋ก ์ ์ํ๋ ์ฐฝ์์ ์ฐ๊ตฌ๋ก, ์ฝ๋ฌผ ๋ฐ๊ฒฌ ๋๋ฉ์ธ์ ์๋ก์ด ๊ด์ ์ ์ ๊ณตํ๋ค. ๋ค๋ง ๋ฉ์ปค๋์ฆ ์ดํด์ ์ค์ ์ ์ฉ ๊ฐ๋ฅ์ฑ ๊ฒ์ฆ์ด ๋ณด์๋๋ฉด ์ํฉํธ๊ฐ ๋์ฑ ๊ฐํ๋ ๊ฒ์ด๋ค.
๊ฐ์ด ๋ณด๋ฉด ์ข์ ๋
ผ๋ฌธ
๊ธฐ๋ฐ ์ฐ๊ตฌ
Retrieval-augmented generation์ ํ๊ฐ ์ํ ์ญํ ๋ฐ ํ๊ณ ๋
ผ์๊ฐ LLM ํ๊ฐ์ ๊ฐ์น ํ๊ฐ ๋ฌธ์ (๋ณธ ๋
ผ๋ฌธ)์ ์ด๋ก ์ ์ผ๋ก ์ฐ๊ฒฐ๋ฉ๋๋ค.
๊ธฐ๋ฐ ์ฐ๊ตฌ
๋ชจ๋ธ ํ๊ฐ ๋ฐ ์ ๋ขฐ๋ ํ๊ฐ์ ๊ดํ ๊ณผํ์ ํ๊ฐ ์ฒด๊ณ๋ฅผ ์ ๊ณตํ๋ฏ๋ก, ํ๊ฐ์ด ์ฑ๋ฅ์ ๋ฏธ์น๋ ํจ๊ณผ ํด์์ ์ด๋ก ์ ๊ทผ๊ฑฐ๋ฅผ ์ค๋ค.
๋ค๋ฅธ ์ ๊ทผ
LLM ์ ์ฉ์ด ๋
ผ๋ฌธ ์์ฑ ๋ฑ ๊ณผํ์ ์ฐฝ์์์ ๋ณธ์ ์๋๊ฒ ์๋ชป๋ ์ ๋ณด ํ์ฐ ๋ฌธ์ ๋ฅผ ์ฌ์ธต์ ์ผ๋ก ์กฐ๋ช
ํ๋ฉฐ, ํ๊ฐ์ ์ํ์ฑ๊ณผ ๊ฐ์น ๋ชจ๋๋ฅผ ๊ท ํ ์๊ฒ ๊ณ ๋ คํฉ๋๋ค.
๋ค๋ฅธ ์ ๊ทผ
์งํ ์๊ณ ๋ฆฌ์ฆ ๊ธฐ๋ฐ ๋ถ์ ์ต์ ํ๋ฅผ ์ํ ๋์์ ๋ฐฉ๋ฒ๋ก ์ ์ ์ํ๋ ๊ด๋ จ ์ฐ๊ตฌ์ด๋ค.
๋ค๋ฅธ ์ ๊ทผ
์๋ฌผํ์ ๋ฐ์ดํฐ์์ ๋ํ ์ฌ์ ํ์ต ๋ชจ๋ธ์ ํจ์จ์ ๋ฏธ์ธ์กฐ์ ์ ์ํ ๊ด๋ จ ๋ฐฉ๋ฒ๋ก ์ฐ๊ตฌ์ด๋ค.
๋ค๋ฅธ ์ ๊ทผ
397๋ฒ ๋
ผ๋ฌธ์ LLM ํ๊ฐ์ ๊ธ์ ์ ์ธก๋ฉด์ ์ฝ๋ฌผ ๋ฐ๊ฒฌ prediction์ ๋ถ์ํ์ฌ, 3276๋ฒ์ ๋ณ์ด ์๊ทธ๋์ฒ ์ถ์ถ ๋ฐ ์์ฑ๋ชจ๋ธ ์ฑ๋ฅ ํ๊ฐ์ ๋๋น๋ฉ๋๋ค.
๋ค๋ฅธ ์ ๊ทผ
์ฝ๋ฌผ ๋ฐ๊ฒฌ์์ ๋ค์ํ ๋จธ์ ๋ฌ๋ ๋ชจ๋ธ์ ์ฑ๋ฅ์ ๋น๊ตํ๋ ์ ์ฌํ ๋ฒค์น๋งํน ์ฐ๊ตฌ์ด๋ค.
ํ์ ์ฐ๊ตฌ
LLM์ ํ๊ฐ ํ์์์ ๋น๋กฏ๋ ์ ๋ณด ์๊ณก ๋ฌธ์ ๋ฐ ๊ทธ ์ํฅ์ ๋ํด ์คํ์ ์ผ๋ก ํ์ฅยท๊ฒ์ฆํฉ๋๋ค.
ํ์ ์ฐ๊ตฌ
์ฝ๋ฌผ ์ฌ์ฐฝ์ถ ๋ชจ๋ธ์ ์ฑ๋ฅ์ ํฅ์์ํค๊ธฐ ์ํ ์ถ๊ฐ์ ์ธ ๋ฐฉ๋ฒ๋ก ์ ์ ๊ณตํ๋ค.
์์ฉ ์ฌ๋ก
Efficient Evolutionary Search Over Chemical Space ๋
ผ๋ฌธ์ ๊ตฌ์กฐ์ ํ๊ฐ์ด ์ค์ ๋ถ์ ํน์ฑ ์์ธก ๋ฐ ์ ์ฝ ํ์ ๋ค์ํ ๋ฌธ์ ์์ ์ด๋ค ํจ๊ณผ๋ฅผ ๋ด๋์ง ์ฌ๋ก ์ค์ฌ์ผ๋ก ํ์ฉํ๋ค.
์์ฉ ์ฌ๋ก
3276๋ฒ ๋
ผ๋ฌธ์ ๋ณ์ด ์๊ทธ๋์ฒ ์์ธก ๋ฑ ์ค์ ๋ถ์ ํ์คํฌ์์ ์์ฑ๋ชจ๋ธ์ ํน์ด์ฑ/์ค๋ฅ๊ฐ ์ฑ๋ฅ์ ๋ผ์น๋ ์ํฅ๊น์ง ๋ค๋ค, 397๋ฒ์ ํ๊ฐ์ด ์ผ๋ฐํ์ ๋ฏธ์น๋ ์ค์ ์์๋ก ์ฝํ ์ ์์ต๋๋ค.
๋ฐ๋ก /๋นํ
Hallucination mitigation ๋
ผ๋ฌธ์ ํ๊ฐ ์ค์ด๊ธฐ๋ฅผ ๋ชฉํ๋ก ํ์ฌ, ์๋์ ํ๊ฐ ํ์ฉ ๊ฐ๋ฅ์ฑ๊ณผ ํ๊ณ๋ฅผ ๋์กฐ์ ์ผ๋ก ๋ณด์ฌ์ค๋ค.
๋ฐ๋ก /๋นํ
Hallucinations can improve large language models in drug discovery ๋
ผ๋ฌธ์ '๋ถ์์ ์ฑ'์ด ํญ์ ๋ถ์ ์ ์ด์ง ์๋ค๋ ์๊ฐ์ ์ ์ํ์ฌ, reward-guided fine-tuning์ ํ๊ณ์ ํด์์ ๊ท ํ๊ฐ์๊ฒ ๋ณด์ฌ์ค๋๋ค.
๋ฐ๋ก /๋นํ
์ฝ๋ฌผ ๋ฐ๊ฒฌ LLM์ ์์ธก ์ ๋ขฐ์ฑ์ ๋ํด ๋ณด์์ ์๊ฐ(์ ๋ขฐํ ์ ์๋ ์์ธก์ ๋ฌด์์ธ๊ฐ)๊ณผ ํ๊ฐ ์์ฉ(์ฑ๋ฅ ํฅ์ ์์)์ด๋ผ๋ ์๋ฐ๋ ๊ด์ ์ ๋น๊ตํ ์ ์๋ค.
๋ฐ๋ก /๋นํ
397 ๋
ผ๋ฌธ์ LLM์ ํ๊ฐ ํ์์ด ์คํ๋ ค ํํฉ๋ฌผ ์ฐฝ์์ฑ์ ๊ธ์ ์ ์ผ๋ก ์์ฉํ ์ ์์์ ๋
ผ์ํ๋ฉฐ, 3131์ ์ฐฝ์์ฑ ๋ฉ์ปค๋์ฆ ํด์๊ณผ ์๋ฐ๋ฉ๋๋ค.