Large-Language-Model-Based AI Agent for Organic Semiconductor Device Research
์ ์: Qian Zhang, Yongxu Hu, Jiaxin Yan, Hengyue Zhang, Xinyi Xie, Jie Zhu, Huchao Li, Xinxin Niu, Liqiang Li, Yajing Sun, Wenping Hu | ๋ ์ง: 2024 | DOI: 10.1002/adma.202405163 📄 PDF
Essence
๋ณธ ์ฐ๊ตฌ๋ GPT-4 ์ธ์ด ๋ชจ๋ธ๊ณผ ๋จธ์ ๋ฌ๋ ์๊ณ ๋ฆฌ์ฆ์ ๊ฒฐํฉํ์ฌ ์ ๊ธฐ ๋ฐ๋์ฒด ์์(OFET) ๊ฐ๋ฐ์ ์ง์ํ๋ AI ์์ด์ ํธ๋ฅผ ๊ฐ๋ฐํ์ผ๋ฉฐ, 277๊ฐ ๋
ผ๋ฌธ์์ ์ถ์ถํ 709๊ฐ OFET์ 10,000๊ฐ ์ด์ ํ๋ผ๋ฏธํฐ๋ก ๊ตฌ์ถํ ๋ฐ์ดํฐ๋ฒ ์ด์ค๋ฅผ ํตํด ์์ ์ฑ๋ฅ์ 3๋ฐฐ ํฅ์์์ผฐ๋ค.
Motivation
- Known: Large Language Models(LLMs)๋ ํ
์คํธ ์ดํด, ์๊ฐ ์ธ์, ์ํ ๋ฌธ์ ํด๊ฒฐ ๋ฑ ๋ค์ํ ๋ถ์ผ์์ ๋ฐ์ด๋ ์ฑ๋ฅ์ ๋ณด์ด๊ณ ์์ผ๋ฉฐ, ํนํ ํํ, ์ฌ๋ฃ๊ณผํ ๋ฑ ์ ๋ฌธํ๋ ๋ถ์ผ์์๋ ๋์ ์ ์ฌ๋ ฅ์ ๊ฐ์ง๊ณ ์๋ค.
- Gap: ๊ธฐ์กด ์๋ ์ ๋ณด ์ถ์ถ ๋๊ตฌ(ChemicalTagger, OSCAR4, ChemDataExtractor)๋ค์ ์๋ ์
๋ ฅ ํ์, ๋๋ฉ์ธ ์ ๋ฌธ ์ง์ ํตํฉ ์ด๋ ค์, ์ด๋ฏธ์ง ๋ฐ์ดํฐ ์ฒ๋ฆฌ ํ๊ณ ๋ฑ์ ๋ฌธ์ ๋ฅผ ๊ฐ์ง๊ณ ์๋ค. ๋ํ OFET ๊ฐ๋ฐ์ ๋ค์ํ ์ฌ๋ฃ์ ์ค๊ณ ํ๋ผ๋ฏธํฐ ์กฐํฉ์ผ๋ก ์ธํด ์ํ์ฐฉ์ค(trial-and-error) ๋ฐฉ์์ ์์กดํ๊ณ ์๋ค.
- Why: ์์ญ ๋
๊ฐ ์ถํ๋ ํ์ ๋ฌธํ์ ์ด๋ฏธ ์ฌ๋ฃ์ ์์ ํ๋ผ๋ฏธํฐ ๊ฐ์ ๋ณต์กํ ๊ด๊ณ๊ฐ ๋ด๊ฒจ ์์ง๋ง, ์ด๋ฅผ ํจ๊ณผ์ ์ผ๋ก ์ถ์ถํ๊ณ ํ์ฉํ๋ ๋ฐฉ๋ฒ์ด ๋ถ์กฑํ๋ค.
- Approach: ๋ฉํฐ๋ชจ๋ฌ GPT-4 ๋ชจ๋ธ์ ์ด๋ฏธ์ง ์ฒ๋ฆฌ ๋ฅ๋ ฅ๊ณผ human-in-the-loop ํ๋กฌํํธ ์์ง๋์ด๋ง์ ํ์ฉํ์ฌ ํ
์คํธ, ํ, ์ด๋ฏธ์ง๋ก๋ถํฐ OFET ํ๋ผ๋ฏธํฐ๋ฅผ ์๋ ์ถ์ถํ๊ณ , XGBoost ๊ธฐ๋ฐ ๋จธ์ ๋ฌ๋ ๋ชจ๋ธ๊ณผ SHAP ํด์ ๋ถ์์ ํตํด ์์ธก ๋ฐ ์ต์ ํ ์ ์์ ์ํํ๋ค.
Achievement
- ๊ณ ์ ํ๋ ํ
์คํธ ๋ง์ด๋: 277๊ฐ ๋
ผ๋ฌธ์์ 709๊ฐ OFET์ ํ๋ผ๋ฏธํฐ ์ถ์ถ ์ ์ ๋ฐ๋(precision)์ ์ฌํ์จ(recall) ๋ชจ๋ 92% ์ด์ ๋ฌ์ฑ
- ํฌ๊ด์ ๋ฐ์ดํฐ๋ฒ ์ด์ค ๊ตฌ์ถ: 14๊ฐ ํต์ฌ OFET ์ค๊ณ ํ๋ผ๋ฏธํฐ(๋ฐ๋์ฒด ์ฌ๋ฃ, ์ ์กฐ ๋ฐฉ๋ฒ, ์ ๊ทน ์ฌ๋ฃ, ์ ์ ์ฒด ํน์ฑ, ์ฑ๋ฅ ์งํ ๋ฑ)๋ฅผ ํฌํจํ๋ 10,000๊ฐ ์ด์ ํ๋ผ๋ฏธํฐ์ ํ์คํ๋ ๋ฐ์ดํฐ๋ฒ ์ด์ค ๊ตฌ์ฑ
- ์คํ์ ๊ฒ์ฆ ์ฑ๊ณต: ์ฐ๊ตฌํ์ด ์ ์ํ ์ต์ ํ ์คํด์ ํตํด 2,6-diphenyldithieno[3,2-b:2โฒ,3โฒ-d]thiophene (DP-DTT) OFET์ ์ ํ ์์ก ํน์ฑ์ 3๋ฐฐ ํฅ์
- ๋ค๊ธฐ๋ฅ AI ์์ด์ ํธ: Trend Tracker(๊ธฐ์ ์งํ ์ถ์ ), Performance Predictor(์ฑ๋ฅ ์์ธก), Lab Advisor(์คํ ์ ์)์ ์ธ ๊ฐ์ง ์ค์ฉ์ ์์ฉ ํ๋ก๊ทธ๋จ ๊ฐ๋ฐ
How
LLM ๊ธฐ๋ฐ AI ์์ด์ ํธ์ ์ฒด๊ณ์ ํํ: a) ๋ฐ์ดํฐ ์ ์ฒ๋ฆฌ ๋๊ตฌ ์์, b) Human-in-the-loop ํ๋กฌํํธ ์์ง๋์ด๋ง ์ ๋ต, c) ํ์คํ ๋ฐ์ดํฐ์
๊ตฌ์ถ ๋ฐ ํ์ ์์ฉ
ํต์ฌ ๋ฐฉ๋ฒ๋ก :
- PDF ํ์ผ ํ์ฑ: Python ์ฝ๋์ GPT-4 Vision์ ํ์ฉํ์ฌ PDF๋ฅผ ํ
์คํธ, ํ, ์ด๋ฏธ์ง๋ก ๋ถํด
- ๋ฉํฐ๋ชจ๋ฌ ๋ฐ์ดํฐ ์ฒ๋ฆฌ:
- ํ
์คํธ ๋ฐ ํ ๋ฐ์ดํฐ: GPT-4 ์์ฐ์ด ์ฒ๋ฆฌ
- ๋ถ์ ๊ตฌ์กฐ ์ด๋ฏธ์ง: DECIMER ๋๊ตฌ๋ก SMILES ํ์์ผ๋ก ๋ณํ
- ์์ ๊ตฌ์กฐ ๋ค์ด์ด๊ทธ๋จ: GPT-4 Vision์ผ๋ก ๊ธฐํํ์ ํ๋ผ๋ฏธํฐ ์ถ์ถ
- ํ๋กฌํํธ ์์ง๋์ด๋ง:
- ์ด๊ธฐ ํ๋กฌํํธ ์ค๊ณ ํ ๋ฐ๋ณต์ ํ๊ฐยท๊ฐ์
- ์ผ๋ฐ์ ์ธ OFET ๊ตฌ์ฑ(BGBC, BGTC, TGBC, TGTC) ๋ฑ ํํ ๋๋ฉ์ธ ์ง์ ํตํฉ
- GPT-4์ 128,000 ํ ํฐ ์ฒ๋ฆฌ ์ฉ๋ ํ์ฉ์ผ๋ก ์ ์ฒด ๋
ผ๋ฌธ ์ปจํ
์คํธ ์ ์ง
- ์ฑ๋ฅ ํ๊ฐ: 14๊ฐ ํ๋ผ๋ฏธํฐ ์ฝ 10,000๊ฐ์ ๋ํด ์๋ ๊ฒ์ฆ์ผ๋ก True Positive, False Positive, False Negative ๋ถ๋ฅ
- ๋จธ์ ๋ฌ๋ ๋ชจ๋ธ: XGBoost ๊ธฐ๋ฐ ์ฑ๋ฅ ์์ธก ๋ชจ๋ธ ๊ตฌ์ถ ๋ฐ SHAP(SHapley Additive exPlanations) ๋ถ์์ผ๋ก ์ค์ ์ธ์ ํด์
- Lab Advisor: ๋ฐ์ดํฐ๋ฒ ์ด์ค ์ฟผ๋ฆฌ์ GPT-4 ์ถ๋ก ์ ๊ฒฐํฉํ์ฌ ๋ง์ถคํ ์คํ ์ ์ ์์ฑ
Originality
- AI์ ๋๋ฉ์ธ ์ตํฉ์ ์๋ก์ด ํจ๋ฌ๋ค์: ๋จ์ํ ํ
์คํธ ์ถ์ถ์ ๋์ด ๋ฉํฐ๋ชจ๋ฌ LLM์ ์ด๋ฏธ์ง ์ฒ๋ฆฌ ๋ฅ๋ ฅ์ ํํ ์ฌ๋ฃ ๊ณผํ์ ์ฒ์ ์ ์ฉ
- Human-in-the-loop ํ๋กฌํํธ ์ต์ ํ: ์๋ํ๋ LLM ์ถ์ถ๊ณผ ์ธ๊ฐ์ ๋๋ฉ์ธ ์ง์์ ๋ฐ๋ณต์ ์ผ๋ก ๊ฒฐํฉํ์ฌ ์ ํ๋ ํฅ์
- ์ข
ํฉ์ ๋ฐ์ดํฐ๋ฒ ์ด์ค ๊ตฌ์ถ: ๊ธฐ์กด ์ฐ๊ตฌ์ ๋ฌ๋ฆฌ OFET์ ๋ณต์กํ ์ค๊ณ ํ๋ผ๋ฏธํฐ๋ฅผ ์ฒด๊ณ์ ์ผ๋ก ํ์คํํ์ฌ ๋๊ท๋ชจ ๋ฐ์ดํฐ์
๊ตฌ์ถ
- ํด์ ๊ฐ๋ฅํ ์์ธก: SHAP ๋ถ์์ผ๋ก ๋ธ๋๋ฐ์ค ๋ชจ๋ธ์ ์์ธก ๊ทผ๊ฑฐ๋ฅผ ๋ช
ํํ ํ์ฌ ๊ณผํ ์ฐ๊ตฌ์ ์ ํฉํ ํฌ๋ช
์ฑ ํ๋ณด
- ์ค์ ์ฑ๋ฅ ๊ฐ์ ์
์ฆ: ์ด๋ก ์ ์ ์์ ๊ทธ์น์ง ์๊ณ ์คํ์ผ๋ก 3๋ฐฐ ์ฑ๋ฅ ํฅ์์ ์ค์ ๋ก ๋ฌ์ฑํ์ฌ ์ค์ฉ์ฑ ๊ฒ์ฆ
Limitation & Further Study
- ๋ฐ์ดํฐ ํธํฅ์ฑ: 277๊ฐ ๋
ผ๋ฌธ์์ ์ถ์ถํ OFET๋ ํน์ ์ถํ์ฌ(Springer, WILEY ๋ฑ)์ ํธ์ค๋ ๊ฐ๋ฅ์ฑ ์์ผ๋ฉฐ, ์์ ์ธ๋ฏธ์ฝ๋ํฐ ์ฌ๋ฃ์ ๋ฐ์ดํฐ๊ฐ ์ง์ค๋ ์ ์์
- ํ๋ผ๋ฏธํฐ ๋๋ฝ ์ฒ๋ฆฌ: ๋
ผ๋ฌธ์์ ๋ณด๊ณ ํ์ง ์์ ํ๋ผ๋ฏธํฐ(์: ์ธต ๋๊ป)๋ฅผ "N/A"๋ก ์ฒ๋ฆฌํ๋ ๋ฐฉ์์ด ํ์ ML ๋ชจ๋ธ ์ฑ๋ฅ์ ๋ฏธ์น๋ ์ํฅ ๋ฏธ๋ถ์
- ๋ชจ๋ธ ์ผ๋ฐํ: DP-DTT ์์์ ๋ํด์๋ง ์คํ์ ๊ฒ์ฆํ์ผ๋ฉฐ, ๋ค๋ฅธ ์ ๊ธฐ ๋ฐ๋์ฒด ์ฌ๋ฃ๋ OFET ์ธ ๋ค๋ฅธ ์์(OLED, ํ์์ ์ง ๋ฑ)๋ก์ ํ๋ ์ ์ฉ ํ์
- LLM ์์กด์ฑ: GPT-4 API์ ๋ํ ๋น์ฉ ๋ฐ ๋ฒ์ ์
๋ฐ์ดํธ์ ๋ฐ๋ฅธ ์ฑ๋ฅ ๋ณ๋ ์ํ ์กด์ฌ
- ํ์ ์ฐ๊ตฌ ๋ฐฉํฅ:
- ๋ค๋ฅธ ์ ๊ธฐ ๋ฐ๋์ฒด ์์(์ ๊ธฐ ํ์์ ์ง, ์ ๊ธฐ ๋ฐ๊ด๋ค์ด์ค๋ ๋ฑ)๋ก์ ํ๋ ์ ์ฉ
- ๊ตญ์ ํ์ ์ง ๋ฐ ํนํ ๋ฐ์ดํฐ๋ฒ ์ด์ค ํฌํจ์ผ๋ก ๋ฐ์ดํฐ ๋ค์์ฑ ์ฆ๋
- ๋ ๊ด๋ฒ์ํ ์์ ์ต์ ํ ์คํ์ผ๋ก ์ผ๋ฐํ ๊ฐ๋ฅ์ฑ ๊ฒ์ฆ
- ์ค์๊ฐ ๋ฌธํ ์
๋ฐ์ดํธ ์์คํ
๊ตฌ์ถ
Evaluation
Novelty: 4.5/5 Technical Soundness: 4/5 Significance: 4.5/5 Clarity: 4/5 Overall: 4.2/5
์ดํ: ์ด ๋
ผ๋ฌธ์ LLM์ ์ ๊ธฐ ๋ฐ๋์ฒด ์ฐ๊ตฌ์ ์ฒ์ ์ฒด๊ณ์ ์ผ๋ก ์ ์ฉํ ์ ๋์ ์ฌ๋ก๋ก, ๊ณ ์ ํ๋ ๋ฐ์ดํฐ ์ถ์ถ, ๋๊ท๋ชจ ๋ฐ์ดํฐ๋ฒ ์ด์ค ๊ตฌ์ถ, ์ค์ ์ฑ๋ฅ ๊ฐ์ ์ด๋ผ๋ ์ ๊ณผ์ ์ ์์ํ๋ค. ๋ค๋ง ๋จ์ผ ์์ ๊ฒ์ฆ๊ณผ ๋ฐ์ดํฐ ํธํฅ์ฑ ๋ถ์ ๋ณด์์ด ํ์ํ๋ฉฐ, ํ ๋ถ์ผ๋ก์ ํ๋ ์ ์ฉ ๊ฐ๋ฅ์ฑ์ด ์ถํ ์ค์ํ ๊ฒ์ฆ ๊ณผ์ ์ด๋ค.
๊ฐ์ด ๋ณด๋ฉด ์ข์ ๋
ผ๋ฌธ
๊ธฐ๋ฐ ์ฐ๊ตฌ
451์ ๋๋ฉ์ธ ํนํ LLM ๊ตฌ์ถ, ์ ๋ณด ์ถ์ถ ๋ฆฌ๋ทฐ๋ 480์ OFET ๋ฐ์ดํฐ ์ถ์ถ ๋ฐ ์ฑ๋ฅ ํฅ์ ์ฌ๋ก์ ๋ฐฉ๋ฒ๋ก ์ ํ ๋๋ฅผ ์ ๊ณตํ๋ค.
๊ธฐ๋ฐ ์ฐ๊ตฌ
480 ์ฐ๊ตฌ์ ์ด๋ก ์ ๋ฐฐ๊ฒฝ์ด ๋๋ ์ฌ๋ฃ๊ณผํ์ฉ ํ์ด๋ฐ์ด์
๋ชจ๋ธ ์ฐ๊ตฌ ํ๋ฆ(343)์ ์ ๊ณตํ๋ฉฐ, ํ์ฅ์ ๋ฐ์ ๋งฅ๋ฝ์ ์ดํดํ๋ ๋ฐ ๋์๋ฉ๋๋ค.
๊ธฐ๋ฐ ์ฐ๊ตฌ
์ฌ๋ฃ๊ณผํ ๋ฐ ๊ณ ๋ถ์ ๋ธ๋ฌ์ ๋ถ์ผ์์ AI/ML ํตํฉ ๋ฐฉ์์ด ์ค์ ์์ ๊ฐ๋ฐ, ์คํ ์๋ํ๋ก ์ด๋ป๊ฒ ํ์ฅ๋๋์ง ์ฌ๋ก๋ก ๋น๊ตํ ์ ์๋ค.
๋ค๋ฅธ ์ ๊ทผ
LLM ์์ด์ ํธ๋ฅผ ๊ธฐ๋ฐ์ผ๋ก ๋ค์ํ ์์ฌ ํ์/์ค๊ณ ์ํฌํ๋ก์ฐ๋ฅผ ์๋ํํ๋ ์์คํ
๊ณผ ๋น๊ตํ ์ ์์ต๋๋ค.
๋ค๋ฅธ ์ ๊ทผ
ํ๊ฒฝ๊ณผํ vs ์ ๊ธฐ๋ฐ๋์ฒด ๊ฐ๋ฐ ๋ถ์ผ ๋ด ํ์ด๋ฐ์ด์
๋ชจ๋ธ ๋ฐ AI/ML์ ์ค์ ์ ์ฉ ์ฌ๋ก๋ฅผ ๋น๊ต ๊ฐ๋ฅํ๋ค.
๋ค๋ฅธ ์ ๊ทผ
480์ด ์ ๊ธฐ ๋ฐ๋์ฒด ์ค๊ณ์ฉ ๋ฉํฐ๋ชจ๋ฌ ์ ๋ณด ์ถ์ถ์ ๋ค๋ฃฌ๋ค๋ฉด, 297์ ์ฌ๋ฃ ํน์ฑ ์๋๋ถ์์ ์ํ ๋น์ -LLM ์ตํฉ ์๋ํ์ ์ด์ ์ ๋ก๋๋ค.
๋ค๋ฅธ ์ ๊ทผ
์์ ์ ๊ฒฝ๋ง์ ํ์ต ๋ฐ ์ต์ ํ์ ๋ํ ๋์์ ๋ฐฉ๋ฒ๋ก ์ ์ ์ํ๋ ์ฐ๊ตฌ์ด๋ค.
ํ์ ์ฐ๊ตฌ
์ฌ๋ฃ๊ณผํ์์ LLM ๋ฐ ML์ ์ค์ OFET ์์ ๊ฐ๋ฐ์ ํ์ฉํ๋ ๋ฐฉ๋ฒ๋ก ์ ๊ตฌ์ฒด์ ์ผ๋ก ๋์
ํฉ๋๋ค.
ํ์ ์ฐ๊ตฌ
์ฌ๋ฃ๊ณผํ ๋ถ์ผ์์ AI/ML ์ตํฉ ์ํฌํ๋ก์ฐ ๋ฐ ์์จ์คํ์ค์ด ์ฑ๋ฅ ์ต์ ํ์ ๊ณ ์ํ์ ์ด๋ป๊ฒ ๊ธฐ์ฌํ๋์ง ์ข
ํฉ์ ์ผ๋ก ๋
ผ์ํ๋ค.
๐ง Audio Overview
์ด ๋
ผ๋ฌธ ๋ฆฌ๋ทฐ๋ฅผ ํ์บ์คํธํ ์ค๋์ค๋ก ์์ฑํฉ๋๋ค. (Gemini ยท ํค๋ ๋ธ๋ผ์ฐ์ ์๋ง ์ ์ฅ ยท ์์ฑ๋ณธ์ ์ด๋ฉ์ผ๋ก๋ ์ ์ก)
โธ ๊ณ ๊ธ: ๊ตฌ์ฑ ๋ฐฉํฅ(๋๋ณธ ์์ฑ ์ง์นจ) ์ง์ ์์