Essence
๋ณธ ๋
ผ๋ฌธ์ ๋๊ท๋ชจ ์ธ์ด๋ชจ๋ธ(LLM)์ด ๋จ์ํ ์ ๋ณด ์คํ์์์ ์๋ก์ด ์ง์์ ๋ฐ๊ฒฌํ๋ ํ์ ์์ง์ผ๋ก ์งํํ ์ ์๋์ง๋ฅผ Peirce์ ์ฒ ํ์ ํ๋ ์์ํฌ(๊ท๋ฉ๋ฒ, ์ฐ์ญ๋ฒ, ๊ท์ถ๋ฒ)๋ฅผ ํตํด ์ฒด๊ณ์ ์ผ๋ก ๋ถ์ํ ์ข
ํฉ ์ค๋ฌธ(survey)์ด๋ค. LLM์ ํ์ฉํ ๊ฐ์ค ๋ฐ๊ฒฌ๊ณผ ๊ท์น ํ์ต์ ์ ์ฒด ์ฌ์ดํด์ ์ด๋ก ์ ์ผ๋ก ์ ๋ฆฝํ๊ณ ์ค์ฆ์ ์ผ๋ก ๊ฒํ ํ ์ฒซ ์๋์ด๋ค.
Evaluation
์ดํ: ๋ณธ ์ค๋ฌธ์ LLM ๊ธฐ๋ฐ ๊ฐ์ค ๋ฐ๊ฒฌ ๋ถ์ผ์ ์ฒซ ์ฒด๊ณ์ ์ข
ํฉ ๋ถ์์ผ๋ก์, ์ฒ ํ์ ์๋ฐ์ฑ๊ณผ ํ์ค์ ์ ์ฉ ๊ฐ๋ฅ์ฑ์ ๋ชจ๋ ๊ฐ์ถ ๊ณ ๊ธ ๋
ผ๋ฌธ์ด๋ค. ๋ค๋ง ๋ฒค์น๋งํฌ์ ํ์ํ ๋ฌธ์ ํธํฅ, ์ค์ ๊ณผํ ๋ฐ์ดํฐ์์์ ๊ฒ์ฆ ๋ถ์ฌ, ์ ์ฑ๋(novelty) ์ ๋ํ ๋ฐฉ๋ฒ์ ๋ฏธ์ฑ์์ ํฅํ ๊ฐ์ ์ด ํ์ํ ํต์ฌ ๊ณผ์ ์ด๋ค. AI ์ปค๋ฎค๋ํฐ์์ ๊ฐ์ค ๋ฐ๊ฒฌ๊ณผ ์๋ ๊ณผํ ์ฐ๊ตฌ์ ์๋ก์ด ์ฐ๊ตฌ ๋ฐฉํฅ์ ์ ์ํ๋ ๊ธฐ์ค์ ์ด ๋ ๊ฐ๋ฅ์ฑ์ด ๋๋ค.
๊ฐ์ด ๋ณด๋ฉด ์ข์ ๋
ผ๋ฌธ
๊ธฐ๋ฐ ์ฐ๊ตฌ
์ ๊ฒฝ ์ ๋ฆฌ ์ฆ๋ช
์ ์ด๊ธฐ ์ฐ๊ตฌ๋ LLM์ด ํ์์ ์ถ๋ก ์ ์ํํ ์ ์์์ ๋ณด์ฌ์ฃผ์ด, ๊ฐ์ค ๋ฐ๊ฒฌ๊ณผ ๊ท์น ํ์ต์ ์ด๋ก ์ ๊ธฐ๋ฐ์ ์ ๊ณตํ๋ค.
๊ธฐ๋ฐ ์ฐ๊ตฌ
476๋ฒ ๋
ผ๋ฌธ์์ ๊ฐ์ค๋ฐ๊ฒฌยท๊ท์นํ์ต ๋ฑ LLM Reasoning์ ์ด๋ก ์ ๊ธฐ๋ฐ์ Peirce/๊ต์ก์ฌ๋ฆฌ ๊ธฐ๋ฐ์ผ๋ก ํด์ํ 363๋ฒ ๋
ผ๋ฌธ์ด ์ค์ํ ๋ฐฐ๊ฒฝ์ด ๋๋ค.
๊ธฐ๋ฐ ์ฐ๊ตฌ
012์ ๊ณผํ ๋ฒ์น ์๋ ์ถ๋ก ยท๋ฐ๊ฒฌ ์ฌ๋ก๋ 363์ LLM ๊ธฐ๋ฐ ๊ฐ์ค ํ์ ๊ธฐ์ ์๋ฒ ์ด์์ ๋ฐฉ๋ฒ๋ก ๋ณ ๋ถ์์ ํ ์์๊ฐ ๋ฉ๋๋ค.
๊ธฐ๋ฐ ์ฐ๊ตฌ
๊ณผํ ์๋ํ์ ๊ดํ ๊ฑฐ์์ ์ฌํ์ ๋
ผ์์, LLM ์ค์ฌ ๊ฐ์ค ๋ฐ๊ฒฌ/๊ฒ์ฆ ๊ธฐ์ ์ ์ค์ง์ ์ํฅ๋ ฅ์ ์ง์ ์ฐ๊ฒฐํ ์ ์๋ค.
๊ธฐ๋ฐ ์ฐ๊ตฌ
558์ ์๋ํ๋ ๊ณผํ ๋ฐ๊ฒฌ ๊ณผ์ ์์ ๊ฐ์ค ํ์๊ณผ ์์ํ ์ฃผ์๋ฌธ์ ๋ฅผ 363์ ๊ฐ์ค๋ฐ๊ฒฌ ์๋ฒ ์ด๋ฅผ ํตํด ์ด๋ก ์ ยท์ญ์ฌ์ ์ผ๋ก ๋งฅ๋ฝํํ ์ ์์ต๋๋ค.
๊ธฐ๋ฐ ์ฐ๊ตฌ
From Reasoning to Learning(363)์ ๊ณผํ์ ๊ฐ์ค ๋ฐ๊ฒฌ/์์ฑ์ ์ํ LLM ๋ฐฉ๋ฒ๋ก ์ ์๋ฒ ์ดํ๋ฉฐ, 417์ ๋ฒค์น๋งํฌ ์ค๊ณ ์์ ์ ๋ฐฐ๊ฒฝ์ง์์ผ๋ก ์ ํฉํ๋ค.
๊ธฐ๋ฐ ์ฐ๊ตฌ
363๋ฒ ๋
ผ๋ฌธ์ ๊ฐ์ค ๋ฐ๊ฒฌ ๋ฐ ๋ฐ์ดํฐ ์ํฌํ๋ก์ฐ ์์์์ ์์ด์ ํฑ Reasoning ํ๊ฐ์ ๋ํด ์ด๋ก ์ ๋ฐฐ๊ฒฝ๊ณผ ๋น๊ต๊ทธ๋ฆผ์ ์ ๊ณตํฉ๋๋ค.
๊ธฐ๋ฐ ์ฐ๊ตฌ
์๊ธฐ ๊ฒ์ฆ, ๊ท๋ฉ/์ฐ์ญ/๊ท์ถ์ ์ถ๋ก ๊ตฌ์กฐ ๋ฑ LLM ๊ธฐ๋ฐ ๊ณผํ์ ๋ฐ๊ฒฌ ํ๋ ์์ํฌ์ ์ด๋ก ์ ๊ธฐ๋ฐ์ด ๋๋ค.
๊ธฐ๋ฐ ์ฐ๊ตฌ
363์ LLM ๊ธฐ๋ฐ ๊ณผํ์ ๊ฐ์ค ๋ฐ๊ฒฌ ๋ฐ ์ถ๋ก ๊ณผ์ ์ ์ฒด๊ณ์ ์ผ๋ก ์ ๋ฆฌํด, PiFlow์ ์ ๋ณด์ด๋ก ๊ธฐ๋ฐ ๋ค์ค์์ด์ ํธ ํ๋ ฅ ํ๋ ์ ์ค๊ณ์ ์ด๋ก ์ ๋ฐฐ๊ฒฝ์ด ๋๋ค.
๊ธฐ๋ฐ ์ฐ๊ตฌ
363์ ๊ณผํ์ ๊ฐ์ค ๋ฐ ์คํ ์ค๊ณยท๋ฐ๊ฒฌ ๊ณผ์ ์ ์๋ํ ์ด๋ก ์ ํฌ๊ด์ ์ผ๋ก ๋ค๋ฃจ์ด, 069์ ์์ด์ ํธ ์์คํ
์๋ฆฌ๋ฅผ ์ดํดํ๋ ๋ฐ ๊ธฐ์ด๊ฐ ๋ฉ๋๋ค.
๊ธฐ๋ฐ ์ฐ๊ตฌ
๊ฐ์ค ๋ฐ๊ฒฌ๊ณผ ๊ท์น ํ์ต ์๋ฒ ์ด๋ ๋ฉํฐ์์ด์ ํธ ์์คํ
์ด ์ง์์ ๋ฐ๊ฒฌํ๋ ์ด๋ก ์ ํ๋ ์์ํฌ๋ฅผ ์ ๊ณตํ์ฌ ์์ด์ ํธ ํ์ฅ ์์น ์ฐ๊ตฌ์ ๊ธฐ๋ฐ์ด ๋๋ค.
๊ธฐ๋ฐ ์ฐ๊ตฌ
๊ฐ์ค ๋ฐ๊ฒฌ ๋ฐ ์๊ธฐ์์ ํ ๊ณผํ ์์คํ
๊ด๋ จ ์ต์ ์๋ฒ ์ด๋ก, ๋ฒ์ฃผ๋ก ์ ํ๋ ์์ํฌ์ ์ํ์ ๋ฒ ์ด์ค ๋ฐ ํํฉ์ ์ดํดํ๋ ๋ฐ ๋์์ด ๋๋ค.
๊ธฐ๋ฐ ์ฐ๊ตฌ
๊ฐ์ค ๋ฐ๊ฒฌ ์๋ํ์ ์ด๋ก ์ ํ์ ํฌ๊ด์ ์ผ๋ก ์๊ฐํ๋ ์๋ฒ ์ด๋ก, ์ธ์ง๊ณผํ ๋ถ์ผ LLM ํ์ฉ์ ์ด๋ก ์ ๊ธฐ๋ฐ ์ ๊ณตํ๋ค.
๊ธฐ๋ฐ ์ฐ๊ตฌ
363์ ์คํ ์ค๊ณ์ ๊ณผํ ์๋ํ์ ์ด๋ก ์ ํ๋ฆ, ํ์ ๋ฃจํ AI ๋ฐ๊ฒฌ ๋ฐฉ์์ ๋ค๋ค 1100์ R-IDEA ์ต์ ์คํ์ค๊ณ ๋
ผ์๋ฅผ ์ดํดํ๋ ๊ธฐ์ด๋ฅผ ์ ๊ณตํฉ๋๋ค.
๊ธฐ๋ฐ ์ฐ๊ตฌ
๊ณผํ์ ์ถ๋ก ์ ๋ต(๊ท๋ฉ, ์ฐ์ญ, ๊ท์ถ)์ ๋ํ ์ด๋ก ์ ๋
ผ์๊ฐ ์คํ์ค ์๋ํ์ LLM ์ถ๋ก ๋ฉ์ปค๋์ฆ์ ์ดํดํ๋ ๋ฐ ๋ฐํ์ด ๋๋ค.
๊ธฐ๋ฐ ์ฐ๊ตฌ
๊ท๋ฉ๋ฒ, ์ฐ์ญ๋ฒ, ๊ท์ถ๋ฒ ๋ฑ LLM ๊ธฐ๋ฐ ๊ฐ์ค ๋ฐ๊ฒฌ ๋
ผ์๋ฅผ ์ด๋ก ์ ์ผ๋ก ์ ๋ฆฝํ์ฌ Co-Scientist์ ๋ฐ๋ณต์ ๊ฐ์ค ๊ฐ์ ๋ฐฉ์์ ์ดํดํ๋ ๋ฐ ๋์์ด ๋๋ค.
๋ค๋ฅธ ์ ๊ทผ
ํธํฅ ์ํ ๋ฐ AI ์ค๋ฆฌ๋ฅผ ์ํ ์ ์ฌํ ๋ฐฉ๋ฒ๋ก ์ ์ ์ฉํ๋ ์ฐ๊ตฌ์ด๋ค.
๋ค๋ฅธ ์ ๊ทผ
LLM์ ํ์ฉํ ๊ณผํ์ ๋ฐ๊ฒฌ๊ณผ ๊ท์น ํ์ต์ ๋ค๋ฃจ๋ ์ ์ฌํ ์ฐ๊ตฌ์ด๋ค.
๋ค๋ฅธ ์ ๊ทผ
๊ธด ์ฌ๊ณ ์ฌ์ฌ ์๋ฒ ์ด๋ LLM์ ์ถ๋ก ๋ฅ๋ ฅ์ ์ฒด๊ณ์ ์ผ๋ก ๋ถ์ํ๋ฉฐ, ๊ฐ์ค ๋ฐ๊ฒฌ๊ณผ ๊ท์น ํ์ต ์๋ฒ ์ด์ ์ํธ ๋ณด์์ ์ธ ๊ด์ ์ ์ ๊ณตํ๋ค.
๋ค๋ฅธ ์ ๊ทผ
๊ฐ์ค ๋ฐ๊ฒฌ๊ณผ ๊ท์น ํ์ต์ ์ฒ ํ์ ํ๋ ์์ํฌ์ ๊ธฐ๋ฐํด ์ฒด๊ณ์ ์ผ๋ก ์ ๋ฆฌํ์ฌ, ๋ฒค์น๋งํฌ ์ค์ฌ AI4Science ๋ฆฌ๋ทฐ์ ์ํธ ๋ณด์ํ๋ค.
๋ค๋ฅธ ์ ๊ทผ
๊ท๋ฉ์ ์ถ๋ก ๊ณผ ๊ฐ์ค ์์ฑ์์ LLM์ ํ์ฉ์ ๋ค๋ฃจ๋ ๊ด๋ จ ์กฐ์ฌ ๋
ผ๋ฌธ์ด๋ค.
๋ค๋ฅธ ์ ๊ทผ
LLM์ ๊ณผํ์ ์ง์ ๋ฐ๊ฒฌ ๋ฅ๋ ฅ์ ๋ถ์ํ๋ ์ ์ฌํ ๋ฐฉํฅ์ ์ฐ๊ตฌ์ด๋ค.
๋ค๋ฅธ ์ ๊ทผ
์๋ช
๊ณผํ ๋ด LLM์ hypothsis discovery survey๋ก, ๋จ๋ฐฑ์ง ์ธ์ด๋ชจ๋ธ ํด์ ๋ฌธ์ ๋ฅผ ๋ค๋ฅธ ์ธก๋ฉด์์ ์กฐ๋งํ๋ค.
ํ์ ์ฐ๊ตฌ
LLM ๊ธฐ๋ฐ ๊ณผํ์ ์ถ๋ก ์ ์์ฉ ๋ฐ ํ์ฅ์ ๋ค๋ฃจ๋ ํ์ ์ฐ๊ตฌ์ด๋ค.
ํ์ ์ฐ๊ตฌ
HypoBench๋ ๊ฐ์ค ๋ฐ๊ฒฌ ๋ฐ ๊ท์นํ์ต ๊ด๋ จ LLM ๋ฒค์น๋งํฌ๋ฅผ ์ ๊ณตํ์ฌ, Survey ๋
ผ๋ฌธ์ด ์ ๊ธฐํ ๊ฐ์คํ AI์ ์ค์ฆ์ ํ๊ฐ ๊ธฐ๋ฐ์ ์ ๊ณตํฉ๋๋ค.
ํ์ ์ฐ๊ตฌ
๊ณผํ ์๋ํ์ ์ด๋ก ์ /์ค์ฆ์ ์๋๋ฅผ LLM ๊ฐ์ค ์ถ๋ก ๋ฐ ๊ท์น ํ์ต ๊ด์ ์์ ํฌ๊ด์ ์ผ๋ก ์ ๋ฆฌํ๋ค.
ํ์ ์ฐ๊ตฌ
LLM์ ๊ฐ์ค ๋ฐ๊ฒฌ๊ณผ ๊ท์น ํ์ต ์๋ฒ ์ด๋ Earth-Agent๊ฐ ์ง๊ตฌ ๊ด์ธก ๋ฐ์ดํฐ์์ ๊ณผํ์ ์ง์์ ๋ฐ๊ฒฌํ๋ ๋ฅ๋ ฅ์ ์ด๋ก ์ ์ผ๋ก ๋ท๋ฐ์นจํ๋ค.
ํ์ ์ฐ๊ตฌ
363๋ฒ ๋
ผ๋ฌธ์ ์์ด์ ํธ ๊ธฐ๋ฐ ๊ฐ์ค ํ์ ๋ฐ ์๋ ์คํ ํ๊ฐ ๋ฐฉ์์ ์ถ๊ฐ๋ก ์ ๊ตํํ์ฌ, 137๋ฒ์ ๊ณผํ ์๋ํ ํ๋ฆ์ ๋ณด๊ฐํฉ๋๋ค.
์์ฉ ์ฌ๋ก
Autonomous chemical research ๋
ผ๋ฌธ์ LLM์ด ๋๋ฉ์ธ ์ง์ ๋ฐ๊ตด๊ณผ ์๋ก์ด ๊ท์น ๋ฐ๊ฒฌ์ ์ค์ ์ ํ์ฉ๋๋ ์ฌ๋ก๋ฅผ ๋ณด์ฌ์ค๋๋ค.
์์ฉ ์ฌ๋ก
๊ฐ์ค ๊ฒ์ฆ๊ณผ ์๊ธฐ๊ฒ์ฆ ๋ฉ์ปค๋์ฆ ์ ์ฉ์ด ์ค์ ์ ์ ์ ์งํฉ ๋ถ์์ ์ด๋ป๊ฒ ์ ์ฉ๋๋์ง ๊ตฌ์ฒด์ ์ฌ๋ก๋ก ์ฐธ๊ณ ๋๋ค.
์์ฉ ์ฌ๋ก
POPPER์ ์๋ ๊ฐ์ค ๊ฒ์ฆ ํ๋ ์์ํฌ๋ LLM ๊ธฐ๋ฐ ๊ฐ์ค ๋ฐ๊ฒฌ๊ณผ ๊ท์น ํ์ต ์๋ฒ ์ด๊ฐ ๋ค๋ฃจ๋ ๊ท์ถ๋ฒ ๊ธฐ๋ฐ ๊ฐ์ค ์์ฑ-๊ฒ์ฆ ์ฌ์ดํด์ ๊ตฌ์ฒด์ ๊ตฌํ์ด๋ค.