์ ์: Haofei Yu, Zhaochen Hong, Zirui Cheng, Kunlun Zhu, Keyang Xuan, Jinwei Yao, Tao Feng, Jiaxuan You | ๋ ์ง: 2024 | DOI: arXiv:2412.17767 📄 PDF
Essence
๊ทธ๋ฆผ 1: ์ธ๊ฐ ์ฐ๊ตฌ ์ปค๋ฎค๋ํฐ๋ฅผ ์์ด์ ํธ-๋ฐ์ดํฐ ๊ทธ๋ํ๋ก ์ถ์ํ. ์ฐ๊ตฌ์๋ ์์ด์ ํธ ๋
ธ๋, ๋
ผ๋ฌธ์ ๋ฐ์ดํฐ ๋
ธ๋๋ก ํํ
๋ณธ ๋
ผ๋ฌธ์ ๋๊ท๋ชจ ์ธ์ด ๋ชจ๋ธ(LLM) ๊ธฐ๋ฐ ๋ฉํฐ์์ด์ ํธ ํ๋ ์์ํฌ๋ฅผ ํตํด ์ธ๊ฐ ์ฐ๊ตฌ ์ปค๋ฎค๋ํฐ๋ฅผ ์๋ฎฌ๋ ์ด์
ํ๋ RESEARCHTOWN์ ์ ์ํ๋ค. ์ฐ๊ตฌ ์ปค๋ฎค๋ํฐ๋ฅผ ์์ด์ ํธ-๋ฐ์ดํฐ ๊ทธ๋ํ๋ก ๋ชจ๋ธ๋งํ๊ณ TextGNN์ด๋ผ๋ ํ
์คํธ ๊ธฐ๋ฐ ๋ฉ์์ง ์ ๋ฌ ๋ฉ์ปค๋์ฆ์ ํตํด ๋
ผ๋ฌธ ์์ฑ, ๋ฆฌ๋ทฐ ์์ฑ ๋ฑ ํ์
์ฐ๊ตฌ ํ๋์ ๋์ ์ผ๋ก ์๋ฎฌ๋ ์ด์
ํ๋ค.
Evaluation
์ดํ: ๋ณธ ๋
ผ๋ฌธ์ LLM ๊ธฐ๋ฐ ๋ฉํฐ์์ด์ ํธ ์ฐ๊ตฌ ์ปค๋ฎค๋ํฐ ์๋ฎฌ๋ ์ด์
์ด๋ผ๋ ์ผ์ฌ์ฐฌ ๋ชฉํ๋ฅผ ์ ์ํ๊ณ , ์์ด์ ํธ-๋ฐ์ดํฐ ๊ทธ๋ํ์ TextGNN์ด๋ผ๋ ์๋ก์ด ํ๋ ์์ํฌ๋ก ์ด๋ฅผ ๊ตฌํํ ์๋ฏธ ์๋ ์ฐ๊ตฌ๋ค. ๋ค๋ง ํ๊ฐ ๋ฉํธ๋ฆญ์ด ์ ์ฌ๋ ๊ธฐ๋ฐ์ ์ ํ๋์ด ์์ฑ ๋
ผ๋ฌธ์ ์ค์ ํ๋ฌธ์ ๊ฐ์น๋ฅผ ์จ์ ํ ํฌ์ฐฉํ์ง ๋ชปํ๊ณ , ๋๊ท๋ชจ ํ์ฅ์ฑ๊ณผ ์ค๋ฆฌ์ ๋ฌธ์ ์ ๋ํ ๋ ๊น์ ๋
ผ์๊ฐ ํ์ํ๋ค.
๊ฐ์ด ๋ณด๋ฉด ์ข์ ๋
ผ๋ฌธ
๊ธฐ๋ฐ ์ฐ๊ตฌ
๋๊ท๋ชจ ์ฌํ ์๋ฎฌ๋ ์ด์
๋ฐ ๋ฉํฐ์์ด์ ํธ ์ ๊ทผ์ ๋ํ ์ต๊ทผ survey๋ก, Researchtown ๋ฉํฐ์์ด์ ํธ ํ๋ ์์ํฌ ๊ตฌํ์ ์ด๋ก ์ ํ ๋์
๋๋ค.
๊ธฐ๋ฐ ์ฐ๊ตฌ
ํ๊ฒฝ ๊ณผํ ๋ฑ์์ ๋ํ๋๋ ์์ด์ ํธ ๊ธฐ๋ฐ ์ฐ๊ตฌ ์ปค๋ฎค๋ํฐ ์๋ฎฌ๋ ์ด์
, ๋ฉํฐ๋ชจ๋ฌ ๋ถ์์ ๊ฐ๋ฅ์ฑ๊ณผ ํ๊ณ๋ฅผ ํญ๋๊ฒ ์๋ฒ ์ดํด RESEARCHTOWN ๊ตฌํ์ ๋์์ ์ค๋๋ค.
๊ธฐ๋ฐ ์ฐ๊ตฌ
Researchtown(673)์ ์ฐ๊ตฌ ์ปค๋ฎค๋ํฐ ์๋ฎฌ๋ ์ด์
๋ฐ ํ๊ฐ ๋ฉ์ปค๋์ฆ์ ์ ๊ณตํด, ํ์ฅํ ์์ด์ ํธ ํ๋ จ ํ๊ฒฝ ์ค๊ณ์ ์ฌํ์ ํ๋ ์์ํฌ๊ฐ ๋๋ค.
๋ค๋ฅธ ์ ๊ทผ
ํผ์ด ๋ฆฌ๋ทฐ ๊ณผ์ ์ ์๋ํ ๋๋ LLM์ ํ์ ํ๊ฐ ํ์ฉ์ ๋ค๋ฃจ๋ ๊ด๋ จ ์ฐ๊ตฌ์ด๋ค.
๋ค๋ฅธ ์ ๊ทผ
๋
ผ๋ฌธ ๊ธฐ๋ฐ ์ง์์๋ต ๋ฐ ํ์์ ๋ฆฌ๋ทฐ ์์ฑ agent ์ฐ๊ตฌ์ ์ฐ๊ฒฐ, citation recommendation๊ณผ ์๋ํ๋ ๋ฆฌ๋ทฐ ์์คํ
๋น๊ต๊ฐ ๊ฐ๋ฅํฉ๋๋ค.
๋ค๋ฅธ ์ ๊ทผ
Researchtown ๋
ผ๋ฌธ์ ๋์๊ณผํ ๋์ ์ ์ฒด ์ฐ๊ตฌ์ ์ปค๋ฎค๋ํฐ ์๋ฎฌ๋ ์ด์
์ LLM์ผ๋ก ์งํํด 660์ด ์งํฅํ๋ ์ฐ๊ตฌ์ ์ง๋จ์ ๋์ ์๋ํ ๋ฌธ์ ์์ ๋์ฒด์ ์ ๊ทผ๋ฒ์ ๋ณด์ฌ์ค๋๋ค.
ํ์ ์ฐ๊ตฌ
Causal learning for socially responsible ai ๋
ผ๋ฌธ์ ์๋ฎฌ๋ ์ด์
๊ธฐ๋ฐ ์ธ๊ณผ ์ถ๋ก ๋ฐ ํ์
์ ์ฌํ์ ์ํฅ ์ฐ๊ตฌ๋ฅผ ํ์ฅํจ์ผ๋ก์จ 673์ ์ฐ๊ตฌ์ ์๋ฎฌ๋ ์ด์
์ ์๋ก์ด ๊ด์ ์ ์ถ๊ฐํฉ๋๋ค.
ํ์ ์ฐ๊ตฌ
์ฌ๋ฌ LLM ์์ด์ ํธ์ ํ๋ ฅ์ ์์
์ํธ์์ฉ ์๋ฆฌ์ ์ง์คํ์ฌ, RESEARCHTOWN์ ์ฌํ์ ํ๋ยทํ์
๋งค์ปค๋์ฆ ๋ชจ๋ธ๋ง์ ์ฌํํ ์ ์์ต๋๋ค.
ํ์ ์ฐ๊ตฌ
673๋ฒ ๋
ผ๋ฌธ์ ์ธ๊ฐ ์ฐ๊ตฌ ์ง๋จ์ ์๋ฎฌ๋ ์ด์
์ ํตํด LLM ์์คํ
์ ๋ฐ์ดํฐ ์ํธ์์ฉ ๋ฐ ๋ค์ค ํ reasoning ๋ฐ์ ๋์ ์คํ์ ์ผ๋ก ๋ถ์ํฉ๋๋ค.
ํ์ ์ฐ๊ตฌ
AI ๊ธฐ๋ฐ ๋
ผ๋ฌธ ์์ฝ ๋ฑ ์ง๋จ์ง์ฑ ํ๋ ฅ์์ ๋ํ๋๋ ์ผ๋ฐํ ํธํฅ ํ์๊น์ง ์ฐ๊ตฌ๋ฅผ ํ์ฅํ๋ค.
์์ฉ ์ฌ๋ก
247๋ฒ ๋
ผ๋ฌธ์ LLM์ ๊ธฐ๋ฐํ ์ฌํ์ ์งํ๋ชจ๋ธ์ ๋
ผ์ํด, 673๋ฒ์ ์์ด์ ํธ-๋ฐ์ดํฐ ๊ทธ๋ํ ๋ฐฉ์ ์ฐ๊ตฌ ์ปค๋ฎค๋ํฐ ์๋ฎฌ๋ ์ด์
์ ์ค์ ์ ์ฉ ์ฌ๋ก๊ฐ ๋๋ค.
์์ฉ ์ฌ๋ก
AI ๊ธฐ๋ฐ ๋๊ท๋ชจ ์ฐ๊ตฌ reproducibility workflow ์ง์ ์ฌ๋ก๋ฅผ ํตํด, ์ค์ ์ฐ๊ตฌ ์ปค๋ฎค๋ํฐ ์๋ฎฌ๋ ์ด์
์์คํ
์ ์ค๋ฌด ํ์ฉ ์์๋ฅผ ์ ๊ณตํฉ๋๋ค.