์ ์: Yuhang Chen, Tianpeng Lv, Siyi Zhang, Yixiang Yin, Yao Wan, Philip S. Yu, Dongping Chen | ๋ ์ง: 2025-10-17 | DOI: N/A 📄 PDF
Essence
ํ์ ๋
ผ๋ฌธ์ ๋ค์ํ ํ์(์ฌ๋ผ์ด๋, ํฌ์คํฐ, ๋น๋์ค, ์น์ฌ์ดํธ, AI ์ด์์คํดํธ)์ผ๋ก ๋ณํํ๋ ํตํฉ ํ๋ซํผ์ ์ผ๋ถ๋ก์ Paper2Web ์์น
ํ์ ๋
ผ๋ฌธ์ ์ ์ ์ธ PDF ํ์์์ ๋ฒ์ด๋ ๋ํํ(interactive) ๋ฉํฐ๋ฏธ๋์ด ์น์ฌ์ดํธ๋ก ๋ณํํ๋ ์์
์ ์๋กญ๊ฒ ์ ์ํ๊ณ , ์ด๋ฅผ ์ํ ๋ฒค์น๋งํฌ ๋ฐ์ดํฐ์
๊ณผ ํ๊ฐ ํ๋ ์์ํฌ๋ฅผ ์ ์ํ๋ค. ์ ์๋ PWAgent๋ ๋ฐ๋ณต์ ๊ฐ์ ์ ํตํด ๊ธฐ์กด ๋ฐฉ๋ฒ๋ค์ ํฐ ํญ์ผ๋ก ๋ฅ๊ฐํ๋ค.
Evaluation
์ดํ: Paper2Web์ ํ์ ๋
ผ๋ฌธ์ ์น๊ธฐ๋ฐ ๊ณต์ ๋ผ๋ ์ค์ํ๋ฉด์๋ ๋ฏธํด๊ฒฐ๋ ๋ฌธ์ ๋ฅผ ์ฒด๊ณ์ ์ผ๋ก ์ ์ํ๊ณ , ํฌ๊ด์ ์ธ ๋ฒค์น๋งํฌ ๋ฐ์ดํฐ์
๊ณผ ๋ค์ฐจ์ ํ๊ฐ ํ๋ ์์ํฌ๋ฅผ ์ ๊ณตํ๋ค๋ ์ ์์ ์๋นํ ๊ฐ์น๊ฐ ์๋ค. PWAgent์ ์ฑ๋ฅ ๊ฐ์ ๋ ์ธ์์ ์ด๋, ๊ธฐ์ ์ ๋
์ฐฝ์ฑ ์ธก๋ฉด์์๋ ๊ธฐ์กด ๋ฐฉ๋ฒ๋ค์ ์กฐํฉ ์์ค์ด๋ฏ๋ก ์ ์ฒด์ ์ผ๋ก๋ ๋์ ์์ค์ ์ค์ง์ ๊ธฐ์ฌ๋ฅผ ํ๋ ์์
์ผ๋ก ํ๊ฐ๋๋ค.
๊ฐ์ด ๋ณด๋ฉด ์ข์ ๋
ผ๋ฌธ
๊ธฐ๋ฐ ์ฐ๊ตฌ
ChemToolAgent ๋
ผ๋ฌธ์ ๋๊ตฌ ํ์ฉ ์ค์ฌ์ LLM ์์ด์ ํธ ์ค๊ณ์ ํผ๋๋ฐฑ-๊ธฐ๋ฐ ์์ฑ ํ๊ฐ๋ฅผ ์คํํ์ฌ Paper2Web์ ๋ฐ๋ณต ๊ฐ์ ํ ์์ด์ ํธ ์ค๊ณ์ ๊ธฐ๋ฐ์ด ๋ฉ๋๋ค.
๊ธฐ๋ฐ ์ฐ๊ตฌ
๋
ผ๋ฌธ-ํฌ์คํฐ ์๋ ๋ณํ ๋ฒค์น๋งํฌ ๋ฐ ํ์ดํ๋ผ์ธ ๊ธฐ์ ์ ๊ธฐ๋ฐ์ผ๋ก, ์น์ฌ์ดํธํ์ ์งํ ๊ณผ์ ์ ๋ฐ๋ผ๊ฐ๊ธฐ์ ์ ํฉํฉ๋๋ค.
๋ค๋ฅธ ์ ๊ทผ
37(Survey on Uncertainty Quantification Methods...)์ ๊ณผํ์ ๊ฒฐ๊ณผ์ ํด์ ๋ฐ ํํ์ ๋ถํ์ค์ฑ ๋ฌธ์ ๋ฅผ ๋ค๋ฃจ์ด, Paper2Web์ด ๋
ผ๋ฌธ์ ์น ์ฌ์ดํธ๋ก ๋ณํํ ๋ ์ ๋ขฐ์ฑ๊ณผ ํด์ ๊ฐ๋ฅ์ฑ ๋
ผ์์ ๋์กฐ์ ์๊ฐ์ ์ ์ํฉ๋๋ค.
๋ค๋ฅธ ์ ๊ทผ
๋
ผ๋ฌธ ์ค๋ฌธ์ด๋ ๋ํํ ์ฝํ
์ธ ์๋ํ ๋ฑ LLM ๊ธฐ๋ฐ ๋
ผ๋ฌธ ์ ํ์ ๋ค์ํ ์ค์ฉ์ ์ฌ๋ก๋ฅผ ๋ค๋ฃน๋๋ค.
๋ค๋ฅธ ์ ๊ทผ
๋
ผ๋ฌธ์ ๋ํํ ๋ฉํฐ๋ฏธ๋์ด ์ ํ์ด๋ผ๋ ๋ชฉํ๋ ๊ฐ์ผ๋, Select, read, and write๋ ์ ์ด ๋ฐฉ๋ฒ ๋ฐ ๋ฉํฐ์์ด์ ํธ ๊ตฌ์ฑ์์ ์ฐจ๋ณ์ ์ ๊ฐ์ต๋๋ค.
๋ค๋ฅธ ์ ๊ทผ
ํ์ ๋
ผ๋ฌธ์์ ๊ฒฐ๊ณผ๋ฅผ ์๋ ์ถ์ถํ์ฌ ๋น๊ตํ๋ ๋ค๋ฅธ ํ๋ ์์ํฌ๋ฅผ ์ ์ํ ์ฐ๊ตฌ์ด๋ค.
๋ค๋ฅธ ์ ๊ทผ
๊ณผํ ๋
ผ๋ฌธ๊ณผ ๋๊ตฌ ํธ์ถ์ ํตํฉํ์ฌ ๋์ ์ฐ๊ตฌ ์ํฌํ๋ก์ฐ ์๋ํ๋ฅผ ์งํฅํ๋ค๋ ์ธก๋ฉด์์ BloClaw์ ์ ์ฌํ์ง๋ง UIยท์๋๋ฐ์ค ๊ตฌํ์ ์ ๊ทผ์ ์์ดํฉ๋๋ค.
ํ์ ์ฐ๊ตฌ
๊ณผํ ๋
ผ๋ฌธ ์ ๋ณด๋ฅผ ์น์ผ๋ก ์๊ฐํ ๋ฐ ๋ถ์ํ๋ LLM ๊ธฐ๋ฐ ํ๋ ์์ํฌ๋ก์จ GIS agent์ ์๋ํ ์๋ฆฌ์ ์๋์ง ํจ๊ณผ๋ฅผ ํ์ธํ ์ ์์ต๋๋ค.
ํ์ ์ฐ๊ตฌ
GraphEval ๋
ผ๋ฌธ์ ํ์ ๋
ผ๋ฌธ์ ๊ทธ๋ํ์ ๊ตฌ์กฐ ์ถ๋ก ๊ณผ ํ๊ฐ๋ฅผ ์๋ํํ์ฌ, ๋
ผ๋ฌธ์ ๋ํํ ์น์ผ๋ก ์ฌ๊ตฌ์ฑํ๊ณ ํ๊ฐํ๋ Paper2Web์ ํ์์ ํ์ฅ ์์ฉ ์ฌ๋ก์
๋๋ค.
ํ์ ์ฐ๊ตฌ
๋
ผ๋ฌธโ์น์ฌ์ดํธ ์๋ ๋ณํ๊ณผ ๋ฌ๋ฆฌ, SurveyX๋ ํ์ ์กฐ์ฌ๋ฅผ ์๋ํํ๋ฏ๋ก, ๋
ผ๋ฌธ ์์ฐ ๋ฐ ํ์ฉ์ ์๋ํ ๋
ผ์๋ฅผ ํ์ฅํฉ๋๋ค.
ํ์ ์ฐ๊ตฌ
ํฌ์คํฐ ์์ฑ์์ ๋์๊ฐ ๋
ผ๋ฌธ์ ๋ํํ ์น์ฌ์ดํธ๋ก ์๋ ๋ณํํ๋ ๊ธฐ์ ๋ฐ์ ๋ฐฉํฅ์ ๋ค๋ฃน๋๋ค.
ํ์ ์ฐ๊ตฌ
PaperBanana ์ญ์ ๋
ผ๋ฌธ ๋ด์ฉ์ ๋ํํ ๋ฐฉ์์ด ์๋ ์๊ฐํ ์๋ํ์ ์ง์คํ์ง๋ง, ๋ฉํฐ๋ฏธ๋์ดํ ํ๋ ์ค๊ฐ ๋จ๊ณ๋ก ์ฐ๊ฒฐ๋ฉ๋๋ค.
์์ฉ ์ฌ๋ก
Paper2Web์์ ์์ฑํ ๋ํํ ๋ฉํฐ๋ฏธ๋์ด ๋
ผ๋ฌธ ํํ์, ๋์ ํผ์ด๋ฆฌ๋ทฐ ๋ํ ๊ธฐ๋ก์ ์ํธ์์ฉ์ ๋ถ์์ด ์ด์ฐ๋ฌ์ ธ ์ค์ peer review dynamics ์ฐ๊ตฌ์ ์ ์ฉ๋ ์ ์์ต๋๋ค.