์ ์: Xinna Lin, Siqi Ma, Junjie Shan, Xiaojing Zhang, Shell Xu Hu, Tiannan Guo, Stan Z. Li, Kaicheng Yu | ๋ ์ง: 2024 | DOI: arXiv:2407.00466 📄 PDF
๊ทธ๋ฆผ 1: (์ข) ๊ธฐ์กด ๋๋ฉ์ธ ํนํ AI ์์ด์ ํธ ๋ฒค์น๋งํฌ๋ ์ง์์๋ต(QA) ๊ฐ์ ์ ์์ค ์์ ์๋ง ์ง์คํ๊ฑฐ๋ ๊ณผํ์ ์ฝํ์ผ๋ฟ ๋ณต์ก ํ์ดํ๋ผ์ธ์ ๋ด์ฌ๋จ. (์ฐ) ๋ณธ ๋ ผ๋ฌธ์ ์ง์๊ทธ๋ํ ์ง์์๋ต(KGQA)๊ณผ ๊ณผํ ์ฃผ์ฅ ๊ฒ์ฆ(SCV)์ ๋ ๊ฐ์ง ์์์ (atomic) ๋ถ์์ ์ผ๋ก ๊ตฌ์ฑ๋ ์ง์๊ทธ๋ํ ๊ฒ์ฆ(KGCheck) ์์ ์ ํตํด ์์ํ AI ์์ด์ ํธ ํ๊ฐ์ ๊ฒฉ์ฐจ๋ฅผ ํด์ํจ.
๋ณธ ๋ ผ๋ฌธ์ ์์ํ ๋ถ์ผ AI ์์ด์ ํธ์ ๋ฌธํ ์ดํด ๋ฅ๋ ฅ์ ํ๊ฐํ๊ธฐ ์ํด BioKGBench ๋ฒค์น๋งํฌ๋ฅผ ์ ์ํ๋ค. ๊ธฐ์กด LLM ๊ธฐ๋ฐ ํ๊ฐ์ ํ๊ฐ(hallucination) ๋ฌธ์ ๋ฅผ ๊ทน๋ณตํ๊ธฐ ์ํด ๊ตฌ์กฐํ๋ ์ง์๊ทธ๋ํ์ ๋น๊ตฌ์กฐํ๋ ํ์ ๋ ผ๋ฌธ์ ๋ชจ๋ ํ์ฉํ๋ ํผํฉํ ํ๊ฐ ํ๋ ์์ํฌ๋ฅผ ๋์ ํ๋ค.
๊ทธ๋ฆผ 3: BKGAgent์ ํ๋ ์์ํฌ.
์ดํ: ๋ณธ ๋ ผ๋ฌธ์ ์์ํ AI ์์ด์ ํธ ํ๊ฐ์ ์ค์ํ ๊ณต๋ฐฑ์ ๋ฉ์ฐ๋ฉฐ, ๊ตฌ์กฐํ๋ ์ง์๊ทธ๋ํ์ ๋น๊ตฌ์กฐํ๋ ํ์ ๋ ผ๋ฌธ์ ํตํฉํ๋ ํ์ ์ ์ธ ๋ฒค์น๋งํฌ๋ฅผ ์ ์ํ๋ค. ์ค์ ๊ณผํ ์ ๋ฌด๋ฅผ ๋ฐ์ํ ์ค๊ณ์ 90๊ฐ ์ด์์ ์ง์๋ฒ ์ด์ค ์ค๋ฅ ๋ฐ๊ฒฌ์ ํตํด ์ค์ง์ ๊ฐ์น๋ฅผ ์ ์ฆํ์ผ๋, ๋ถ๋ถ๊ทธ๋ํ ์ฌ์ฉ๊ณผ ์ด์ง ๋ถ๋ฅ ์ค์ฌ์ ํ๊ฐ ์ค๊ณ๋ ์ถ๊ฐ ํ์ฅ์ ์ฌ์ง๋ฅผ ๋จ๊ธด๋ค.