OmniScientist: Toward a Co-evolving Ecosystem of Human and AI Scientists
์ ์: Chenyang Shao, Dehao Huang, Yu Li, Keyu Zhao, Weiquan Lin, Yining Zhang, Qingbin Zeng, Zhiyu Chen, Tianxing Li, Yifei Huang, Taozhong Wu, Xinyang Liu, Ruotong Zhao, Mengsheng Zhao, Jiaoyang Li, Xuhua Zhang, Yue Wang, Yuanyi Zhen, Fengli Xu, Yong Li, Tie-Yan Liu | ๋ ์ง: 2025-11-21 | URL: https://arxiv.org/abs/2511.16931 📄 PDF
Essence
๋ณธ ๋
ผ๋ฌธ์ ๊ธฐ์กด AI Scientist ์์คํ
๋ค์ ๊ณ ๋ฆฝ์ ์ด๊ณ ๋
๋ฆฝ์ ์ธ ๋ฌธ์ ํด๊ฒฐ ์ ๊ทผ๋ฐฉ์์ ํ๊ณ๋ฅผ ์ง์ ํ๊ณ , ์ธ๊ฐ ๊ณผํ ์ธํ๋ผ์ ์ฌํ์ ยทํ๋ ฅ์ ๋ฉ์ปค๋์ฆ์ ๋ช
์์ ์ผ๋ก ์ธ์ฝ๋ฉํ๋ OmniScientist ํ๋ ์์ํฌ๋ฅผ ์ ์ํ๋ค. ๋ฐ์ดํฐ ๊ธฐ๋ฐ, ๋ฌธํ ๊ฒํ , ์ฐ๊ตฌ ์์ด๋์ด ๋์ถ, ์คํ ์๋ํ, ๊ณผํ ์ ์ , ๋
ผ๋ฌธ ๊ฒํ ์ ์ ์ฃผ๊ธฐ์ ๊ฑธ์ณ end-to-end ์๋ํ๋ฅผ ๊ตฌํํ๋ฉด์๋, ๊ตฌ์กฐํ๋ ์ง์ ์์คํ
, ํ๋ ฅ ํ๋กํ ์ฝ(OSP), ํ๊ฐ ํ๋ซํผ(ScienceArena)์ ํตํด ์ธ๊ฐ-AI ๊ณผํ์์ ๊ณต์งํ ์ํ๊ณ๋ฅผ ์คํํ๋ค.
Motivation
- Known: ๊ธฐ์กด AI Scientist ์์คํ
(AlphaEvolve, OpenAI Deep Research, Virtual Lab, Future House ๋ฑ)์ ๊ณผํ์ ๋ฐ๊ฒฌ์ ๊ณ ๋ฆฝ๋ ๊ฒ์ ๋๋ ์ต์ ํ ๋ฌธ์ ๋ก ๊ณต์ํํ์ฌ, ๊ณผํ์ด ๋ณธ์ง์ ์ผ๋ก ์ฌํ์ ์ด๊ณ ํ๋ ฅ์ ์ธ ํ๋์์ ๊ฐ๊ณผํ๊ณ ์๋ค. ์ธ์ฉ ๋คํธ์ํฌ, ํผ์ด ๋ฆฌ๋ทฐ, ํ๋ ฅ ํ๋กํ ์ฝ ๋ฑ ์ธ๊ฐ ๊ณผํ ์ธํ๋ผ์ ๊ตฌ์กฐ์ ๋ฉ์ปค๋์ฆ์ด ๊ณผํ ๋ฐ์ ์ ํต์ฌ์ด๋ค.
- Gap: ๊ธฐ์กด AI ๊ณผํ์ ์์คํ
๋ค์ ๊ณผํ์ ์
๋ฌด ์๋ํ์ ์ด์ ์ ๋ง์ถ๋ฉด์๋, ๊ณผํ ์ฐ๊ตฌ์ ์ฌํ์ ยทํ๋ ฅ์ ๋ณธ์ง๊ณผ ์ธ๊ฐ ๊ณผํ ์ธํ๋ผ์ ๋ณต์กํ ๋ฉ์ปค๋์ฆ(๊ธฐ์ฌ๋ ์ถ์ , ํผ์ด ๋ฆฌ๋ทฐ, ๊ตฌ์กฐํ๋ ์ง์ ๋คํธ์ํฌ ๋ฑ)์ ๋ชจ๋ธ๋งํ์ง ๋ชปํด ์ง์ ํ ์ฐ๊ตฌ ์ํ๊ณ๋ฅผ ๊ตฌ์ถํ์ง ๋ชปํ๊ณ ์ธ๊ฐ ๊ณผํ ์ปค๋ฎค๋ํฐ์ ๊น์ ์ํธ์์ฉ์ด ๋ถ๊ฐ๋ฅํ๋ค.
- Why: AI ๊ณผํ์๊ฐ ๋จ์ ์
๋ฌด ์คํ ๋๊ตฌ์์ ์ง์ ํ ๊ณผํ์๋ก ์งํํ๋ ค๋ฉด, ์ธ๊ฐ ๊ณผํ ์์คํ
์ ๋์ ์ด๊ณ ์๊ธฐ๊ต์ ์ ์ธ ํน์ฑ์ ์์๋ฐ์์ผ ํ๋ค. ์ด๋ฅผ ์ํด ์ธ์ฉ ๋คํธ์ํฌ, ํผ์ด ๋ฆฌ๋ทฐ, ํ๋ ฅ ๋ฉ์ปค๋์ฆ ๋ฑ ์ธ๊ฐ ๊ณผํ ์ธํ๋ผ์ ๊ทผ๋ณธ์ ์ธ ๋ฉ์ปค๋์ฆ์ AI ์ํฌํ๋ก์ฐ์ ๋ช
์์ ์ผ๋ก ํตํฉํ๋ ๊ฒ์ด ํ์์ ์ด๋ค.
- Approach: OmniScientist๋ LLM ๊ธฐ๋ฐ ๋ฉํฐ ์์ด์ ํธ ์ํคํ
์ฒ๋ฅผ ๊ธฐ๋ฐ์ผ๋ก, ๋ฐฑ๋ง ๊ฐ ์ด์์ full-text ๋
ผ๋ฌธ๊ณผ ๋ฉํ๋ฐ์ดํฐ๋ก ๊ตฌ์ฑ๋ robustํ ๋ฐ์ดํฐ ๊ธฐ๋ฐ์ ๊ตฌ์ถํ๊ณ , ์ด๋ฅผ ๋ฐํ์ผ๋ก iterativeํ ๋ฌธํ ๊ฒํ , ๊ณผํ ์ง์ ๋คํธ์ํฌ ๋ด์์์ ์ฐ๊ตฌ ์์ด๋์ด ๋์ถ, multi-agent loop๋ฅผ ํตํ ์คํ ์๋ํ, ํ์ ๊ท๋ฒ์ ๋ฐ๋ฅด๋ ๊ณผํ ์ ์ , ํผ์ด ๋ฆฌ๋ทฐ ๋ฉ์ปค๋์ฆ์ ์์ฐจ์ ์ผ๋ก ๊ตฌํํ๋ค. ์ถ๊ฐ๋ก Omni Scientific Protocol(OSP)์ ํตํด ์ธ๊ฐ ์ฐ๊ตฌ์์ AI ์์ด์ ํธ์ seamlessํ ํ๋ ฅ์ ๊ฐ๋ฅํ๊ฒ ํ๊ณ , ๊ธฐ์ฌ๋ ์ถ์ ์์คํ
์ผ๋ก ๊ณผํ์ ๋ฌด๊ฒฐ์ฑ์ ๋ณด์ฅํ๋ฉฐ, ScienceArena๋ฅผ ํตํด blind pairwise user voting๊ณผ Elo ranking ๊ธฐ๋ฐ์ ํ๊ฐ ๋ฉ์ปค๋์ฆ์ ์ ๊ณตํ๋ค.
Achievement
Figure 1: Overview of Our OmniScientist System
- Data Foundation ๊ตฌ์ถ: 100๋ง ๊ฐ ์ด์์ full-text ๋
ผ๋ฌธ ๋ฐ ๋ฉํ๋ฐ์ดํฐ๋ฅผ ํตํฉํ์ฌ citation network์ conceptual correlation์ ํฌํจํ ๋์ ๊ณผํ ๋คํธ์ํฌ ๊ตฌ์ฑ
- End-to-end ์๋ํ: ๋ฌธํ ๊ฒํ (multi-agent ๊ธฐ๋ฐ iterative ํ์), ์ฐ๊ตฌ ์์ด๋์ด ๋์ถ(science of science ์๋ฆฌ ํ์ฉ), ์คํ ์๋ํ(closed-loop feedback mechanism), ๊ณผํ ์ ์ (๊ด๋ จ ์ฐ๊ตฌ ํฉ์ฑ ๋ฐ figure ์์ฑ), ๋
ผ๋ฌธ ๊ฒํ (prior work ๋น๊ต ๊ธฐ๋ฐ ํ๊ฐ) ์ ์ฃผ๊ธฐ์ ์๋ํ ๋ฌ์ฑ
- ํ๋ ฅ ์ธํ๋ผ: OSP๋ฅผ ํตํด ์ธ๊ฐ ์ฐ๊ตฌ์์ seamlessํ ์ฐธ์ฌ, ์ ๋ต์ ์ ์, ๊ณผ์ ๊ฐ์ ์ ๊ฐ๋ฅํ๊ฒ ํจ
- ๊ธฐ์ฌ๋ ์ถ์ ์์คํ
: ๋ชจ๋ ์์ด๋์ด, ๋ฐ์ดํฐ์
, ์คํ ๊ฒฐ๊ณผ์ ์ถ์ฒ๋ฅผ granularํ๊ฒ ๊ธฐ๋กํ์ฌ ํน์ ์์ด์ ํธ ๋๋ ์ธ๊ฐ ์ฐธ์ฌ์์๊ฒ credit ๊ท์
- ํ๊ฐ ํ๋ซํผ: ScienceArena์์ blind pairwise user voting๊ณผ Elo ranking ๊ธฐ๋ฐ์ real-time ranking ์์คํ
๊ตฌํ
- Case Study: STDE์ variance reduction(closed-loop experiment) ๋ฐ HLE challenge(human-AI collaboration) ์ฌ๋ก๋ฅผ ํตํด ์์คํ
์ ์ค์ง์ ํจ๊ณผ ์
์ฆ
- ํ๊ฐ ๊ฒ์ฆ: citation์ด ๋ฌธํ ๊ฒํ ํ์ง์ ๋ฏธ์น๋ ์ํฅ, novelty์ feasibility์ ๊ท ํ ์๋ ์์ด๋์ด ๋์ถ, paper review์์ ํ๋ณ๋ ฅ๊ณผ ๊ฐ๊ฒฐ์ฑ์ ์กฐํ ๋ฑ ํต์ฌ ์ค๊ณ ์๋ฆฌ์ ์ ํจ์ฑ ํ์ธ
How
Figure 2: The Multi-Agent Refinement Pipeline (left) and the Refined Data Structure (right).
- ๋ฌธํ ๊ฒํ : semantic guidance ๊ธฐ๋ฐ์ iterative exploration์ ํตํด multi-agent ์ํคํ
์ฒ๋ก ์ฐ๊ตฌ ์ ๊ฒฝ ํ์
๊ตฌํ
- ์ฐ๊ตฌ ์์ด๋์ด ๋์ถ: science of science ์๋ฆฌ๋ฅผ ํ์ฉํ์ฌ citation network ๋ด์์ ๊ฐ๋
์ ํ์ํ๊ณ refineํ์ฌ contextually groundedํ๊ณ methodologically rigorousํ ๊ฐ์ค ์์ฑ
- ์คํ ์๋ํ: iterative multi-agent loop๋ฅผ ํตํด ์คํ ์ ๋ต ์์ฑ, ํ๊ฐ, refinement๋ฅผ ์ํํ๋ฉฐ rigorous feedback mechanism์ผ๋ก self-optimization ์คํ
- ๊ณผํ ์ ์ : ๊ด๋ จ ์ฐ๊ตฌ ํฉ์ฑ, figure ์์ฑ, ํ์ ๊ท๋ฒ์ ๋ฐ๋ฅธ ํ
์คํธ refinement๋ฅผ ํตํฉํ์ฌ publication-ready manuscript ์์ฑ
- ๋
ผ๋ฌธ ๊ฒํ : prior work์์ in-depth comparison์ ํตํด objectiveํ๊ณ actionableํ ํผ๋๋ฐฑ ์ ๊ณต
- OSP ํ๋กํ ์ฝ: ์ค์ํ๋ hub๋ก ๋ค์ค ์ฐธ์ฌ์ engagement๋ฅผ ์กฐ์จํ๊ณ external users๋ฅผ internal participants๋ก ์ ํํ๋ฉฐ data provenance์์ contribution provenance๋ก ๋ฐ์
- ๊ธฐ์ฌ๋ ์ถ์ : granularํ provenance ๊ธฐ๋ก ์์คํ
์ผ๋ก ๋ชจ๋ ์์์ ์ถ์ฒ์ ๊ธฐ์ฌ์ ๋ช
์
- ScienceArena: blind pairwise user voting๊ณผ Elo-based real-time ranking์ผ๋ก ๊ฐ๊ด์ ์ด๊ณ ์ง์์ ์ธ ํ๊ฐ ์ํ
Originality
- ์ธ๊ฐ ๊ณผํ ์ธํ๋ผ์ ๋ช
์์ ์ธ์ฝ๋ฉ: ๊ธฐ์กด AI Scientist ์์คํ
๋ค์ด ๊ฐ๊ณผํ ์ธ์ฉ ๋คํธ์ํฌ, ํผ์ด ๋ฆฌ๋ทฐ, ํ๋ ฅ ๋ฉ์ปค๋์ฆ, ๊ธฐ์ฌ๋ ์ถ์ ๋ฑ ์ธ๊ฐ ๊ณผํ ์์คํ
์ ๊ทผ๋ณธ์ ๋ฉ์ปค๋์ฆ์ AI ์ํฌํ๋ก์ฐ์ ์ต์ด๋ก ๋ช
์์ ์ผ๋ก ํตํฉ
- ํ๋ ฅ ๊ณผํ ํ๋กํ ์ฝ(OSP) ์ ์: ์ธ๊ฐ ์ฐ๊ตฌ์์ AI ์์ด์ ํธ์ seamlessํ ํ๋ ฅ์ ๊ฐ๋ฅํ๊ฒ ํ๋ standardized collaboration backbone์ผ๋ก์ ๊ธฐ์กด ์ ๊ทผ๊ณผ ์ฐจ๋ณํ
- ๊ธฐ์ฌ๋ ์ถ์ ์์คํ
: ๊ณผํ์ ๋ฌด๊ฒฐ์ฑ์ ๋ณด์ฅํ๋ granularํ provenance ๊ธฐ๋ก ๋ฉ์ปค๋์ฆ์ผ๋ก credit attribution์ ํฌ๋ช
์ฑ๊ณผ ๊ณต์ ์ฑ ํ๋ณด
- ํ๊ฐ ์ํ๊ณ(ScienceArena) ๊ตฌ์ถ: blind pairwise user voting๊ณผ Elo ranking ๊ธฐ๋ฐ์ open evaluation platform์ผ๋ก ๊ณผํ ์ปค๋ฎค๋ํฐ์ ์ง์ ์ ์ธ ์ฐธ์ฌ์ ํฉ์ ํ์ฑ ๋ฉ์ปค๋์ฆ ๋์
- ๊ณต์งํ ์ํ๊ณ ๋น์ : AI ๊ณผํ์๋ฅผ task executor์์ human-AI collaboration์ด ๊ฐ๋ฅํ genuine scientist๋ก ์ ํํ๋ ํตํฉ์ ํ๋ ์์ํฌ ์ ์
Limitation & Further Study
- ๋ฐ์ดํฐ ๊ธฐ๋ฐ์ ํ๊ณ: ๋ฐฑ๋ง ๊ฐ ์์ค์ ๋
ผ๋ฌธ ๋ฐ์ดํฐ๋ ์ ์ฒด ๊ณผํ ๋ฌธํ์ ๊ทนํ ์ผ๋ถ์ด๋ฉฐ, coverage gap์ผ๋ก ์ธํด emerging field๋ non-English ๋ฌธํ์ ๋ํ ์ ํ๋ ์ ๊ทผ์ฑ
- LLM ๋ฅ๋ ฅ์ ์์กด์ฑ: ๋ชจ๋ ์ฃผ์ ๋ชจ๋์ด LLM์ ์ฑ๋ฅ์ ํฌ๊ฒ ์์กดํ๋ฏ๋ก, LLM์ hallucination, ํธํฅ์ฑ, ๊ณผํ ์ง์์ ์๊ฐ ๊ฒฝ๊ณผ์ ๋ฐ๋ฅธ outdating ๋ฌธ์ ๋ก ์ธํ ์ค๋ฅ ๊ฐ๋ฅ์ฑ
- Case study์ ์ ํ์ฑ: STDE variance reduction๊ณผ HLE challenge ๋ ๊ฐ์ง ์ฌ๋ก๋ง ์ ์๋์ด ๋ค์ํ ๊ณผํ ๋ถ์ผ์ ๋ํ general generalizability ํ์ธ ๋ถ์กฑ
- ํ๋ ฅ ๋ฉ์ปค๋์ฆ์ ์ค์ ํจ๊ณผ์ฑ: OSP๊ฐ ์ค์ ์ธ๊ฐ-AI ํ๋ ฅ์์ ์ผ๋ง๋ ํจ๊ณผ์ ์ธ์ง์ ๋ํ large-scale empirical validation ๋ถ์กฑ
- ํ๊ฐ ๋ฉํธ๋ฆญ์ ์ ๋ขฐ์ฑ: ScienceArena์ blind pairwise user voting์ด ๊ณผํ์ ์๋ฐ์ฑ์ ์ถฉ๋ถํ ๋ฐ์ํ๋์ง, evaluator์ ํธํฅ์ฑ์ด ๋ฐฐ์ ๋๋์ง์ ๋ํ ์์ธํ ๊ฒ์ฆ ๋ถ์ฌ
- ํ์ฅ์ฑ๊ณผ ๋น์ฉ: ๋๊ท๋ชจ ๋ฐ์ดํฐ ๊ธฐ๋ฐ ๊ตฌ์ถ, ๋ฉํฐ ์์ด์ ํธ ์ด์, human evaluator ๋ชจ์ง ๋ฑ์ผ๋ก ์ธํ ๋์ computational cost์ operation cost
- ํ์ ์ฐ๊ตฌ: ๋ ๋ค์ํ ๊ณผํ ๋ถ์ผ์์์ case study, fine-grained human-AI collaboration evaluation, contribution tracking system์ ๊ณต์ ์ฑ ๊ฒ์ฆ, ScienceArena ํ๊ฐ์ ์ฅ๊ธฐ์ ์ ๋ขฐ์ฑ ๋ถ์ ํ์
Evaluation
Novelty: 5/5 Technical Soundness: 4/5 Significance: 5/5 Clarity: 4/5 Overall: 4/5
์ดํ: OmniScientist๋ ๊ธฐ์กด AI Scientist ์์คํ
์ ๊ณ ๋ฆฝ์ฑ์ ๊ทน๋ณตํ๊ณ , ์ธ๊ฐ ๊ณผํ ์ธํ๋ผ์ ์ฌํ์ ยทํ๋ ฅ์ ๋ฉ์ปค๋์ฆ์ ๋ช
์์ ์ผ๋ก ์ธ์ฝ๋ฉํจ์ผ๋ก์จ AI ๊ณผํ์์ ์งํ์ ๋ํ ๊ทผ๋ณธ์ ์ธ ์๊ฐ ๋ณํ๋ฅผ ์ ์ํ๋ค. End-to-end ์๋ํ, ํ๋ ฅ ํ๋กํ ์ฝ, ํ๊ฐ ์ํ๊ณ์ ํตํฉ์ ๊ตฌํ์ ๋์ ์ผ์ฌ์ ๋ชฉํ์ด๋ฉฐ, ์ด๋ฅผ ํตํด ์ธ๊ฐ-AI ๊ณต์งํ ์ํ๊ณ ๊ตฌ์ถ์ ๊ฐ๋ฅ์ฑ์ ๋ณด์ฌ์ค๋ค. ๋ค๋ง ์ ํ๋ ์ฌ๋ก ๊ฒ์ฆ, LLM ์์กด์ฑ ๋ฌธ์ , ์ค์ ์ธ๊ฐ-AI ํ๋ ฅ์ large-scale validation ๋ถ์กฑ ๋ฑ์ด ๊ฐ์ ๊ณผ์ ์ด๋ค.
๊ฐ์ด ๋ณด๋ฉด ์ข์ ๋
ผ๋ฌธ
๊ธฐ๋ฐ ์ฐ๊ตฌ
Towards AI for science๋ ์ธ๊ฐ-๊ณผํ ์ธํ๋ผ์ AI์ ํตํฉ์ ํ๋ ฅ ๊ตฌ์กฐ์ ๋ํ ๊ฐ๋
์ ๋
ผ์๋ฅผ ์ ๊ณตํ์ฌ OmniScientist ๋ก๋๋งต์ ์ด๋ก ์ ๊ธฐ๋ฐ์ด ๋ฉ๋๋ค.
๋ค๋ฅธ ์ ๊ทผ
Exploring collaboration mechanisms for llm agents ๋
ผ๋ฌธ์ ์ฌํ ์๋ฎฌ๋ ์ด์
์์ LLM ๊ธฐ๋ฐ ์์ด์ ํธ ํ์
๊ตฌ์กฐ๋ฅผ ๋ค๋ฃจ์ด OmniScientist์ ์ธ๊ฐ-์์ด์ ํธ ์ํธ์์ฉ ์ค๊ณ์ ๋น๊ต๊ฐ ๊ฐ๋ฅํฉ๋๋ค.
๋ค๋ฅธ ์ ๊ทผ
The AI Scientist: Towards Fully Automated Open-Ended Scientific Discovery ๋
ผ๋ฌธ์ end-to-end ๊ณผํ ์๋ํ๋ผ๋ ์ ์ฌ ๋ชฉํ๋ฅผ ๊ฐ๊ณ OmniScientist์ ๋ค๋ฅธ ํ๋ ์์ํฌ๋ฅผ ์ ์ํฉ๋๋ค.
๋ค๋ฅธ ์ ๊ทผ
Sakana์ AI Scientist ํ๊ฐ ๋
ผ๋ฌธ์ ์๋ํ ์ฐ๊ตฌ์์คํ
์ ์ฑ๋ฅ ๊ฒ์ฆ ํต์ฐฐ์ ์ ๊ณตํ์ฌ, ์ธ๊ฐ-์ธ๊ณต์ง๋ฅ ํ์
ํ ํ๋ ์์ํฌ์ ์ฐจ๋ณ์ ์ ๋น๊ตํ ์ ์์ต๋๋ค.
๋ค๋ฅธ ์ ๊ทผ
OmniScientist ๋
ผ๋ฌธ์ ์ธ๊ฐ-AI ์ฌํ์ ์ํธ์์ฉ ๋ฐ ์ฅ๊ธฐ๊ฐ ์๋ฎฌ๋ ์ด์
์์ ์์ด์ ํธ ์ผ๊ด์ฑ๊ณผ ํ์ต์ ๋ชจ๋ธ๋งํ์ฌ Vending-Bench์ ์ฅ๊ธฐ ์์ด์ ํธ ์ผ๊ด์ฑ ๋ถ์๊ณผ ๊ด๋ จ ๊น๋ค.
๋ค๋ฅธ ์ ๊ทผ
3389๋ ์ธ๊ฐ-์์ด์ ํธ ๊ณต์งํ์ ํ๊ฐ ์ํ๊ณ๋ฅผ ๋
ผ์ํ๋ ์ฐจ์ธ๋ ๋ฒค์น๋งํน ์ ๊ทผ์ผ๋ก, 090์ ๋ฒค์น๋งํฌ์ ๋๋น๋๋ค.
ํ์ ์ฐ๊ตฌ
3389(OmniScientist)๋ ์ธ๊ฐ-์์ด์ ํธ ํ๋ ฅํ ์ํ๊ณ ๋ฐ ๋์ ๊ฒ์-์์ฑ ์์ด์ ํธ ์ค๊ณ๋ฅผ ๋ค๋ฃจ์ด, 295์ ๋ค์ค ์์ด์ ํธ ์กฐ์ ๊ตฌํ์ ํ์ฅํฉ๋๋ค.
ํ์ ์ฐ๊ตฌ
์ธ๊ฐ-AI ์ง์ ์ฐฝ์ถ์ ์ฅ๊ธฐ์ , ์ํ๊ณ ๊ด์ ์์ ํ๋ ฅ/๊ณต์งํ ๋ชจ๋ธ์ ์๋ํ ์ฐ๊ตฌ ํ๋ซํ๊ณผ ์ฐ๊ฒฐํ์ฌ ๊ตฌ์ฒดํํ๋ค.
ํ์ ์ฐ๊ตฌ
๊ณผํ ํ๊ตฌ ๋ถ์ผ์์ LLM ๊ธฐ๋ฐ AI Scientist ์์คํ
์ ๋ฐ์ ์ฒด๊ณ์ ์ผ๋ก ๊ฒํ ํ๊ณ , OmniScientist ํ๋ ์์ํฌ์ ์ ์ฌํ ์ฌ๋ก๋ฅผ ์ ๋ฆฌํฉ๋๋ค.
์์ฉ ์ฌ๋ก
Vending-Bench ๋
ผ๋ฌธ์ ์ฅ๊ธฐ ๊ณผ์ ์ํ์ ์ผ๊ด์ฑ ํ๊ฐ๋ฅผ ์ํ ํ๋ ์์ํฌ๋ฅผ ์ ์ํด, AI/์ธ๊ฐ ํ์
๊ธฐ๋ฐ ์ฐ๊ตฌ ์์คํ
์ ์คํํจ๊ณผ๋ฅผ ์ธก์ ํ๋๋ฐ ํ์ฉ๋ฉ๋๋ค.
๐ง Audio Overview
์ด ๋
ผ๋ฌธ ๋ฆฌ๋ทฐ๋ฅผ ํ์บ์คํธํ ์ค๋์ค๋ก ์์ฑํฉ๋๋ค. (Gemini ยท ํค๋ ๋ธ๋ผ์ฐ์ ์๋ง ์ ์ฅ ยท ์์ฑ๋ณธ์ ์ด๋ฉ์ผ๋ก๋ ์ ์ก)
โธ ๊ณ ๊ธ: ๊ตฌ์ฑ ๋ฐฉํฅ(๋๋ณธ ์์ฑ ์ง์นจ) ์ง์ ์์