์ ์: David P. Woodruff, Vincent Cohen-Addad, Lalit Jain, Jieming Mao, Song Zuo, MohammadHossein Bateni, Simina Branzei, Michael P. Brenner, Lin Chen, Ying Feng, Lance Fortnow, Gang Fu, Ziyi Guan, Zahra Hadizadeh, Mohammad T. Hajiaghayi, Mahdi JafariRaviz, Adel Javanmard, Karthik C. S, Ken-ichi Kawarabayashi, Ravi Kumar, Silvio Lattanzi, Euiwoong Lee, Yi Li, Ioannis Panageas, Dimitris Paparas, Benjamin Przybocki, Bernardo Subercaseaux, Ola Svensson, Shayan Taherijam, Xuan Wu, Eylon Yogev, Morteza Zadimoghaddam, Samson Zhou, Vahab Mirrokni | ๋ ์ง: 2026-02-03 | DOI: 10.48550/arXiv.2602.03837 📄 PDF
Essence
๋ณธ ๋
ผ๋ฌธ์ Google์ Gemini Deep Think ๋ฐ ๊ทธ ๊ณ ๋ํ ๋ชจํ๋ค์ ํ์ฉํ์ฌ ์ด๋ก ์ปดํจํฐ ๊ณผํ, ๊ฒฝ์ ํ, ์ต์ ํ, ๋ฌผ๋ฆฌํ ๋ฑ ๋ค์ํ ๋ถ์ผ์์ ๋ฏธํด๊ฒฐ ๋ฌธ์ ๋ฅผ ํด๊ฒฐํ๊ณ ์๋ก์ด ์ ๋ฆฌ๋ฅผ ์์ฑํ ์ค์ ์ฌ๋ก๋ค์ ์ ์ํ๋ค. ์ ์๋ค์ ์ธ๊ฐ-AI ํ๋ ฅ์ ์ผ๋ฐํ๋ ๊ธฐ๋ฒ๋ค์ ์ถ์ถํ์ฌ ๊ณผํ ์ฐ๊ตฌ ๊ฐ์ํ๋ฅผ ์ํ ์ฒด๊ณ์ ๋ฐฉ๋ฒ๋ก ์ ์ ์ํ๋ค.
Evaluation
์ดํ: ๋ณธ ๋
ผ๋ฌธ์ ์ต์ LLM์ด ๋จ์ ์๋ํ ๋๊ตฌ๋ฅผ ๋์ด ์ง์ ํ ๊ณผํ ์ฐ๊ตฌ ํํธ๋๋ก ๊ธฐ๋ฅํ ์ ์์์ ๊ด๋ฒ์ํ ์ค์ ์ฌ๋ก์ ๋ฉํ ๋ฐฉ๋ฒ๋ก ์ผ๋ก ์
์ฆํ๋ ์ค์ํ ๊ธฐ์ฌ์ด๋ค. ํนํ ์ ๊ฒฝ๊ธฐํธ ๋ฃจํ์ ์ ๋์ ๊ฒํ ํ๋ ์์ํฌ ๊ฐ์ ์๋ก์ด ํ์ฉ ๋ฐฉ์์ ์ฃผ๋ชฉํ ๋งํ๋ค. ๋ค๋ง ํ์ ๊ฒ์ฆ, ์คํจ ๋ถ์, ๊ทธ๋ฆฌ๊ณ ์ผ๋ฐํ ๊ฐ๋ฅ์ฑ ์ ์๊ฐ ๋ณด๊ฐ๋๋ค๋ฉด ๋์ฑ ๊ฐ๋ ฅํ ๊ฐ์ด๋๋ผ์ธ์ด
๊ฐ์ด ๋ณด๋ฉด ์ข์ ๋
ผ๋ฌธ
๊ธฐ๋ฐ ์ฐ๊ตฌ
Gemini ํจ๋ฐ๋ฆฌ ๋ชจ๋ธ์ ๊ธฐ์ ์ฑ๋ฅ์ ๋ถ์ํ ๋
ผ๋ฌธ์ด ์ค์ ๊ณผํ ํ๊ตฌ ์ฌ๋ก ์ ์ฉ์ ๊ทผ๊ฐ์ด ๋ฉ๋๋ค.
๊ธฐ๋ฐ ์ฐ๊ตฌ
044๋ฒ ๋
ผ๋ฌธ์ LLM ๊ธฐ๋ฐ ์๋ํ๊ฐ ๋ค์ํ ๊ณผํ ์ค๋ฌด์ ์ ์ฉ๋ ์ฌ๋ก์ฐ๊ตฌ๋ฅผ ๋ค๋ฃจ๋ฉฐ, 851๋ฒ ์์คํ
๊ฐ๋ฐ ๋๋ ํ๊ฐ ์ ๋ค์ํ ์ฐธ๊ณ ๊ฐ๋ฅ ์ฌ๋ก๋ฅผ ์ ์ํ๋ค.
๊ธฐ๋ฐ ์ฐ๊ตฌ
๊ณ ๊ธ LLM์ ๊ณผํ์ ์ถ๋ก ๋ฅ๋ ฅ์ ๊ธฐ๋ฐ์ด ๋๋ ๋ชจ๋ธ ์ฐ๊ตฌ์ด๋ค.
๋ค๋ฅธ ์ ๊ทผ
AI๋ฅผ ํ์ฉํ ์ํ ๋ฐ ๊ณผํ ๋ฌธ์ ํด๊ฒฐ์ ๋ค๋ฅธ ๋ฐฉ๋ฒ๋ก ์ผ๋ก ์ ๊ทผํ ์ฐ๊ตฌ์ด๋ค.
๋ค๋ฅธ ์ ๊ทผ
LLM์ ํ์ฉํ ๊ณผํ์ ๋ฐ๊ฒฌ ๋ฐ ๋ฌธ์ ํด๊ฒฐ์ ๋ค๋ฅธ ๋๋ฉ์ธ์์ ๋ค๋ฃฌ ์ฐ๊ตฌ์ด๋ค.
๋ค๋ฅธ ์ ๊ทผ
๋ ๋
ผ๋ฌธ ๋ชจ๋ AI๋ฅผ ํตํ ๊ณผํ์ ๋ฒ์น ๋ฐ๊ฒฌ์ ๋ค๋ฃจ๋, [012]๋ ๋ค์ํ ๋ฌผ๋ฆฌ์ ๋ฒ์น ๋ฐ๊ตด์ ์ํ ๋ค์ค ์์ด์ ํธ ํ๋ ์์ํฌ๋ฅผ ์ ์ํ์ฌ ์ ๊ทผ๋ฒ์ด ๋ค๋ฆ
๋๋ค.
๋ค๋ฅธ ์ ๊ทผ
Towards a client-centered assessment of llm therapists ๋
ผ๋ฌธ์ ์ธ๊ฐ-AI ํ์
์ ํน์์ฌ๋ก(์๋ด)์์ AI์ ์ธ๊ฐ์ ์ํธ์์ฉ ํ๊ฐ๋ผ๋ ๊ด์ ์์ Gemini์ ๋ฐฉ๋ฒ๋ก ์ ํ๋ ์์ํฌ ํ์ฉ ๋ฒ์๋ฅผ ๋ํ์ค๋ค.
๋ค๋ฅธ ์ ๊ทผ
์๋ฎฌ๋ ์ด์
์์ ์ค์ ํ๊ฒฝ์ผ๋ก์ ์ ์ฑ
์ ์ด ๋ฌธ์ ๋ฅผ ๋ค๋ฃจ๋ ๊ด๋ จ ์ฐ๊ตฌ์ด๋ค.
๋ค๋ฅธ ์ ๊ทผ
AI์ ์ธ๊ฐ ํ๋ ฅ์ ํตํ ๊ณผํ์ ๋ฌธ์ ํด๊ฒฐ์ ๋ค๋ฅธ ๋ฐฉ์์ผ๋ก ๊ตฌํํ ์ฐ๊ตฌ์ด๋ค.
๋ค๋ฅธ ์ ๊ทผ
LLM์ ๊ณผํ์ ์ง์ ๋ฐ๊ฒฌ ๋ฅ๋ ฅ์ ๋ถ์ํ๋ ์ ์ฌํ ๋ฐฉํฅ์ ์ฐ๊ตฌ์ด๋ค.
๋ค๋ฅธ ์ ๊ทผ
AI๋ฅผ ์ด์ฉํ ๋ฏธํด๊ฒฐ ๊ณผํ ๋ฌธ์ ์ ๊ทผ์ ๋ค๋ฅธ ๋ถ์ผ์์ ๋ค๋ฃจ๋ ์ฐ๊ตฌ์ด๋ค.
๋ค๋ฅธ ์ ๊ทผ
๋ ๋
ผ๋ฌธ ๋ชจ๋ ๊ณผํ ์ฐ๊ตฌ์ AI ์์ด์ ํธ๋ฅผ ์ ์ฉํ์ง๋ง, [822]๋ AI ์์ด์ ํธ์ ์ ๋ขฐ์ฑ์ ์ด์ ์ ๋ง์ถ๊ณ ์์ด ์ ๊ทผ๋ฐฉ์์ด ๋ค๋ฆ
๋๋ค.
๋ค๋ฅธ ์ ๊ทผ
๋ฉํฐ์์ด์ ํธ ํ๋ ์์ํฌ๋ฅผ ํ์ฉํ ๊ณผํ์ ๋ฌธ์ ํด๊ฒฐ์ ๊ด๋ จ ์ฐ๊ตฌ์ด๋ค.
๋ค๋ฅธ ์ ๊ทผ
AI๊ฐ ๊ณผํ์ ์ฐ๊ตฌ๋ฅผ ๊ฐ์ํํ๋ ๋ค์ํ ์ฌ๋ก์ ์ ๊ทผ๋ฒ์ ์๊ฐํ์ฌ ์์จ ์์ฌ ๊ฐ๋ฐ์ ์ ๋ฐ์ ์๋ํ์ ๋น๊ตํ ์ ์๋ค.
ํ์ ์ฐ๊ตฌ
The AI Scientist-v2 ๋
ผ๋ฌธ์ AI ์์ฒ๋ชจ๋ธ์ ํ์ฉํด ์๋ ๋
ผ๋ฌธ ์์ฑ ๋ฑ ์ค์ ๊ณผํ ๋ฐ๊ฒฌ์ ์คํํ ์ฌ๋ก ์ฐ๊ตฌ๋ก Gemini ๊ธฐ๋ฐ ๊ณผํ ๊ฐ์ํ ๋
ผ๋ฌธ๊ณผ ์ง์ ์ฐ๊ฒฐ๋ฉ๋๋ค.
ํ์ ์ฐ๊ตฌ
AI-Researcher ๋
ผ๋ฌธ์ LLM ๊ธฐ๋ฐ ์ ์ฒด ์ฐ๊ตฌ ์๋ํ ํ์ดํ๋ผ์ธ์ ์คํํ๊ณ , Gemini ๋
ผ๋ฌธ์ ์ค์ ์ ์ฉ ์ฌ๋ก์ ์ฒด๊ณ์ ๋ฐฉ๋ฒ๋ก ์ ์ค์ง์ ์์ฌ์ ์ ์ ๊ณตํ๋ค.
ํ์ ์ฐ๊ตฌ
Gemini ๋ชจ๋ธ์ ํ์ฉํ ๊ณผํ์ ์๋ฎฌ๋ ์ด์
์๋ํ ์ฌ๋ก๋ก, ์ค๋ ฅํ ํํ ๋ชจ๋ธ๋ง์ ๋ํ์ธ์ด๋ชจ๋ธ/AI์ ์ค์ง์ ์ ์ฉ ๊ฐ๋ฅ์ฑ์ ์ฟ๋ณผ ์ ์์ต๋๋ค.
์์ฉ ์ฌ๋ก
Accelerating Scientific Research with Gemini ๋
ผ๋ฌธ์ ์์ด์ ํธ ๊ธฐ๋ฐ ์ฐ๊ตฌ ์๋ํ์ ์ค์ ์ ์ฉ์ฌ๋ก ๋ฐ ํ๋ ์์ํฌ ์ถ์ถ์ ๋ํด ๋
ผํ๋ฏ๋ก, MLGym์ ํ๊ฐ ๋ฐฉ๋ฒ๋ก ๊ณผ ์ ๋ชฉ ๊ฐ๋ฅํ๋ค.
์์ฉ ์ฌ๋ก
Gemini ๊ธฐ๋ฐ ์ค์ ๊ณผํ ์ฐ๊ตฌ ์๋ํ ์ฌ๋ก๋ค์ ํตํด, PiFlow ์์คํ
์ด ์ค์ ๊ณผํ ๋ถ์ผ๋ก ํ์ฅ๋ ๋์ ์ ์ฉ ๊ฐ๋ฅ์ฑ๊ณผ ํ๊ณ์ ์ ๋
ผ์ํ ์ ์๋ค.