AAAR-1.0: Assessing AI's Potential to Assist Research

์ €์ž: Renze Lou et al. | ๋‚ ์งœ: 2025 | DOI: N/A


Essence

Figure 1

๊ทธ๋ฆผ 1: AAAR-1.0 ๋ฒค์น˜๋งˆํฌ์˜ 4๊ฐ€์ง€ ์ž‘์—…์— ๋Œ€ํ•œ ์ž…์ถœ๋ ฅ ์˜ˆ์‹œ

๋ณธ ๋…ผ๋ฌธ์€ ๋Œ€๊ทœ๋ชจ ์–ธ์–ด๋ชจ๋ธ(LLM)์ด ์—ฐ๊ตฌ ์ž‘์—…์„ ์–ผ๋งˆ๋‚˜ ํšจ๊ณผ์ ์œผ๋กœ ์ง€์›ํ•  ์ˆ˜ ์žˆ๋Š”์ง€ ํ‰๊ฐ€ํ•˜๊ธฐ ์œ„ํ•œ ๋ฒค์น˜๋งˆํฌ AAAR-1.0์„ ์ œ์‹œํ•œ๋‹ค. ๋ฐฉ์ •์‹ ์ถ”๋ก , ์‹คํ—˜ ์„ค๊ณ„, ๋…ผ๋ฌธ ์•ฝ์  ์‹๋ณ„, ๋ฆฌ๋ทฐ ๋น„ํŒ์˜ 4๊ฐ€์ง€ ์ „๋ฌธ๊ฐ€๊ธ‰ AI ์—ฐ๊ตฌ ์ž‘์—…์„ ํ†ตํ•ด LLM์˜ ์ง€์‹ ๊ธฐ๋ฐ˜๊ณผ ์ถ”๋ก  ๋Šฅ๋ ฅ์„ ์ข…ํ•ฉ์ ์œผ๋กœ ํ‰๊ฐ€ํ•œ๋‹ค.

Motivation

Achievement

Figure 2

๊ทธ๋ฆผ 2: ๋ฐ์ดํ„ฐ ๊ตฌ์ถ• ๊ณผ์ • ๊ฐœ์š”

  1. AAAR-1.0 ๋ฒค์น˜๋งˆํฌ ๊ตฌ์ถ•: 4๊ฐ€์ง€ ์ „๋ฌธ๊ฐ€๊ธ‰ ์—ฐ๊ตฌ ์ž‘์—…์œผ๋กœ ๊ตฌ์„ฑ๋œ ์ตœ์ดˆ์˜ ์—ฐ๊ตฌ ์ง€ํ–ฅ์  ๋ฒค์น˜๋งˆํฌ ๋ฐ์ดํ„ฐ์…‹ ๊ฐœ๋ฐœ
    • ๋ฐฉ์ •์‹ ์ถ”๋ก (EQINFER): 1,449๊ฐœ ๊ธ์ • ์‚ฌ๋ก€, 4,347๊ฐœ ๋ถ€์ • ์‚ฌ๋ก€
    • ์‹คํ—˜ ์„ค๊ณ„(EXPDESIGN): ๋„๋ฉ”์ธ ์ „๋ฌธ๊ฐ€๊ฐ€ ๊ฒ€์ฆํ•œ ๊ณ ํ’ˆ์งˆ ๋ฐ์ดํ„ฐ
    • ๋…ผ๋ฌธ ์•ฝ์ (PAPERWEAKNESS): ๋‹ค์–‘ํ•œ ๋…ผ๋ฌธ์—์„œ ์ถ”์ถœํ•œ ์•ฝ์  ์‚ฌ๋ก€๋“ค
    • ๋ฆฌ๋ทฐ ๋น„ํŒ(REVIEWCRITIQUE): ์‹ ๋ขฐ์„ฑ ์žˆ๋Š” ๋ฆฌ๋ทฐ ํ‰๊ฐ€ ์‚ฌ๋ก€
  2. LLM ์„ฑ๋Šฅ ํ‰๊ฐ€ ๊ฒฐ๊ณผ:
    • ๋ฌด์ž‘์œ„ ์ถ”์ธก(40% F1) ๋Œ€๋น„ ์ฃผ์š” ๋ชจ๋ธ๋“ค์ด EQINFER์—์„œ ์•ฝ 46% ์ •๋„๋กœ ๊ฑฐ์˜ ์ฐจ์ด ์—†์Œ
    • LLM์ด ์„ค๊ณ„ํ•œ ์‹คํ—˜์ด ์ธ๊ฐ„์˜ ์‹คํ—˜๋ณด๋‹ค ํ˜์‹ ์ ์ด๊ณ  ๋‹ค์–‘ํ•˜์ง€๋งŒ, ๋งŽ์€ ๊ฒฝ์šฐ ์‹คํ–‰ ๋ถˆ๊ฐ€๋Šฅํ•˜๊ณ  ์›๋ž˜ ์—ฐ๊ตฌ ๋ชฉํ‘œ์™€ ๋ฒ—์–ด๋‚จ
    • LLM์ด ์‹๋ณ„ํ•œ ์•ฝ์ ๋“ค์ด ๋„ˆ๋ฌด ๋ชจํ˜ธํ•˜๊ณ  ์ผ๋ฐ˜์ ์ด์–ด์„œ ๊ตฌ์ฒด์  ํ”ผ๋“œ๋ฐฑ์œผ๋กœ ๋ถ€์กฑํ•จ
    • ๊ฒฐํ•จ ์žˆ๋Š” ๋ฆฌ๋ทฐ๋ฅผ ํšจ๊ณผ์ ์œผ๋กœ ์‹๋ณ„ํ•˜์ง€ ๋ชปํ•ด ๋ฉ”ํƒ€๋ฆฌ๋ทฐ์–ด ์ง€์› ๊ฐ€์น˜ ์ œํ•œ์ 

How

Figure 5

๊ทธ๋ฆผ 5: EXPDESIGN ์ž‘์—…์—์„œ ๋‹ค์–‘ํ•œ LLM์˜ ๋ฌธ๋งฅ ๊ธธ์ด ์Šค์ผ€์ผ๋ง ์ถ”์ด

Originality

Limitation & Further Study

Evaluation

์ดํ‰: ๋ณธ ๋…ผ๋ฌธ์€ AI๊ฐ€ ์ „๋ฌธ์  ์—ฐ๊ตฌ ํ™œ๋™์„ ์–ผ๋งˆ๋‚˜ ํšจ๊ณผ์ ์œผ๋กœ ์ง€์›ํ•  ์ˆ˜ ์žˆ๋Š”์ง€ ์ฒด๊ณ„์ ์œผ๋กœ ํ‰๊ฐ€ํ•˜๊ธฐ ์œ„ํ•œ ๊ณ ํ’ˆ์งˆ ๋ฒค์น˜๋งˆํฌ๋ฅผ ์ œ์‹œํ–ˆ์œผ๋ฉฐ, ํ˜„์žฌ LLM์˜ ๋ช…ํ™•ํ•œ ํ•œ๊ณ„๋ฅผ ๋“œ๋Ÿฌ๋ƒ„์œผ๋กœ์จ ํ•™๊ณ„์— ์˜๋ฏธ ์žˆ๋Š” ๊ธฐ์—ฌ๋ฅผ ํ•œ๋‹ค. ๋‹ค๋งŒ ํŠน์ • ๋ถ„์•ผ ํŽธ์ค‘ ๊ทน๋ณต๊ณผ ์‹ค์ œ ๊ฐœ์„  ๋ฐฉ์•ˆ ์ œ์‹œ๋ฅผ ํ†ตํ•ด ๋”์šฑ ์™„์„ฑ๋„ ๋†’์€ ์—ฐ๊ตฌ๋กœ ๋ฐœ์ „ํ•  ์—ฌ์ง€๊ฐ€ ์žˆ๋‹ค.

๊ฐ™์ด ๋ณด๋ฉด ์ข‹์€ ๋…ผ๋ฌธ

๊ธฐ๋ฐ˜ ์—ฐ๊ตฌ
838์˜ LLM ์‚ฌํšŒ์  ํ•™์Šต ์„ค๊ณ„๋Š” 041์—์„œ ํƒ๊ตฌํ•˜๋Š” ์—ฐ๊ตฌ ๋ณด์กฐ AI์˜ ์ž ์žฌ์„ฑ๊ณผ ํ•œ๊ณ„์— ๋Œ€ํ•œ ์ •์„ฑ์  ๋…ผ์˜์— ๋ฐ”ํƒ•์„ ๋‘ก๋‹ˆ๋‹ค.
๊ธฐ๋ฐ˜ ์—ฐ๊ตฌ
834 ๋…ผ๋ฌธ์˜ ํ†ตํ•ฉํ˜• ๊ณผํ•™ AI ์‹œ์Šคํ…œ ๊ฐœ๋ฐœ ๊ณผ์ œ๋Š” AAAR-1.0์ด ์‹คํ—˜ํ•œ ์‹ค์งˆ์  ์—ฐ๊ตฌ ์ž‘์—… ์ง€์› ํ•œ๊ณ„ ๋ถ„์„์— ์ด๋ก ์  ๊ทผ๊ฑฐ์™€ ๋ฌธ์ œ์˜์‹์ด ๋‹ด๊ฒจ์žˆ์Šต๋‹ˆ๋‹ค.
๊ธฐ๋ฐ˜ ์—ฐ๊ตฌ
๋ฐ์ดํ„ฐ ๊ธฐ๋ฐ˜ ๊ณผํ•™์  ๋ฐœ๊ฒฌ์„ ์œ„ํ•œ LLM ํ™œ์šฉ์˜ ์ด๋ก ์ ยท๋ฐฉ๋ฒ•๋ก ์  ๊ธฐ๋ฐ˜์„ ์ œ๊ณตํ•œ๋‹ค.
๊ธฐ๋ฐ˜ ์—ฐ๊ตฌ
041์€ AI์˜ ํ•™์ˆ  ์—ฐ๊ตฌ ์ง€์› ๋Šฅ๋ ฅ์„ ์ฒด๊ณ„์ ์œผ๋กœ ํ‰๊ฐ€ํ•˜์—ฌ, 664์˜ ์ž๋™ ํ‰๊ฐ€ ๋ฒค์น˜๋งˆํ‚น ์—ฐ๊ตฌ์˜ ์ด๋ก ์  ๋ฐฐ๊ฒฝ์„ ์ œ๊ณตํ•ฉ๋‹ˆ๋‹ค.
๊ธฐ๋ฐ˜ ์—ฐ๊ตฌ
088๋ฒˆ ๋…ผ๋ฌธ์€ ๊ณผํ•™์—ฐ๊ตฌ ์ง€์› AI์˜ ์ „์ฒด ํ˜„ํ™ฉ์„ ์ •๋ฆฌํ•˜์—ฌ, 041๋ฒˆ์—์„œ ๋ฒค์น˜๋งˆํฌ๋กœ ํ‰๊ฐ€ํ•˜๋Š” ๋‹ค์–‘ํ•œ ๊ณผํ•™ ์ž‘์—… AI ์ง€์› ๊ฐ€๋Šฅ์„ฑ์˜ ์ด๋ก ์  ์ถœ๋ฐœ์ ์ด ๋ฉ๋‹ˆ๋‹ค.
๊ธฐ๋ฐ˜ ์—ฐ๊ตฌ
041๋Š” ์—ฐ๊ตฌ ์ง€์› AI์˜ ์ž ์žฌ๋ ฅ ํ‰๊ฐ€๋ฅผ ๋…ผ์˜ํ•˜๋ฉฐ, CoPaLink ๊ฐ™์€ ๋„๊ตฌ๊ฐ€ ํ•™์ˆ  ํ”„๋กœ์„ธ์Šค์— ๋ฏธ์น˜๋Š” ์˜ํ–ฅ ์ดํ•ด์— ๋„์›€์„ ์ค๋‹ˆ๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
LLM์˜ ์ „๋ฌธ ์ง€์‹ ๋ฐ ์ถ”๋ก  ๋Šฅ๋ ฅ์„ ๋‹ค๋ฅธ ๋ฐฉ์‹์œผ๋กœ ๋ฒค์น˜๋งˆํ‚นํ•˜๋Š” ์—ฐ๊ตฌ์ด๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
LLM์˜ ์—ฐ๊ตฌ ๋ณด์กฐ ๋Šฅ๋ ฅ์„ ํ‰๊ฐ€ํ•˜๋Š” ๋‹ค๋ฅธ ๋ฒค์น˜๋งˆํฌ๋‚˜ ๋ฐฉ๋ฒ•๋ก ์„ ์ œ์‹œํ•˜๋Š” ์—ฐ๊ตฌ์ด๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
AI ๊ธฐ๋ฐ˜ ์—ฐ๊ตฌ์ง€์› ๋ฐ ๊ณต์ •์„ฑ, ํˆฌ๋ช…์„ฑ์˜ ์ž ์žฌ์  ๋ฆฌ์Šคํฌ๋ฅผ ์ ๊ฒ€ํ•˜๋Š” ์‹œ๊ฐ์œผ๋กœ 870๋ฒˆ ๋…ผ๋ฌธ์˜ ๋…ผ์˜๋ฅผ ํ™•์žฅํ•  ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
Reviewer2 ๋…ผ๋ฌธ์€ LLM ๊ธฐ๋ฐ˜ ์ž๋™ ๋ฆฌ๋ทฐ ์ƒ์„ฑ ํ’ˆ์งˆ ๊ฐœ์„ ์„ ๋‹ค๋ฃจ๋ฉฐ, AAAR-1.0์˜ LLM ์—ฐ๊ตฌ์ง€์› ์ „๋ฌธ๊ฐ€ ์ž‘์—… ํ‰๊ฐ€์™€ ๋ณ‘๋ ฌ์  ๋ฌธ์ œ์˜์‹์ด ์žˆ๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
AI์˜ ๊ณผํ•™์  ์ถ”๋ก  ๋ฐ ์—ฐ๊ตฌ ์ง€์› ๋Šฅ๋ ฅ์„ ๋‹ค๋ฅธ ์ธก๋ฉด์—์„œ ํ‰๊ฐ€ํ•˜๋Š” ์—ฐ๊ตฌ์ด๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
AI ์‹œ์Šคํ…œ์˜ ์—ฐ๊ตฌ ์—ญ๋Ÿ‰ ํ‰๊ฐ€๋ฅผ ์œ„ํ•œ ๋‹ค๋ฅธ ๊ธฐ์ค€์ด๋‚˜ ๋ฐฉ๋ฒ•๋ก ์„ ์ œ์‹œํ•˜๋Š” ์—ฐ๊ตฌ์ด๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
AAAR-1.0 ๋…ผ๋ฌธ์€ LLM์˜ ์—ฐ๊ตฌ ์ž‘์—… ์ง€์› ๋Šฅ๋ ฅ(์ „๋ฌธ์  ์ž‘์—… ํฌํ•จ) ํ‰๊ฐ€์— ์ดˆ์ ์„ ๋‘์–ด, DRE-Bench ๋ฒค์น˜๋งˆํฌ์˜ ์ธ์ง€์  ์œ ๋™์ง€๋Šฅ ํ‰๊ฐ€์™€ ๋‹ค๋ฅธ ๊ด€์ ์„ ์ œ๊ณตํ•œ๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
AI๊ฐ€ ๊ณผํ•™ ์—ฐ๊ตฌ ์ง€์›์—์„œ ํ‰๊ฐ€, ์‹ ๋ขฐ, ์–ด์‹œ์Šคํ„ดํŠธ ์—ญํ• ์„ ์ข…ํ•ฉ์ ์œผ๋กœ ์ ๊ฒ€ํ•˜๋Š” ๋ฐฉ๋ฒ•๋ก  ๋…ผ๋ฌธ์ž…๋‹ˆ๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
041์€ AI๊ฐ€ ๊ณผํ•™ ์—ฐ๊ตฌ ๋ณด์กฐ์—์„œ ์–ด๋–ค ์ž ์žฌ๋ ฅ์„ ๋ณด์ด๋Š”์ง€๋ฅผ ํ‰๊ฐ€ํ•˜๋ฉฐ, 724์˜ AI-for-Science ์ค€๋น„๋„ ๋ฒค์น˜๋งˆํ‚น ํ”„๋ ˆ์ž„์›Œํฌ์™€ ์œ ์‚ฌ ๋ชฉ์ ์ด์ง€๋งŒ ์ ‘๊ทผ ๋ฐฉ์‹์ด ๋‹ค๋ฆ…๋‹ˆ๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
LLM ์—์ด์ „ํŠธ ๊ธฐ๋ฐ˜ ์ž์œจ ๊ณผํ•™ ์—ฐ๊ตฌ ์‹œ์Šคํ…œ์œผ๋กœ AgentRxiv์™€ ์œ ์‚ฌํ•œ ๋ชฉํ‘œ๋ฅผ ์ถ”๊ตฌํ•œ๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
AI๊ฐ€ ์‹ค์ œ ์—ฐ๊ตฌ ํ˜„์žฅ ๋ฐ ์—…๋ฌด ์ง€์›์— ์–ด๋А์ •๋„ ๊ธฐ์—ฌํ•  ์ˆ˜ ์žˆ๋Š”์ง€ ๋‹ค์–‘ํ•œ ์ผ€์ด์Šค๋ฅผ ๋น„๊ต ๊ฒ€ํ† ํ•  ์ˆ˜ ์žˆ๋‹ค.
ํ›„์† ์—ฐ๊ตฌ
Augmented Language Models: a Survey๋Š” AAAR-1.0 ๋ฒค์น˜๋งˆํฌ๊ฐ€ ํ‰๊ฐ€ํ•˜๋Š” ๋‹ค์–‘ํ•œ AI ๋ณด์กฐ ์—ฐ๊ตฌ ์ž‘์—…๊ณผ ์ฆ๊ฐ• ๋ชจ๋ธ์˜ ์ด๋ก ์  ๊ธฐ๋ฐ˜์„ ์ œ๊ณตํ•ฉ๋‹ˆ๋‹ค.
ํ›„์† ์—ฐ๊ตฌ
GPT-4์˜ ํ”ผ์–ด๋ฆฌ๋ทฐ ๋ณด์กฐ ๋Šฅ๋ ฅ์„ ํŠน์ • ํ•™์ˆ  ๋งฅ๋ฝ์— ํ™•์žฅ ์ ์šฉํ•œ ์—ฐ๊ตฌ์ด๋‹ค.
ํ›„์† ์—ฐ๊ตฌ
041๋ฒˆ ๋…ผ๋ฌธ์€ AI๊ฐ€ ์—ฐ๊ตฌ๋ณด์กฐ์ž๋กœ์„œ ์‹ค์ œ๋กœ ํˆฌ๋ช…์„ฑ๊ณผ ์‹ ๋ขฐ์„ฑ ๋ณด์žฅ์„ ์–ด๋–ป๊ฒŒ ํ•  ์ˆ˜ ์žˆ๋Š”์ง€ ์‚ฌ๋ก€์™€ ํ‰๊ฐ€ ๋ถ„์„์„ ์ œ๊ณตํ•˜์—ฌ, 895๋ฒˆ์˜ 'ํ†ต์ œ์™€ ์‹ ๋ขฐ' ์ด์Šˆ ๋…ผ์˜์— ์‹ค์ฆ์  ๊ทผ๊ฑฐ๋ฅผ ์ œ๊ณตํ•œ๋‹ค.
ํ›„์† ์—ฐ๊ตฌ
Can large language models provide useful feedback on research ๋…ผ๋ฌธ์€ ์‹ค์ œ LLM์˜ ๋ฆฌ๋ทฐ ๋น„ํŒ ๋ฐ ํ”ผ๋“œ๋ฐฑ ๋Šฅ๋ ฅ์— ๊ด€ํ•œ ํ‰๊ฐ€๋กœ, AAAR-1.0 ๋ฒค์น˜๋งˆํฌ์˜ ์‹ค์ œ ํ‰๊ฐ€ ํ•ญ๋ชฉ์„ ํ™•์žฅํ•œ๋‹ค.
ํ›„์† ์—ฐ๊ตฌ
TrustLLM์˜ ์‹ ๋ขฐ์„ฑ ํ‰๊ฐ€๋Š” AAAR-1.0์˜ AI ์—ฐ๊ตฌ ์ง€์› ํ‰๊ฐ€์™€ ์ƒํ˜ธ ๋ณด์™„์ ์œผ๋กœ AI์˜ ์‹ค์งˆ์  ํ™œ์šฉ ๋Šฅ๋ ฅ์„ ์ด๊ด„ ํ‰๊ฐ€ํ•ฉ๋‹ˆ๋‹ค.
ํ›„์† ์—ฐ๊ตฌ
083๋ฒˆ ๋…ผ๋ฌธ์€ LLM ๊ธฐ๋ฐ˜ ํ™•์žฅํ˜• ๋ฆฌ๋ทฐ ์‹œ์Šคํ…œ์˜ ๋Œ€๊ทœ๋ชจ ํ‰๊ฐ€๋ฅผ ํ†ตํ•ด, 041๋ฒˆ์— ๋“ฑ์žฅํ•˜๋Š” ๋ฆฌ๋ทฐ ์ƒ์„ฑ ๋ฐ ํฌ๋ฆฌํ‹ฑ ๋Šฅ๋ ฅ ํ‰๊ฐ€ ํ•ญ๋ชฉ๊ณผ ์‹คํ—˜์ ์œผ๋กœ ์—ฐ๊ฒฐํ•  ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค.
ํ›„์† ์—ฐ๊ตฌ
LLM์˜ ์ „๋ฌธ๊ฐ€ ์ˆ˜์ค€ ์—ฐ๊ตฌ ์ž‘์—… ์ˆ˜ํ–‰ ๋Šฅ๋ ฅ์„ ํŠน์ • ๋„๋ฉ”์ธ์—์„œ ํ™•์žฅ ํ‰๊ฐ€ํ•œ ์—ฐ๊ตฌ์ด๋‹ค.
์‘์šฉ ์‚ฌ๋ก€
AAAR-1.0 ๋ฒค์น˜๋งˆํฌ๋Š” ์ •๋ณด ๊ฒ€์ƒ‰ ๊ธฐ๋ฐ˜ ์–ธ์–ด๋ชจ๋ธ๋“ค์ด ์‹ค์ œ ๊ณผํ•™ ์ž‘์—…์— ์–ด๋–ป๊ฒŒ ์ ์šฉ๋  ์ˆ˜ ์žˆ๋Š”์ง€ ํ‰๊ฐ€ํ•ฉ๋‹ˆ๋‹ค.
์‘์šฉ ์‚ฌ๋ก€
AAAR-1.0์€ ๋‹ค์–‘ํ•œ LLM์ด ์—ฐ๊ตฌ ์ง€์›์— ๋ฏธ์น˜๋Š” ์‹ค์งˆ์  ์˜ํ–ฅ ํ‰๊ฐ€์— StarCoder2 ๊ฐ™์€ ์ฝ”๋“œ ๋ชจ๋ธ์ด ํฌํ•จ๋  ์ˆ˜ ์žˆ์Œ์„ ์‹œ์‚ฌํ•ฉ๋‹ˆ๋‹ค.
์‘์šฉ ์‚ฌ๋ก€
Lazyreview ๋ฐ์ดํ„ฐ์…‹์€ AAAR-1.0 ๋ฒค์น˜๋งˆํฌ์—์„œ ๋ฆฌ๋ทฐ ํ’ˆ์งˆ ํ‰๊ฐ€์™€ LLM ๋ณด์กฐ ์—ฐ๊ตฌ ์ž‘์—…์˜ ์‹ค์ œ ์ ์šฉ ์—ฐ๊ตฌ์— ํ™œ์šฉํ•  ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค.
์‘์šฉ ์‚ฌ๋ก€
041๋ฒˆ ๋…ผ๋ฌธ์€ AI๊ฐ€ ๊ณผํ•™์—ฐ๊ตฌ ์ƒ์‚ฐ์„ฑ์„ ์‹ค์งˆ์ ์œผ๋กœ ์ฆ์ง„ํ•  ์ˆ˜ ์žˆ๋Š” ์ž ์žฌ๋ ฅ๊ณผ ์‹ค์ œ ์‚ฌ์šฉ ์˜ˆ์‹œ๋ฅผ ์ œ๊ณตํ•ด, 233๋ฒˆ์˜ ์ธ๊ฐ„-AI ๊ณต์ง„ํ™” ํ”„๋ ˆ์ž„์— ๊ตฌ์ฒด์  ์ ์šฉ ์˜ˆ๋ฅผ ๋ณด์—ฌ์ค€๋‹ค.
์‘์šฉ ์‚ฌ๋ก€
AAAR-1.0 ๋…ผ๋ฌธ์€ AI๊ฐ€ ๊ณผํ•™ ์—ฐ๊ตฌ ์ง€์›์— ์–ด๋–ป๊ฒŒ ํ™œ์šฉ๋  ์ˆ˜ ์žˆ๋Š”์ง€ ์‹ค์ œ ์ ์šฉ ์‚ฌ๋ก€๋ฅผ ๋‹ค๋ฃจ๋ฏ€๋กœ, MedAgentGym์˜ agentic ํ”Œ๋žซํผ ํ™œ์šฉ ํ™•์žฅ ๋…ผ์˜์— ๋„์›€์ด ๋œ๋‹ค.
์‘์šฉ ์‚ฌ๋ก€
AAAR-1.0์€ AI์˜ ์—ฐ๊ตฌ ์–ด์‹œ์Šคํ„ดํŠธ๋กœ์„œ์˜ ๊ฐ€๋Šฅ์„ฑ ํ‰๊ฐ€๋ฅผ ๋‹ค๋ฃจ์–ด, The AI Scientist์˜ ์—”๋“œ-ํˆฌ-์—”๋“œ ๊ณผํ•™ ์ž๋™ํ™” ์ ์šฉ์˜ ํ‰๊ฐ€ ์ง€์ ์ด ๋œ๋‹ค.
← ๋ชฉ๋ก์œผ๋กœ ๋Œ์•„๊ฐ€๊ธฐ

๐ŸŽง Audio Overview

์ด ๋…ผ๋ฌธ ๋ฆฌ๋ทฐ๋ฅผ ํŒŸ์บ์ŠคํŠธํ˜• ์˜ค๋””์˜ค๋กœ ์ƒ์„ฑํ•ฉ๋‹ˆ๋‹ค. (Gemini ยท ํ‚ค๋Š” ๋ธŒ๋ผ์šฐ์ €์—๋งŒ ์ €์žฅ ยท ์™„์„ฑ๋ณธ์€ ์ด๋ฉ”์ผ๋กœ๋„ ์ „์†ก)
โ–ธ ๊ณ ๊ธ‰: ๊ตฌ์„ฑ ๋ฐฉํ–ฅ(๋Œ€๋ณธ ์ž‘์„ฑ ์ง€์นจ) ์ง์ ‘ ์ˆ˜์ •