Predicting empirical ai research outcomes with language models

์ €์ž: Jiaxin Wen, Chenglei Si, Chen Yueh-Han, He He, Shi Feng | ๋‚ ์งœ: 2025 | DOI: N/A 📄 PDF


Essence

Figure 1

์ธ๊ฐ„ NLP ์ „๋ฌธ๊ฐ€ ๋Œ€๋น„ ์‹œ์Šคํ…œ์˜ ์˜ˆ์ธก ์ •ํ™•๋„ ๋น„๊ต

๋ณธ ๋…ผ๋ฌธ์€ AI ์—ฐ๊ตฌ ์•„์ด๋””์–ด์˜ ์‹คํ—˜ ์„ฑ๊ณต ๊ฐ€๋Šฅ์„ฑ์„ ์‚ฌ์ „์— ์˜ˆ์ธกํ•˜๋Š” ์ตœ์ดˆ์˜ ๋ฒค์น˜๋งˆํฌ์™€ ์–ธ์–ด ๋ชจ๋ธ ๊ธฐ๋ฐ˜ ์‹œ์Šคํ…œ์„ ์ œ์‹œํ•œ๋‹ค. ๋‘ ๊ฐœ์˜ ๊ฒฝ์Ÿํ•˜๋Š” ์—ฐ๊ตฌ ์•„์ด๋””์–ด ์ค‘ ์–ด๋А ๊ฒƒ์ด ๋ฒค์น˜๋งˆํฌ์—์„œ ๋” ์ข‹์€ ์„ฑ๋Šฅ์„ ๋ณด์ผ์ง€ ์˜ˆ์ธกํ•˜๋Š” ๊ณผ์ œ์—์„œ, ๋ฏธ์„ธ์กฐ์ •๋œ GPT-4.1๊ณผ ๊ฒ€์ƒ‰ ์—์ด์ „ํŠธ๋ฅผ ๊ฒฐํ•ฉํ•œ ์‹œ์Šคํ…œ์ด ์ธ๊ฐ„ ์ „๋ฌธ๊ฐ€๋ฅผ ํฐ ํญ์œผ๋กœ ๋Šฅ๊ฐ€ํ•จ์„ ๋ณด์—ฌ์ค€๋‹ค.

Motivation

Achievement

Figure 2

๋‘ ๊ฐœ์˜ jailbreaking ๋ฐฉ๋ฒ•์„ ์—ฌ๋Ÿฌ ๋ฒค์น˜๋งˆํฌ์—์„œ ๋น„๊ตํ•˜๋Š” ์˜ˆ์‹œ

  1. ๋ฒค์น˜๋งˆํฌ ๊ตฌ์ถ•: 1,585๊ฐœ์˜ ์ธ๊ฐ„ ๊ฒ€์ฆ๋œ ํ…Œ์ŠคํŠธ ์˜ˆ์‹œ(๋ชจ๋ธ ํ•™์Šต ํ›„ ๋ฐœํ‘œ๋œ ์•„์ด๋””์–ด ํฌํ•จ)์™€ 6,000๊ฐœ์˜ ํ›ˆ๋ จ ์˜ˆ์‹œ๋กœ ๊ตฌ์„ฑ๋œ ์ตœ์ดˆ์˜ ์‹ค์ฆ์  AI ์—ฐ๊ตฌ ์„ฑ๊ณผ ์˜ˆ์ธก ๋ฒค์น˜๋งˆํฌ ์ƒ์„ฑ
  2. ์ธ๊ฐ„ ์ „๋ฌธ๊ฐ€ ๋Šฅ๊ฐ€: NLP ๋„๋ฉ”์ธ์˜ 45๊ฐœ ์•„์ด๋””์–ด ์Œ์—์„œ ์‹œ์Šคํ…œ์ด 64.4% ์ •ํ™•๋„๋ฅผ ๋‹ฌ์„ฑํ•˜์—ฌ ์ธ๊ฐ„ ์ „๋ฌธ๊ฐ€ ์•™์ƒ๋ธ”(48.9%)์„ ํฐ ํญ์œผ๋กœ ๋Šฅ๊ฐ€
  3. ๋†’์€ ์ผ๋ฐ˜ํ™” ์„ฑ๋Šฅ: ์ „์ฒด ํ…Œ์ŠคํŠธ ์…‹์—์„œ 77% ์ •ํ™•๋„ ๋‹ฌ์„ฑ, ๋ฏธ๋ฐœํ‘œ ์‹ ๊ทœ ์—ฐ๊ตฌ ์•„์ด๋””์–ด 35๊ฐœ์—์„œ 63.6% ์ •ํ™•๋„๋กœ ๋ณด์œ  ๊ฐ€๋Šฅ์„ฑ ์ž…์ฆ
  4. ๊ฐ•๊ฑด์„ฑ ๊ฒ€์ฆ: ์•„์ด๋””์–ด ๋ณต์žก๋„, ์ตœ์‹ ์„ฑ ๋“ฑ ํ‘œ๋ฉด์  ํŠน์ง•์— ๋Œ€ํ•œ ์ŠคํŠธ๋ ˆ์Šค ํ…Œ์ŠคํŠธ์™€ LM์ด ์„ค๊ณ„ํ•œ ์ˆ˜๋ฐฑ ๊ฐœ์˜ ๊ฒฌ๊ณ ์„ฑ ํ…Œ์ŠคํŠธ๋ฅผ ํ†ต๊ณผ

How

Figure 3

์ž๋™ ํ‰๊ฐ€ ๊ฒฐ๊ณผ

๋ฒค์น˜๋งˆํฌ ๊ตฌ์„ฑ ํŒŒ์ดํ”„๋ผ์ธ:

๊ฒ€์ƒ‰ ๊ฐ•ํ™” ์‹œ์Šคํ…œ:

๋ฏธ์„ธ์กฐ์ • ๋ฐ ํ‰๊ฐ€:

Originality

Limitation & Further Study

Evaluation

์ดํ‰: ๋ณธ ๋…ผ๋ฌธ์€ ์‹ค์ฆ์  AI ์—ฐ๊ตฌ ์„ฑ๊ณผ ์˜ˆ์ธก์ด๋ผ๋Š” ์ค‘์š”ํ•˜๋ฉด์„œ๋„ ๋ฏธ๊ฐœ์ฒ™๋œ ๋ฌธ์ œ์— ๋Œ€ํ•ด ์—„๊ฒฉํ•œ ๋ฒค์น˜๋งˆํฌ ๊ตฌ์ถ•๊ณผ ๊ฐ•๋ ฅํ•œ ์‹œ์Šคํ…œ ๊ฐœ๋ฐœ์„ ์ œ์‹œํ•œ ์šฐ์ˆ˜ํ•œ ์—ฐ๊ตฌ์ด๋‹ค. ํŠนํžˆ ์ธ๊ฐ„ ์ „๋ฌธ๊ฐ€๋ฅผ ๋Šฅ๊ฐ€ํ•˜๋Š” ์„ฑ๋Šฅ๊ณผ ๋ฏธ๋ฐœํ‘œ ์•„์ด๋””์–ด์— ๋Œ€ํ•œ ์ผ๋ฐ˜ํ™” ๊ฐ€๋Šฅ์„ฑ์€ ์ฃผ๋ชฉํ•  ๋งŒํ•˜๋‚˜, ๋„๋ฉ”์ธ ๊ฐ„ ์„ฑ๋Šฅ ๊ฒฉ์ฐจ ๋ถ„์„๊ณผ ์™œ ์ตœ์‹  ๋Œ€ํ˜• ์–ธ์–ด ๋ชจ๋ธ๋“ค์ด ์ด ๊ณผ์ œ์—์„œ ์‹คํŒจํ•˜๋Š”์ง€์— ๋Œ€ํ•œ ์‹ฌ์ธต์  ์ดํ•ด๊ฐ€ ํ–ฅ์ƒ๋˜๋ฉด ์˜ํ–ฅ๋ ฅ์ด ๋”์šฑ ์ปค์งˆ ์ˆ˜ ์žˆ๋‹ค.

๊ฐ™์ด ๋ณด๋ฉด ์ข‹์€ ๋…ผ๋ฌธ

๊ธฐ๋ฐ˜ ์—ฐ๊ตฌ
684๋ฒˆ์€ ๊ณผํ•™์  ๊ฐ€์„ค์˜ ๊ฒ€์ฆ ๊ฐ€๋Šฅ์„ฑ ๋ฐ ๋‹ค์ค‘ ์—์ด์ „ํŠธ ๊ธฐ๋ฐ˜ ๊ฒ€์ฆ ๋ฐฉ๋ฒ•์„ ๋‹ค๋ฃจ์–ด 630๋ฒˆ์˜ ์—ฐ๊ตฌ ์•„์ด๋””์–ด ์„ฑ๊ณต ์˜ˆ์ธก ๋ฌธ์ œ์— ํ•ด์„์  ๋ฐฐ๊ฒฝ์„ ์ œ๊ณตํ•œ๋‹ค.
๊ธฐ๋ฐ˜ ์—ฐ๊ตฌ
AI๊ฐ€ ์ „๋ฌธ์ ์ธ ๊ฒฝํ—˜์  ์—ฐ๊ตฌ ๊ฒฐ๊ณผ ์˜ˆ์ธก ๋…ผ๋ฌธ ์ดˆ์•ˆ ์ž‘์„ฑ ๋ฐ ํ‰๊ฐ€ ์ง€์›์— ์–ด๋–ป๊ฒŒ ํ™œ์šฉ๋  ์ˆ˜ ์žˆ๋Š”์ง€ ์‹ค์ฆ ์—ฐ๊ตฌ๋กœ, outcome prediction ์ž๋™ํ™” ๋งฅ๋ฝ์˜ ๊ธฐ์ดˆ๊ฐ€ ๋ฉ๋‹ˆ๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
Forecasting the future of artificial intelligence ๋…ผ๋ฌธ์€ ๋จธ์‹ ๋Ÿฌ๋‹์„ ํ†ตํ•œ AI ๋ฐœ์ „์˜ ๋ฏธ๋ž˜๋ฅผ ์˜ˆ์ธกํ•˜๋Š” ๋Œ€์ฒด์  ๋ฐฉ๋ฒ•์„ ๋‹ค๋ฃจ์–ด ๋‘ ๋…ผ๋ฌธ์€ AI ์—ฐ๊ตฌ ํŠธ๋ Œ๋“œ ์˜ˆ์ธก ๋ฐฉ๋ฒ•์—์„œ ์ฐจ์ด๋ฅผ ๋ณด์ž…๋‹ˆ๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
585๋ฒˆ OpenAI o1 System Card๋Š” ์ตœ์‹  LLM ์‹œ์Šคํ…œ์˜ ์•ˆ์ „์„ฑยท๊ฐ•๊ฑด์„ฑ ๋ฐœ์ „์„ ๋‹ค๋ฃจ๋ฉฐ, 630๋ฒˆ์˜ ์‹คํ—˜ ์˜ˆ์ธก ์„ฑ๋Šฅ ์—ฐ๊ตฌ์™€ ์ตœ์‹  ๋ชจ๋ธ ๊ธฐ๋ฐ˜ ์„ฑ๊ณผ ๋น„๊ต๊ฐ€ ๊ฐ€๋Šฅํ•˜๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
๋ฐด์น˜๋งˆํฌยท๋ชจ๋ธ์„ ํ™œ์šฉํ•ด ์‹คํ—˜ ๊ฒฐ๊ณผ ์˜ˆ์ธก์„ ์‹œ๋„ํ•œ ์œ ์‚ฌ ์—ฐ๊ตฌ๋กœ, ์ ์šฉ ๋„๋ฉ”์ธ๊ณผ ํ‰๊ฐ€ ๋ฐฉ๋ฒ•๋ก ์˜ ์ฐจ์ด์ ์„ ๋น„๊ตํ•  ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
680๋ฒˆ์€ LLM ๊ธฐ๋ฐ˜ ๋…ผ๋ฌธ ์‹ฌ์‚ฌ์˜ ํ•ต์‹ฌ ๋ฌธ์ œ ๋ฐœ๊ฒฌ ๋ฐ ๋น„ํŒ์  ํ‰๊ฐ€๋ฅผ ์ค‘์ ์ ์œผ๋กœ ๋‹ค๋ฃจ๋ฏ€๋กœ, 630๋ฒˆ์˜ ์—ฐ๊ตฌ ์•„์ด๋””์–ด outcome ์˜ˆ์ธก๊ณผ ๋ณด์™„์ ์œผ๋กœ ์ฝ์„ ์ˆ˜ ์žˆ๋‹ค.
๋‹ค๋ฅธ ์ ‘๊ทผ
ReviewAgents๋Š” LLM์ด ์ œ์•ˆ๋œ ์—ฐ๊ตฌ ์•„์ด๋””์–ด์˜ ์‹ค์งˆ์  ๊ฐ€๋Šฅ์„ฑยทํ’ˆ์งˆ์„ ํ‰๊ฐ€ํ•˜๋Š” ๋ฐ ์ดˆ์ ์„ ๋งž์ถ”์–ด, AI ๊ธฐ๋ฐ˜ ์‹ฌ์‚ฌยท๋ฏธ๋ž˜ ์˜ˆ์ธก ํ‰๊ฐ€ ์ ‘๊ทผ๋ฒ•์„ ๋น„๊ตํ•  ์ˆ˜ ์žˆ๋‹ค.
ํ›„์† ์—ฐ๊ตฌ
Predicting the future of ai with ai ๋…ผ๋ฌธ์€ LLM์„ ํ™œ์šฉํ•œ AI ๋ถ„์•ผ ์˜ˆ์ธก ์—ฐ๊ตฌ๋ฅผ ํ™•์žฅยท๋ณด์™„ํ•˜๋ฉฐ 630์˜ ๊ฒฐ๊ณผ์™€ ์ƒํ˜ธ๋ณด์™„์ ์œผ๋กœ ์—ฐ๊ฒฐ๋ฉ๋‹ˆ๋‹ค.
ํ›„์† ์—ฐ๊ตฌ
MIRAI ๋…ผ๋ฌธ์€ ๊ณ ์ž„ํŒฉํŠธ ๋…ผ๋ฌธ/์—ฐ๊ตฌ ์„ฑ๊ณผ ์˜ˆ์ธก์˜ ์ƒ์„ฑ ๋ฐ ํƒ€๋‹น์„ฑ ๋ถ„์„ ๊ธฐ์ˆ ์„ ๋ฐœ์ „์‹œ์ผœ, ์•„์ด๋””์–ด ์‹คํ—˜ ์„ฑ๊ณต ์˜ˆ์ธก ๋ฌธ์ œ์— ๋‹ค์–‘ํ•œ ํ”„๋ ˆ์ž„์›Œํฌ๋ฅผ ์ œ๊ณตํ•œ๋‹ค.
์‘์šฉ ์‚ฌ๋ก€
AI ๊ธฐ๋ฐ˜ ์‹คํ—˜ ๋ฐ์ดํ„ฐ/๊ฒฐ๊ณผ ์˜ˆ์ธก ๋…ผ๋ฌธ์œผ๋กœ, Polybot ํ”Œ๋žซํผ์ด ๋ณด์œ ํ•œ ๋ฐ์ดํ„ฐ ํ™œ์šฉ ๋ฐ ๋ถ„์„ ๊ธฐ๋Šฅ์˜ ์‘์šฉ ๊ฐ€๋Šฅ์„ฑ์„ ๋ณด์—ฌ์ค€๋‹ค.
← ๋ชฉ๋ก์œผ๋กœ ๋Œ์•„๊ฐ€๊ธฐ

๐ŸŽง Audio Overview

์ด ๋…ผ๋ฌธ ๋ฆฌ๋ทฐ๋ฅผ ํŒŸ์บ์ŠคํŠธํ˜• ์˜ค๋””์˜ค๋กœ ์ƒ์„ฑํ•ฉ๋‹ˆ๋‹ค. (Gemini ยท ํ‚ค๋Š” ๋ธŒ๋ผ์šฐ์ €์—๋งŒ ์ €์žฅ ยท ์™„์„ฑ๋ณธ์€ ์ด๋ฉ”์ผ๋กœ๋„ ์ „์†ก)
โ–ธ ๊ณ ๊ธ‰: ๊ตฌ์„ฑ ๋ฐฉํ–ฅ(๋Œ€๋ณธ ์ž‘์„ฑ ์ง€์นจ) ์ง์ ‘ ์ˆ˜์ •