Essence
Figure 2: Distribution of lazy thinking labels in our
๋ณธ ๋
ผ๋ฌธ์ NLP ๋๋ฃ ๊ฒํ ์์ ๊ฒ์ผ๋ฅธ ์ฌ๊ณ (lazy thinking)๋ฅผ ํ์งํ๊ธฐ ์ํ LAZYREVIEW ๋ฐ์ดํฐ์
์ ์๊ฐํ๋ค. ARR ๊ฐ์ด๋๋ผ์ธ์ ์ ์๋ 14๊ฐ์ง ๊ฒ์ผ๋ฅธ ์ฌ๊ณ ์ ํ์ ๊ธฐ๋ฐ์ผ๋ก 500๊ฐ์ ์ ๋ฌธ๊ฐ ์ฃผ์์ด ๋ฌ๋ฆฐ ๊ฒํ ์ธ๊ทธ๋จผํธ์ 1,276๊ฐ์ ์ค๋ฒ ์ฃผ์ ์ธ๊ทธ๋จผํธ๋ก ๊ตฌ์ฑ๋ ๋ฐ์ดํฐ์
์ ์ ์ํ๋ฉฐ, instruction-tuning์ ํตํด LLM์ ์ฑ๋ฅ์ 10-20 ํฌ์ธํธ ํฅ์์ํจ๋ค.
Achievement
Figure 2: Distribution of lazy thinking labels in our
์๋ก์ด ๋ฐ์ดํฐ์
๊ตฌ์ถ: 500๊ฐ์ ์ ๋ฌธ๊ฐ ์ฃผ์๊ณผ 1,276๊ฐ์ ์ค๋ฒ ์ฃผ์์ ํฌํจํ LAZYREVIEW ๋ฐ์ดํฐ์
์ ์ | ๊ฐ์ด๋๋ผ์ธ ๊ฐ์ : ์์ฑ ์์ (positive examples)๋ฅผ ํฌํจํ์ฌ ์ฃผ์ ํ์ง์ ํฅ์์ํจ ๊ฐํ๋ ๊ฐ์ด๋๋ผ์ธ ๊ฐ๋ฐ | LLM ์ฑ๋ฅ ํฅ์: instruction-tuning์ผ๋ก LLM ์ฑ๋ฅ์ 10-20 ํฌ์ธํธ ํฅ์ | ๊ฒํ ํ์ง ๊ฐ์ ๊ฒ์ฆ: ๊ฒ์ผ๋ฅธ ์ฌ๊ณ ํผ๋๋ฐฑ์ผ๋ก ์์ ๋ ๊ฒํ ๊ฐ ๋ ํฌ๊ด์ ์ด๊ณ ์คํ ๊ฐ๋ฅํจ์ ์
์ฆ | ์ฃผ์ ํ์ง ํฅ์: ์์ฑ ์์ ๊ฐ ์ฃผ์ ํ์ง๊ณผ in-context learning์ ํฅ์์ํด์ ํ์ธ
Evaluation
Novelty: 4/5 Technical Soundness: 4/5 Significance: 4/5 Clarity: 4/5 Overall: 4/5
์ดํ: ๋ณธ ๋
ผ๋ฌธ์ NLP ๋๋ฃ ๊ฒํ ํ์ง ํฅ์์ด๋ผ๋ ์ค์ํ ๋ฌธ์ ๋ฅผ ํด๊ฒฐํ๊ธฐ ์ํด ์ค์ ๋ฐ์ดํฐ์
์ ๊ตฌ์ถํ๊ณ ์๋ํ ๋ฐฉ๋ฒ์ ์ ์ํ ๊ฐ์น ์๋ ์ฐ๊ตฌ์ด๋ค. ์ฒด๊ณ์ ์ธ ์ฃผ์ ํ๋ก์ธ์ค, ์์ฑ ์์ ํ์ฉ, ๊ทธ๋ฆฌ๊ณ ์ค์ ๊ฒํ ํ์ง ๊ฐ์ ๊ฒ์ฆ์ ํตํด ํ์ ์ถํ ์ํ๊ณ์ ๊ธ์ ์ ๊ธฐ์ฌ๋ฅผ ํ ์ ์์ ๊ฒ์ผ๋ก ๊ธฐ๋๋๋ค.
๊ฐ์ด ๋ณด๋ฉด ์ข์ ๋
ผ๋ฌธ
๋ค๋ฅธ ์ ๊ทผ
LLM์ ์๊ธฐ ๊ฐ์ ๋ฅ๋ ฅ์ ์ํ ๋์์ ํ๋กฌํํ
๋ฐ ํ์ต ํ๋ ์์ํฌ์ด๋ค.
๋ค๋ฅธ ์ ๊ทผ
609 ๋
ผ๋ฌธ์ ๋
ผ๋ฌธ ๋ฆฌ๋ทฐ์ ๋ํ LLM ๊ธฐ๋ฐ์ ๋
ผ์ฆ์ ํ๊ฐ ์ฒด๊ณ๋ฅผ ์ ์ํ์ฌ, peer review ๊ณผ์ ์์์ '๊ฒ์ผ๋ฅธ ์ฌ๊ณ ' ๋ฌธ์ ํ์ ์ ๊ทผ๋ฒ์ ๋น๊ตํ ์ ์์ต๋๋ค.
๋ค๋ฅธ ์ ๊ทผ
Learning to generate research idea ๋
ผ๋ฌธ์ LLM ๊ธฐ๋ฐ ์ ๊ทผ๋ฒ์ผ๋ก biomed ๋ถ์ผ ์์ด๋์ด/๊ฐ์ค ์์ฑ์ ๋ ๋ค๋ฅธ ๋ฐฉ๋ฒ๋ก ์ ๋ณด์ฌ์ค ๋น๊ต ์ฐ๊ตฌ์ ๋์์ด ๋ฉ๋๋ค.
๋ค๋ฅธ ์ ๊ทผ
Lazyreview ๋ฐ์ดํฐ์
์ ๊ตฌ์ฒด์ ์ธ ๋๋ฃ ์ฌ์ฌ ํผ๋๋ฐฑ ํ์ง ๋์(๊ฒ์ผ๋ฅธ ์ฌ๊ณ )์ ์ ๊ณต, NLP ๊ธฐ๋ฐ ๋๋ฃ ์ฌ์ฌ ์๋ํ ๋ฐฉ๋ฒ ์ฐ๊ตฌ์ ์ค์ ๋ฐ์ดํฐ๋ฅผ ๋ณด์ํ๋ค.
๋ค๋ฅธ ์ ๊ทผ
ReviewEval ๋
ผ๋ฌธ์ AI ๊ธฐ๋ฐ ๋ฆฌ๋ทฐ ํ์ง ํ๊ฐ์ ๋ํ ์ ๊ทผ๋ฒ๊ณผ ์งํ๋ฅผ ๋น๊ตํด LAZYREVIEW ๋ฐ์ดํฐ์
์ ์ ์ฉ ์์ญ์ ํ์ฅํฉ๋๋ค.
๋ค๋ฅธ ์ ๊ทผ
128๋ฒ ๋
ผ๋ฌธ์ LLM ๊ธฐ๋ฐ ์๋ ๋ฆฌ๋ทฐ ํ๊ฐ์ ๋ค์ํ ์งํ ๋ฐ ๋ฐฉ๋ฒ๋ก ์ ๋น๊ต ๋ถ์ํ์ฌ, 481๋ฒ์ '๊ฒ์ผ๋ฅธ ๋ฆฌ๋ทฐ' ํ์ง์ ์ํธ ๋ณด์์ ์
๋๋ค.
ํ์ ์ฐ๊ตฌ
481์ Lazyreview ๋ฐ์ดํฐ์
์ NLP ํผ์ด๋ฆฌ๋ทฐ์ 'lazy thinking'์ ๊ฒ์ถํ๋ ค๋ ์๋๋ฅผ ํ์ฌ 883์ ๋ชจ์ ํ์ง์ ์ํธ๋ณด์์ ์
๋๋ค.
ํ์ ์ฐ๊ตฌ
ReviewerGPT ๋
ผ๋ฌธ์ LAZYREVIEW์ ์ ์ฌํ ๋ฆฌ๋ทฐ ํผ๋๋ฐฑ ์๋ํ ๋ฌธ์ ์ LLM ํ์ฉ ๋ฐฉ์์ ์ถ๊ฐ์ ์ผ๋ก ํ๊ตฌํฉ๋๋ค.
ํ์ ์ฐ๊ตฌ
Lazyreview ๋
ผ๋ฌธ์ LLM์ด ์์ฑํ๋ ๋ฆฌ๋ทฐ์ 'lazy thinking'๊ณผ ํ์ ๋ฆฌ๋ทฐ ํ์ง์ ๋ฌธ์ ๋ฅผ ํ๊ตฌํ์ฌ Agentreview์ ์์ด์ ํธ ๊ธฐ๋ฐ ํผ์ด๋ฆฌ๋ทฐ ๋์ ํ๊ฐ๋ฅผ ์ค์ฆ์ ์ผ๋ก ๋ณด์ํ๋ค.
ํ์ ์ฐ๊ตฌ
664 ๋
ผ๋ฌธ์ ์๋ฒ ์ด ๋
ผ๋ฌธ ๋ฆฌ๋ทฐ ๊ณผ์ ์์ AI ๋ฆฌ๋ทฐ์ด์ ํ๊ฐ ํ์ง ๋ฐ ํ๋ ์์ ๋ฒค์น๋งํนํจ์ผ๋ก์จ, ์๋ ๋ฆฌ๋ทฐ ์์ฑ์์ ํ์งยท๋ค์์ฑ๊ณผ์ ์ฐ๊ด์ฑ์ ์ถ๊ฐ ์ฐ๊ตฌํฉ๋๋ค.
ํ์ ์ฐ๊ตฌ
676๋ฒ ๋
ผ๋ฌธ์ AI์ ์ธ๊ฐ ๋ฆฌ๋ทฐ์ ๊ฐ๊ทน์ ์ขํ๋ ํ๋ ์์ํฌ๋ฅผ ์ ์ํ์ฌ, 481๋ฒ ๊ฒ์ผ๋ฅธ ์ฌ๊ณ ํ์ง ๋ฐ์ดํฐ์
๊ณผ ์ฐ๊ณํด ์ค์ ๋ฆฌ๋ทฐ ํ์ง ๊ฐ์ ์ ํ์ฉํ ์ ์์ต๋๋ค.
ํ์ ์ฐ๊ตฌ
481์ LLM ํผ์ด ๋ฆฌ๋ทฐ์ ํ์ง ๋ฌธ์ (๊ฒ์ผ๋ฅธ ์ฌ๊ณ ๋ฑ)๋ฅผ ๋ฐํ๋ด TreeReview์ ๊ฒํ ์ฌ์ธตํ ๋ชฉ์ ์ ๋ณด์ํฉ๋๋ค.
์์ฉ ์ฌ๋ก
Lazyreview ๋ฐ์ดํฐ์
์ NLP ๋๋ฃ ์ฌ์ฌ ํ๋ก์ธ์ค ๋ด '๊ฒ์ผ๋ฅธ ์ฌ๊ณ ' ํ์ง๋ฅผ ์ํ ์ค์ ์์๋ก, peer review ์๋ํ์ ์ฌ๋ก ์ฐ๊ตฌ์ ์ง์ ์ ์ผ๋ก ์ฐ๊ฒฐ๋๋ค.
์์ฉ ์ฌ๋ก
AAAR-1.0 ๋ฒค์น๋งํฌ๋ LLM์ด ๋
ผ๋ฌธ ํ๊ฐ์ ๋ฆฌ๋ทฐ ๋นํ ์์
์ ์ฌ์ฉ๋ ๋, LAZYREVIEW์ ๊ฐ์ ํ์ง ํฅ์ ๋ฐ์ดํฐ์
์ ํ์์ฑ์ ์
์ฆํฉ๋๋ค.