Essence
Figure 1: Illustration of error amplification and de-
๋ฒ ์ด์ง์ ์ต์ ์คํ์ค๊ณ(BOED) ํ์์ ๋ชจ๋ธ ์ค๋ช
์(model misspecification)๋ก ์ธํ ์ผ๋ฐํ ์ค์ฐจ๋ฅผ ๋ถ์ํ๊ณ , ๋ํ์ฑ(representativeness), ์ ๋ณด์ฑ(informativeness), ์ค์ฐจ ์ํ(de-amplification)๋ฅผ ๋ชจ๋ ๊ณ ๋ คํ๋ R-IDeA ํ๋ํจ์๋ฅผ ์ ์ํ๋ค.
Evaluation
Novelty: 4/5 Technical Soundness: 3/5 Significance: 4/5 Clarity: 4/5 Overall: 4/5
์ดํ: ๋ชจ๋ธ ์ค๋ช
์ ํ ๋ฅ๋ํ์ต์ ์ฅ๊ธฐ ๊ฐ๊ณผ๋ ์ธก๋ฉด(์ค์ฐจ ์ํ)์ ์ด๋ก ์ ์ผ๋ก ๊ท๋ช
ํ๊ณ ์ค์ฉ์ ํด๋ฒ์ ์ ์ํ ์ค์ํ ๊ธฐ์ฌ๋ก, ๋ฒ ์ด์ง์ ์คํ์ค๊ณ ๋ถ์ผ์ ๊ฒฌ๊ณ ์ฑ๊ณผ ์ ๋ขฐ์ฑ์ ํฌ๊ฒ ํฅ์์ํฌ ์ ์๋ ์์
์ด๋ค.
๊ฐ์ด ๋ณด๋ฉด ์ข์ ๋
ผ๋ฌธ
๊ธฐ๋ฐ ์ฐ๊ตฌ
๋ฒ ์ด์ง์ ์ต์ ์คํ์ค๊ณ์ ์ด๋ก ์ ๊ธฐ๋ฐ์ ์ ๊ณตํ๋ ์ฐ๊ตฌ์ด๋ค.
๊ธฐ๋ฐ ์ฐ๊ตฌ
363์ ์คํ ์ค๊ณ์ ๊ณผํ ์๋ํ์ ์ด๋ก ์ ํ๋ฆ, ํ์ ๋ฃจํ AI ๋ฐ๊ฒฌ ๋ฐฉ์์ ๋ค๋ค 1100์ R-IDEA ์ต์ ์คํ์ค๊ณ ๋
ผ์๋ฅผ ์ดํดํ๋ ๊ธฐ์ด๋ฅผ ์ ๊ณตํฉ๋๋ค.
๋ค๋ฅธ ์ ๊ทผ
์ต์ ์คํ ์ค๊ณ์ ์ผ๋ฐํ ์ค์ฐจ ๋ถ์์์ ๋์์ ๋ฐฉ๋ฒ๋ก ์ ์ ์ํ๋ค.
๋ค๋ฅธ ์ ๊ทผ
๋ฒ ์ด์ง์ ์คํ ์ค๊ณ์ ์ ์ฌํ ๋ฌธ์ ๋ฅผ ๋ค๋ฅธ ๊ด์ ์์ ์ ๊ทผํ๋ค.
๋ค๋ฅธ ์ ๊ทผ
๋ฒ ์ด์ง์ ์ต์ ์คํ์ค๊ณ์ ์คํ ์ค๊ณ ๋ฌธ์ ์์, ๋๊ท๋ชจ ์ปดํจํ
๋ฐ ๋ฐ์ดํฐ ๊ธฐ๋ฐ ์๋ฎฌ๋ ์ด์
์ ์ฅ๋จ์ ์ ๋ค๋ฅด๊ฒ ๋ณด์ฌ์ค๋ค.
๋ค๋ฅธ ์ ๊ทผ
Axolotl ๋
ผ๋ฌธ์ LLM์ ํธํฅ ๋ณด์ ๊ณผ ๊ณต์ ์ฑ์ ์ด์ ์ ๋ง์ถ ๋์์ ์ ๊ทผ๋ฒ์ ์ ์ํ๋ฏ๋ก ๋น๊ต๊ฐ ์ ์๋ฏธํฉ๋๋ค.
๋ค๋ฅธ ์ ๊ทผ
์คํ ์ค๊ณ์์ ๋ชจ๋ธ ์ค๋ช
์ ๋ฌธ์ ๋ฅผ ๋ค๋ฅธ ๋ฐฉ์์ผ๋ก ์ ๊ทผํ๋ ์ฐ๊ตฌ์ด๋ค.
๋ค๋ฅธ ์ ๊ทผ
๋ฅ ์กํฐ๋ธ๋ฌ๋ ๊ธฐ๋ฐ ์คํ ์ค๊ณ๋ฅผ ์ ์ฉํ์ฌ ์คํ ๋น์ฉ ์ต์ํ์ ์ ๋ณด์ฑ ์ต์ ํ ์ธก๋ฉด์์ ๋น๊ต ๊ฐ๋ฅํ ๋์์ ์ ๊ทผ์ ๋ณด์ฌ์ค๋ค.
ํ์ ์ฐ๊ตฌ
346์ foundation model์ ํ์ฉํ data-efficient active learning์ ๋ค๋ฃจ๋ฉฐ, 1100์ ์ค๋ฅ์ํ ์ค์ฌ framework์ ์ค์ ๋ฐ์ดํฐ ์ ์ฉ ํ์ฅ ์ฌ๋ก์
๋๋ค.
์์ฉ ์ฌ๋ก
๋ฐ์ด์ค ์คํ ์ค๊ณ์ ๋ฒ ์ด์ง์ ์ต์ ํ ๋ฐฉ๋ฒ๋ก ์ ์ค์ ์ ์ฉํ ์ฌ๋ก๋ก, BOED ๊ธฐ๋ฐ์ ์ค์ฐจ ๋ถ์๊ณผ ์ฐ๊ฒฐํ ์ ์์ต๋๋ค.