Essence
ํนํ ์ ๊ตฌ๋ถ ์์
์์ LLM์ ์ ํ๋ ๋น๊ต: "๋ค๋ฅธ ํนํ์ธ๊ฐ?"์ "๊ฐ์ ํนํ์ธ๊ฐ?" ์ง๋ฌธ์ ๋ํ ์๋ต ๋ถํฌ
๋ณธ ๋
ผ๋ฌธ์ ๋๊ท๋ชจ ์ธ์ด๋ชจ๋ธ(LLM)์ ๊ธฐ์ ํ๋จ ๋ฅ๋ ฅ์ ํ๊ฐํ๊ธฐ ์ํด USPTO ํนํ ๋ถ๋ฅ ์์
์ ํ์ฉํ์ฌ, ๋ชจ๋ธ์ด ๋ณด์ ํ ์ง์(lay-in knowledge)๊ณผ ์ค์ ํ์ฉํ๋ ์ง์(working knowledge) ๊ฐ์ ๊ฒฉ์ฐจ๋ฅผ ์ง๋จํ๋ ํ๋ ์์ํฌ๋ฅผ ์ ์ํ๋ค.
Evaluation
Novelty: 4.5/5 Technical Soundness: 4/5 Significance: 4.5/5 Clarity: 4/5 Overall: 4.25/5
์ดํ: ๋ณธ ๋
ผ๋ฌธ์ LLM์ ์ค์ ๋ฅ๋ ฅ ํ๊ฐ์ ์ค์ํ "๋ฏธ์ฌ์ฉ ์ง์" ๋ฌธ์ ๋ฅผ ์ฒด๊ณ์ ์ผ๋ก ๊ท๋ช
ํ๊ณ , ํนํ๋ผ๋ ๋๋ฉ์ธ์ ํตํด ๊ฐ๋
์ดํด์ ํต์ฌ ์์์ธ ์ฐจ๋ณํ ๋ฅ๋ ฅ์ ์ฐฝ์์ ์ผ๋ก ํ
์คํธํ๋ค. ๋ค๋ง, ๋๋ฉ์ธ ํน์ด์ฑ๊ณผ ์ธ๋ถ ์ ๋ณด์ ์์ ์ฑ ๊ฐ์ ์ผ๋ก ์ธํด ์ผ๋ฐํ์ ์ ์ฝ์ด ์์ผ๋ฉฐ, ์ง๋จ ์ดํ ๊ฐ์ ๋ฐฉ์ ์ ์๊น์ง๋ ๋ฏธํกํ ์ํ์ด๋ค.
๊ฐ์ด ๋ณด๋ฉด ์ข์ ๋
ผ๋ฌธ
๊ธฐ๋ฐ ์ฐ๊ตฌ
LLM์ ์ ๋ก์ท ๊ธฐ๋ฐ ๊ฐ์ค ์์ฑ/์ถ๋ก ๋ฅ๋ ฅ์ ํ๊ฐํจ์ผ๋ก์จ, ๊ธฐ์ ํ๋จ์ ํ์ํ LLM์ ์ค์ ์ ํ์ฉ ์ง์์ ํ์
ํ ์ ์๋ค.
๊ธฐ๋ฐ ์ฐ๊ตฌ
Large language models meet NLP ๋
ผ๋ฌธ์ LLM์ ๋ค์ํ NLP ํ์ฉ๊ณผ ๊ทธ ํ๊ณ๋ฅผ ์ข
ํฉ์ ์ผ๋ก ์ ๋ฆฌํ์ฌ, ๊ธฐ์ ์ ์ ๋ฌธ์ฑ ๋ฐ ํ๊ฐ ํ๋ ์์ํฌ ์ง๋จ์ ์ด๋ก ์ ํ ๋๊ฐ ๋๋ค.
๊ธฐ๋ฐ ์ฐ๊ตฌ
How deep do large language models internalize scientific literature๋ LLM์ด ์ค์ ์ง์์ ๋ด์ฌํํ ์ ๋์ ํ์ฉ์ ์ฐจ์ด๋ฅผ ๋ถ์ํด ๋ณธ ๋
ผ๋ฌธ์ ๋ฐฐ๊ฒฝ์ ์ด๋ก ์ ์ ๊ณตํฉ๋๋ค.
๋ค๋ฅธ ์ ๊ทผ
Enabling AI Scientists to Recognize Innovation(313)์ LLM์ ํ์ ์ฑ ํ๊ฐ ๋ฐ ๊ฐ๋
ํ์ฉ ๋ฅ๋ ฅ์ ๋ฒค์น๋งํน์ ๋ค๋ฃจ๋ฉฐ, ์ง์ ์ ํ ๊ฐ ์ฐจ๋ณ ์ธก์ ๊ณผ ์ฐ๊ฒฐ๋๋ค.
๋ค๋ฅธ ์ ๊ทผ
LLM์ ํ์ฉํ ํนํ ๋ฌธ์ ์ฒ๋ฆฌ ๋ฐ ์ฌ์ฌ ์๋ํ๋ฅผ ์ฐ๊ตฌํ๋ ์ ์ฌํ ์์ฉ ์ฐ๊ตฌ์ด๋ค.
๋ค๋ฅธ ์ ๊ทผ
438์ ํนํ ๋ถ๋ฅ ๊ธฐ๋ฐ LLM ๊ธฐ์ ํ๊ฐ, 668์ ๋
ผ๋ฌธ ๊ธฐ๋ฐ ์ฐ๊ตฌ ์์ด๋์ด ์์ฑ ํ๋ ์์ํฌ๋ก, AI์ ๊ณผํ ์์ด๋์ด/๊ธฐ์ ํ๊ฐ์ ์์ดํ ๋ฐฉ์ ์ ์ฉ์ ๋ณด์ฌ์ค๋๋ค.
ํ์ ์ฐ๊ตฌ
LLM์ ์๊ธฐ์ฑ์ฅ, ์๊ธฐ๊ฐ์ ๋ฉ์ปค๋์ฆ์ ๋ค๊ฐ๋๋ก ๋ถ์ํด, 314๋ฒ์ PIT ํ๋ ์์ํฌ์ ์คํ์ ํ์ฅ ์ฐ๊ตฌ๋ก ์ฐ๊ฒฐํ ์ ์์ต๋๋ค.
ํ์ ์ฐ๊ตฌ
LLM์ ์๊ธฐ ์ฑ์ฐฐ์ ์ฑ์ฅ(โ๋ฉํ-๋ฌ๋โ) ๋ฉ์ปค๋์ฆ์ ๋ถ์ํจ์ผ๋ก์จ, LLM ๊ธฐ๋ฐ ๊ธฐ์ต ์ฒด๊ณ ๋ถ๋ฅ ์ฒด๊ณ์ ์ค์ฉ์ ํจ์๋ฅผ ์ ๊ณตํ๋ค.
์์ฉ ์ฌ๋ก
The AI Scientist ๋
ผ๋ฌธ์ LLM์ ์ค์ ๊ธฐ์ ์ ์๊ฐ์ฑ์ฅ ๋ฐ ์ง์ ํ์ฉ ํ๊ณ๋ฅผ ์คํ์ ์ผ๋ก ๋ณด์ฌ์ฃผ๋ฉฐ, ์๋ํ ๊ณผํ ์ํ์์ expertise assessment์ ์ค์ ์ ์๋ฏธ๋ฅผ ์ ๊ณตํ๋ค.
์์ฉ ์ฌ๋ก
LLM์ ๋ด์ฌ ์ง์๊ณผ ์ค์ ํ์ฉ ์ง์ ๊ฐ ๊ฒฉ์ฐจ๋ฅผ ์ง๋จํ๋ 438๋ฒ ๋
ผ๋ฌธ์ ํ๋ ์์ํฌ์ ๋ฉ์ปค๋์ฆ ํด์ ๊ธฐ๋ฐ ์ธ๊ณผ ๋ถ์์ ์ ์ฉํ ์ ์๋ค.
์์ฉ ์ฌ๋ก
LLMEval-Med๋ ์์ ๋๋ฉ์ธ์์ LLM์ ์ค์ง์ ์ ๋ฌธ ์ง์ ํ๊ฐ ํ๋ ์์ํฌ๋ฅผ ์ ์ฉํ์ฌ introspective growth์ ์์ด๋์ด๋ฅผ ์๋ฃ์ ํ์ฅํฉ๋๋ค.