Neural Brain: A Neuroscience-inspired Framework for Embodied Agents
์ ์: Jian Liu, Xiongtao Shi, Thai Duy Nguyen, Haitian Zhang, Tianxiang Zhang, Wei Sun, Yanjie Li, Athanasios V. Vasilakos, Giovanni Iacca, Arshad Ali Khan, Arvind Kumar, Jae Won Cho, Ajmal Mian, Lihua Xie, Erik Cambria, Lin Wang | ๋ ์ง: 2025-05-12 | URL: https://arxiv.org/abs/2505.07634 📄 PDF
Essence
Fig. 1. Human brain-inspired Neural Brain. The human brain comprises four key components: sensing, function (perception,
๋ณธ ๋
ผ๋ฌธ์ ์ ๊ฒฝ๊ณผํ์์ ์๊ฐ์ ๋ฐ์ Neural Brain ํ๋ ์์ํฌ๋ฅผ ์ ์ํ์ฌ embodied agent๊ฐ ์ธ๊ฐ ์์ค์ ์ ์์ฑ์ผ๋ก ์ค์ ํ๊ฒฝ๊ณผ ์ํธ์์ฉํ ์ ์๋๋ก ์ค๊ณํ์๋ค. ์ด ํ๋ ์์ํฌ๋ multimodal active sensing, perception-cognition-action ๊ธฐ๋ฅ, neuroplasticity ๊ธฐ๋ฐ ๋ฉ๋ชจ๋ฆฌ, neuromorphic hardware/software ์ต์ ํ๋ฅผ ํตํฉํ๋ค.
Motivation
- Known: ํ์ฌ AI ์์คํ
, ํนํ large language models๋ ํจํด ์ธ์๊ณผ ๊ธฐํธ ์ถ๋ก ์์ ๋ฐ์ด๋์ง๋ง ๋ฌผ๋ฆฌ์ ์ธ๊ณ์์ ์ํธ์์ฉ์ด ๋ถ๊ฐ๋ฅํ disembodied ์ํ์ด๋ค. ์ธ๊ฐ ๋๋ ๊ฐ๊ฐ ์ฒ๋ฆฌ, ์ธ์ง, ํ๋์ ๊ณ์ธต์ ๋ถ์ฐ ๊ตฌ์กฐ๋ก ํตํฉํ์ฌ ๋์ ํ๊ฒฝ์์ ์ ์์ ํ๋์ ๊ฐ๋ฅํ๊ฒ ํ๋ค.
- Gap: Embodied ์ง๋ฅ์ ์ ๊ฒฝ๊ณผํ ๊ด์ ์์ ์ค๊ณํ๊ณ ๊ตฌํํ๋ ์ฐ๊ตฌ๊ฐ ๋ถ์กฑํ๋ฉฐ, ์ ์ AI ๋ชจ๋ธ๊ณผ ๋์ ์ค์ ํ๊ฒฝ ๋ฐฐํฌ ์ฌ์ด์ ๊ฐญ์ ํด๊ฒฐํ ํตํฉ ํ๋ ์์ํฌ๊ฐ ์๋ค. ํ์กดํ๋ modular perception-cognition-action ํ์ดํ๋ผ์ธ๊ณผ end-to-end reinforcement learning์ ์ ์์ฑ, ํตํฉ์ฑ, ์๋์ง ํจ์จ์ฑ์์ ์ ํ์ ๋ณด์ธ๋ค.
- Why: Embodied agent๋ unstructured ํ๊ฒฝ์์ ์ค์๊ฐ์ผ๋ก ์ ์์ ์ผ๋ก ํ๋ํด์ผ ํ๋ฉฐ, ์ด๋ฅผ ์ํด์๋ ๊ฐ๊ฐ-์ธ์ง-ํ๋์ ํ์ ๋ฃจํ ํตํฉ์ด ํ์์ด๋ค. ์ ๊ฒฝ๊ณผํ ๊ธฐ๋ฐ์ ํตํฉ ํ๋ ์์ํฌ๋ ํ์ฌ AI ์์คํ
์ brittleness๋ฅผ ํด๊ฒฐํ๊ณ ์ผ๋ฐํ ๊ฐ๋ฅํ ์์จ agent ๊ฐ๋ฐ์ ๊ฐ๋ฅํ๊ฒ ํ๋ค.
- Approach: ์ธ๊ฐ ๋์ ๊ตฌ์กฐ์ ๊ธฐ๋ฅ์์ ์๊ฐ์ ์ป์ด Neural Brain์ ์ ์ํ๊ณ , multimodal active sensing, closed-loop perception-cognition-action, neuroplasticity ๊ธฐ๋ฐ ๋ฉ๋ชจ๋ฆฌ, neuromorphic hardware/software co-design์ 4๊ฐ์ง ํต์ฌ ๋ชจ๋์ ํตํฉํ๋ ํต์ผ๋ ์๋ฌผํ์ ์๊ฐ ์ํคํ
์ฒ๋ฅผ ์ ์ํ๋ค.
Achievement
Fig. 1. Human brain-inspired Neural Brain. The human brain comprises four key components: sensing, function (perception,
- Neural Brain ์ ์ ๋ฐ ์ํคํ
์ฒ: Embodied agent๋ฅผ ์ํ Neural Brain์ 4๊ฐ์ง ํต์ฌ ์ปดํฌ๋ํธ(Sensing, Function, Memory, Hardware/Software)๋ฅผ ๋ช
ํํ ์ ์ํ์ฌ ๊ฑด์ถ ๊ฐ๋ฅํ ์ฒญ์ฌ์ง ์ ์
- Multimodal ๊ฐ๊ฐ ํตํฉ: ์๊ฐ, ์ธ์ด, ์ฒญ๊ฐ, ์ด๊ฐ, ํ๊ฐ, ๊ณต๊ฐ ์ธ์์ ํฌํจํ comprehensive multimodal sensing ํ๋ ์์ํฌ ๊ตฌ์ถ
- ํ์๋ฃจํ ์ํธ์์ฉ: Predictive perception, cognitive reasoning, action์ ํ์๋ฃจํ ๊ตฌ์กฐ๋ก ํ๊ฒฝ๊ณผ์ ์ง์์ ์ํธ์์ฉ ์คํ
- Neuroplasticity ๊ธฐ๋ฐ ๋ฉ๋ชจ๋ฆฌ: Hierarchical architecture, context-aware retrieval, adaptive updating์ ํตํ ๋์ ๋ฉ๋ชจ๋ฆฌ ์์คํ
- ์๋์ง ํจ์จ์ ๊ตฌํ: Event-driven processing๊ณผ neuromorphic hardware/software co-design์ผ๋ก ์ค์๊ฐ ์ ์ด์ ํจ์จ์ฑ ์ฆ๋
- ์ข
ํฉ์ ๋ฌธํ ๋ฆฌ๋ทฐ: Embodied agent ์ฐ๊ตฌ์ ์ต์ ๋ํฅ์ 4๊ฐ์ง ์ธก๋ฉด์์ ๋ถ์ํ๊ณ ์ธ๊ฐ ์ง๋ฅ๊ณผ์ ๊ฐญ ๋ถ์
How
Fig. 1. Human brain-inspired Neural Brain. The human brain comprises four key components: sensing, function (perception,
- ์ธ๊ฐ ๋์ ๊ตฌ์กฐ ๋ถ์: hippocampus, prefrontal cortex, cerebellum ๋ฑ์ ๊ธฐ๋ฅ์ embodied agent ์ํคํ
์ฒ์ ๋งคํ
- Multimodal active sensing ๊ตฌํ: ๋ค์ค ์ผ์์์ ์์งํ ์ ๋ณด๋ฅผ ํจ๊ณผ์ ์ผ๋ก ์ตํฉํ๊ธฐ ์ํ adaptive calibration ์ ์ฉ
- Closed-loop perception-cognition-action ์ค๊ณ: Predictive coding ๋ฉ์ปค๋์ฆ์ผ๋ก ๊ฐ๊ฐ ์์ธก ์ค๋ฅ ์ต์ํ
- Neuroplasticity ๊ธฐ๋ฐ ๋ฉ๋ชจ๋ฆฌ: Short-term memory (working memory)์ long-term memory (hippocampal hash-like mechanism)์ ๊ณ์ธต์ ๊ตฌ์กฐ ๊ตฌํ
- Event-driven neuromorphic ์ฒ๋ฆฌ: Sparse activation์ผ๋ก ์๋์ง ์๋น ๊ฐ์ ๋ฐ ์ค์๊ฐ ์ฒ๋ฆฌ ๋ฌ์ฑ
- Hardware/software co-design: Neuromorphic architecture ํ์ฉ์ผ๋ก ํจ์จ์ ๊ณ์ฐ ๋ฐ ์ ์ฐํ ์ ์ด ๊ตฌํ
Originality
- ์ ๊ฒฝ๊ณผํ ๊ธฐ๋ฐ์ ํตํฉ ํ๋ ์์ํฌ: ๊ธฐ์กด robotics, machine learning, AI ์ฐ๊ตฌ์ ๋ฌ๋ฆฌ neuroscience ๊ด์ ์์ embodied agent ์ค๊ณ์ ์ด๋ก ์ ๊ธฐ์ด ์ ๊ณต
- 4-๋ชจ๋ ์ํคํ
์ฒ์ ์ฒด๊ณํ: Sensing, Function, Memory, Hardware/Software๋ฅผ ์ธ๊ฐ ๋ ๊ธฐ๋ฅ์ ๊ธฐ๋ฐํ์ฌ ๋ช
ํํ๊ฒ ์ ์ํ๊ณ ํตํฉ
- Biologically-inspired ๊ตฌํ: Sparse activation, event-driven processing, predictive coding, distributed architecture ๋ฑ ์๋ฌผํ์ ์๋ฆฌ๋ฅผ ์ค์ agent ๊ตฌํ์ ์ง์ ์ ์ฉ
- Multimodal ํตํฉ์ ์ฐ์ ์์: ๊ธฐ์กด vision-centric ์ ๊ทผ์ ๋์ด ์ฒญ๊ฐ, ์ด๊ฐ, ํ๊ฐ, ๊ณต๊ฐ ์ธ์ ๋ฑ์ ๋๋ฑํ๊ฒ ๋ค๋ฃจ๋ comprehensive multimodal framework ์ ์
Limitation & Further Study
- ์ค์ ๊ตฌํ์ ๋ถ์ฌ: ๋
ผ๋ฌธ์ ํ๋ ์์ํฌ์ ์ค๊ณ ์์น์ ์ ์ํ์ง๋ง ๊ตฌ์ฒด์ ์ธ embodied agent ์์คํ
๊ตฌํ์ด๋ ์คํ ๊ฒฐ๊ณผ๊ฐ ๋ถ์กฑ
- ์ ๋์ ๊ฒ์ฆ ๋ถ์กฑ: ์ ์๋ Neural Brain ์ํคํ
์ฒ์ ์ฑ๋ฅ์ ์ ๋์ ์ผ๋ก ํ๊ฐํ ๋ฒค์น๋งํฌ๋ ์คํ ๋น๊ต๊ฐ ์ ํ์
- Hardware ์คํ์ ๋ณต์ก์ฑ: Neuromorphic hardware/software co-design์ ๊ตฌ์ฒด์ ๊ตฌํ ๋ฐฉ๋ฒ ๋ฐ scalability์ ๋ํ ์์ธ ๋ถ์ ํ์
- ํ์ต ๋ฉ์ปค๋์ฆ์ ์์ธํ: Neuroplasticity ๊ธฐ๋ฐ ๋ฉ๋ชจ๋ฆฌ์ ํ์ต ์๊ณ ๋ฆฌ์ฆ๊ณผ ์ ์ ๋ฉ์ปค๋์ฆ์ด ์ถฉ๋ถํ ๊ตฌ์ฒดํ๋์ง ์์
- ํ์ ์ฐ๊ตฌ ๋ฐฉํฅ: ์ค์ humanoid robot (Atlas, Optimus, Unitree G1 ๋ฑ)์ ์ ์ฉํ๋ end-to-end ๊ตฌํ ๋ฐ ํ๊ฐ ํ์
- ์ผ๋ฐํ ์ฑ๋ฅ: ๋ค์ํ real-world unstructured ํ๊ฒฝ์์์ ์ผ๋ฐํ ๊ฐ๋ฅ์ฑ๊ณผ robust ์ฑ๋ฅ ๊ฒ์ฆ ํ์
Evaluation
Novelty: 4/5 Technical Soundness: 3/5 Significance: 4/5 Clarity: 4/5 Overall: 4/5
์ดํ: ๋ณธ ๋
ผ๋ฌธ์ embodied AI์ ์ค๊ณ ์์น์ ์ ๊ฒฝ๊ณผํ ๊ธฐ๋ฐ์ผ๋ก ์ฒด๊ณ์ ์ผ๋ก ์ ๋ฆฝํ ์ค์ํ ์ด๋ก ์ ๊ธฐ์ฌ๋ฅผ ์ ๊ณตํ๋ฉฐ, Neural Brain์ 4๊ฐ์ง ํต์ฌ ๋ชจ๋์ ๋ช
ํํ ์ ์ํจ์ผ๋ก์จ future embodied agent ์ฐ๊ตฌ์ ํตํฉ์ ์ฒญ์ฌ์ง์ ์ ์ํ๋ค. ๋ค๋ง ๊ตฌ์ฒด์ ์ธ ๊ตฌํ๊ณผ ์คํ์ ๊ฒ์ฆ์ด ๋ถ์กฑํ๋ฏ๋ก, ์ค์ robotic system์ ๋ํ end-to-end ์ ์ฉ์ ํตํ ํ์ ์ฐ๊ตฌ๋ก ์ด ํ๋ ์์ํฌ์ ์คํจ์ฑ์ ์
์ฆํ ํ์๊ฐ ์๋ค.
๐ง Audio Overview
์ด ๋
ผ๋ฌธ ๋ฆฌ๋ทฐ๋ฅผ ํ์บ์คํธํ ์ค๋์ค๋ก ์์ฑํฉ๋๋ค. (Gemini ยท ํค๋ ๋ธ๋ผ์ฐ์ ์๋ง ์ ์ฅ ยท ์์ฑ๋ณธ์ ์ด๋ฉ์ผ๋ก๋ ์ ์ก)
โธ ๊ณ ๊ธ: ๊ตฌ์ฑ ๋ฐฉํฅ(๋๋ณธ ์์ฑ ์ง์นจ) ์ง์ ์์