Towards Scientific Intelligence: A Survey of LLM-based Scientific Agents

How

그림 1: 전형적 LLM 기반 과학 에이전트의 워크플로우

아키텍처 및 메커니즘 설계:

Planner 메커니즘: 사용자의 과학 문제를 부분 과제(sub-task)로 분해하고, 메모리에서 맥락/지식을 검색, 액션 스페이스를 통해 도구 호출 조율. Prompt 기반 (명시적 템플릿, 맥락 보강, 자기 성찰, 탐색 기반, 역할 상호작용, 프로그래밍 기반)과 학습 기반(도메인 미세조정, 강화학습) 두 가족으로 구분
Memory 메커니즘: 과거 실행 궤적, 검색된 문헌, 도메인 지식 베이스, 검증 결과 등을 저장하여 이후 결정 정제에 활용
Action Space: API 호출, 코드 실행, 시뮬레이터 상호작용, 문헌 검색 등 다양한 외부 도구 및 환경과의 인터페이스
Verifier: 중간 결과의 정확도, 일관성, 과학적 타당성을 검증하고, 추가 액션 또는 수정이 필요한 경우 Planner에 피드백 제공

반복 프로세스: 사용자 쿼리 → Planner 분해 → Memory 검색 → Action Space 실행 → Verifier 검증 → 메모리 저장 → (필요시 재계획) → 최종 결과 반환

같이 보면 좋은 논문

기반 연구

Toward a Team of AI-made Scientists for Scientific Discovery from Gene Expression Data

835는 LLM 기반 AI 과학자 프레임워크의 기술적 메타서베이로, 817의 AI-made scientist 팀 구축에 필수적 개념을 제공합니다.

기반 연구

From LLM Reasoning to Autonomous AI Agents: A Comprehensive Review

LLM 추론에서 AI 에이전트로의 전이 및 구조적 구성에 대한 포괄적 서베이로 835번의 이론적 배경을 제공합니다.

기반 연구

AI Scientists Fail Without Strong Implementation Capability

081의 논지는 835 논문의 대규모 LLM 기반 과학 연구 자동화 프레임워크 현황과 평가를 기반 삼아 비판적으로 읽어야 한다.

기반 연구

AutoSDT: Scaling Data-Driven Discovery Tasks Toward Open Co-Scientists

과학적 지식 발견을 위한 LLM 에이전트 시스템의 이론적 토대와 다양한 활용 사례를 다루고 있습니다.

기반 연구

Advancing AI-Scientist Understanding: Making LLM Think Like a Physicist with Interpretable Reasoning

과학적 추론과 LLM 기반 AI-과학자 프레임워크의 대규모 서베이로, 물리 문제의 해석성과 검증성에 초점을 맞춘 연구의 이론적 기반이다.

기반 연구

From Automation to Autonomy: A Survey on Large Language Models in Scientific Discovery

From Automation to Autonomy 논문은 LLM을 과학 자동화 시스템에 적용하기 위한 기반 방법론과 현황을 포괄적으로 정리해, 본 논문의 이론적 토대가 된다.

기반 연구

Unlocking the Potential of AI Researchers in Scientific Discovery: What Is Missing?

Towards Scientific Intelligence: A Survey of LLM-based Scientific Agents는 LLM 기반 AI 연구자agent의 역할과 한계에 대해 총괄적으로 다루어, 857의 AI 연구자 참여 확대 논의에 이론적 근거를 제공한다.

기반 연구

PersonaAI: An Interactive Agentic-AI Framework for Autonomous Hypothesis Generation and Validation in Aging

835번은 LLM 기반 과학 지능 및 에이전트 구조의 최신 동향을 개관하여, PersonaAI의 배경 이론을 제공합니다.

다른 접근

DSBench: How far are data science agents to becoming data science experts? arXiv preprint arXiv:2409.07703, 2024.

데이터 모델링 작업에서 AI 에이전트의 성능을 평가한 유사 벤치마크 연구이다.

다른 접근

A vision for auto research with llm agents

LLM 에이전트 기반 연구(오토리서치)의 비전과 필요한 역량을 논의한 논문으로, 과학 에이전트의 미래에 대한 입체적 논의를 제공합니다.

다른 접근

Can ai agents design and implement drug discovery pipelines? arXiv preprint arXiv:2504.19912, 2025.

신약 발견 과제에서 멀티-에이전트 시스템의 성능과 자율성을 평가하는 관련 벤치마크 연구이다.