Towards end-to-end automation of AI research

같이 보면 좋은 논문

기반 연구

From LLM Reasoning to Autonomous AI Agents: A Comprehensive Review

LLM 및 자율 에이전트 벤치마크 체계적 리뷰가 AI Scientist 시스템의 전체 자동화 파이프라인 구현에 기반이 됩니다.

기반 연구

Automating the practice of science: Opportunities, challenges, and implications

Automating the practice of science 논문은 과학 자동화의 근본적 가능성과 과제를 논의하여 AI Scientist 연구의 철학/이론 기반을 제시합니다.

기반 연구

AI-Researcher: Autonomous Scientific Innovation

Towards end-to-end automation of AI research 논문은 AI 연구 자동화의 전체적인 청사진을 제시하여, AI-Researcher의 시스템 설계에 이론적 가이드가 된다.

기반 연구

Accelerating Scientific Research with Gemini: Case Studies and Common Techniques

고급 LLM의 과학적 추론 능력의 기반이 되는 모델 연구이다.

다른 접근

The AI Scientist: Towards Fully Automated Open-Ended Scientific Discovery

AI Scientist v2는 연구 자동화의 현실적 어려움, 최적화된 파이프라인·워크플로우 구현 등, end-to-end 자동화의 또 다른 성공 사례를 보여줍니다.

다른 접근

Mlr-copilot: Autonomous machine learning research based on large language models agents

AI 연구 전과정의 자동화 프레임워크 논의 속에서 LLM 에이전트 기반 ML 연구 자동화의 차별점을 확실히 보여줍니다.

다른 접근

Automating the practice of science: Opportunities, challenges, and implications

자동화된 과학 연구의 기회와 한계를 탐색하는 유사한 연구이다.

다른 접근

Human-ai teaming using large language models: Boosting brain-computer interfacing (bci) and brain research

AI 연구 환경 완전 자동화를 지향하는 접근법으로, 완전 자동화와 인간-AI 팀 공동연구의 장단점 및 상호보완 방안을 비교할 수 있음.

다른 접근

Evaluating Sakana's AI Scientist for Autonomous Research: Wishful Thinking or an Emerging Reality Towards 'Artificial Research Intelligence'(ARI)? arXiv preprint arXiv:2502.14297, 2025.

AI 기반 자율 과학 연구 시스템의 능력과 한계를 평가하는 유사한 주제의 연구이다.

다른 접근

AI-Newton: A concept-driven physical law discovery system without prior physical knowledge

AI 기반 자동 과학 발견 또는 법칙 추출 시스템으로 유사한 접근법을 공유한다.

다른 접근

Dolphin: Closed-loop open-ended auto-research through thinking, practice, and feedback

828번 논문은 전자동 AI 연구 프레임워크에 대한 다른 접근으로, DOLPHIN과 유사한 오픈엔디드 과학 자동화 시스템을 소개하여 비교할 만합니다.

다른 접근

AI Agents in Engineering Design: A Multi-Agent Framework for Aesthetic and Aerodynamic Car Design

AI 기반 설계 또는 엔지니어링 최적화 자동화 시스템으로 유사한 목표를 추구한다.

다른 접근

Towards Scientific Intelligence: A Survey of LLM-based Scientific Agents

Towards end-to-end automation of AI research 논문은 LLM 기반 과학 연구 에이전트를 실제 연구 자동화에 적용한 프레임워크로, 본 서베이의 설계와 비교할 만하다.

다른 접근

From Automation to Autonomy: A Survey on Large Language Models in Scientific Discovery

828번 논문은 AI 연구 과정의 완전 자동화를 시도한 실제 적용 프레임워크로, 353번의 LLM 자율화 단계 이론과 대조적으로 비교될 수 있습니다.

다른 접근

aiXiv: A Next-Generation Open Access Ecosystem for Scientific Discovery Generated by AI Scientists

Towards end-to-end automation of AI research 논문은 다중 에이전트 환경에서 실험 반복과 연구 자동화의 또 다른 접근법을 제시하므로 함께 비교할 만하다.

다른 접근

Towards a Medical AI Scientist

자율 AI 과학자 시스템의 유사한 문제를 다른 방식으로 접근한다.

다른 접근

AutoSOTA: An End-to-End Automated Research System for State-of-the-Art AI Model Discovery

AI 연구 자동화에서 SOTA 재현, 개선 등 자동 실험 시스템 구현 시 다양한 multi-agent 구조와 플로우 자동화 접근법을 비교할 수 있다.

후속 연구

Towards Scientific Discovery with Generative AI: Progress, Opportunities, and Challenges

Towards end-to-end automation of AI research 논문은 실제 연구 실험 자동화를 위한 시스템적 실천 사례를 제시하여, 포괄적 과학 AI 시스템의 실현 가능성을 논의합니다.

후속 연구

From LLM Reasoning to Autonomous AI Agents: A Comprehensive Review

AI Scientist 시스템은 자율 AI 에이전트 연구의 엔드-투-엔드 자동화 적용 사례로 본 논문 리뷰의 실질적 확장입니다.

후속 연구

MLGym: A new framework and benchmark for advancing ai research agents

Towards end-to-end automation of AI research 논문은 MLGym처럼 AI 연구 환경 자동화를 더욱 넓은 범위로 확장하고 있습니다.

후속 연구

Exp-bench: Can ai conduct ai research experiments? arXiv preprint arXiv:2505.24785, 2025.

Towards end-to-end automation of AI research 논문은 실질적인 AI 연구 완전 자동화 구조와 구현 사례를 보여주며, Exp-bench의 평가 결과를 현실화하는 방향을 제시합니다.

후속 연구

Autoreproduce: Automatic AI Experiment Reproduction with Paper Lineage

828은 AI 연구의 End-to-End 자동화로 확장하는 방안을 제시하여, 145의 자동 실험 재현을 더 포괄적인 연구 자동화로 발전시킨다.

후속 연구

MLR-Bench: Evaluating AI Agents on Open-Ended Machine Learning Research

자동화된 AI 연구 시스템 구축에 관한 최신 동향 및 전체 과정 자동화 문제를 분석해, MLR-Bench 시스템의 상용화·확장 가능성 평가에 도움을 줍니다.

후속 연구

EAIRA: Establishing a Methodology for Evaluating AI Models as Scientific Research Assistants

AI 연구 전반의 엔드-투-엔드 자동화 벤치마킹 사례들을 통해 EAIRA의 실험성과 비교 가능한 프레임워크를 제시한다.

후속 연구

The AI Scientist-v2: Workshop-Level Automated Scientific Discovery via Agentic Tree Search

The AI Scientist-v2 논문은 AI 연구자의 상위권 논문 생성 등 엔드-투-엔드 과학 자동화의 진화된 실증 사례를 보완합니다.

후속 연구

From Automation to Autonomy: A Survey on Large Language Models in Scientific Discovery

From Automation to Autonomy 논문은 자동화-자율화 전환의 최신 동향 및 실제 연구 응용을 비교적으로 다룹니다.

후속 연구

Agent Laboratory: Using LLM Agents as Research Assistants

828은 AI연구의 엔드 투 엔드 자동화 프레임워크를 제안하여 059의 구현사례에 한층 범용적 시사점을 더한다.

후속 연구

Democratizing AI scientists using ToolUniverse

828은 LLM의 도구 사용 능력이나 과학적 추론을 확장하여 ToolUniverse 생태계의 활용 범위를 보완한다.

후속 연구

Cocoa: Co-planning and co-execution with AI Agents

Towards end-to-end automation of AI research 논문은 에이전트 기반 과학연구 자동화의 한계와 향후 방향성을 논의하여 Cocoa의 협업 프레임워크와 연관성 있습니다.

후속 연구

A Survey of AI Scientists

AI 과학자 시스템의 특정 측면을 확장하거나 응용한 연구이다.

후속 연구

ResearchGym: Evaluating Language Model Agents on Real-World AI Research

Towards end-to-end automation of AI research 논문은 실제 연구 자동화 전체적 관점에서 AI 에이전트 평가 기준 확장을 논의하여 ResearchGym의 목적과 연장성을 가진다.

후속 연구

Can we automatize scientific discovery in the cognitive sciences?

Towards end-to-end automation of AI research 논문은 AI 연구 전 과정을 자동화하는 구체적 시스템 수준 사례를 제시합니다.

응용 사례

A Review on Scientific Knowledge Extraction using Large Language Models in Biomedical Sciences

828 논문은 AI 연구의 엔드-투-엔드 자동화를 다루며, 021의 LLM 기반 과학 지식 추출의 실제 적용 사례를 탐색합니다.

응용 사례

Sciclaimhunt: A large dataset for evidence-based scientific claim verification

710 논문은 바이오메디컬 분야에서 자동 클레임 생성 및 검증 시스템을 적용해 실제 연구 자동화 파이프라인의 실효성 검증 사례를 보완합니다.

응용 사례

AAAR-1.0: Assessing AI's Potential to Assist Research

AAAR-1.0은 AI의 연구 어시스턴트로서의 가능성 평가를 다루어, The AI Scientist의 엔드-투-엔드 과학 자동화 적용의 평가 지점이 된다.

반론/비판

Exp-bench: Can ai conduct ai research experiments? arXiv preprint arXiv:2505.24785, 2025.

AI 기반 실험 설계 및 자동화 프레임워크의 실제 실험 수행 능력과 한계를 비교 분석할 수 있도록 해줍니다.

반론/비판

AI Scientists Fail Without Strong Implementation Capability

AI Scientist의 능력을 긍정적으로 평가하는 입장으로, AI 과학 연구 구현 능력 부족을 비판하는 본 논문과 대비되는 관점을 제시한다.

Towards end-to-end automation of AI research

Essence

Motivation

Achievement

How

Originality

Limitation & Further Study

Evaluation

같이 보면 좋은 논문

Towards end-to-end automation of AI research

Essence

Motivation

Achievement

How

Originality

Limitation & Further Study

Evaluation

같이 보면 좋은 논문

🎧 Audio Overview