画图、润色、改格式只是开始Auto Research 已经把读文献、跑实验、写论文都卷进工具链里。最近几个月Auto Research 这个词有点太热了。前阵子还在让 AI 画图、改格式、润色论文现在已经卷到让它自己找 idea、写代码、跑实验、直出论文。问题也跟着来了项目太多名字太像主页一个比一个会吹真要挨个试半天就没了。为了帮大家节省点 token今天推荐一个宝藏开源仓库Awesome Auto Research Tools。这个仓库只收录 GitHub 上 500 Star 且持续活跃的自动化科研项目。它提前帮你踩了坑把那些真正能跑通、有社区背书的可用项目单列了出来。不管你需要的是一个文献调研助手还是想搭一套能自动迭代的工作流都可以直接从这份清单里找方案。端到端自主研究系统如果你想一步到位直接体验全自动包工头的快感可以重点看看这几个端到端系统。它们的目标非常明确自动化完整的研究生命周期覆盖从“想法 → 实验 → 论文”的全过程。autoresearchStar 数量79k框架 / 工具自研PyTorch, nanochat支持的 LLM APIAnthropic Claude, OpenAI Codex项目地址https://github.com/karpathy/autoresearch项目简介Andrej Karpathy 出品。630 行 AI 智能体自主阅读训练脚本、提出假设、修改代码、运行实验并评估结果 —— 一夜跑数百个实验。autoresearchStar 数量79k框架 / 工具自研PyTorch, nanochat支持的 LLM APIAnthropic Claude, OpenAI Codex项目地址https://github.com/karpathy/autoresearch项目简介Andrej Karpathy 出品。630 行 AI 智能体自主阅读训练脚本、提出假设、修改代码、运行实验并评估结果 —— 一夜跑数百个实验。AI-ScientistStar 数量14k框架 / 工具自研模板系统, LaTeX 流水线支持的 LLM APIOpenAI, Anthropic Claude, DeepSeek, Gemini, OpenRouter, 开源模型项目地址https://github.com/SakanaAI/AI-Scientist项目简介首个全自动开放式科学发现系统。自动完成想法生成、编码、实验运行和完整论文撰写。RD-AgentStar 数量13k框架 / 工具自研 LiteLLM, Docker, Streamlit, Qlib支持的 LLM APIOpenAI (GPT-4o/o1/o3), Azure OpenAI, DeepSeek任何 LiteLLM 支持的提供商项目地址https://github.com/microsoft/RD-Agent项目简介微软出品。自动化 RD 流程 —— 量化因子/模型演化、Kaggle 自动化、论文到代码实现。MLE-bench 顶尖 agent。AutoResearchClawStar 数量12k框架 / 工具OpenClaw Docker, LaTeX (NeurIPS/ICML/ICLR), OpenAlex, Semantic Scholar支持的 LLM APIOpenAI (GPT-4o), OpenRouter, DeepSeek, MiniMaxClaude/Gemini/Kimi 经 ACP 协议项目地址https://github.com/aiming-lab/AutoResearchClaw项目简介全自主研究idea → 文献检索 → 沙箱实验 → 多 agent 同行评审 → LaTeX 论文输出。ARISStar 数量8.2k框架 / 工具Claude Code MCPCodex, llm-chat, Zotero, Obsidian支持的 LLM APIAnthropic Claude, OpenAI GPT, GLM-5, MiniMax, Kimi, Qwen, DeepSeek, LongCat任何 OpenAI 兼容 API项目地址https://github.com/wanshuiyin/Auto-claude-code-research-in-sleep项目简介Claude Code skills 套件用于自主 ML 研究跨模型评审循环、想法发现流水线、实验自动化与论文撰写。AI-Scientist-v2Star 数量6.1k框架 / 工具自研BFTS 智能体树搜索, AIDE支持的 LLM APIOpenAI (o1/o3/GPT-4o), Anthropic (Bedrock), Gemini项目地址https://github.com/SakanaAI/AI-Scientist-v2项目简介AI-Scientist 升级版。首篇完全由 AI 撰写并通过同行评审被接收的 Workshop 论文。Agent LaboratoryStar 数量5.6k框架 / 工具自研多智能体arXiv, HuggingFace, LaTeX支持的 LLM APIOpenAI (o1/o3/GPT-4o), DeepSeek项目地址https://github.com/SamuelSchmidgall/AgentLaboratory项目简介端到端自主研究工作流包含文献综述、实验和报告撰写的专用智能体。AI-ResearcherStar 数量5.3k框架 / 工具自研 LiteLLM, Docker, Gradio支持的 LLM APIAnthropic, OpenAI, Gemini, DeepSeek, OpenRouter, GitHub AI经 LiteLLM项目地址https://github.com/HKUDS/AI-Researcher项目简介NeurIPS 2025 Spotlight。完全自主系统覆盖文献综述、假设生成、算法实现和可投稿论文准备。claude-scholarStar 数量3.5k框架 / 工具Claude Code / Codex CLI / OpenCode, Zotero MCP, Obsidian, LaTeX支持的 LLM APIAnthropic Claude, OpenAI经 Codex项目地址https://github.com/Galaxy-Dawn/claude-scholar项目简介半自动学术研究助手覆盖 idea → 编码 → 实验 → 写作 → 投稿。BiomniStar 数量3k框架 / 工具生物医学自研智能体 代码执行、数据湖、know-how 知识库支持的 LLM APIAnthropic Claude, OpenAI, Azure OpenAI, Gemini, Groq, AWS Bedrock, 自定义 OpenAI 兼容 API项目地址https://github.com/snap-stanford/Biomni项目简介斯坦福出品。通用生物医学 AI 智能体可在生物与医学研究中自主执行任务结合 LLM 推理、检索增强与工具/代码调用。DeepScientistStar 数量2.5k框架 / 工具自研贝叶斯优化、Findings Memory、Research MapGit worktrees, LaTeX支持的 LLM APIOpenAI (Codex CLI), Anthropic Claude, Moonshot Kimi, OpenCode本地模型后端项目地址https://github.com/ResearAI/DeepScientist项目简介Local-first 自主研究 studio。Findings Memory 与贝叶斯优化编排基线复现 → 分支实验 → LaTeX 论文草稿。DATAGENStar 数量1.7k框架 / 工具LangChain LangGraph, MCP servers, Firecrawl支持的 LLM APIOpenAI, Anthropic Claude, Gemini, Ollama, Groq项目地址https://github.com/starpig1129/DATAGEN项目简介AI 驱动的多智能体研究助手自动完成假设生成、数据分析、可视化和报告撰写。Idea2PaperStar 数量1.3k框架 / 工具自研 AgentAlpha 框架多智能体协作向量数据库知识图谱支持的 LLM APIDeepSeek V3/R1, Claude 3.5, GPT-4oSemantic Scholar, ArXiv API项目地址https://github.com/AgentAlphaAGI/Idea2Paper项目简介科研灵感探索引擎多 Agent 协同进行深度文献挖掘与知识图谱对齐将朴素 idea 包装为结构化课题方案。InternAgentStar 数量1.3k框架 / 工具自研Aider 代码生成、持久化记忆CondaGoogle Search, Semantic Scholar支持的 LLM APIOpenAI含 OpenAI 兼容接口, Anthropic Claude项目地址https://github.com/InternScience/InternAgent项目简介上海 AI Lab 出品。长周期自主科学发现的统一 agentic 框架覆盖物理、生物、地球与生命科学 —— 反应产率预测、分子动力学、蛋白质工程、气候诊断。深度调研与文献综合科研的第一步永远是海量的信息输入。这一类工具主要帮你解决信息过载的问题聚焦于自动信息收集、文献综述和深度的报告生成。有了它们梳理某个细分领域时就不需要去一页页翻 PDF 了。DeerFlowStar 数量66k框架 / 工具LangChain LangGraph, InfoQuest支持的 LLM API任何 OpenAI 兼容 APIGPT-4, Gemini via OpenRouter 等项目地址https://github.com/bytedance/deer-flow项目简介字节跳动出品。开源 SuperAgent 框架编排子智能体、记忆和沙箱用于深度调研、代码生成和报告撰写。STORMStar 数量28k框架 / 工具DSPy LiteLLM, Streamlit支持的 LLM API全部 LiteLLM 支持的模型OpenAI, Azure 等搜索You.com, Bing, Google, Brave, Tavily, SearXNG项目地址https://github.com/stanford-oval/storm项目简介斯坦福出品。LLM 驱动的知识管理系统生成带引用的完整维基百科风格文章。支持 Co-STORM 人机协作。GPT ResearcherStar 数量27k框架 / 工具LangGraph, MCP, FastAPI, NextJS支持的 LLM APIOpenAI, Anthropic Claude, Gemini任何 OpenAI 兼容 API项目地址https://github.com/assafelovic/gpt-researcher项目简介自主深度调研智能体。生成 5-6 页带引用的事实性报告支持 PDF/Docx/Markdown 和多智能体工作流。ChatPaperStar 数量19k框架 / 工具PyMuPDF, arxiv.py, Flask, Docker支持的 LLM APIOpenAI (GPT-3.5/4)项目地址https://github.com/kaixindelele/ChatPaper项目简介用 ChatGPT 总结 arXiv 论文、专业翻译、论文润色、审稿分析和审稿人回复生成。通义深度研究Star 数量19k框架 / 工具自研ReAct, IterResearch, GRPO RLSerper, Jina, SandboxFusion支持的 LLM APIOpenAI 兼容, OpenRouter通义-30B-A3B, Dashscope/百炼项目地址https://github.com/Alibaba-NLP/DeepResearch项目简介阿里巴巴出品。Agentic LLM305 亿参数33 亿激活专为长周期深度信息检索设计。多项基准 SOTA。Open Deep ResearchStar 数量11k框架 / 工具LangChain LangGraph, MCP, LangSmith支持的 LLM APIOpenAI (GPT-5/4.1), Anthropic (Sonnet 4), OpenRouter, Ollama本地项目地址https://github.com/langchain-ai/open_deep_research项目简介LangChain 出品。开源深度调研框架可配置 MCP 工具和搜索 API。PaperQA2Star 数量8.4k框架 / 工具自研 LiteLLM, Pydantic, tantivy支持的 LLM APIOpenAI, Anthropic, Gemini, Ollama, llama.cpp任何 LiteLLM 支持的提供商项目地址https://github.com/Future-House/paper-qa项目简介面向科学文献的高精度 RAG 系统。动态检索全文论文并迭代优化回答。发表于 ICLR。DeepResearchAgentStar 数量3.4k框架 / 工具自研Autogenesis 自演化协议MMEngine 配置支持的 LLM APIOpenRouter多模型访问项目地址https://github.com/SkyworkAI/DeepResearchAgent项目简介昆仑万维出品。层级多智能体系统顶层规划智能体协调多个专业化底层智能体。Auto-Deep-ResearchStar 数量1.5k框架 / 工具AutoAgent 框架 LiteLLM, Docker支持的 LLM APIAnthropic, OpenAI, Gemini, Mistral, Groq, OpenRouter, DeepSeek任何 OpenAI 兼容项目地址https://github.com/HKUDS/Auto-Deep-Research项目简介OpenAI Deep Research 的开源替代。通用 LLM 兼容零配置启动。GAIA Benchmark 表现优异。OpenScholarStar 数量1.5k框架 / 工具自研 RAGPyTorch, HuggingFace, Contriever)支持的 LLM APIOpenAI (GPT-4o), Llama 3.1 8B自部署Semantic Scholar API, You.com项目地址https://github.com/AkariAsai/OpenScholar项目简介检索增强语言模型搜索 4500 万篇论文。发表于 Nature。超越 PaperQA2 和 Perplexity Pro。ChatReviewerStar 数量1.4k框架 / 工具Python, tiktoken, Docker, HuggingFace Spaces支持的 LLM APIOpenAI (GPT-3.5/4)项目地址https://github.com/nishiwen1214/ChatReviewer项目简介用 ChatGPT 分析论文优缺点提供改进建议自动生成审稿人回复。ChatPaper 姊妹项目。OpenResearcherStar 数量741框架 / 工具Megatron-LM训练, vLLM部署, HuggingFace, Tevatron, BM25 Qwen3-Embedding, Serper支持的 LLM APIOpenResearcher-30B-A3B开源权重; OpenAI API评分项目地址https://github.com/InternScience/InternAgent项目简介完全开源的长周期 deep research 训练 推理 pipeline发布 30B-A3B 开源模型在 BrowseComp-Plus 上超越 GPT-4.1 和 Claude Opus 4。自动化实验与代码智能体到了落地执行阶段这部分项目专门用于自动化编码、实验执行和迭代优化。它们更像是整个系统的底层驱动负责替你处理调参、修代码、看报错等繁琐的体力活。AutoGPTStar 数量184k框架 / 工具自研Agent Builder, 工作流模块Docker支持的 LLM APIOpenAI, Anthropic, Groq, Llama, AI/ML API300 模型项目地址https://github.com/Significant-Gravitas/AutoGPT项目简介最早的自主 AI 智能体框架之一。包含 Forge智能体创建、基准测试套件和用户界面。OpenHandsStar 数量73k框架 / 工具自研智能体框架可组合 Python 库支持的 LLM APIAnthropic Claude, OpenAI GPT, MiniMax任何 LLM项目地址https://github.com/All-Hands-AI/OpenHands项目简介AI 驱动的软件开发平台。自主编码智能体可编辑文件、运行命令、浏览网页。SWE-Bench Verified 达 72%。AiderStar 数量44k框架 / 工具自研AI 结对编程 CLIGit 集成支持的 LLM APIAnthropic Claude, OpenAI, DeepSeek, OpenRouter, Ollama几乎任何 LLM项目地址https://github.com/Aider-AI/aider项目简介终端中的 AI 结对编程。支持多文件编辑、Git 集成。广泛用作研究流水线中的编码基础设施。SWE-agentStar 数量19k框架 / 工具自研YAML 配置驱动面向研究场景支持的 LLM APIOpenAI (GPT-4o), Anthropic (Sonnet 4, Claude 3.7)可配置项目地址https://github.com/SWE-agent/SWE-agent项目简介普林斯顿出品。将 LLM 转化为修复真实 GitHub Issue 的软件工程智能体。开创 SWE-Bench 基准。PaperBananaStar 数量6.2k框架 / 工具Streamlit, OpenRouter支持的 LLM APIOpenAI, Anthropic, Gemini经 OpenRouter项目地址https://github.com/dwzhu-pku/PaperBanana项目简介参考驱动的多智能体学术插图生成框架。5 个专用 agent检索、规划、风格、可视化、评审生成出版级插图。MLE-agentStar 数量1.6k框架 / 工具Python, Kaggle 集成, arXiv, Papers with Code支持的 LLM APIOpenAI, Anthropic Claude, Ollama (Llama3), Mistral项目地址https://github.com/MLSysOps/MLE-agent项目简介ML 工程与研究的智能伴侣。集成 arXiv 和 Papers with Code提供更好的代码/研究计划。自动调试。AIDEStar 数量1.3k框架 / 工具Python, Streamlit, Docker支持的 LLM APIOpenAI (GPT-4-turbo/4o), Anthropic Claude, Gemini, Ollama本地项目地址https://github.com/WecoAI/aideml项目简介用 AI 驱动的代码空间探索。LLM agent 通过树搜索编写、评估和改进 ML 代码。Kaggle 奖牌数是最佳线性 agent 的 4 倍。研究 Skills 与插件合集如果你的本地环境已经有了跑得比较顺手的通用执行工具比如 Claude Code 或者 Codex清单里也整理了可复用的 Skill 集合和插件生态。直接安装这些插件就能给你的模型快速扩展出特定的科研技能。scientific-agent-skillsStar 数量20k框架 / 工具PyTorch Lightning, scikit-learn, BioPython, RDKit, DeepChem, Scanpy, OpenMM支持的 LLM APIAgent 无关Claude Code, Cursor, Codex, Gemini CLI项目地址https://github.com/K-Dense-AI/scientific-agent-skills项目简介133 个即用型科学 skills覆盖生物信息学、药物发现、临床研究、医学影像和材料科学。AI-Research-SKILLsStar 数量8k框架 / 工具DeepSpeed, vLLM, LangChain, WB, MLflow 等 80 框架支持的 LLM APIAgent 无关Claude Code, Codex, Gemini CLI, Qwen Code项目地址https://github.com/Orchestra-Research/AI-research-SKILLs项目简介86 个 skills 覆盖 22 个类别贯穿 AI 研究全生命周期文献综述、想法生成、实验和论文撰写。结语Auto Research 的进化速度确实快得惊人。虽然工具还不能替你凭空变出一篇顶会满分论文但把查文献、找环境、改bug 这种最费时的体力活交接出去已经是完全可以落地的现实了。建议大家从这份清单里挑几款工具熟悉一下在日常的工作流里给自己增加一点自动化能力https://github.com/handsome-rich/Awesome-Auto-Research-Tools更多阅读#投 稿 通 道#让你的文字被更多人看到如何才能让更多的优质内容以更短路径到达读者群体缩短读者寻找优质内容的成本呢答案就是你不认识的人。总有一些你不认识的人知道你想知道的东西。PaperWeekly 或许可以成为一座桥梁促使不同背景、不同方向的学者和学术灵感相互碰撞迸发出更多的可能性。PaperWeekly 鼓励高校实验室或个人在我们的平台上分享各类优质内容可以是最新论文解读也可以是学术热点剖析、科研心得或竞赛经验讲解等。我们的目的只有一个让知识真正流动起来。稿件基本要求• 文章确系个人原创作品未曾在公开渠道发表如为其他平台已发表或待发表的文章请明确标注• 稿件建议以markdown格式撰写文中配图以附件形式发送要求图片清晰无版权问题• PaperWeekly 尊重原作者署名权并将为每篇被采纳的原创首发稿件提供业内具有竞争力稿酬具体依据文章阅读量和文章质量阶梯制结算投稿通道• 投稿邮箱hrpaperweekly.site• 来稿请备注即时联系方式微信以便我们在稿件选用的第一时间联系作者• 您也可以直接添加小编微信pwbot02快速投稿备注姓名-投稿△长按添加PaperWeekly小编现在在「知乎」也能找到我们了进入知乎首页搜索「PaperWeekly」点击「关注」订阅我们的专栏吧·