自主科研AI Agent的现状与问题目前自主科研AI Agent已能跑通“从灵感到论文”的完整流程一觉醒来Agent或许已完成实验并写出论文。但它存在两个关键问题一是生成和审查常由同一模型系列完成许多系统性错误难以在内部暴露二是Agent在几乎无人监督的情况下连续工作数天后其最终结论难以判断是否有充分证据支撑。上海交通大学团队的解决方案——ARIS上海交通大学团队提出了“在睡眠中自动研究”Auto - Research - in - sleepARIS这是一个用于自动化科研的开源研究harness。其重点不是让Agent更快写出论文而是让写出的论文更经得起检验。在社区实操案例展示中已有研究人员使用ARIS全流程完成各自论文并被会议接受。ARIS的系统拓扑Aris的系统拓扑由三层构成。第一层是执行层提供具体能力由可复用的Markdown定义技能和持久化研究Wiki构成第二层是编排层负责把能力串成完整流程5个端到端工作流——idea发现、实验桥接、自动审查循环、论文撰写、rebuttal覆盖从发现到投稿后的4个研究阶段第三层是保障层这是Aris最核心的创新负责证据到主张的审计以及文稿检查包括3阶段证据 - 声明审计级联、5遍科学写作编辑流水线、数学证明检查器、视觉PDF审查以及引用审计。核心机制跨模型对抗协作研究团队认为单个Agent难以可靠地完成长程研究任务因此采用跨模型家族的“执行 - 审查 - 修正”循环。执行者默认推荐Claude家族负责产出代码、实验或论文草稿审查者默认推荐GPT - 5.4家族在预定义评分标准下打分并返回结构化的行动项执行者据此修正后再次提交如此反复直到评分达标。端到端工作流在这套机制之上ARIS组织了5条端到端工作流。工作流1负责创意发现包括文献调研、新颖性检查和实验规划工作流2是实验桥接把计划推进到代码实现、算力执行和结果回收工作流3是自动审查循环每轮将草稿提交给跨模型审查者进行结构化评分提取行动项按需运行GPU实验获取新证据修订受影响章节检查收敛工作流4是论文写作阶段系统会依次完成7个关键步骤先做论文规划和图表生成再进行LaTeX撰写与五轮编辑如有需要再加入证明检查随后进行结论审计、编译并通过两轮基于GPT - 5.4 xhigh的视觉审查与自动修订进入自动改进循环工作流5是投稿后阶段系统会一次完成解析审稿意见、拆分关键问题、规划回应策略、起草回复、通过三道安全检查、进行压力测试最后定稿其中的安全检查分别用于防止捏造、过度承诺和遗漏回应。为AI输出增加“自证安全网”ARIS最有特点的设计在于设置了3步审计链。第一步检查实验本身是否可靠重点排查伪标签、幽灵结果、未执行指标和超范围外推等问题第二步把每一条候选结论与现有证据逐一对应判断其是“有支持”“部分支持”还是“不成立”第三步再回到论文文本直接核对原始结果、实验设置和文中的数字与表是否一致。在这条审计链之外研究团队还设置了额外保障。初稿完成后ARIS会进行5轮科学编辑依次处理冗余表达、主动语态、局部连贯、术语一致性和数字一致性对于理论成分较重的论文还会调用证明检查器审查证明义务在审稿阶段系统会检查图注错位、版面异常和表格可读性问题最后进行引文核验不仅检查文献是否存在、元数据是否正确也检查引用是否真的支持正文中的论断。从“反复试错”到“螺旋式学习”研究知识库是ARIS的重要组成部分它是项目级的持久化记录系统持续保存相关论文、研究想法、实验过程和阶段性结论并记录它们之间的关联。有了这套记忆机制失败方向会被及时排除已经验证的结论则会成为下一轮研究的起点把一次性的研究过程转变为螺旋式学习。ARIS的效果与不足截至目前ARIS的技能库已从最初的21个核心技能扩展到65个以上覆盖机器人学、硬件设计、通信、数学证明、基金申请和演示生成等多个方向。同时ARIS也已在Claude Code、Codex CLI和Cursor三个平台上完成测试审查端目前可接入GPT、Gemini、DeepSeek等多种模型后端。研究团队给出的一次真实隔夜运行记录显示在大约8小时内ARIS完成了4轮“审查 - 修改”循环内部审查分数从5.0/10提升到7.5/10其间触发了20多次GPU实验并主动删除了一些缺乏足够证据支撑的结论。不过研究团队强调这些只是观察性证据不能据此做出因果判断。缺乏受控评估是目前研究最主要的局限论文中所有报告结果均为观察性记录无法将效果在因果层面归因于ARIS本身。ARIS也不能保证任何输出一定正确、新颖或保证科学上合理三阶段审计链虽能拦住不少常见失真但不能保证发现所有错误或伪造。最终的研究方向选择、证据核验和提交决定仍然需要由人负责在安全层面仓库级审查还可能涉及将源代码发送给外部模型接口而本地审查路由目前仍处于规划阶段。ARIS的意义ARIS里这套机制未必只服务于论文写作审查者独立、“证据到结论”审计和可追溯台账理论上都可以被置于在模型输出与后续训练信号之间成为自我改进系统的一层显式监督。归根结底ARIS真正推进的不是自动化科研的速度而是它的可信性它至少把一个长期被忽视的问题摆到了台面上对自动化科研来说这或许比再快一点、更自动一点更重要。