智源大会2026悟界系列:世界模型范式变革与Physis-v0.1
摘要2026年6月12日第八届北京智源大会在中关村国际创新中心开幕。智源研究院院长王仲远发布2026年研究进展报告宣布AI正经历从预测下一个词元到预测下一个物理状态的重大范式变革推出悟界系列5款大模型Physis-v0.1全球首个通用世界基座模型物理隐空间替代像素预测50复杂物理场景长程推理、Emu3.5多模态统一学习基座登刊Nature正刊、Brainμ1.0全球首个多模态神经科学大模型登刊Science、OpenComplex2.5药物发现模型、RoboBrain Orca具身智能大脑。同步发布4款智能体矩阵和FlagOS 2.1智算软件栈支持18家芯片厂商32款芯片。22岁北大本科生陈博远担任Physis模型负责人。核心结论智源大会2026揭示了大模型发展的下一站——世界模型。从预测下一个词元语言模型到预测下一个物理状态世界模型的范式变革将深刻改变AI理解和交互物理世界的方式。悟界·Physis-v0.1以物理隐空间表征替代像素预测是这一范式的首个工程实现。同时FlagOS 2.1覆盖18家芯片厂商32款芯片正在解决多模型×多芯片适配这个中国AI产业的核心痛点。一、范式变革从下一个词元到下一个物理状态1.1 为什么世界模型是下一代大模型的核心智源研究院在本次大会上明确提出一个关键论断预测下一个词元是语言模型的核心预测下一个物理状态将是世界模型的核心。维度语言模型世界模型核心任务预测下一个词元预测下一个物理状态训练数据文本多模态感知物理交互数据理解深度统计共现关系因果物理规律输出空间离散token连续物理状态落地场景对话/写作/编码机器人/自动驾驶/科学发现代表模型GPT/Claude/GeminiPhysis/Cosmos 3智源将现有世界模型分为四类类别核心表征代表工作局限性以语言为中心文本描述物理GPT/Claude物理理解浅层以像素为中心视频帧预测Sora/Runway违反物理规律以三维结构为中心点云/网格3D生成模型缺乏动态推理以视觉表征为中心物理隐空间Physis训练成本高1.2 6月12日的世界模型双响炮同一天智源发布Physis-v0.1NVIDIA发布Cosmos 3——东西方两大AI机构同时将世界模型推向产业前台这不是巧合而是AI发展规律的自然演进。二、悟界系列5款大模型深度解析2.1 悟界·Physis-v0.1全球首个通用世界基座模型核心创新物理隐空间表征替代像素预测传统视频生成模型如Sora直接预测像素导致物理一致性差——物体可能穿墙、水可能向上流。Physis-v0.1的革命性在于不在像素空间预测而在物理隐空间中预测。这类似于语言模型中不在字符层面预测而在语义层面预测——先理解物理世界的隐含结构再在隐空间中做推理和预测。四大核心能力能力描述技术实现物理一致性遵守物理定律重力、碰撞、流体力学等物理引擎约束的隐空间编码动作因果性理解动作→结果的因果关系因果推理模块长程推理50复杂物理场景的长时域推理层次化时序建模泛化能力跨场景迁移物理规律抽象而非场景记忆项目负责人22岁北大本科生陈博远担任智源研究院行为世界模型创新中心负责人。王仲远透露Physis训练完成后将开源开放。2.2 悟界·Emu3.5多模态统一学习基座指标描述核心架构基于预测下一个词元实现文本图像视频统一学习创新点打破模态孤岛内置时空与物理规律建模能力学术成果登刊《Nature》正刊开源状态已开源Emu3.5的技术路线与Meta的Chameleon类似——用统一token化方案将文本、图像、视频映射到同一表征空间。但Emu3.5的独特之处在于内置时空与物理规律建模使其不仅是多模态生成模型更是多模态理解物理规律感知模型。2.3 悟界·Brainμ1.0全球首个多模态神经科学大模型指标描述核心能力理解与生成统一跨物种全模态脑信号统一编码配套平台万亿级AI-Ready神经科学数据平台BrainToken应用方向脑疾病诊断辅助、神经科学科研学术成果登刊《Science》Brainμ1.0是AI脑科学交叉领域的重要突破。传统神经科学研究依赖人工分析脑信号EEG/fMRI/电生理等不同物种、不同模态的脑信号之间缺乏统一表征。Brainμ1.0首次实现了跨物种人/猴/鼠/果蝇等全模态脑信号的统一编码这意味着可以用同一个模型理解不同物种的大脑活动。2.4 悟界·OpenComplex2.5AI驱动药物发现指标描述核心突破精准解析固有无序蛋白IDP构象覆盖能力口袋识别反向筛选结构预测亲和力预测四合一应用价值缩短药物发现周期降低研发成本2.5 悟界·RoboBrain Orca具身智能大脑指标描述核心理念以下一个物理状态预测为核心能力架构想、看、动三位一体价值提升具身智能少样本与跨场景泛化能力三、4款智能体矩阵智能体场景核心能力关键指标BAAI Cardiac Agent心脏磁共振辅助诊断复刻专家诊疗流程诊断精确度AUC超0.93AREX自主科学研究降低科研全流程对人类依赖实现自主科学发现SoulAgent个人专属智能体用户画像自进化高私密个性化节省30% Token成本有害蛋白风险发现智能体生物安全主动模拟攻击识别脆弱性事前演练替代事后应对BAAI Cardiac Agent是全球首个心脏磁共振辅助诊断智能体AUC超0.93的临床级表现意味着它已经可以在辅助诊断场景中发挥实际价值。SoulAgent的节省30% Token成本值得关注——它通过用户画像自进化减少不必要的推理和冗余对话是AI Agent从能用到好用的关键一步。四、FlagOS 2.1解决多模型×多芯片适配难题4.1 中国AI产业的核心痛点中国AI产业面临一个独特的挑战多模型×多芯片的适配矩阵爆炸。维度数量主流开源大模型90国产AI芯片厂商18适配矩阵规模90×181620每个模型×芯片的组合都需要独立的算子适配、性能调优和稳定性验证这是巨大的人力投入。FlagOS 2.1的目标是模型发布即多芯适配。4.2 FlagOS 2.1核心升级指标FlagOS 2.0FlagOS 2.1芯片厂商12家18家芯片型号2032款算子总数400600主流开源大模型覆盖率75%90%多芯片部署手动适配发布即多芯适配新增配套工具FlagRelease Express高速镜像版本模型发布即同步多芯片版本FlagCICD首个AI多芯片开源集成测试发版平台自动化多芯片回归测试量智融合前沿布局将量子计算引入AI训练4.3 FlagOS 2.1 vs 其他智算软件栈维度FlagOS 2.1NVIDIA DGX Cloud华为ModelArts芯片覆盖18家厂商32款NVIDIA专属昇腾专属模型覆盖90%开源模型全系列NVIDIA优化华为生态模型开源属性完全开源闭源部分开源核心价值多芯片统一部署极致NVIDIA性能昇腾深度优化FlagOS 2.1的独特价值在于中立性——它不绑定任何一家芯片厂商而是做AI芯片领域的Android。五、智源开源生态全景指标数据开源模型总数200全球总下载量10亿悟道系列早期大模型中文NLP为主悟界系列世界模型具身智能科学发现FlagOS智算软件栈多芯片适配代码共建者1.3万FAQQ1什么是世界模型它和语言模型有什么本质区别A世界模型的核心任务是预测下一个物理状态——给定当前世界的状态视觉、力觉、声音等感知输入和Agent的动作预测下一个时刻世界的状态。语言模型预测的是文本token的统计分布而世界模型预测的是物理世界的因果演化。简单说语言模型理解文字说什么世界模型理解世界怎么变。Q2Physis-v0.1和NVIDIA Cosmos 3有什么区别A两者都是世界模型但技术路线不同。Cosmos 3采用混合Transformer架构推理Transformer专家生成Transformer在像素层面生成物理场景视频Physis-v0.1采用物理隐空间表征不直接预测像素而是在隐空间中做物理推理。Physis的路线理论上更优雅先理解物理再生成但工程复杂度更高Cosmos 3的路线更实用直接生成视频即可用于机器人训练。Q3Brainμ1.0登刊Science意味着什么A这意味着AI脑科学交叉研究获得了顶级学术期刊的认可。Brainμ1.0的核心贡献是跨物种全模态脑信号统一编码——这是神经科学领域长期以来的未解难题。Science的审稿标准极高能登刊说明该方法在实验验证和临床价值上都有实质性突破。Q4FlagOS 2.1覆盖18家芯片厂商32款芯片包含哪些A智源未公布完整芯片列表但据公开信息推测包括华为昇腾、寒武纪、海光DCU、燧原GCU、壁仞、沐曦、摩尔线程、天数智芯、百度昆仑芯、灵汐、清华大学等国产AI芯片以及部分NVIDIA/AMD型号。FlagOS的中立性使其成为国产AI芯片生态的关键基础设施。Q522岁北大本科生陈博远为何能担任Physis负责人A据智源官方介绍陈博远2004年出生在物理AI和世界模型方向上展现了极高的研究天赋。智源研究院实行以能力定岗位的机制不按资排辈。这也体现了中国AI研究机构在人才选拔上的灵活性。参考资料智源研究院院长王仲远2026年研究进展报告 (2026-06-12)腾讯新闻《第八届北京智源大会开幕智源发布悟界系列大模型与FlagOS 2.1》 (2026-06-12)腾讯新闻《智源研究院发布通用世界基座模型悟界·Physis-v0.1》 (2026-06-12)腾讯新闻《2026北京智源大会开幕从「悟道」到「悟界」》 (2026-06-12)QQ新闻《全新世界模型悟界·Physis将开源22岁北大本科生担任负责人》 (2026-06-12)