Q主持人投资人CAlexanderBericosOpenAI Codex 产品负责人来源youtube访谈视频Mixlab 编辑团队整理优化导语OpenAI Codex 产品负责人 Alexander 在本期访谈中从投资人、从业者与产品构建者三重视角系统性地回答了关于 AI 编程现状与未来的关键问题。他的核心观点反直觉却有力AI 不会消灭程序员而是会让写代码这件事变得基础到近乎透明 —— 真正的瓶颈是人类自己愿不愿意张嘴、愿不愿意定义任务。此外他透露 Codex 自 GPT-5.2 以来用户量增长20 倍并预告未来将重新押注云端产品。为什么人类打字速度才是 AGI 的真正瓶颈Q你之前说过人类打字速度和验证工作是比模型算力或架构更关键的 AGI 瓶颈。这是什么意思C让我先问你你现在每天使用 AI 多少次Q三十多次吧。C如果完全零成本你认为 AI 每天能帮你多少次Q我觉得应该全天候运行在所有事情上。C没错。现在 OpenAI 内部的工程师基本上 Codex 从不关机甚至在开会时都开着因为Codex 没活干就等于在浪费时间。但问题是我明知 AI 能帮我做所有事我却懒得打那么多 prompt也想不出所有它能帮我的场景。所以我每天用 AI 的次数和你差不多。我认为 AI 应该每天帮助我们成千上万次但人类的输入成本太高了。大多数人不可能为了用好 AGI 而去学怎么写 prompt。真正理想的世界里你不需要想AI 能帮我什么它就是知道你的上下文然后适时出现。a16z是时候重新设计我们的工厂了。三阶段路线图Codex 想走完的 AI 开发演进C如果形象地描述我认为有三阶段第一阶段让 AI 代理先把软件工程和编程做好因为 LLM 本身就很擅长编程。第二阶段让 AI 代理能操作电脑毕竟编程是 AI 操作电脑最好的方式。然后让所有有好奇心、愿意探索的人都能用上这些工具。第三阶段等我们看清什么模式有效了再做高度产品化的事情让用户开箱即用。我们正在加速这个全过程。Agent Team从零构建 Claude Code Agent 工作流AI 不会让程序员消失就像高级语言没消灭软件工程师QElon Musk 说编程是第一批被大规模自动化的职业你同意吗C我同意编程是 LLM 最先擅长的领域之一。但自动化这个词太重了。举一个例子我们现在不写汇编了转向了高级语言你会说编程被自动化了吗显然不是。我们只是能写多得多得多的代码结果反而需要更多软件工程师。历史上也是如此computer 这个词最初指的是人在 Bletchley Park 帮 Enigma 机器打孔卡的人。第一代电子表格软件的设计逻辑其实就是把人组织成网格、做表格计算再往下传递。那些具体任务都被自动化了但每一次自动化都带来了需求的爆发反而需要更多人。所以 5 年后程序员会更多不会更少。只不过程序员的定义可能会变——人才栈已经在压缩了以前有前端工程师、后端工程师现在越来越全栈。品味、审美有多重要 人的能力 A...为什么 PM 在 AI 时代看起来没那么必要Q你自己是 PM你觉得 AI 时代还需要 PM 吗C笑这是个玩笑但我来认真回答。PM 的角色本质上是未定义的它的目标是适配团队和业务当下的需求。在小团队里一个强的技术领导者或一个有产品思维的设计师其实就能完成大部分 PM 工作。你可能不需要很多人做 PM直到团队变得很大。但这不意味着 PM 会消失而是说这个岗位的门槛在变高。Mixlab AI训练营#菜单内部代码有多大比例是 Codex 写的Q现在 OpenAI 内部代码有多少是 Codex 生成的C没有具体百分比但我可以说绝大部分代码是 AI 写的。大部分人现在甚至不再打开 IDE 了。这个转折点发生在GPT-5.2 Codex去年 12 月模型在长程任务、端到端处理、上下文管理和指令遵循上突然好了一个台阶。之前我们是在用 AI 做 tab 补全或结对编程程序员还是得守在键盘前之后我就直接委托任务给它了跟它一起定计划、定规范然后让它自己跑。这就是为什么我们发布了 Codex App我们想要一种委托式而非结对式的交互体验。可以同时委托多个代理可以高效管理符合真正的人机工效。计划审查正在变得比代码审查更重要C在委托模式下针对规范和计划的审查比代码审查更重要。我们最近上线了一个计划模式agent 先跑出去生成一个很长的计划然后问你你同意我这么做吗或者有什么要调整的。这很像团队里新来的同事在动手之前要向团队提交一份Request for Comments。所以 review the plan 的能力变得极其关键——它比 review 代码本身更被低估。至于代码审查Codex 被专门训练过做这件事而且效果非常好它的批评信号噪声低你真的可以信任它的反馈。我们几乎所有代码都会自动经过 Codex 审查。企业级 AI 落地自上而下 vs. 自下而上Q有一种声音说企业落地 AI 必须靠 FDE现场交付工程师你不同意C如果你一开始就搞大而全的 workflow 自动化你得穿透所有安全合规障碍、对接所有数据系统这个工程量巨大确实需要 FDE。但代价是你严重低估了 AI 在这家公司的实际潜力。更好的方式把 AI 直接交到干活的人手里。让他们同时用 AI 干活、同时被 AI 部分替代这样他们会对 AI 形成真正的掌控力知道这东西怎么工作、边界在哪而不是面对一个黑盒子束手无策。想象一下你是一个客服专员AI 正在自动化你部分工作但你从来没听说过 ChatGPT也不被允许用它。你对 AI 完全没感觉。但如果同时你自己也在用 ChatGPT 处理工作你就感觉是被赋能而不是被替代。OpenAI 正在构建一个浏览器内核Browser Atlas原因之一就是企业里有大量工具系统目前还没有 AI 原生的 FDE 接口但它们都在浏览器里运行。通过控制浏览器我们可以给企业做一个安全的 agentic browsing 层不需要任何 FDE 介入。重新定义生产力的“AgentOS”#MIXLAB 零基础AgentOS训练营速度很重要但护城河不是推理垄断QCodex 跟 Cerebras 合作Cerebras 是最快的推理提供商。这个合作很重要但我认为推理不会是垄断的——竞争太激烈了一定会有多个答案。C完全同意。但 GPT-5.3 Codex 模型效率确实显著提升用户反馈它比之前快很多。除了模型本身的优化我们在 inference 层面也做了改进API 层面的模型服务快了 40%Codex 端快了 25%。速度非常重要我们从硬件和模型两个维度同时推进。用户留存为什么 Codex 押注开放标准Q你们怎么防止用户转向 Cursor 或 Claude CodeC我们采取了一个反直觉的策略尽量让切换变得容易。比如我们发起并推广了agents.md这个开放标准让所有代理都能读取skills文件夹也没有命名为codex-skills而是中立的agents这样任何代理都能用。编程任务本身是密封的代理读取 agents 文件、写好 patch 提交到 git两端都是 vendor-neutral 的所以迁移成本低。但当代理开始接入更多系统Google Docs、各种企业工具迁移成本就高了连接代理到一个系统本身就是一个信任决策企业会非常慎重。这就是真正的留存点。核心指标不是收入而是活跃用户Q你跟 Sam 或 Brad 汇报时核心指标是什么C活跃用户不是收入。我们目前用周活跃用户WAU但我同意 DAU 更适合——尤其当 Codex 在某种程度上正在取代 IDE 时 daily active 才是正确的衡量标准。理想状态是对于任何任务你的本能反应是去问一个代理。就像现在用 Google 搜索一样自然——我要做什么事我就去这个文本框。Chat 会不会是 AI 的终极 UIQ对大多数普通人来说 chat 效率太低browser-based discovery UI 才是未来。你怎么看C我的答案是肯定的但也分两层。第一层对话式界面会是核心支柱。你可以把它加进任何群聊它就能发现怎么帮你。这类似于 Slack 当年成为信息流转中心的方式——虽然理论上在文档里评论、在正确的时间戳标注视频才是更高效的但 Slack 的我就想发个消息给你的交互摩擦极低人们就是会去那里。第二层对于深度用户GUI图形界面依然重要。就像高管助理的场景——你需要亲自翻看会议记录、自己编辑。不同场景用不同界面chat 和专用 GUI 会配对使用。对创业者和投资人的建议什么不会被 AI 替代QSaaS 是不是都要被颠覆了Salesforce、ServiceNow 跌了 20-40%。C我认为这个反应过度了。关键问题是这个 SaaS 公司是否拥有与终端用户的真实关系是否拥有某个重要的系统 of record数据记录系统如果拥有这两者实际上比以往更重要。但如果是纯粘合层——两边都不沾那就危险了。客户支持Customer Support我是真的认为会被大幅渗透。对于创业者来说因为现在 building good product 变容易了你不能只靠我会做产品这件事。真正稀缺的是agency主动性、品味和质量以及对特定客户的深度理解。看好的领域涉及复杂物理基础设施的fintech 和银行集成这种难做的金融产品——OpenAI 不太可能去和东南亚 500 家银行建立关系。给 CS 学生的建议Q如果你面对一个斯坦福、剑桥、ETH 的 CS 学生你会说什么C这是做工程师最好的时代。你有不可思议的工具能以前所未有的速度理解阅读大型代码库你可以问 AI 关于代码库的几乎任何问题让它帮你规划可能原本要研究好几天的改动。但找工作的竞争也更激烈了。你需要展示你的品味做出真正高质量的东西然后分享出来。当有人给我发邮件附上一个有意思的项目链接这比简历更让我注意。Dropbox 教会我什么C在 Dropbox 我学到最重要的一课是做工具必须把它当作参与系统来设计。如果你的工具不能让用户觉得这就是最简单的方式他们就是不会用。Slack 就是一个例子——理论上在文档里评论更高效但 Slack 有巨大的引力人们就是想去那里聊。现在做 Codex agents 也是同理如果你把它们纯粹做成工作流自动化就必须雇 Accenture 来部署 FDEs。但如果你能做出一个人们就是喜欢用的东西哪怕只用来做部分任务——用户会越来越好、越来越深然后你再接入更多工具和自动化。这才是正确的顺序。未来 10 年最让我兴奋的事C我加入 OpenAI 时最强的感受是模型已经很强但普通人完全用不上。技术能力过剩产品没有跟上。我最期待的是让 AI 帮助每一个人而不只是科技人。具体愿景有一天我们会在家庭 WhatsApp 里加一个代理它自己就开始有用——不需要任何人去配置它就像家里突然多了一个很会做事的人。Quick Fire过去 12 个月你最后悔没预料到什么我以为多模态视频、音频的进展会更快以为 AI 会主要通过这些方式进入普通人生活。实际上通过代码操控电脑的代理才是正道多模态的进展比我预期的慢得多。最欣赏的小竞争对手Amodo来自 Source Graph 团队的 AMP。他们的产品口碑极好而且他们推动了agents.md和agents/skills的标准化这对整个生态贡献巨大。最艰难的产品决策之前 Codex Cloud 是无限使用模式我们知道拖太久很难收回但一直忙于更有 PMF 的产品。当我们终于改成合理限额时遭遇了大量用户反弹——哪怕只有一小部分人觉得应该永远免费但社交媒体上的声音影响了所有人。定价和条款grandfathering是极难的事。五年后回看今天什么会觉得最荒谬手动编辑代码、手动管理 CI/CD 和部署流程。未来会有一个完全 AI 托管的技术栈新公司起步的方式就是去问一个 agent帮我建一家公司然后不断往里加 agent。飞书推出CLI #MIXLAB 零基础AgentOS训练营Mixlab AI训练营#菜单