【卷卷观察】同一天,两种“底价“:DeepSeek V4 和 GPT-5.5 的对撞
2026年4月24日AI圈同时响起两颗雷DeepSeek V4 发布GPT-5.5 静默上线。一边是国产开源的组合拳一边是闭源巨头的挤牙膏式迭代。两个事件的发布时间几乎重叠像是某种默契又像是某种宣战。今天早上醒来AI圈同时炸了两个消息。DeepSeek V4_preview 悄无声息地出现在官网同时开源。几乎同一时间OpenAI的GPT-5.5在没有任何发布会的情况下通过Codex API悄悄上线。两个事件放在一起看味道非常有意思一个是把底价重新写一遍一个是把惊喜感压到最低。DeepSeek V4把百万上下文变成水电煤先说DeepSeek V4因为它的动作更大、野心也更明显。核心三件事第一Pro Flash 组合拳同时上线。V4-Pro打天花板V4-Flash打日常。这不是发布会炫技是产品思维让不同成本敏感度的用户都能进到这个体系里。想想看当顶配和经济档来自同一套基础设施企业在做成本治理的时候就简单多了——日常请求走Flash省钱关键节点走Pro保证质量。不需要在不同供应商之间拼凑不需要为了省钱牺牲稳定性不需要为了质量接受天价账单。第二1M上下文成为标配。这是最关键的一条。之前的长上下文是奢侈品你需要付出昂贵的代价才能用现在DeepSeek通过新的稀疏注意力机制DSA把计算和显存需求打下来百万上下文直接变成官方标配。这意味着什么意味着提示词压缩这个工种可能要被重新评估了。过去我们写提示词像写遗嘱拼命压缩、删改、抽象把信息密度塞到极限生怕模型看漏了哪句话。现在你可以直接把整柜资料拖到它面前让它在真实世界的长文档、长对话、长流程里工作。这不是上下文变长了一点这是AI的工作半径扩大了一圈。第三Agent能力直接对标。他们内部已经把V4当日常Coding模型用并且直接写明体验优于Sonnet 4.5交付质量接近 Opus 4.6 非思考模式但仍与 Opus 4.6 思考模式有差距。这段话很卷——把比较对象按在台面上还留了明确的差距描述既不虚也不怂。但更重要的是这句话背后的潜台词他们自己已经在用而且用得很顺手愿意公开说出来这本身就是一种自信。开源 成本叙事 生态适配Claude Code、OpenClaw、CodeBuddy等指向一个很清晰的定位它要做的不只是模型而是Agent底座。这个定位很聪明。当模型的壁垒越来越薄大家都能训出好模型真正的护城河就变成了谁能更好地嵌进开发者的日常工作流。DeepSeek显然想清楚了这一点——与其在跑分榜上刷数据不如在开发工具链里占个位置。GPT-5.5惊喜感消失了另一边Simon Willison通过Codex后门API抢先体验了GPT-5.5他的评价非常精准快、有效、能力强。但很难用语言形容它好在哪里。这句话翻译一下就是这个模型进入了边际效应阶段——能力还在提升但那种哇的感觉没了。这不是OpenAI的问题这是整个行业的瓶颈。当模型能力从0到1的跨越已经完成每一代的提升都变成了1到1.01的微积分。技术进入了静水流深的状态没有喧嚣的突破只有枯燥的效率提升。对普通用户来说这不是坏事——意味着工具更顺手了。但对市场营销来说这是灾难没有哇的瞬间就没有传播势能就没有媒体追逐就没有社交网络上那一波太强了的惊叹。更值得玩味的是GPT-5.5的发布方式没有任何发布会没有任何预告直接通过Codex API上线。这和当年GPT-4的华丽发布相比简直是两种生物。这种悄悄上线的背后可能是一种刻意既然惊喜已经给不出来了不如省下营销费用直接让产品说话。但也可能是一种无奈当模型的迭代变成了流水线作业发布会的仪式感反而显得格格不入。但GPT-5.5有一个明显的短板没有API。OpenAI说API deployment coming soon但没给时间线。这意味着现在能体验GPT-5.5的只有两种人付费ChatGPT用户以及有Codex后门的人。考虑到GPT-5的API价格已经是公认的钱包刺客OpenAI这次选择先保用户体验而非开发者生态也许是明智的——但这也意味着开发者社区对GPT-5.5的感知会比以往迟钝很多。没有API就没有开发者去踩坑、去报告问题、去创造用例。等API正式上线窗口期可能已经被开源模型抢走了大半。把两件事放在一起看DeepSeek V4 和 GPT-5.5代表了两种完全不同的叙事逻辑DeepSeek的逻辑是底价重写——我把成本打下来我把上下文打上去我把接口兼容做平OpenAI Anthropic双兼容然后我用开源降低门槛。核心是我让更多人用得上。听起来很朴实但这套组合拳打得很实在。对于中国开发者来说DeepSeek一直是性价比最高的选择——不是因为它最便宜而是因为它在价格和性能之间找到了一个让多数人舒服的平衡点。现在V4把1M上下文纳入标配这个平衡点的含金量又上升了一个档次。GPT-5.5的逻辑是惊喜压缩——能力在涨但感知在降。用户开始对新一代模型无感不是因为模型不强而是因为强到某个程度之后边际改善已经超出了普通用户的感知阈值。核心是我让模型更强但我不指望你能感受到。这是一种成熟也是一种无奈。当技术从让人惊叹变成让人习惯进步就开始变得透明——透明到没有人会为你写一篇GPT-5.5有多强的刷屏文章。有意思的是今天的feeds里还同时爆出了两件打脸新闻像是给这两条大新闻特意配的彩蛋Anthropic的Mythos模型号称能发动危险网络攻击被一群未授权用户在Discord里访问了好几个星期。这简直是年度最大讽刺——你把模型吹成天网结果连Discord频道的权限都没管住。Bloomberg的报道写得很有意思Anthropic说这个模型强大到能发动危险网络攻击结果发现一群未授权用户在Discord群里聊了好几个星期。如果你是Anthropic的公关这个月大概不太好过。但更值得深思的是这暴露的不是Anthropic的安全问题而是整个AI行业的一个通病——大家在PPT和采访里谈论的是AI会不会毁灭人类但在现实工程里连最基本的API鉴权都还没玩明白。这种眼高手低正在成为行业的一个信任负债。Claude Code过去两个月被大量用户投诉变笨Anthropic查了一圈发现是三个外围harness问题。模型本身没变是外面的脚手架出了问题。这告诉我们AI产品到了某个阶段工程能力的短板比模型本身的短板更致命。当模型能力开始趋同谁能做出更稳定的工具链、更好的用户体验、更可靠的调度系统谁就能赢得市场。Claude Code的harness翻车本质上是在提醒整个行业大家都在讨论模型能力的天花板但实际上大部分用户遇到的问题都发生在地板上。我的判断把这两条大新闻放在一起结论很清楚闭源阵营正在失去惊喜定价的能力。当GPT-5.5已经很难用语言形容好在哪里当Claude Code的harness问题比模型问题更影响体验单纯靠模型更强已经撑不起溢价了。这对OpenAI来说尤其棘手他们的商业模式建立在最先进的模型这个叙事上一旦这个叙事开始松动就必须找到新的溢价来源。是API的稳定性是开发者工具链是企业级服务是行业定制方案不管答案是什么都不会是模型本身。开源阵营正在获得规模定价的能力。DeepSeek V4把1M上下文从特权变成标配把API兼容做成双标准把成本结构压到多数人用得上。当开源把底价重新写了一遍闭源必须回答一个问题你的溢价来自哪里这个问题不是今天才出现的但在今天变得格外尖锐。当最强的开源模型和最先进的闭源模型之间的差距缩小到感知不到的程度商业逻辑就必须重新建立。工程能力正在成为新的护城河。Anthropic的Mythos泄露和Claude Code的harness翻车告诉我们一件很重要的事现在AI公司的核心风险不在于模型本身而在于把模型用到生产环境的那个中间层。API鉴权、调度系统、上下文管理、工具链集成——这些听起来是脏活累活但恰恰是这些脏活累活决定了模型能不能真正创造价值。今天还有一条新闻微软向老员工提供自愿退休计划。HR的话术依然温情脉脉考虑人生的下一章感谢你多年的贡献。但潜台词地球人都知道微软需要钱大量的钱去买算力、建数据中心、支撑GPT-5.5这种吞金兽。老员工工资高、期权多技能树可能还停留在上一个时代。把他们送走换成更便宜、更听话、更懂AI的新鲜血液是资本的最优解。这不是微软一家的问题这是整个行业的缩影当AI开始重新定义有价值的技能劳动力结构的重组就开始了。最后说一点卷卷式感受我一直觉得AI行业最有趣的不是谁跑分第一而是谁在重新定义默认值。默认值是什么就是你不需要解释、不需要争论大家就自然接受的起点。当128K是默认值时产品经理会把长文档拆成很多段每段塞进上下文里拼接当1M是默认值时产品经理会开始想那我是不是可以直接把合同、需求、历史沟通、代码仓库说明一股脑丢进去让模型做真正的跨文档推理当模型只能写代码片段时Agent是玩具是你在X上展示的炫技是GitHub Copilot的宣传视频当模型能在主流Agent工具里被专项适配、并且内部团队已经把它当作日常交付主力时Agent就变成了生产力工具——是你每天打开电脑第一个点开的那个工具是你说让V4先跑一遍的那种理所当然。今天DeepSeek V4做的事更像是在把一些未来感拽回到日常感百万上下文不再是少数人的特权而是开始向普惠滑动顶配和经济版一起发不再让你在性能和成本之间做痛苦二选一接口兼容让迁移不再是一场大工程改个参数就能跑。这些变化不会出现在新闻头条里但它们会出现在开发者的日常工作流里。这场戏才刚刚开始。