刚刚月之暗面 Kimi K2.7 Code 正式发布同步在 HuggingFace 开源。token 消耗降了30%代码能力全面提升想得更少写得更好。月之暗面把 K2.6 的编程短板补上了一块大的长上下文指令遵循、长程任务完成率都明显提升Agent 自主执行能力也跟着涨了约10%下周一还有5到6倍输出速度的高速版上线。代码能力跃升K2.7 Code 代码基准测试成绩都很亮眼。Kimi Code Bench v2 覆盖10余种主流编程语言和完整生产技术栈任务来自内部工程需求、线上生产事故、真实开源项目偏后端、基础设施、性能调优、安全、前端和 ML 数据工程。Program-Bench 更硬核给模型一个编译好的二进制文件加文档不给源代码不给反编译不给联网模型要自己选语言从零写出行为等价的程序每道题有超过24.8万个模糊测试用例来验证对不对。MLS Bench Lite 考察 AI 能否发明可泛化、可扩展的机器学习方法涵盖 LLM 预训练、后训练、机器人、世界模型、视觉、强化学习、优化、ML 系统和 AI for ScienceAgent 有5小时探索时间再提交方案。Kimi Code Bench v2 从50.9涨到62.0提升21.8%。Program-Bench 从48.3涨到53.6提升11%。MLS Bench Lite 从26.7涨到35.1提升31.5%。跟 GPT-5.5 和 Claude Opus 4.8 比一比更直观。Kimi Code Bench v2 上K2.7 Code 拿62.0分GPT-5.5 是69.0Opus 4.8 是67.4差距在缩小。MLS Bench Lite 上K2.7 Code 的35.1分已经逼近 GPT-5.5 的35.5分。三项 Agent 基准测试K2.7 Code 相比 K2.6 提升约10%。Kimi Claw 24/7 Bench 评估多天持续协作的长程 Agent 任务覆盖软件工程、ML 研究、招聘、交易、营销等17个专业场景610个评估点所有任务通过 OpenClaw harness 执行最终得分取3次运行的平均通过率。MCP Atlas 测的是 LLM 在真实工具调用任务中的表现基于可扩展的 MCP 协议每轮最多100次工具调用、32K token 上限成绩取3次平均。MCP Mark Verified 是人工验证版的 MCPMark在 Notion、GitHub、Filesystem、Postgres、Playwright 五个真实服务器环境里考察 MCP 工具使用能力每步最多100次调用、32K token 上限也是3次平均。Kimi Claw 24/7 Bench 从42.9涨到46.9。MCP Atlas 从69.4涨到76.0。MCP Mark Verified 从72.8涨到81.1。在工具调用场景里K2.7 Code 已经部分跑到 Opus 4.8 前面了。K2.7 Code 在 MCP Mark Verified 上超过了 Claude Opus 4.8 的76.4分。更快更省K2.7 Code 有一个很实用的改进减少了长程任务中的过度思考倾向平均 token 消耗比 K2.6 减少约30%。用更少的 token 达到更高的性能。模型架构沿用 K2.6 的 MoE 设计总参数1T激活参数32B384个专家每次选8个1个共享专家上下文长度256K token。视觉部分搭载 MoonViT 编码器400M 参数支持图片和视频输入。模型已采用原生 INT4 量化在 HuggingFace 上以 Modified MIT License 开源支持 vLLM、SGLang、KTransformers 部署。价格和 K2.6 保持一致1M token 标准输入6.5元输出27元命中缓存的输入价格调整为1.3元。企业和开发者可通过 platform.kimi.com 调用 APIKimi Code Plankimi.com/code的默认模型也已升级为 K2.7 Code。使用有一个硬性要求K2.7 Code 必须开启思考模式Thinking才能发挥最佳性能。Kimi API 和 Kimi Code 默认开启手动关闭的话 API 会报错Kimi Code 会回退到 K2.6 模型。非编程任务官方仍然推荐用能力更全面的 K2.6。6月15日K2.7 Code 高速版上线同一个模型输出速度约为普通版的5到6倍常规编程场景约180 Token/s短上下文场景可达260 Token/s6倍速度2倍价格。参考资料https://huggingface.co/moonshotai/Kimi-K2.7-Codehttps://platform.kimi.com/docs/guide/kimi-k2-7-code-quickstart