我在 Cursor 里用了一天 Sonnet 5，试了三件事

张

张建站

2026/7/3 11:51:09

10分钟阅读

Anthropic 又半夜发东西了。这次是 Claude Sonnet 5。就今天。Cursor 同步上线，已经在设置里可以切了。数据上，Cursor 官方说的是 CursorBench 从 Sonnet 4.6 的 49% 跳到 57%。SWE-bench Verified 跑到了 85.20%。部分 Agent 任务直接逼近 Opus 4.8。乍一看是个常规升级。但有几个数字细看一下挺有意思。怎么讲呢，主要是 8 个百分点这个数。乍看不大，细想不小。CursorBench 涨了8个百分点，什么概念CursorBench 不是那种「AI做了道LeetCode题」的竞赛榜单。它是 Cursor 自己搞的测试，全是不明确的、跨多个文件的任务。模拟的是你真正在用AI写代码时遇到的那种情况。不是「写一个排序算法」，是「这个文件改了之后，另外三个文件也得跟着改，但你得自己判断改哪」。说实话，这种测试才接近真实开发场景。从 49% 到 57%，涨了 8 个百分点。看着不多，但在这个量级每涨一个点都不容易。而且 57% 意味着超过一半的复杂多文件编程任务，AI可以自己搞定了，不需要你一条条交代。我觉得这才是真正应该关注的数字。不是它比上一代强了多少，是它到了「大部分真实任务能自己跑通」的临界线附近。关键是 Agent 能力这次升级宣发重复最多的词是 Agent。Sonnet 5 能制定计划。调用浏览器。操作终端。自己做判断然后执行。不是「你问它答」的模式。是「你交代目标和约束，它想办法完成」。这个跟前两天我们聊的那个话题完全对上了。从「跟AI聊天」到「让AI自己干活」那一步。Anthr

老旧iOS设备性能优化：系统降级与越狱定制技术指南

老旧iOS设备性能优化：系统降级与越狱定制技术指南【免费下载链接】Legacy-iOS-Kit An all-in-one tool to restore/downgrade, save SHSH blobs, jailbreak legacy iOS devices, and more 项目地址: https://gitcode.com/gh_mirrors/le/Legacy-iOS-Kit 面对…...

2026/7/3 11:44:35 阅读更多 →

告别绘图软件学习成本！paperxie 一站式 AI 科研绘图页面实操全解

paperxie-免费查重复率aigc检测/开题报告/毕业论文/智能排版/文献综述/科研绘图科研绘图 - PaperXie智能写作PaperXie免费论文查重检测-首款免费论文检测软件,为毕业生提供专业的论文重复率检测、论文降重、Aigc检测、智能排版、论文写作等一站式服务。https://www.paperxie.c…...

2026/7/3 11:40:06 阅读更多 →

嵌入式系统按键优化：74HC32与PIC18F85J50智能方案

1. 项目背景与核心需求在嵌入式系统开发中，按键输入是最基础也最频繁使用的人机交互方式之一。传统方案通常直接将机械按键连接到微控制器的GPIO引脚，但这种方式存在两个显著问题：一是按键抖动会导致误触发，二是占用宝贵的IO资源。…...

2026/7/3 11:38:22 阅读更多 →

棋牌室茶楼收银别只看价格：京东收银K6收银机为什么值得小店老板优先了解

棋牌室茶楼收银别只看价格：京东收银K6收银机为什么值得小店老板优先了解棋牌室、茶楼老板选收银机，常见问题不是“能不能收钱”，而是开台计时别算错、会员储值别记混、团购核销别卡住、茶水小食别漏单，营业结束后还能把账看清楚。…...

2026/7/3 4:15:01 阅读更多 →

Claude 桌面版深度使用技巧指南

一、文件分析的高阶技巧1. 截图与设计稿的精确提问法不要只丢一张图说“帮我看看”。带指令地上传效果倍增：像素级评审：“以 iOS 设计规范为标准，检查这张截图的间距、字号和颜色一致性，标出具体坐标。”信息提取：“把…...

2026/7/3 4:11:13 阅读更多 →

【Claude】Request timed out 请求超时报错已解决

【Claude】Request timed out 请求超时报错已解决关键词：Claude Code、Request timed out、API_TIMEOUT_MS、请求超时、网络代理、自动重试、Waiting for API response一、问题现象：一行干巴巴的超时 Claude Code 干着干着，终端冒出极简的一行…...

2026/7/3 4:13:55 阅读更多 →