从Prompt→Context→Harness Engineering，聊聊过去三年的变与不变

张

张建站

2026/4/17 1:54:15

10分钟阅读

从Prompt→Context→Harness Engineering，聊聊过去三年的变与不变

2026年初AI圈和OpenClaw一起爆火的有一个晦涩难懂的新词儿叫做Harness Engineering。这是一个复杂而抽象的概念各种中文翻译都得其意不得其神。我并没有纠结于这个概念在中文圈子应该叫什么而是在过去的两年多一直在身体力行地实践Harness如何设计好一个SystemPrompt如何定义并优化一个Skill使其效果性能做到极致如何用好ClaudeCode如何用AI重塑团队协同开发的效能如果用AI Agent引擎在各种工作场景中造出一个又一个的符合上岗需求的“人” 每当回顾自己的这些工作从最初针对模型API调优PEPrompt Engineering到后来结合RagMCP文件系统的CEContext Engineering调优再到现在为“龙虾们”构建环境的最优解。有一个问题一直在我脑子里打转从PE→CE→HE→*E变的是什么不变的又是什么这几天总算腾出点时间来码码字系统思考下这个问题。想通了才发现这三个词其实在说同一件事。它们只是在不同的高度望向同一个问题。那个始终没变的东西先说答案。这三年不管圈子里造了多少新词、发了多少论文、开了多少发布会我们真正在解决的问题从头到尾只有一个怎么让 AI 在该做决定推理的那一刻脑子里上下文里刚好装着对的东西。就这一件事朴素到不能再朴素。仔细想想在输入框里加一句Let’s think step by stepPE准确率涨了。这是在干嘛是在通过措辞把请一步步想这个信息塞进模型的脑子。一个 RAG 系统从向量库里拉出三段文档拼进上下文是在干嘛是在通过管道把这个问题相关的背景知识塞进模型的脑子。给 Agent 配好工具权限、错误恢复机制、质量评估流程是在干嘛是在通过环境设计确保模型在每一步决策时既看得到该看的又做不了不该做的。手段完全不同。目的一模一样。Harrison Chase 说 Context Engineering 是在正确的时机、以正确的格式向模型提供正确的信息和工具。这个定义其实不只适用于 CE把信息和工具换成措辞就是 PE换成整个运行环境就是 HE。三个词一个内核。像三层同心圆圆心始终没动。我跟很多做 AI 应用的朋友聊过这个判断他们的反应出奇一致先愣一下然后说对好像确实是这样。有个做 RAG 的哥们说得更直接“我每天干的活换了三遍说法但我打开电脑之后解决的问题从来没换过。”这个不变重要吗我觉得非常重要。因为它意味着我们没有在原地打转。三年了问题没变说明这个问题是真问题不是被炒作出来的伪命题。它不会因为下一个新词的出现而消失不管 2027 年这个东西叫什么 Engineering它要解决的还是同一件事。但如果问题没变为什么要换词因为变的是别的东西。变的第一层你在调什么最直观的变化是操作对象变了。Prompt Engineering 时代你调的是措辞。字面意思就是改字。“你是助手改成你是一个有二十年临床经验的主治医师”回答就变专业了。给两个例子格式就对了。温度调 0.7XML 标签包起来system prompt 要这么写不能那么写。LinkedIn 上有人给 Prompt Engineer 标了 30 万美金年薪。社区里到处是秘籍。那段时间有一种我掌握了魔法咒语的快感。你跟模型之间的关系就像给一个极其聪明但对你一无所知的人写信。信写得好他就表现好信写得差他就跑偏。整件事的关键就在你笔下的那几十个字。Context Engineering 时代你调的是信息流。哪些文档该喂进去、什么时候喂、以什么格式喂、上下文窗口快满了怎么取舍。Shopify 的 CEO Tobi Lütke 在推上写了一句“I really like the term ‘context engineering’ over prompt engineering”Karpathy 转了加个1一个词就立住了。为什么因为2024年所有人都憋了一年没说清楚的感觉被这个词戳中了我们管的根本不是话术我们管的是信息。Harness Engineering 时代你调的是整个世界。OpenAI 的工程师 Ryan Lopopolo 写过一句后来被引用无数次的话“Agents aren’t hard; the Harness is hard.” Agent 不难难的是围绕 Agent 的那一整套东西工具权限、纠错恢复、质量评估、状态持久化、安全护栏。你不是在调一个输入你是在造一个 Agent 能活在里面的世界。从字到信息流到环境。操作粒度在变大操作对象在升维。但注意这三层不是替代关系是套娃。HE 包着 CECE 包着 PE。你在设计 harness 的时候上下文管理是其中一个子系统你在管上下文的时候prompt 怎么写是其中一个细节。不是 PE 过时了是 PE 被装进了更大的框架里。就像学会了系统架构不代表不用写好代码只是写代码变成了更大图景里的一个局部。变的第二层你是谁比操作对象更深的变化是操作者的角色变了。PE 时代你是操作员。亲手打磨每一句话一个字一个字试改了再改。像手工匠人活儿好不好全凭手艺你的全部武器就是你的遣词造句。CE 时代你是信息管理员。你不再逐字斟酌而是在更高的层面做选择这个信息该不该让模型看到什么时候看到以什么格式看到上下文窗口从 4K 涨到 100K 再到 1M但能塞和该塞完全是两回事。你把 100 页文档一股脑倒进去模型反而更容易忽略关键信息。研究发现信息放在开头还是中间效果差距巨大。你不可能通过给一个人更多参考资料来让他做出更好的决策。资料太多淹没了。重点是哪些资料、什么顺序、什么时候给。这是管理员的活不是操作员的活。HE 时代你是架构师。你甚至不直接管信息了你设计规则和环境。Agent 能调哪些 API危险操作需不需要人签字写错代码了怎么回滚卡了二十分钟谁来叫停Anthropic 做过研究结论挺扎心的模型没法可靠地评估自己的输出你得另外安排一个评委。OpenAI 自己踩过的坑特别说明问题他们发现最大的障碍不是模型笨是环境没定义好。Agent 的能力在那儿摆着但它缺少完成目标所需要的工具和结构。然后他们发现了一件反直觉的事约束越多Agent 反而干得越好。不是那种五十页操作手册的约束。规则太多跟没规则一样Agent 要么全忽略要么开始优化错误的目标。但如果你把约束做成结构化的比如linter 自动检查、CI 流程卡控、权限分级。这样Agent 的解空间缩小了反而更容易找到正确路径。这跟管人一模一样。你不会给一个优秀工程师写五十页操作手册。你给他清晰的架构规范、可靠的测试流程和及时的 code review然后闭嘴让他干。好的管理者从来不是控制欲最强的那个人而是环境设计得最好的那个人。操作员 → 信息管理员 → 架构师。每退一步离具体操作更远离这个世界应该长什么样更近。人并没有变得不重要。恰恰相反——人的杠杆在变大。操作员影响的是一次对话的质量信息管理员影响的是一个任务的成败架构师影响的是一整个系统的上限。你每后退一步你的一个决策所波及的范围就大一个量级。变的第三层为什么必须变前两层回答了变了什么。但更重要的问题是为什么必须变不是因为人闲着没事爱造新词。是因为问题的规模在膨胀。PE 时代AI 的典型任务是回答一个问题。一轮对话一进一出。你精心写好 prompt它给你一个回答完事。这个尺度下打磨措辞就够了。但当你试着让 AI 处理一个真实的工作任务需要查十份文档、对比三个方案、参考上周的对话记录。你会发现一条 prompt 塞不下这些东西。你精心设计的措辞面对真实世界的复杂度就像拿一张便签纸去指挥一场战役。不是 prompt 写得不好是 prompt 这个容器太小了。所以 CE 出现了。它把容器从一句话扩展成一整套管道RAG、记忆系统、动态上下文组装。能应付的复杂度上了一个量级。但很快又撞墙了。因为 AI 开始干一件更新的事不只是回答一个问题而是持续工作好几个小时。写代码、跑测试、查 bug、提 PR。一个任务分十步每步要用不同的工具中间可能走进死胡同需要回退。这时候光让模型看到对的信息不够了。它还需要知道能干什么、不能干什么、错了怎么办、谁来判断它干得好不好。信息管理解决不了这些。你需要设计的是一个环境。所以 HE 出现了。看到规律了吗不是新词在追时髦是问题的复杂度在逼着解法升维。一个问题、一个回答措辞就够了一个任务、多轮交互得管好信息流一个目标、持续运行你得造一个世界问题没变问题的规模在变。规模一变同样的内核就需要更高维度的解法。这才是三个词背后真正的逻辑不是否定前一个是在更大的尺度上重新发明同一个东西。就像你学会了给一个人写备忘录然后发现要管一个团队得建信息系统再然后发现要管一家公司得设计组织架构。备忘录过时了吗没有它被包进了信息系统里。信息系统过时了吗没有它被包进了组织架构里。每一层都在只是变成了更大框架的一个局部。所以当有人问我PE 是不是过时了我的回答是PE 没有过时PE 被装进了 CE 里CE 也不会过时CE 被装进了 HE 里。你在设计 harness 的时候上下文管理是其中一个子系统你在管上下文的时候prompt 怎么写是其中一个细节。就像学会了系统架构不代表不用写好代码只是写代码变成了更大图景里的一个局部。他们是套娃不是接力棒。一个让人眩晕的推论写到这里其实可以收了。三个词、一个问题、解法在升维这个结论已经够清晰了。但我想多说一层。你有没有注意到这三年的变化有一条暗线我们以为自己在优化 AI 的能力但其实一直在优化 AI 所处的环境。PE 是在调整措辞模型的直接输入。CE 是在筛选信息模型的感知范围。HE 是在设计世界模型的整个生存空间。这让我想到柏拉图的洞穴。洞穴里的人只能看到墙上的影子以为那就是现实。走出洞穴的人看到了投射影子的火光和物体。再往外走看到了太阳本身。PE 是在调整影子的形状。CE 是在选择哪些物体放在火光前面。HE 是在设计整个洞穴光源的位置、墙壁的角度、什么东西能进来什么不能。这就引向一个让人有点眩晕的问题一个智能体的表现究竟在多大程度上取决于它自身使用的模型能力又在多大程度上取决于它被放置其中的环境三年前我们觉得答案是能力所以拼命调 prompt 去激发模型的潜力。三年后我们越来越倾向于环境所以开始造 harness造整个世界。也许智能从来不是某个主体的独立属性。它是主体与环境之间的一种共振。如果这个推论成立那我们花三年绕的这一大圈绕出来的不只是技术进步还有一个更深的认知你以为在调 AI其实在造世界。三年前写咒语现在造世界。问题始终是那一个。学AI大模型的正确顺序千万不要搞错了2026年AI风口已来各行各业的AI渗透肉眼可见超多公司要么转型做AI相关产品要么高薪挖AI技术人才机遇直接摆在眼前有往AI方向发展或者本身有后端编程基础的朋友直接冲AI大模型应用开发转岗超合适就算暂时不打算转岗了解大模型、RAG、Prompt、Agent这些热门概念能上手做简单项目也绝对是求职加分王给大家整理了超全最新的AI大模型应用开发学习清单和资料手把手帮你快速入门学习路线:✅大模型基础认知—大模型核心原理、发展历程、主流模型GPT、文心一言等特点解析✅核心技术模块—RAG检索增强生成、Prompt工程实战、Agent智能体开发逻辑✅开发基础能力—Python进阶、API接口调用、大模型开发框架LangChain等实操✅应用场景开发—智能问答系统、企业知识库、AIGC内容生成工具、行业定制化大模型应用✅项目落地流程—需求拆解、技术选型、模型调优、测试上线、运维迭代✅面试求职冲刺—岗位JD解析、简历AI项目包装、高频面试题汇总、模拟面经以上6大模块看似清晰好上手实则每个部分都有扎实的核心内容需要吃透我把大模型的学习全流程已经整理好了抓住AI时代风口轻松解锁职业新可能希望大家都能把握机遇实现薪资/职业跃迁这份完整版的大模型 AI 学习资料已经上传CSDN朋友们如果需要可以微信扫描下方CSDN官方认证二维码免费领取【保证100%免费】

从石墨烯芯片到简历微调：2026奇点大会硬核披露AI简历优化器底层架构（含3类Transformer轻量化部署路径）

第一章：2026奇点智能技术大会：AI简历优化器 2026奇点智能技术大会(https://ml-summit.org) 核心能力与技术架构 AI简历优化器是本届大会发布的开源智能体（Agent）系统，基于多模态大模型微调框架LLM-Resume v3.2构建&a…...

2026/4/17 1:54:14 阅读更多 →

别再乱接续流二极管了！用STM32驱动12V继电器，实测对比1N4007和肖特基二极管的区别

STM32驱动12V继电器：续流二极管选型实战与波形对比在嵌入式系统设计中，继电器控制电路看似简单却暗藏玄机。许多工程师都曾遇到过这样的场景：代码逻辑完全正确，继电器却莫名其妙地烧毁驱动芯片，或是系统出现难以解释的…...

2026/4/17 1:54:13 阅读更多 →

2026奇点大会AI健身计划全链路拆解（从多模态体态感知到个性化生成式训练处方）

第一章：2026奇点大会AI健身计划的范式跃迁与产业定位 2026奇点智能技术大会(https://ml-summit.org) 传统健身服务正经历从“经验驱动”到“多模态闭环智能体驱动”的根本性重构。2026奇点大会首次将AI健身计划定义为具备实时生理反馈、跨设备协同决策与个性化目标…...

2026/4/17 1:54:12 阅读更多 →

HagiCode Desktop 混合分发架构解析：如何用 PP 加速大文件下载籽

一、Actor 模型：不是并发技巧，而是领域单元 Actor 模型的本质是： Actor 是独立运行的实体 Actor 之间只通过消息交互 Actor 内部状态不可被外部直接访问 Actor 自行决定如何处理收到的消息 Actor 模型真正解决的是： 如何在不共享状…...

2026/4/16 0:30:59 阅读更多 →

从数据采集到回放验证：ADTF 适配 ROS 的 ADAS 测试实践饺

一、简化查询 1. 先看一下查询的例子 /// /// 账户获取服务 /// /// /// public class AccountGetService(AccountTable table, IShadowBuilder builder) {private readonly SqlSource _source new(builder.DataSource);private readonly IParamQuery _accountQuery build…...

2026/4/15 6:20:42 阅读更多 →