Agent Harness

原创

lpp31

修改于 2026-06-11 17:29:07

1090

文章被收录于专栏：前端小羊前端小羊 111222444

Agent Harness（智能体驾驭层/运行框架） 是包裹在大模型（LLM）之外、让它能真正执行任务而非只"说"不"做"的那整套工程运行时基础设施。

业界共识公式：Agent = Model（大模型）+ Harness（驾驭层）

🐎 为什么叫 Harness？

英文原意是"马的挽具/马具"——把野马（强但不受控的 LLM）套上挽具，把它的力量导向拉车干活。裸 LLM 只会 text-in → text-out，说"我想调搜索工具"但不会真去搜；Harness 负责解析意图→真正执行工具→把结果塞回上下文→驱动下一轮，形成 Plan-Act-Observe 闭环。

🔧 Harness 通常包含什么

组件	职责
编排循环（Agent Loop）	驱动模型多轮调用，判断继续/终止/回退
工具路由与执行	解析 function_call，真正调 API/读文件/跑代码
上下文 & 记忆管理	短期对话 + 长期记忆，含压缩/召回/裁剪（Context Engineering）
状态持久化	任务进度、Checkpoint、断点续跑
沙箱 & 执行环境	代码在哪跑、资源隔离、防删库
Guardrails / HITL	危险操作拦截、人工审批节点
可观测性	全链路追踪每步输入/输出/工具调用

狭义上 Harness 指执行引擎（驱动循环+工具调度）；广义上常把 Scaffolding（System Prompt、工具描述、输出格式等模型可见的规则层）也纳入，即"模型之外的一切"。

🆚 与 Scaffolding 的区别

Scaffolding（脚手架/规则层）：模型能感知到的部分——System Prompt 怎么写、有哪些工具描述、输出格式要求。决定模型"怎么想"。
Harness（驾驭层）：模型感知不到的执行部分——调模型、解析输出、执行工具、管理状态、重试/超时。决定 Agent "怎么跑"。

🏗️ 类比帮助理解

Model = CPU，Harness = 操作系统（OS）——CPU 再强没有 OS 也跑不了应用
Model = 主厨大脑（决定怎么做菜），Harness = 厨房+炉灶+帮厨（真正点火翻面装盘）
Claude Code / Cursor Agent / OpenCode 本质上就是围绕某模型构建的 Agent Harness，所以同一模型配上不同 Harness 体验差异巨大。

一句话：Harness 就是把"会说话的大模型"变成"能干活的自主智能体"的工程运行时。 你之前问的 AI 开发三阶段里，Harness 阶段正是从"写好 Spec"演进到"构建这套可靠的运行系统让 Agent 自主完成任务"。

如果想看最小可运行的 Harness Loop 代码示例（Python 伪代码），我可以给你写一版 👍

原创声明：本文系作者授权腾讯云开发者社区发表，未经许可，不得转载。

如有侵权，请联系 cloudcommunity@tencent.com 删除。

x11

原创声明：本文系作者授权腾讯云开发者社区发表，未经许可，不得转载。

如有侵权，请联系 cloudcommunity@tencent.com 删除。

x11

登录后参与评论

0 条评论

热度

Agent Harness

Agent Harness

🐎 为什么叫 Harness？

🔧 Harness 通常包含什么

🆚 与 Scaffolding 的区别

🏗️ 类比帮助理解

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐