Agent Harness(智能体驾驭层/运行框架) 是包裹在大模型(LLM)之外、让它能真正执行任务而非只"说"不"做"的那整套工程运行时基础设施。
业界共识公式:Agent = Model(大模型)+ Harness(驾驭层)
英文原意是"马的挽具/马具"——把野马(强但不受控的 LLM)套上挽具,把它的力量导向拉车干活。裸 LLM 只会 text-in → text-out,说"我想调搜索工具"但不会真去搜;Harness 负责解析意图→真正执行工具→把结果塞回上下文→驱动下一轮,形成 Plan-Act-Observe 闭环。
组件 | 职责 |
|---|---|
编排循环(Agent Loop) | 驱动模型多轮调用,判断继续/终止/回退 |
工具路由与执行 | 解析 function_call,真正调 API/读文件/跑代码 |
上下文 & 记忆管理 | 短期对话 + 长期记忆,含压缩/召回/裁剪(Context Engineering) |
状态持久化 | 任务进度、Checkpoint、断点续跑 |
沙箱 & 执行环境 | 代码在哪跑、资源隔离、防删库 |
Guardrails / HITL | 危险操作拦截、人工审批节点 |
可观测性 | 全链路追踪每步输入/输出/工具调用 |
狭义上 Harness 指执行引擎(驱动循环+工具调度);广义上常把 Scaffolding(System Prompt、工具描述、输出格式等模型可见的规则层)也纳入,即"模型之外的一切"。
一句话:Harness 就是把"会说话的大模型"变成"能干活的自主智能体"的工程运行时。 你之前问的 AI 开发三阶段里,Harness 阶段正是从"写好 Spec"演进到"构建这套可靠的运行系统让 Agent 自主完成任务"。
如果想看最小可运行的 Harness Loop 代码示例(Python 伪代码),我可以给你写一版 👍
原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。
如有侵权,请联系 cloudcommunity@tencent.com 删除。
原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。
如有侵权,请联系 cloudcommunity@tencent.com 删除。