首页
学习
活动
专区
圈层
工具
发布
社区首页 >专栏 >Agent Harness

Agent Harness

原创
作者头像
lpp31
修改2026-06-11 17:29:07
修改2026-06-11 17:29:07
1090
举报
文章被收录于专栏:前端小羊前端小羊111222444

Agent Harness(智能体驾驭层/运行框架)​ 是包裹在大模型(LLM)之外、让它能真正执行任务而非只"说"不"做"的那整套工程运行时基础设施。

业界共识公式:Agent = Model(大模型)+ Harness(驾驭层)


🐎 为什么叫 Harness?

英文原意是"马的挽具/马具"——把野马(强但不受控的 LLM)套上挽具,把它的力量导向拉车干活。裸 LLM 只会 text-in → text-out,说"我想调搜索工具"但不会真去搜;Harness 负责解析意图→真正执行工具→把结果塞回上下文→驱动下一轮,形成 Plan-Act-Observe 闭环。


🔧 Harness 通常包含什么

组件

职责

编排循环(Agent Loop)​

驱动模型多轮调用,判断继续/终止/回退

工具路由与执行​

解析 function_call,真正调 API/读文件/跑代码

上下文 & 记忆管理​

短期对话 + 长期记忆,含压缩/召回/裁剪(Context Engineering)

状态持久化​

任务进度、Checkpoint、断点续跑

沙箱 & 执行环境​

代码在哪跑、资源隔离、防删库

Guardrails / HITL​

危险操作拦截、人工审批节点

可观测性​

全链路追踪每步输入/输出/工具调用

狭义上 Harness 指执行引擎(驱动循环+工具调度);广义上常把 Scaffolding(System Prompt、工具描述、输出格式等模型可见的规则层)也纳入,即"模型之外的一切"。


🆚 与 Scaffolding 的区别

  • Scaffolding(脚手架/规则层):模型能感知到的部分——System Prompt 怎么写、有哪些工具描述、输出格式要求。决定模型"怎么想"。
  • Harness(驾驭层):模型感知不到的执行部分——调模型、解析输出、执行工具、管理状态、重试/超时。决定 Agent "怎么跑"。

🏗️ 类比帮助理解

  • Model = CPU,Harness = 操作系统(OS)——CPU 再强没有 OS 也跑不了应用
  • Model = 主厨大脑(决定怎么做菜),Harness = 厨房+炉灶+帮厨(真正点火翻面装盘)
  • Claude Code / Cursor Agent / OpenCode 本质上就是围绕某模型构建的 Agent Harness,所以同一模型配上不同 Harness 体验差异巨大。

一句话:Harness 就是把"会说话的大模型"变成"能干活的自主智能体"的工程运行时。​ 你之前问的 AI 开发三阶段里,Harness 阶段正是从"写好 Spec"演进到"构建这套可靠的运行系统让 Agent 自主完成任务"。

如果想看最小可运行的 Harness Loop 代码示例(Python 伪代码),我可以给你写一版 👍

原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。

如有侵权,请联系 cloudcommunity@tencent.com 删除。

原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。

如有侵权,请联系 cloudcommunity@tencent.com 删除。

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • 🐎 为什么叫 Harness?
  • 🔧 Harness 通常包含什么
  • 🆚 与 Scaffolding 的区别
  • 🏗️ 类比帮助理解
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档