首页
学习
活动
专区
圈层
工具
发布
社区首页 >专栏 >Agent Runtime:基于任务生命周期的云端解耦与按需计费架构

Agent Runtime:基于任务生命周期的云端解耦与按需计费架构

原创
作者头像
IT资讯研究所
发布2026-06-11 11:03:19
发布2026-06-11 11:03:19
1000
举报

传统架构与Agent运行特征的错配困境

当前企业部署智能体(Agent)面临核心架构冲突:主流的微服务与Serverless架构(如K8s容器、云函数Lambda) 与Agent的实际运行特征存在本质错配。Agent具有长生命周期(>30分钟)、需中间暂停等待用户确认、实时流式输出、断网/换设备不中断的特征,其生命周期应绑定在“任务”维度。

而传统架构的生命周期由通信层决定:Serverless Container由HTTP连接断开销毁,Lambda由函数return销毁(且存在时长上限)。二者均无法支持Agent的任务绑定需求,导致企业被迫做出5项妥协:

  1. 成本浪费:使用长连接维持实例不回收,付费与实际计算比例约为 18:1
  2. 任务中断风险:连接断开即任务终止,用户离开页面会导致中间状态全部丢失。
  3. 冷启动劣化:状态持久化上移至业务层,NFS挂载耗时 5-6秒
  4. 计费错配:扩缩容依据请求数而非真实计算压力。
  5. 恢复脆弱:Resume功能不稳定,流式输出与特定实例强绑定。

数据来源:2026腾讯云AI产业应用大会 Tencent Cloud AI Industry Applications Summit

执行层与通信层解耦的Agent基础设施

腾讯云推出Agent Runtime平台,核心解决思路是将执行层与通信层解耦:执行层运行在Sandbox,通信层托管在独立网关,二者通过消息队列连接。

产品架构覆盖全链路能力:

  • 基础层:Agent Identity身份与凭证、Agent Gateway模型与工具接入
  • 核心能力层
    • Agent Sandbox:隔离执行环境、多种沙箱工具环境
    • Agent Engine:构建与托管
    • Agent Optimize:优化评测
    • 生命周期与状态管理、弹性调度
  • 观测层:全链路可观测
  • 典型客群:大模型厂商、强化学习训练/评测平台、Agent服务商

用户流程实现闭环管理:入站管理 → Agent沙箱 → 出站管理 → 连接Agent Wall、Agent Gateway、身份证托管服务(凭证托管自动轮转、到期撤销、内置第三方服务) → 对接大模型、MCP工具、企业系统、云API → 全链路可观测。

数据来源:2026腾讯云AI产业应用大会 Tencent Cloud AI Industry Applications Summit

云端Sandbox模式的量化业务价值

Agent Runtime采用的第四种运行模式:云端Sandbox,实现了存算按需分离、按任务隔离、暂停免费、秒级唤醒,是唯一同时满足Agent全部运行特征的技术方案,核心指标如下:

  1. 启动效率:支持毫秒级创建沙箱与执行任务,提供CLI(agr)工具链,支持实例创建、删除、执行命令、文件操作、暂停/恢复等全流程操作。
  2. 成本优化:实例支持暂停状态免费,解决传统架构常驻Pod的高成本问题,对比Serverless长连接方案降低 约94.4%(18x浪费优化)的无效支出。
  3. 隔离性与稳定性:提供强隔离完整Linux环境,支持海量创建与海量暂停,避免本地裸机运行的安全风险(如rm -rf破坏宿主机),同时解决本地依赖缺失问题。

数据来源:2026腾讯云AI产业应用大会 Tencent Cloud AI Industry Applications Summit

毫秒级沙箱调度的开发实践

基于Agent Runtime CLI(agr),开发者可实现高效的Agent生命周期管理,核心操作包括:

  • 实例管理:agr instance create 毫秒级创建沙箱实例,agr instance pause/resume 实现任务暂停与秒级唤醒
  • 任务执行:agr instance exec 在实例内执行Shell命令,agr instance browser/mobile 支持浏览器、移动端ADB沙箱操作
  • 文件与连接:agr instance file 操作沙箱文件,agr instance proxy 实现实例端口到本地的转发

该工具链直接支持Agent Loop全流程:从读取提示词/工具/记忆、构建上下文、LLM调用与工具调用、Trace观测到结果交付,全流程在隔离沙箱内完成,状态由平台托管,无需依赖本地存储。

数据来源:2026腾讯云AI产业应用大会 Tencent Cloud AI Industry Applications Summit

适配Agent运行特征的云原生技术能力

腾讯云Agent Runtime是当前唯一匹配Agent全运行特征的云原生方案,技术确定性体现在:

  1. 架构适配性:唯一实现“执行层与通信层解耦”的方案,生命周期由Session显式结束或超时决定,而非HTTP连接,完全匹配Agent长周期、可暂停的任务特征。
  2. 核心能力覆盖:同时满足强隔离完整Linux、毫秒级启动、海量创建/暂停、按需计费(暂停免费) 四项Agent核心需求,传统K8s容器、Serverless、云函数均无法满足全部指标。
  3. 技术成熟度:基于腾讯云云原生技术积累,提供全链路可观测、凭证自动轮转、内置第三方服务集成等生产级能力,支持从Agent构建、托管到优化评测的全生命周期管理。

数据来源:2026腾讯云AI产业应用大会 Tencent Cloud AI Industry Applications Summit

原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。

如有侵权,请联系 cloudcommunity@tencent.com 删除。

原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。

如有侵权,请联系 cloudcommunity@tencent.com 删除。

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • 传统架构与Agent运行特征的错配困境
  • 执行层与通信层解耦的Agent基础设施
  • 云端Sandbox模式的量化业务价值
  • 毫秒级沙箱调度的开发实践
  • 适配Agent运行特征的云原生技术能力
相关产品与服务
Agent Runtime
腾讯云 Agent Runtime 是一套围绕 Agent 原生执行范式打造的新一代基础设施平台。 与传统工作负载的"请求-响应"模式不同,Agent 具备目标导向、自主决策、多步执行、 工具调用四大核心执行特征。Agent Runtime 面向Agentic RL、Agentic Agent、企业级 Agent 平台,重塑 Agent 运行时、管控治理与智能化能力,支持 Agent 运行时、沙箱、工具、网关、记忆、观测等多种能力,用系统的确定性来收敛 Agent 的不确定性。
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档