首页
学习
活动
专区
圈层
工具
发布
社区首页 >专栏 >腾讯云 Agent Runtime:Agent原生基础设施产品解析与应用实践

腾讯云 Agent Runtime:Agent原生基础设施产品解析与应用实践

原创
作者头像
gawain2048
发布2026-06-09 19:16:11
发布2026-06-09 19:16:11
1170
举报

讲者信息:马文霜(腾讯云存储总经理)

发布场景:中关村论坛系列活动

一、 产品定位与核心亮点

腾讯云 Agent Runtime 是一款专为 AI Agent 打造的原生云基础设施。其核心技术属性在于提供会话独占的运行环境,将 Agent 任务与底层计算(沙箱)、存储(硬盘)及治理(凭证·规则)资源进行 1:1 并发绑定

其商业差异化卖点在于彻底重构了传统云基础设施的资源调度逻辑,通过实现毫秒级启动极致弹性,解决了大模型训练与 Agent 应用在规模化部署中面临的运行速度、资源成本及数据隐私问题。

二、 产品应用场景

该产品主要面向大模型训练厂商、AI 应用开发者及传统 Web 业务转型企业。解决以下核心痛点:

  • 大模型语料生产与训练场景:解决传统环境启动慢、无法应对突发海量并发任务、导致 GPU 算力空跑的瓶颈。
  • 企业级办公与日常 Agent 调度场景:解决 AI 执行长任务易出错导致的数据丢失问题,以及 Agent 闲置时持续占用云资源带来的高昂成本。
  • Web 应用智能化升级场景:解决传统 Web 架构接入 AI 模型时面临的底层基础设施配置复杂、研发周期长、系统延迟高及安全链路不可控的困境。

三、 应用框架和功能介绍

1. 功能框架

Agent Runtime 提供一站式集成的核心模块矩阵:

  • Agent 沙箱:提供极致弹性的独立计算环境。
  • Agent 存储:提供支持快照与启停的低成本数据挂载方案。
  • Agent 记忆:优化长任务上下文管理的记忆模块。
  • Agent 网关:保障企业数据访问的安全管控枢纽。
  • Agent 可观测:提供全链路状态监控与优化追踪。

2. 硬核指标

  • 并发与吞吐量:支持 1秒拉起上万沙箱1分钟吞吐 16万 次任务拉起;支持 100万 个沙箱的超大规模化学习。
  • API响应与延迟:沙箱启动时间仅需 60ms;存储克隆仅需 百毫秒 (100ms级别)
  • 效能指标:长任务成功率提升 30%;Token 消耗降低 60%
  • 数据追踪:实现 100% Session 全留痕

3. 产品优势

  • 环境独占与数据隔离:坚持“一沙箱,一任务”,保证中间产物完全用户私有。
  • 身份专属与零信任架构:凭证规则随用户流转;网关层实现 零凭证接触,访问必须通过 零信任授权,安心访问企业数据。
  • 极速启动与成本控制:沙箱拉起速度比业界快 2.5倍;存储模块支持“停时不计费,唤醒即用”,实现资源按用量最省。
  • 灵活开放与开箱即用:支持任意框架、任意语言、任意模型;部署后自动生效,Web 与 Agent 可共用同一项目并统一控制台管理。

4. 荣誉背书

材料未提供具体的外部奖项名称,但明确该技术产品作为核心议题亮相于中关村论坛系列活动

四、 典型案例

案例一:MiniMax

  • 背景:MiniMax 在大模型持续迭代过程中,需要进行大规模的自主语料生产(Rollout),依赖大量独立环境执行代码(GitHub修bug)、桌面软件(PPT/Excel读取修改)及手机 APP(打开APP/播放音乐)的操作与结果验证,面临 GPU 空跑与吞吐量瓶颈。
  • 解决方案:全面接入 Agent 沙箱模块(覆盖代码沙箱、桌面沙箱、手机沙箱)。
  • 成效:实现突发任务不阻塞,1秒拉起上万沙箱;沙箱启动延迟降至 60ms(较业界提升2.5倍);具备 1分钟 16万 的高吞吐力,支撑 100万级别 的超大规模化沙箱学习。

案例二:WorkBuddy

  • 背景:在办公辅助场景(如运营小李让 AI 做销售周报或清理过期素材)中,AI 可能因理解错误导致误删产物;同时办公 Agent 存在明显的潮汐效应,中午等闲置时段资源浪费严重。
  • 解决方案:采用 Agent 存储 模块。利用其“毫秒级快照/回退”与“百毫秒启停”能力。
  • 成效:任务执行前自动打照,实现 AI 犯错后数据的 一键回滚/恢复(容得了错);实现系统闲置时自动合盖休眠,唤醒即用且停时不计费(闲下来省)。

案例三:EdgeOne Makers

  • 背景:开发者及企业(如在线法律服务平台)面临从传统 Web 应用向 AI Agent 升级的诉求,但自建基础设施配置复杂、研发周期长。
  • 解决方案:使用 Agent 原生基础设施。针对新应用提供一站式框架(模版改造);针对已有网站,利用灵活开放特性,直接在原有代码架构下新增 agents/ 目录进行接入。
  • 成效:Agent 上线时间由 数周缩短至分钟级;整体开发效率提升 80%;成功在不改动原有代码的情况下,为法律网站极速新增 AI 法律咨询助手入口,提升了咨询承接与转化率。

原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。

如有侵权,请联系 cloudcommunity@tencent.com 删除。

原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。

如有侵权,请联系 cloudcommunity@tencent.com 删除。

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • 一、 产品定位与核心亮点
  • 二、 产品应用场景
  • 三、 应用框架和功能介绍
    • 1. 功能框架
    • 2. 硬核指标
    • 3. 产品优势
    • 4. 荣誉背书
  • 四、 典型案例
    • 案例一:MiniMax
    • 案例二:WorkBuddy
    • 案例三:EdgeOne Makers
相关产品与服务
Agent Runtime
腾讯云 Agent Runtime 是一套围绕 Agent 原生执行范式打造的新一代基础设施平台。 与传统工作负载的"请求-响应"模式不同,Agent 具备目标导向、自主决策、多步执行、 工具调用四大核心执行特征。Agent Runtime 面向Agentic RL、Agentic Agent、企业级 Agent 平台,重塑 Agent 运行时、管控治理与智能化能力,支持 Agent 运行时、沙箱、工具、网关、记忆、观测等多种能力,用系统的确定性来收敛 Agent 的不确定性。
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档