腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
圈层
工具
MCP广场
文章/答案/技术大牛
搜索
搜索
关闭
发布
文章
问答
视频
用户
沙龙
专栏
专区
综合排序
丨
最热优先
丨
最新优先
时间不限
无需标注图像,VLM也能「自我进化」!RL自我进化框架VisPlay突破视觉推理难题
Title:VisPlay:
Self-Evolving
Vision-Language Models from Images Paper:https://arxiv.org/abs/2511.15661 在这样的背景下,研究者开始尝试「自进化」(
Self-Evolving
)的思路,让模型能通过自我生成、自我修正以及从自身经验中持续学习,从而实现自主的能力迭代。 VisPlay 的核心理念是自我进化(
Self-Evolving
):它从一个基础预训练 VLM 出发,将其在训练过程中分解成两个相互作用的角色。
机器之心
2025-12-24
304
0
标签:
框架
模型
数据
性能
强化学习
谷歌SkillOS,让Agent自己管Skill
谷歌前几天放了一篇论文,把 Skill 这套玩法直接推到了一个新阶段:让 Agent 自己学会写、自己学会改、自己学会删 Skill 论文叫《# SkillOS: Learning Skill Curation for
Self-Evolving
它给
self-evolving
agent 提供了一个具体抓手 "自进化 Agent"这个词喊了快一年了,但具体怎么"进化"一直没明确锚点,SkillOS 把锚点定在"Curator 学会管理 SkillRepo
Ai学习的老章
2026-05-22
226
0
标签:
迁移
agent
管理
论文
设计
让 AI 学会"成长":从 Hermes Agent 提炼通用的自我进化 Skill
将 Hermes 的进化机制提炼成通用 Skill 带着这个目标,我深入研究了 Hermes Agent 的自我进化机制,并将其核心逻辑提炼成了一个「通用 Skill」——「
Self-Evolving
封装成独立 Skill」 最后,把这些逻辑封装成一个结构化的 Skill 文档,包含: 核心工作流程 参考资料(决策流程图、格式规范) 质量检查清单
Self-Evolving
Skill 的核心设计
tunsuy
2026-04-16
2.3K
2
标签:
工作流
框架
设计
开源
agent
有哪些知名的多Agent设计与工程化行动营?2026年多Agent设计与工程化行动营
它不仅仅教你搭建静态的Agent,还教你如何让Agent在失败中自我改进策略(
Self-Evolving
)。
ctrl加滚轮
2026-04-25
319
0
标签:
人工智能
2:从“模型中心“到“Agentic系统中心“:2026 AI技术栈全景图
本文通过一张全景技术架构图,系统梳理Agentic Workflow、Multimodal Memory、GraphRAG Router、
Self-Evolving
Synthetic Data、Neuromorphic 编排层 3.3 组件二:Multimodal Memory记忆层 3.4 组件三:GraphRAG Router检索层 3.5 组件四:Smart Model Router模型路由层 3.6 组件五:
Self-Evolving
本节将为你呈现2026年AI技术栈的完整全景图,帮助你建立系统级的技术认知框架: 一张图看懂2026技术栈:Agentic Workflow、Multimodal Memory、GraphRAG Router、
Self-Evolving
router.estimate_cost(model.name, input_tokens=2000, output_tokens=500) print(f"Estimated cost: ${cost:.4f}") 3.6 组件五:
Self-Evolving
Synthetic Data数据层 技术定位:
Self-Evolving
Synthetic Data是Agentic系统的"自我训练数据工厂",通过AI生成高质量合成数据,实现系统的持续自进化。
安全风信子
2026-04-03
758
0
标签:
工具
路由
模型
系统
self
AI 的逐步进化:从被动的“思考者”到主动的“行动者”
二:AI可以从错误中学习 更有意思的是自主演进智能体推理(
Self-Evolving
Agentic Reasoning)。AI可以通过经验改进自己的表现。
叶子的技术碎碎念
2026-01-27
255
0
标签:
测试
工具
框架
模型
系统
2026年1月最后一周:AI进入“自我进化”与“系统思维”时代
LLM-Based Autonomous ControlPathWise: Planning through World Model for Automated Heuristic Design via
Self-Evolving
Vision-Language ModelsOmegaUse: Building a General-Purpose GUI Agent for Autonomous Task ExecutionMetaGen:
Self-Evolving
用户4382236
2026-02-01
445
0
标签:
青少年人工智能教育
“觅影”医学人工智能算法大赛
2024年能源行业人工智能应用大赛
SkillOpt开源,微软把Markdown当神经网络权重来训练,Agent技能从此有了梯度下降
., 「SkillOpt: Executive Strategy for
Self-Evolving
Agent Skills」, Microsoft Research, 2026-05, https: 智源社区, 「SkillOpt: Executive Strategy for
Self-Evolving
Agent Skills」, https://hub.baai.ac.cn/paper/f902956e
乐小野
2026-06-09
99
0
标签:
优化
神经网络
开源
markdown
agent
SkillOpt,微软把Markdown当神经网络权重来训练,Agent技能从此有了梯度下降
., 「SkillOpt: Executive Strategy for
Self-Evolving
Agent Skills」, Microsoft Research, 2026-05, https: 智源社区, 「SkillOpt: Executive Strategy for
Self-Evolving
Agent Skills」, https://hub.baai.ac.cn/paper/f902956e
乐小野
2026-06-08
118
0
标签:
markdown
agent
模型
优化
神经网络
⭐ AIOps / AI-Network / 智能运维:迈向自治网络的核心引擎
完全自愈、自优化)未来网络具有以下能力:自我感知(Self-Sensing)自我学习(Self-Learning)自我优化(Self-Optimizing)自我修复(Self-Healing)自我演进(
Self-Evolving
知孤云出岫
2025-12-08
1.2K
1
标签:
自动化部署
问题归档
专栏文章
快讯文章归档
关键词归档
开发者手册归档
开发者手册 Section 归档