腾讯云开发者社区-腾讯云

开发者社区

文档建议反馈控制台

文章/答案/技术大牛

发布

综合排序丨最热优先丨最新优先

无需标注图像，VLM也能「自我进化」！RL自我进化框架VisPlay突破视觉推理难题

Title：VisPlay: Self-Evolving Vision-Language Models from Images Paper:https://arxiv.org/abs/2511.15661 在这样的背景下，研究者开始尝试「自进化」（Self-Evolving）的思路，让模型能通过自我生成、自我修正以及从自身经验中持续学习，从而实现自主的能力迭代。 VisPlay 的核心理念是自我进化（Self-Evolving）：它从一个基础预训练 VLM 出发，将其在训练过程中分解成两个相互作用的角色。

2025-12-24

3040

标签:

谷歌SkillOS，让Agent自己管Skill

谷歌前几天放了一篇论文，把 Skill 这套玩法直接推到了一个新阶段：让 Agent 自己学会写、自己学会改、自己学会删 Skill 论文叫《# SkillOS: Learning Skill Curation for Self-Evolving 它给 self-evolving agent 提供了一个具体抓手 "自进化 Agent"这个词喊了快一年了，但具体怎么"进化"一直没明确锚点，SkillOS 把锚点定在"Curator 学会管理 SkillRepo

Ai学习的老章

2026-05-22

2260

标签:

让 AI 学会"成长"：从 Hermes Agent 提炼通用的自我进化 Skill

将 Hermes 的进化机制提炼成通用 Skill 带着这个目标，我深入研究了 Hermes Agent 的自我进化机制，并将其核心逻辑提炼成了一个「通用 Skill」——「Self-Evolving 封装成独立 Skill」最后，把这些逻辑封装成一个结构化的 Skill 文档，包含：核心工作流程参考资料（决策流程图、格式规范）质量检查清单 Self-Evolving Skill 的核心设计

2026-04-16

2.3K2

标签:

有哪些知名的多Agent设计与工程化行动营？2026年多Agent设计与工程化行动营

它不仅仅教你搭建静态的Agent，还教你如何让Agent在失败中自我改进策略（Self-Evolving）。

2026-04-25

3190

标签:

2:从“模型中心“到“Agentic系统中心“：2026 AI技术栈全景图

本文通过一张全景技术架构图，系统梳理Agentic Workflow、Multimodal Memory、GraphRAG Router、Self-Evolving Synthetic Data、Neuromorphic 编排层 3.3 组件二：Multimodal Memory记忆层 3.4 组件三：GraphRAG Router检索层 3.5 组件四：Smart Model Router模型路由层 3.6 组件五：Self-Evolving 本节将为你呈现2026年AI技术栈的完整全景图，帮助你建立系统级的技术认知框架：一张图看懂2026技术栈：Agentic Workflow、Multimodal Memory、GraphRAG Router、Self-Evolving router.estimate_cost(model.name, input_tokens=2000, output_tokens=500) print(f"Estimated cost: ${cost:.4f}") 3.6 组件五：Self-Evolving Synthetic Data数据层技术定位： Self-Evolving Synthetic Data是Agentic系统的"自我训练数据工厂"，通过AI生成高质量合成数据，实现系统的持续自进化。

安全风信子

2026-04-03

7580

标签:

AI 的逐步进化：从被动的“思考者”到主动的“行动者”

二：AI可以从错误中学习更有意思的是自主演进智能体推理（Self-Evolving Agentic Reasoning）。AI可以通过经验改进自己的表现。

叶子的技术碎碎念

2026-01-27

2550

标签:

2026年1月最后一周：AI进入“自我进化”与“系统思维”时代

LLM-Based Autonomous ControlPathWise: Planning through World Model for Automated Heuristic Design via Self-Evolving Vision-Language ModelsOmegaUse: Building a General-Purpose GUI Agent for Autonomous Task ExecutionMetaGen: Self-Evolving

2026-02-01

4450

标签:

青少年人工智能教育

“觅影”医学人工智能算法大赛

2024年能源行业人工智能应用大赛

SkillOpt开源，微软把Markdown当神经网络权重来训练，Agent技能从此有了梯度下降

., 「SkillOpt: Executive Strategy for Self-Evolving Agent Skills」, Microsoft Research, 2026-05, https: 智源社区, 「SkillOpt: Executive Strategy for Self-Evolving Agent Skills」, https://hub.baai.ac.cn/paper/f902956e

2026-06-09

990

标签:

SkillOpt，微软把Markdown当神经网络权重来训练，Agent技能从此有了梯度下降

., 「SkillOpt: Executive Strategy for Self-Evolving Agent Skills」, Microsoft Research, 2026-05, https: 智源社区, 「SkillOpt: Executive Strategy for Self-Evolving Agent Skills」, https://hub.baai.ac.cn/paper/f902956e

2026-06-08

1180

标签:

⭐ AIOps / AI-Network / 智能运维：迈向自治网络的核心引擎

完全自愈、自优化）未来网络具有以下能力：自我感知（Self-Sensing）自我学习（Self-Learning）自我优化（Self-Optimizing）自我修复（Self-Healing）自我演进（Self-Evolving

知孤云出岫

2025-12-08

1.2K1

标签:

自动化部署