首页
学习
活动
专区
圈层
工具
发布
综合排序最热优先最新优先
时间不限
无需标注图像,VLM也能「自我进化」!RL自我进化框架VisPlay突破视觉推理难题
Title:VisPlay: Self-Evolving Vision-Language Models from Images Paper:https://arxiv.org/abs/2511.15661 在这样的背景下,研究者开始尝试「自进化」(Self-Evolving)的思路,让模型能通过自我生成、自我修正以及从自身经验中持续学习,从而实现自主的能力迭代。 VisPlay 的核心理念是自我进化(Self-Evolving):它从一个基础预训练 VLM 出发,将其在训练过程中分解成两个相互作用的角色。
机器之心
2025-12-24
3040
标签:
谷歌SkillOS,让Agent自己管Skill
谷歌前几天放了一篇论文,把 Skill 这套玩法直接推到了一个新阶段:让 Agent 自己学会写、自己学会改、自己学会删 Skill 论文叫《# SkillOS: Learning Skill Curation for Self-Evolving 它给 self-evolving agent 提供了一个具体抓手 "自进化 Agent"这个词喊了快一年了,但具体怎么"进化"一直没明确锚点,SkillOS 把锚点定在"Curator 学会管理 SkillRepo
Ai学习的老章
2026-05-22
2260
标签:
让 AI 学会"成长":从 Hermes Agent 提炼通用的自我进化 Skill
将 Hermes 的进化机制提炼成通用 Skill 带着这个目标,我深入研究了 Hermes Agent 的自我进化机制,并将其核心逻辑提炼成了一个「通用 Skill」——「Self-Evolving 封装成独立 Skill」 最后,把这些逻辑封装成一个结构化的 Skill 文档,包含: 核心工作流程 参考资料(决策流程图、格式规范) 质量检查清单 Self-Evolving Skill 的核心设计
tunsuy
2026-04-16
2.3K2
标签:
有哪些知名的多Agent设计与工程化行动营?2026年多Agent设计与工程化行动营
它不仅仅教你搭建静态的Agent,还教你如何让Agent在失败中自我改进策略(Self-Evolving)。
ctrl加滚轮
2026-04-25
3190
标签:
2:从“模型中心“到“Agentic系统中心“:2026 AI技术栈全景图
本文通过一张全景技术架构图,系统梳理Agentic Workflow、Multimodal Memory、GraphRAG Router、Self-Evolving Synthetic Data、Neuromorphic 编排层 3.3 组件二:Multimodal Memory记忆层 3.4 组件三:GraphRAG Router检索层 3.5 组件四:Smart Model Router模型路由层 3.6 组件五:Self-Evolving 本节将为你呈现2026年AI技术栈的完整全景图,帮助你建立系统级的技术认知框架: 一张图看懂2026技术栈:Agentic Workflow、Multimodal Memory、GraphRAG Router、Self-Evolving router.estimate_cost(model.name, input_tokens=2000, output_tokens=500) print(f"Estimated cost: ${cost:.4f}") 3.6 组件五:Self-Evolving Synthetic Data数据层 技术定位: Self-Evolving Synthetic Data是Agentic系统的"自我训练数据工厂",通过AI生成高质量合成数据,实现系统的持续自进化。
安全风信子
2026-04-03
7580
标签:
AI 的逐步进化:从被动的“思考者”到主动的“行动者”
二:AI可以从错误中学习 更有意思的是自主演进智能体推理(Self-Evolving Agentic Reasoning)。AI可以通过经验改进自己的表现。
叶子的技术碎碎念
2026-01-27
2550
标签:
2026年1月最后一周:AI进入“自我进化”与“系统思维”时代
LLM-Based Autonomous ControlPathWise: Planning through World Model for Automated Heuristic Design via Self-Evolving Vision-Language ModelsOmegaUse: Building a General-Purpose GUI Agent for Autonomous Task ExecutionMetaGen: Self-Evolving
用户4382236
2026-02-01
4450
标签:
SkillOpt开源,微软把Markdown当神经网络权重来训练,Agent技能从此有了梯度下降
., 「SkillOpt: Executive Strategy for Self-Evolving Agent Skills」, Microsoft Research, 2026-05, https: 智源社区, 「SkillOpt: Executive Strategy for Self-Evolving Agent Skills」, https://hub.baai.ac.cn/paper/f902956e
乐小野
2026-06-09
990
标签:
SkillOpt,微软把Markdown当神经网络权重来训练,Agent技能从此有了梯度下降
., 「SkillOpt: Executive Strategy for Self-Evolving Agent Skills」, Microsoft Research, 2026-05, https: 智源社区, 「SkillOpt: Executive Strategy for Self-Evolving Agent Skills」, https://hub.baai.ac.cn/paper/f902956e
乐小野
2026-06-08
1180
标签:
⭐ AIOps / AI-Network / 智能运维:迈向自治网络的核心引擎
完全自愈、自优化)未来网络具有以下能力:自我感知(Self-Sensing)自我学习(Self-Learning)自我优化(Self-Optimizing)自我修复(Self-Healing)自我演进(Self-Evolving
知孤云出岫
2025-12-08
1.2K1
标签:
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档