前两天我看到一个数据,米哈游做了一次多 Agent 实验,几十个 Agent 在后台互相调用、互相等待、互相确认。你问我一句,我回你一句,你再确认我一下。谁都没有真正收尾,整个调用链越滚越长。
一个晚上,烧掉了大约 200 万元 Token。而真正产出的价值,微乎其微。
200 万。一个晚上。
我当时就想,这 TM 到底是在用 AI,还是在给 AI 送钱。
AI 刚出来的时候,老板们的想象特别美好。
一个 AI 顶三个人,不眠不休,随叫随到,不用涨薪,不用社保,24 小时在线。听起来很完美。
现实呢。AI 确实不摸鱼,也确实不加班。它只是每多干一点,就多收一点钱。
Uber 给 5000 名工程师开放了 Claude Code,短短几个月几乎烧光了全年 AI 预算。微软这段时间开始踩刹车,收紧内部 Claude Code 的使用权限,不再让工程师无限制调用。亚马逊更直接,干脆把内部的 AI 使用排行榜给撤了。
原因很简单。他们发现一旦把「用了多少 AI」当成指标,员工就会开始为了排名疯狂刷 Token。
看起来所有人都在积极拥抱 AI。实际上很多调用根本没有产出,就是单纯「为了用而用」。
Meta 内部搞过一个排行榜叫「Claudeonomics」,专门看谁用 AI 最多。第一名一个月干掉了 31.2 万亿 Token。 换算一下,这一个月烧掉的钱,够请两个资深工程师干一年。
坦率的讲,我看到这个数字的时候,脑子里只有一个问题:这 31.2 万亿 Token,到底换回来了什么。
有一项针对 2444 家公司的研究,数据特别扎心。
企业每花 1 美元在 AI Token 上,0.44 美元用于修复 AI 生成的 bug,0.27 美元用于重写 AI 产出的代码,0.11 美元消耗在审查和合并延迟上。
一块钱买 AI,八毛钱修 AI。
剩下两毛钱,可能还不够付电费。
而且这还没算更隐蔽的成本。工程师用 AI 生成代码速度翻倍了,但代码「流失率」——也就是被抛弃或重写的比例——上升了 800%。
800% 啊朋友们。你写得更快了,但也写得更多需要重写的代码了。这到底是提效还是降效。
JPMorgan 发了一篇措辞严厉的报告,标题直白得让人不舒服:「AI Token 成本正在吞噬互联网利润」。Shopify、Spotify、ServiceNow、Roku 在财报电话会上纷纷提到,AI 成了运营支出的主要压力来源。
整个行业的气氛,从「用 AI 多牛」变成了「这钱花得到底值不值」。
前面说的都是人在用 AI。但真正把成本推到失控边缘的,是多 Agent 系统。
理论上,这套东西很美。一个 Agent 负责规划,一个负责执行,一个负责检查,一个负责总结。像个数字版团队协作。
但现实跑起来,它更像一个没人主持的项目会。
你问我,我问你。你等我,我等你。确认一轮不够再来一轮。所有人都在动,但事情就是收不了尾。
在大部分多 Agent 系统里,有 30% 到 60% 的 Token,消耗在这种无意义的循环里。
更讽刺的是,这些 Agent 并不是在偷懒。反而是太认真了。严格按照流程走,严格执行每一步逻辑。前一个 Agent 调后一个,后一个再回来确认前一个,直到整个系统把自己绕进死胡同。
这就有点像,几十个人在会议室里从晚上开会开到第二天早上。每个人都在发言,每个人都很投入,但没人拍板。而且这个会议室,按秒收费。
说真的,我每次看到多 Agent 架构图的时候,都觉得特别美。但每次看到账单的时候,又觉得特别疼。
这里有一个特别反直觉的结论。
个人效率提升,不等于公司收益增长。
Uber 首席运营官说了一句很坦诚的话。他们发现很难把员工个人生产力的提升,和公司整体的业务影响联系起来。「如果你看不出 AI 帮你向用户推了多少有价值的功能,Token 成本就更难为自己辩护。」
翻译一下就是:员工用 AI 写周报快了三倍,但公司营收没有变化。员工用 AI 写代码快了一倍,但产品没多卖一单。
那只是「更快地花钱」,不是赚钱。
微软前首席 AI 官说了一句更扎心的话:「大多数人默认自动化他们不喜欢的任务,而不是对公司最有价值的任务。」
企业自动化的是员工「讨厌的工作」,而不是「赚钱的工作」。
这也是为什么大约 30% 的生成式 AI 项目,卡在概念验证阶段就被放弃了。成本说不清,价值也说不清,老板自然不续费。
仅有 14% 的 CFO 表示能看到 AI 投资有清晰可衡量的回报。14%。剩下 86% 的人,钱花出去了,但不知道花在了哪、花得值不值。
全球 AI 软件支出预计 2026 年将达到 2.59 万亿美元,同比增长 47%。但与此同时,94% 的工程负责人表示关键 ROI 指标仍然缺失。
钱越花越多,但没人知道烧在哪。
经济学里有一个很经典的规律,叫古德哈特定律。
当一个指标变成目标,它就不再是一个好指标。
Tokenmaxxing 这个词,就是古德哈特定律在 AI 时代的完美示范。
公司把「Token 使用量」写进考核,员工就开始疯狂刷 Token。有人让 AI 反复优化同一段代码几十遍,有人让 AI 一口气生成十几个版本的报告,有人把一个本来几步就能完成的任务硬拆成一堆 Agent 协作。
不是为了产出。是为了让系统看起来更智能,让数据看起来更好看。
投资人 Shruti Gandhi 说了一句特别精辟的话:「Tokenmaxxing 企业,就像靠开着所有的灯来衡量生产力的公司——花更多钱,不等于产出更多。」
我觉得这句话值一万篇行业报告。
说真的,我不是在说 AI 没用。我自己天天用 AI,离了 AI 我写代码的速度直接腰斩。
但我想说的是,AI 不是一个「用得越多越厉害」的工具。它是一个「用得越多越烧钱」的系统。
DeepSeek 开始限流了。豆包要收费了。硅谷大厂开始砍 Token 预算了。Hinton 说 AI 已经有意识了。Anthropic 说停一停。
这些事看起来各不相关,但底层逻辑是同一件事。
AI 行业正在从一个「先烧钱再说」的阶段,进入一个「这笔账到底怎么算」的阶段。
而在这个阶段里,最先被淘汰的不是不用 AI 的公司。是那些无脑用 AI、把 Token 当自来水、月底看到账单才开始冒冷汗的公司。
Fortune 杂志有一句话说得特别直接:「Tokenmaxxing 很容易,重新设计工作流程很难。」
大多数公司现在做的,是在优化现有流程,而不是重新发明商业模式。这是 AI 真正价值的所在,也是大多数企业还没有到达的地方。
如果只是用 AI 把旧的工作做得更快,账单总有一天会把你逼回到这个问题面前。