这么快,巨头就烧不起 token了?

这么快,巨头就烧不起 token了?

按头让员工猛猛用AI的硅谷巨头,开始“玩不起”了。

亚马逊苦口婆心地说“不要为了用AI而用AI”,大手一挥关闭了内部的员工token消耗排行榜。

微软突然取消大部分Claude Code授权,要求开发者将工作流程迁回GitHub Copilot CLI。

不久前,情况还完全不是这样。AI用得越多,似乎就代表员工越先进,公司越有未来。

但当员工真的开始狂用AI,企业很快发现,自己有没有逼出来更高生产力还未可知,账单先膨胀了。

一边开始为Token账单头疼,一边又怕自己在AI竞赛里落后。硅谷正在面对一个自己亲手制造的难题。

伙计们,AI实在是太好用啦!

一切要从去年说起,虽然“鼓励员工拥抱AI”的现象早已有之,但2025年突然变成了不由分说的浪潮。

最明显的,就是硅谷大厂带头按头员工多用AI。

用微软开发者工具业务的高管潘正磊(Julia Liuson)的话说就是:“使用AI已经不再是可选项,而是每个职位、每个层级的核心能力。”

彼时她在内部邮件中要求管理者,在评估员工表现时考虑其使用内部AI工具的情况,其中包括GitHub Copilot。

亚马逊则一边表示未来部分岗位可能因AI而减少,一边告诉员工应对方式是“拥抱AI”。

去年夏天,CEO安迪·贾西(Andy Jassy)向全体员工发送了一封关于生成式AI的邮件。他在邮件中表示,随着公司大规模部署生成式AI和智能体,部分现有岗位需要的人会减少;在未来几年里,AI带来的效率提升预计会减少亚马逊的企业员工总数。

在谈到员工应当如何应对时,贾西直接要求员工主动拥抱AI:

“了解AI,参加研讨会和培训,尽可能使用和试验AI,参与团队头脑风暴,思考如何更快、更大范围地为客户创新,以及如何用更精简的团队完成更多工作。”

这段话可以视为亚马逊内部AI动员的公开起点。

不仅是几家巨头,在2025年,高调“全员AI”几乎是某种时尚。

Shopify提出“反射式使用AI”的概念,表示这现在是公司的基础要求。所谓“反射式使用”,意思是“像条件反射一样用AI”。员工遇到任务时,首先应该想到能否借助AI完成。

公司还要求,团队在申请增加人手和资源之前,必须先回答一个问题:为什么这项工作不能由AI完成?

多邻国更是公开表示公司将转向“AI优先”。能用AI的,不用外包。能用AI的,不招新人。在员工评价中,也会考察其使用AI的情况。

这种趋势,一定程度上也延宕到今年。

今年3月,黄仁勋公开表示假如英伟达年薪50万美元的工程师一年没有消耗至少25万美元的AI Token,自己会感到“非常担忧”。当被问到英伟达是否准备每年为工程团队花费约20亿美元购买Token时,黄仁勋的回答是:“我们正在努力。”

这已经不是他第一次表态,去年底,在英伟达内部举行的一次全员大会上,黄仁勋质问曾建议团队“少用AI”的高管“你们疯了吗”,并明确要求员工尽可能用AI自动化所有可以自动化的任务,同时向员工保证AI不会夺走他们的饭碗。

但要说哪家公司最激进,Meta当仁不让。

2025年11月,Meta首席人力官贾内尔·盖尔(Janelle Gale)宣布,从2026年起,“AI驱动的影响力”将成为员工的核心期待,正式进入绩效评价。

到了今年4月,Meta内部又出现了一块名为“Claudeonomics”的排行榜:它追踪超过8.5万名员工消耗的Token数量,列出前250名,并授予“Token传说”“缓存大师”等称号。短短30天内,榜单记录的Token消耗量超过60万亿个。

AI使用变成了一场相互厮杀的内部游戏。

BCG在《AI Radar 2026》报告中调查了2360名企业高管,其中包括六百多名CEO。结果显示,94%的组织表示,即使AI投资在2026年无法立即带来回报,它们也会继续投入。

报告预计,企业用于AI的投入占营收比例,将从2025年的约0.8%提高至2026年的约1.7%,几乎翻倍。72%的CEO表示,自己已经是公司AI决策的主要负责人;一半CEO甚至认为,如果AI投入无法取得成效,自己的职位都会受到影响。

对这些公司来说,AI成为CEO亲自下注的一场转型,重要的是不能显得自己比同行慢一步。

是不是玩不起?硅谷巨头带头反悔

然而,这场AI使用大赛还没热闹多久,硅谷巨头们就开始踩刹车了。

最先打自己脸的,正是此前要求员工“尽可能使用和试验AI”的亚马逊。

今年5月底,亚马逊被曝关闭了一项名为“KiroRank”的内部排行榜。这个由员工自行制作的榜单,用来显示员工使用AI工具时消耗的Token数量。

据《金融时报》报道,一些员工开始使用亚马逊内部AI智能体平台MeshClaw运行非必要任务,以提高自己的AI使用数据。MeshClaw原本可以代替员工发起代码部署、分拣邮件,或与Slack等应用交互;但当Token消耗被放进排行榜,员工运行这些智能体的目的,就可能从完成真正需要的工作,变成单纯“刷榜”。

这种行为甚至有了一个专门的名字:Tokenmaxxing,意思就是尽可能刷高Token消耗量。

虽然亚马逊没有披露员工究竟运行了哪些无效任务,但在相关社区讨论中,有用户已经直接设想过这种“冲榜”方式:

把MeshClaw挂在后台,让它持续对源代码包进行静态分析,Token自然会不断累积。

Hacker News上还有用户称,自己认识的员工在公司开始考核“花掉多少Token”后,干脆让不同AI智能体互相接收对方输出、循环运行,因为真正需要大量Token的工作根本没有那么多。

亚马逊最后不得不叫停这场比赛。

公司高级副总裁戴夫·特雷德韦尔(Dave Treadwell)在内部提醒员工:“请不要为了使用AI而使用AI。使用AI,是为了帮助你解决客户问题、解决业务问题、实现创新。”

这距离贾西亲自鼓动员工“拥抱AI”还不到一年。

亚马逊不是唯一一个开始收手的巨头。今年5月中旬,微软开始取消内部大部分Claude Code许可证。

巨头之下,中小公司也撑不住了。

去年4月,多邻国CEO路易斯·冯·安(Luis von Ahn)还宣布公司转向“AI优先”,但一年后,他承认公司已经撤回了这项考核标准。

整整一年后,他在播客中表示,员工曾经向公司提出质疑:是不是为了显得公司足够“AI优先”,大家就必须为了使用AI而使用AI?

最终,多邻国不再将员工是否使用AI作为正式绩效指标。冯·安表示,真正重要的是员工能不能把工作做好。AI适合某些任务,但并不适合所有任务,公司也不应该强迫员工在不适合的地方硬用AI。

曾经迫不及待让员工“拥抱AI”的公司当然没有放弃AI。

它们只是终于发现员工不用AI是一个问题,但员工为了排名、绩效和自保而狂烧Token,可能是另一个更“贵”的麻烦。

AI虽好,贪不起杯啊

“造AI”很烧钱,这个大家都知道了。

但是“用AI”也这么烧钱,还真有点意外。

一个典型是Uber,今年4月就花光了全年的AI预算。遥想去年12月,Uber向约5000名工程师开放了Anthropic旗下的AI编程工具Claude Code。

前文提到今年5月微软开始取消内部大部分Claude Code许可证,微软对内解释称,这是为了将工具链统一到自家的Copilot CLI。

但据The Verge报道,这同时也是一项财务决定。

Claude Code授权将在6月底,也就是微软当前财年结束前被大规模关闭,以便在新财年开始前削减一部分运营成本。

而更值得注意的是,在微软推动员工迁回Copilot CLI之际,Copilot本身的收费方式也正在改变。

今年4月,GitHub宣布,从6月1日起,面向企业和团队用户的GitHub Copilot付费方案将转向基于使用量的计费模式。过去,这些客户主要按照订阅套餐和高级请求次数付费;新方案下,每个套餐只包含一定额度的GitHub AI Credits,超出额度后需要按照实际使用量继续付费。

这笔费用怎么算?按照员工使用过程中消耗的输入Token、输出Token和缓存Token计算。

GitHub在官方公告中表示,随着Copilot开始承担分析、修改和迭代等更复杂的智能体任务,不同任务的算力消耗差异越来越大,因此需要改用按实际使用量计费。

Anthropic也采取了类似的计费逻辑。

目前,Claude企业版的座席费只覆盖平台访问权限,并不包含实际使用量。员工使用Claude、Claude Code和Cowork时产生的每一个Token,都要按照标准API价格另外计费。

更直接的是,Anthropic官方帮助文档明确提醒企业:在新的按使用量计费方案下,团队没有单独分配好的Token额度。一名员工大量使用AI,并不会减少其他员工可用的额度,只会让组织最终收到的账单更高。旧的固定座席方案,也将在续约时逐步转入这种按使用量计费的模式。

OpenAI的动作稍有不同。它没有宣布将所有企业方案统一改为按Token收费,但在今年4月,为ChatGPT Business和Enterprise团队推出了Codex按量付费选项:企业可以不用支付固定座席费,而是根据实际使用量为Codex付费。

与此同时,更强模型的调用成本也明显更高。

今年4月进入API的GPT-5.5,调用成本相比GPT-5.4进一步提高,在标准API价格下,其输入和输出Token单价均达到后者的两倍。

当公司要求员工“尽可能使用AI”,AI厂商却把费用精确挂到每一次调用和每一个Token上,事情就开始变得微妙了。

问题还不只是AI贵。

更直击灵魂的叩问是,当“全司AI向前冲”,效果究竟好吗?

早就有人看出其中的逻辑漏洞:让工程师以Token消耗量论英雄,和以谁花钱更多来给营销团队成员打分有什么区别?

全行业都已经在使用AI,但真正能把这种使用转化成利润的企业,目前仍然只是少数。

麦肯锡在《2025年AI现状》报告中调查了1993名企业受访者。结果显示,只有39%的受访者表示,AI已经对整个企业层面的息税前利润,也就是EBIT,产生了影响。

麦肯锡还专门定义了一类“AI高绩效企业”:既认为AI已经为公司创造显著价值,又认为AI对企业EBIT的贡献达到至少5%。符合这两个条件的企业,只占全部受访者的约6%。

此外,去年7月,研究机构METR公布了一项随机对照实验。16名有经验的开源软件开发者,在自己熟悉的代码库中完成246项真实任务,其中一部分任务允许使用AI工具,另一部分则不能使用AI。

在实验开始前,开发者预计,AI可以让他们完成任务的时间缩短24%。

实验结束后,即便已经亲自使用过这些工具,他们仍然认为AI让自己的工作速度提高了20%。

但实际结果完全相反:使用AI后,这些开发者完成任务所需的时间,反而增加了19%。

这项研究针对的是熟悉大型开源代码库的资深开发者,当然不能直接证明AI编程对所有人、所有任务都没有帮助。

但它至少说明了员工感觉自己在用AI提效,不等于效率真的提高了。公司看到AI使用量增长,也不等于公司真的获得了与之匹配的产出。

Token消耗变成绩效考核标准和“觉悟检测器”的时候,闹剧的基调就已经被定下了。AI当然不会因此退潮。但把Token消耗速率当成转型进度、把“多用AI”当成绩效答案的阶段,可能已经快结束了。

可喜可贺。

本文来自微信公众号“字母AI”,作者:小金牙,36氪经授权发布。

来源:36氪

免责声明:含第三方意见,不构成财务建议

分享至
X
Telegram
WeChat
QQ
Link
推荐阅读

戴尔股价年内涨幅达 230%,Seeking Alpha 探讨估值是否过高

24 分钟前
戴尔股价年内涨幅达 230%,Seeking Alpha 探讨估值是否过高

博通与Ciena指引不及预期致科技股下挫,博通股价暴跌13%

29 分钟前
博通与Ciena指引不及预期致科技股下挫,博通股价暴跌13%

谷歌实验室推出实验性应用 Dreambeans,整合 Gmail 等数据生成个性化故事

32 分钟前
谷歌实验室推出实验性应用 Dreambeans,整合 Gmail 等数据生成个性化故事

苹果新版 Siri 或借助谷歌云端的 Nvidia Blackwell B200 GPU 运行

35 分钟前
苹果新版 Siri 或借助谷歌云端的 Nvidia Blackwell B200 GPU 运行

Anthropic Claude Mythos 技术预览版遭未授权访问,安全基础设施成 AI 防御关键

41 分钟前
Anthropic Claude Mythos 技术预览版遭未授权访问,安全基础设施成 AI 防御关键

英伟达开源 5500 亿参数 Nemotron 3 Ultra 模型,采用 Mamba-Transformer 混合 MoE 架构

46 分钟前
英伟达开源 5500 亿参数 Nemotron 3 Ultra 模型,采用 Mamba-Transformer 混合 MoE 架构

Snap 收购增强现实公司 Illumix 以强化 AR 技术布局

2 小时前
Snap 收购增强现实公司 Illumix 以强化 AR 技术布局