这么快，巨头就烧不起 token了？

最新热点前沿06-03 23:20

按头让员工猛猛用AI的硅谷巨头，开始“玩不起”了。

亚马逊苦口婆心地说“不要为了用AI而用AI”，大手一挥关闭了内部的员工token消耗排行榜。

微软突然取消大部分Claude Code授权，要求开发者将工作流程迁回GitHub Copilot CLI。

不久前，情况还完全不是这样。AI用得越多，似乎就代表员工越先进，公司越有未来。

但当员工真的开始狂用AI，企业很快发现，自己有没有逼出来更高生产力还未可知，账单先膨胀了。

一边开始为Token账单头疼，一边又怕自己在AI竞赛里落后。硅谷正在面对一个自己亲手制造的难题。

伙计们，AI实在是太好用啦！

一切要从去年说起，虽然“鼓励员工拥抱AI”的现象早已有之，但2025年突然变成了不由分说的浪潮。

最明显的，就是硅谷大厂带头按头员工多用AI。

用微软开发者工具业务的高管潘正磊（Julia Liuson）的话说就是：“使用AI已经不再是可选项，而是每个职位、每个层级的核心能力。”

彼时她在内部邮件中要求管理者，在评估员工表现时考虑其使用内部AI工具的情况，其中包括GitHub Copilot。

亚马逊则一边表示未来部分岗位可能因AI而减少，一边告诉员工应对方式是“拥抱AI”。

去年夏天，CEO安迪·贾西（Andy Jassy）向全体员工发送了一封关于生成式AI的邮件。他在邮件中表示，随着公司大规模部署生成式AI和智能体，部分现有岗位需要的人会减少；在未来几年里，AI带来的效率提升预计会减少亚马逊的企业员工总数。

在谈到员工应当如何应对时，贾西直接要求员工主动拥抱AI：

“了解AI，参加研讨会和培训，尽可能使用和试验AI，参与团队头脑风暴，思考如何更快、更大范围地为客户创新，以及如何用更精简的团队完成更多工作。”

这段话可以视为亚马逊内部AI动员的公开起点。

不仅是几家巨头，在2025年，高调“全员AI”几乎是某种时尚。

Shopify提出“反射式使用AI”的概念，表示这现在是公司的基础要求。所谓“反射式使用”，意思是“像条件反射一样用AI”。员工遇到任务时，首先应该想到能否借助AI完成。

公司还要求，团队在申请增加人手和资源之前，必须先回答一个问题：为什么这项工作不能由AI完成？

多邻国更是公开表示公司将转向“AI优先”。能用AI的，不用外包。能用AI的，不招新人。在员工评价中，也会考察其使用AI的情况。

这种趋势，一定程度上也延宕到今年。

今年3月，黄仁勋公开表示假如英伟达年薪50万美元的工程师一年没有消耗至少25万美元的AI Token，自己会感到“非常担忧”。当被问到英伟达是否准备每年为工程团队花费约20亿美元购买Token时，黄仁勋的回答是：“我们正在努力。”

这已经不是他第一次表态，去年底，在英伟达内部举行的一次全员大会上，黄仁勋质问曾建议团队“少用AI”的高管“你们疯了吗”，并明确要求员工尽可能用AI自动化所有可以自动化的任务，同时向员工保证AI不会夺走他们的饭碗。

但要说哪家公司最激进，Meta当仁不让。

2025年11月，Meta首席人力官贾内尔·盖尔（Janelle Gale）宣布，从2026年起，“AI驱动的影响力”将成为员工的核心期待，正式进入绩效评价。

到了今年4月，Meta内部又出现了一块名为“Claudeonomics”的排行榜：它追踪超过8.5万名员工消耗的Token数量，列出前250名，并授予“Token传说”“缓存大师”等称号。短短30天内，榜单记录的Token消耗量超过60万亿个。

AI使用变成了一场相互厮杀的内部游戏。

BCG在《AI Radar 2026》报告中调查了2360名企业高管，其中包括六百多名CEO。结果显示，94%的组织表示，即使AI投资在2026年无法立即带来回报，它们也会继续投入。

报告预计，企业用于AI的投入占营收比例，将从2025年的约0.8%提高至2026年的约1.7%，几乎翻倍。72%的CEO表示，自己已经是公司AI决策的主要负责人；一半CEO甚至认为，如果AI投入无法取得成效，自己的职位都会受到影响。

对这些公司来说，AI成为CEO亲自下注的一场转型，重要的是不能显得自己比同行慢一步。

是不是玩不起？硅谷巨头带头反悔

然而，这场AI使用大赛还没热闹多久，硅谷巨头们就开始踩刹车了。

最先打自己脸的，正是此前要求员工“尽可能使用和试验AI”的亚马逊。

今年5月底，亚马逊被曝关闭了一项名为“KiroRank”的内部排行榜。这个由员工自行制作的榜单，用来显示员工使用AI工具时消耗的Token数量。

据《金融时报》报道，一些员工开始使用亚马逊内部AI智能体平台MeshClaw运行非必要任务，以提高自己的AI使用数据。MeshClaw原本可以代替员工发起代码部署、分拣邮件，或与Slack等应用交互；但当Token消耗被放进排行榜，员工运行这些智能体的目的，就可能从完成真正需要的工作，变成单纯“刷榜”。

这种行为甚至有了一个专门的名字：Tokenmaxxing，意思就是尽可能刷高Token消耗量。

虽然亚马逊没有披露员工究竟运行了哪些无效任务，但在相关社区讨论中，有用户已经直接设想过这种“冲榜”方式：

把MeshClaw挂在后台，让它持续对源代码包进行静态分析，Token自然会不断累积。

Hacker News上还有用户称，自己认识的员工在公司开始考核“花掉多少Token”后，干脆让不同AI智能体互相接收对方输出、循环运行，因为真正需要大量Token的工作根本没有那么多。

亚马逊最后不得不叫停这场比赛。

公司高级副总裁戴夫·特雷德韦尔（Dave Treadwell）在内部提醒员工：“请不要为了使用AI而使用AI。使用AI，是为了帮助你解决客户问题、解决业务问题、实现创新。”

这距离贾西亲自鼓动员工“拥抱AI”还不到一年。

亚马逊不是唯一一个开始收手的巨头。今年5月中旬，微软开始取消内部大部分Claude Code许可证。

巨头之下，中小公司也撑不住了。

去年4月，多邻国CEO路易斯·冯·安（Luis von Ahn）还宣布公司转向“AI优先”，但一年后，他承认公司已经撤回了这项考核标准。

整整一年后，他在播客中表示，员工曾经向公司提出质疑：是不是为了显得公司足够“AI优先”，大家就必须为了使用AI而使用AI？

最终，多邻国不再将员工是否使用AI作为正式绩效指标。冯·安表示，真正重要的是员工能不能把工作做好。AI适合某些任务，但并不适合所有任务，公司也不应该强迫员工在不适合的地方硬用AI。

曾经迫不及待让员工“拥抱AI”的公司当然没有放弃AI。

它们只是终于发现员工不用AI是一个问题，但员工为了排名、绩效和自保而狂烧Token，可能是另一个更“贵”的麻烦。

AI虽好，贪不起杯啊

“造AI”很烧钱，这个大家都知道了。

但是“用AI”也这么烧钱，还真有点意外。

一个典型是Uber，今年4月就花光了全年的AI预算。遥想去年12月，Uber向约5000名工程师开放了Anthropic旗下的AI编程工具Claude Code。

前文提到今年5月微软开始取消内部大部分Claude Code许可证，微软对内解释称，这是为了将工具链统一到自家的Copilot CLI。

但据The Verge报道，这同时也是一项财务决定。

Claude Code授权将在6月底，也就是微软当前财年结束前被大规模关闭，以便在新财年开始前削减一部分运营成本。

而更值得注意的是，在微软推动员工迁回Copilot CLI之际，Copilot本身的收费方式也正在改变。

今年4月，GitHub宣布，从6月1日起，面向企业和团队用户的GitHub Copilot付费方案将转向基于使用量的计费模式。过去，这些客户主要按照订阅套餐和高级请求次数付费；新方案下，每个套餐只包含一定额度的GitHub AI Credits，超出额度后需要按照实际使用量继续付费。

这笔费用怎么算？按照员工使用过程中消耗的输入Token、输出Token和缓存Token计算。

GitHub在官方公告中表示，随着Copilot开始承担分析、修改和迭代等更复杂的智能体任务，不同任务的算力消耗差异越来越大，因此需要改用按实际使用量计费。

Anthropic也采取了类似的计费逻辑。

目前，Claude企业版的座席费只覆盖平台访问权限，并不包含实际使用量。员工使用Claude、Claude Code和Cowork时产生的每一个Token，都要按照标准API价格另外计费。

更直接的是，Anthropic官方帮助文档明确提醒企业：在新的按使用量计费方案下，团队没有单独分配好的Token额度。一名员工大量使用AI，并不会减少其他员工可用的额度，只会让组织最终收到的账单更高。旧的固定座席方案，也将在续约时逐步转入这种按使用量计费的模式。

OpenAI的动作稍有不同。它没有宣布将所有企业方案统一改为按Token收费，但在今年4月，为ChatGPT Business和Enterprise团队推出了Codex按量付费选项：企业可以不用支付固定座席费，而是根据实际使用量为Codex付费。

与此同时，更强模型的调用成本也明显更高。

今年4月进入API的GPT-5.5，调用成本相比GPT-5.4进一步提高，在标准API价格下，其输入和输出Token单价均达到后者的两倍。

当公司要求员工“尽可能使用AI”，AI厂商却把费用精确挂到每一次调用和每一个Token上，事情就开始变得微妙了。

问题还不只是AI贵。

更直击灵魂的叩问是，当“全司AI向前冲”，效果究竟好吗？

早就有人看出其中的逻辑漏洞：让工程师以Token消耗量论英雄，和以谁花钱更多来给营销团队成员打分有什么区别？

全行业都已经在使用AI，但真正能把这种使用转化成利润的企业，目前仍然只是少数。

麦肯锡在《2025年AI现状》报告中调查了1993名企业受访者。结果显示，只有39%的受访者表示，AI已经对整个企业层面的息税前利润，也就是EBIT，产生了影响。

麦肯锡还专门定义了一类“AI高绩效企业”：既认为AI已经为公司创造显著价值，又认为AI对企业EBIT的贡献达到至少5%。符合这两个条件的企业，只占全部受访者的约6%。

此外，去年7月，研究机构METR公布了一项随机对照实验。16名有经验的开源软件开发者，在自己熟悉的代码库中完成246项真实任务，其中一部分任务允许使用AI工具，另一部分则不能使用AI。

在实验开始前，开发者预计，AI可以让他们完成任务的时间缩短24%。

实验结束后，即便已经亲自使用过这些工具，他们仍然认为AI让自己的工作速度提高了20%。

但实际结果完全相反：使用AI后，这些开发者完成任务所需的时间，反而增加了19%。

这项研究针对的是熟悉大型开源代码库的资深开发者，当然不能直接证明AI编程对所有人、所有任务都没有帮助。

但它至少说明了员工感觉自己在用AI提效，不等于效率真的提高了。公司看到AI使用量增长，也不等于公司真的获得了与之匹配的产出。

Token消耗变成绩效考核标准和“觉悟检测器”的时候，闹剧的基调就已经被定下了。AI当然不会因此退潮。但把Token消耗速率当成转型进度、把“多用AI”当成绩效答案的阶段，可能已经快结束了。

可喜可贺。

本文来自微信公众号“字母AI”，作者：小金牙，36氪经授权发布。

来源：36氪

免责声明：含第三方意见，不构成财务建议

分享至