在最近的一周内,有人消耗了超过2100亿个Token,而另一家公司在一个月内为AI编程工具投入了15万美元。
在硅谷,程序员的能力不再是通过代码质量、项目交付或团队贡献来评判,而是通过一个昂贵的技术指标——Token消耗量来衡量。

据报道,一名OpenAI工程师在短短一周内通过公司AI模型烧掉了相当于33个维基百科总文本的2100亿个Token,成为公司中的佼佼者。在同一时期,AI公司Anthropic的一位用户在一个月内产生了超过15万美元的账单。
这种现象并非员工个人兴趣使然,而是出于管理层的鼓励,他们相信AI能够提高效率,员工因此不得不展示自己在AI上的投入,以保全职位。
一些企业甚至制定了内部排名,以Token消耗量来评判员工的工作表现。这种做法引发了对实际产出质量的关注。
一些专家将这种现象称为“数字出勤主义”,即用Token消耗量来证明自己的价值,而实际上却可能在浪费资源。
许多企业对AI工具的使用成本没有严格控制,这导致了成本的激增。例如,Exceeds AI创始人马克·赫尔最近使用Claude Code开发了三种工作流工具,Token成本约为2000美元,但48小时内成本急剧上升,不得不设置使用限制。
一些企业已经开始探索更有效的Token使用方式。例如,Zapier的萨穆特表示,他们会通过分析得出结论,判断某种使用模式是否值得在同事中推广,或需要通过指导来改进。
有评论者认为,衡量Token消耗量的最终目的是为了评估其换回的实际产出价值。只有将每个Token转化为实际业务价值,才能在未来的竞赛中胜出。
这场靠燃烧算力来“假装努力”的内卷游戏,最终可能只是一场昂贵的职场行为艺术。一旦企业重新审视“有效产出”的真正定义,这座泡沫可能会迅速破裂。
未来,企业需要更精细化地管理Token使用情况,以避免资源浪费,同时探索更高效、更智能的AI使用方式。
对于管理者来说,他们需要面对一个现实:在这场内卷游戏中,还没有真正的超级英雄。唯一可能的赢家,是那些提供强大算力的供应商。
在探索AI潜力的过程中,有些“Token成瘾者”或许能进化成高效工程师,但也可能只是在进行昂贵的职场行为艺术。

随着未来的数据中心变得更大,真正能在竞赛中胜出的,将是那些懂得将每个Token转化为实际业务价值的组织和个人。
在展望这场生产力革命的最终胜利之前,企业需要确保财务负责人能够应对不断增长的账单,保持情绪稳定。
在一些科技公司,Token消耗量已不再只是一个技术指标,而是被赋予了强烈的社交属性。在Meta和OpenAI等AI公司,员工们会在内部排行榜上展开竞争,比拼的正是各自消耗的Token数量。排行榜成了新的业绩展示板。慷慨的Token预算正成为程序员的一项工作福利,就像牙科保险或免费午餐一样。
Shopify则是另一条路径的代表。该公司在一份声明中确认,Token使用只是衡量绩效的指标之一,同时也会考察AI如何改进和放大工作成果。该公司CEO托比·卢特克(Tobi Lütke)已将AI的使用设为一项基本期望,并直接与绩效评估挂钩,那些大量使用AI工具的员工会得到奖励,而使用较少或不使用的员工则会受到敲打。
这种氛围催生了一种新的职场焦虑。风险投资家尼昆吉·科塔里(Nikunj Kothari)在他发表于Substack的文章中将其称为“Token焦虑”。他观察到,科技圈的对话主题正在悄然改变,过去人们见面时常问“你在构建什么?”,如今变成了“你跑了多少个智能体?”
为了在排行榜上占据一席之地,一些员工开始采用极端策略。一些程序员掌握了AI多任务处理的艺术,同时打开多个窗口,一次性将几十个智能体释放到他们的项目中。
更有甚者,利用订阅套餐的漏洞,以远低于市场价的成本获取大量Token额度。一位初创公司创始人透露,他发现设计初创公司Figma开发的一款AI工具存在漏洞,通过每月20美元的账户,就能使用相当于价值7万美元的Claude Token。他利用这个漏洞同时构建了六个软件项目,直到该功能在最近几天开始执行AI额度限制。
这种现象在AI公司内部也引发了反思。一位匿名OpenAI员工表示这似乎不可持续。
然而,没有人愿意轻易停下脚步,因为谁也不愿成为那个在AI时代仍主要依靠手工编码的人。正如科技通讯作者格尔盖利·奥罗斯(Gergely Orosz)所言,在大型科技公司内部,无论产出质量如何,不以加速的步伐使用AI正成为一种职业风险。
这种文化在观察者眼中已经偏离了工程应有的轨道。有网友评论称,真正的工程追求效率,用最少的资源换取最优的结果。而当前这种攀比服务器账单的行为,不过是将烧钱误当作生产力,企业若为草率的实验无节制地买单,终究会为此付出代价。

03 Token消耗:衡量的是努力还是成果?
员工比着用,老板乐得买单,看似双赢。但这里隐藏着一个经典的管理学难题,Token消耗量大,就一定意味着产出高吗?
自动化平台制造商Zapier已经开始用一种新的仪表板追踪员工的Token使用情况。其首席AI转型官布兰登·萨穆特(Brandon Sammut)表示,如果发现某个员工的Token用量是同伴的五倍,他们会感到好奇,这个人是效率极低,还是真正的超级明星?答案取决于这些Token究竟换回了什么。
Vercel公司提供了一个正面案例。一位高级工程师让一组AI智能体在一周内基于一篇研究论文,构建了一套核心基础设施的新服务。如果交由人类工程师完成,这项任务需要数周甚至数月。这份工作的账单是1万美元左右。Vercel的CEO吉列尔莫·劳赫(Guillermo Rauch)认为这笔投入非常值得,他表示这有点像给人们一根喷射燃料的消防水带。他估计,花1万美元换回的一天工作量,可能为公司节省了数百万美元。
Kumo AI公司则从另一个角度看到了Token投入的价值。联合创始人赫马·拉加万(Hema Raghavan)透露,她手下优秀的工程师使用AI智能体,就像拥有了一支初级助手大军。有些工程师在周末滑雪时,他们的智能体仍在继续执行任务。更重要的是,拉加万发现,智能体有时能帮助编写出更优的代码,反而降低了公司的整体云成本。
然而,并非所有高消耗都能产生如此积极的回报。一些员工可能只是为了在排行榜上露脸,或者出于用了就是对的的简单逻辑,进行了大量低效、重复甚至无意义的计算。有网友评论指出,这好比只看销售人员拨打了多少通电话,却不关心他最终完成了多少成交。如果企业不区分努力与成果,激励机制就会导向表面忙碌而非实质贡献。
更有工程师分享了更精明的使用策略,将自然语言提示词提炼为关键变量,而非将完整段落原封不动地传递给模型。通过这种方式,Token使用量可以下降约99%,而效果仍能保留近九成。这位评论者直言:“Tokenmaxxing是在烧钱来假装有生产力,语义效率才是真正的解锁之道。”

《纽约时报》的凯文·鲁斯(Kevin Roose)在采访了多位重度用户后,提出了一个更为严峻的质疑,排行榜不衡量产出质量,这引发了一个显而易见的问题:这些Token最大化者中,有人产出了好东西吗?还是他们只是在原地打转,拼命产出无用的代码并浪费宝贵的处理能力,仅仅为了让自己看起来很忙?

04成本账单:谁来为“数字出勤主义”买单?
目前,Token的消耗成本大多由企业承担。但随着使用量的激增,这笔账迟早要被认真核算。
AI公司本身已经从这股浪潮中获益。Anthropic在今年前两个月内将其收入预测提高了一倍多,主要归功于智能体编码工具的迅猛增长。OpenAI的Codex工具,自年初以来每周活跃用户增加了两倍,以Token衡量的总体使用量增长了五倍。谷歌去年曾表示,其AI模型每月处理超过1.3千万亿个Token。
但对于使用这些工具的企业而言,Token成本的飙升是一个不容忽视的现实。有网友指出,目前市面上的AI订阅服务,如Claude每月200美元的套餐,其实际资源消耗远超定价,背后是AI公司的高额补贴。一旦AI公司需要实现盈利而提高价格,或者企业转向按使用量付费的API模式,Token成本可能上涨数倍甚至更多。届时,那些在排行榜上风光无限的Token大户,很可能迅速变成老板眼中的成本黑洞。

这种情况在云计算普及之初就曾上演。许多企业因上云成本失控而付出沉重代价,如资源闲置、配置过度、缺乏治理,最终导致账单远超预期。
如今,Token成本正在成为新的云成本问题。Exceeds AI创始人马克·赫尔(Mark Hull)称,他最近使用Claude Code开发了三种工作流工具,总计约30万行代码,Token成本约为2000美元。他决定让公司全体员工都使用这个平台,但48小时内成本就急剧飙升,迫使他不得不设置使用限制。
Vercel的CEO吉列尔莫·劳赫也承认,虽然目前Token消耗最多的员工也是表现最好的,但他并不否认未来会出现滥用行为。他直言员工可能把这些Token用在了副业项目上,比如自己的初创公司、兼职赚外快或者任何事情上,肯定会有很多滥用的情况。
有评论将这种现象称为数字出勤主义(digital presenteeism)在AI时代的翻版。过去,有人把外套挂在椅子上假装在公司,有人在居家办公时用物理鼠标抖动器(mouse jigglers)保持即时通讯工具在线,如今则用Token消耗量来证明自己的价值。只是这次,成本不再是免费的演技,而是真金白银。一旦企业开始严格核算投入产出比,这些表演就会变得格外刺眼。

FinOps专家凯文·普罗科佩茨(Kevin Prokopetz)指出,不加管理的AI工具采用会导致大量Token被烧掉,却对实际投资回报率毫无可见性。另一位评论者内特·帕特尔(Nate Patel)说得更为直白:“如果Token消耗不能与交付成果或节省的时间挂钩,那就只是在烧钱。”
05回归本源:究竟应该衡量什么
问题回到了管理学的原点。自彼得·德鲁克(Peter Drucker)首次系统论述知识工作者的生产力以来,如何有效衡量产出就一直困扰着各类组织。人们总是倾向于衡量最容易计算的指标,而非最有价值的指标。过去是代码行数、发送邮件数量、工作时长,如今轮到了Token消耗量。
有评论引用古德哈特定律来剖析这一现象,当一个指标本身成为目标时,它就不再是一个好指标。Token排行榜正是如此,它驱使员工去攀比消耗量,而非追求真正的成果。

芝加哥大学布斯商学院的研究员布莱恩·贾巴里安(Brian Jabarian)称,公司必须开始衡量Token使用情况,但目的不是为了比较谁用得多,而是为了看清投入产出。
他认为每个人都以为只要使用AI Token生产力就会提高,然后事情就结束了,但现实要复杂得多。如果一家公司通过AI招聘节省了前期成本,但后期需要耗费更多人力或Token去弥补错误,那么整体就是亏损的。当一家公司向50万名员工提供AI工具时,这些Token问题就变成了首要问题。
一些企业已经开始探索更精细化的管理方式。Zapier的萨穆特表示,他们会通过分析得出结论,判断某种使用模式是值得在同事中推广的金牌模式,还是需要通过指导来摆脱的反面模式。Exceeds AI的赫尔则建议,公司应围绕Token使用制定治理规则,例如对特定任务可以使用哪些模型设置限制,甚至可以借助AI本身来实现此类选择的自动化。
一位网友分享了他的评估标准,评价一个AI项目的价值,看的不是消耗了多少Token,而是每个Token创造了多少持久的价值。如果哪个管理者坚持以Token消费额为唯一考核标准,他会毫不犹豫地选择离开。

也许,我们需要的不是更多的Token,而是更聪明的使用方式。许多公司将最先进的顶级模型用于所有场景,而许多工作流程中,使用成本更低的模型就足够了。缺乏上下文缓存和糟糕的上下文管理,同样是企业浪费Token的重要原因。

还有人开始探索让AI更加节俭、更加自主,比如用更小规模的模型来完成特定任务。IBM的Granite 4系列模型,其3B和350M参数版本运行成本仅为大型模型的一小部分,甚至可以在树莓派等低功耗设备上运行。
另一位评论者则从技术架构的角度提出了更根本的思考。他认为,真正的突破在于用结构效率取代参数膨胀。用消耗数百亿Token的蛮力来解决确定性逻辑问题,就像开着喷气发动机去酒吧,这是一种巨大的、毫无道理的能源浪费。智能体AI的未来应该是节俭的、自主的、确定性的,将刚性逻辑卸载给高效的求解器,而不是在软件沙箱中无节制地生成数百个子智能体。
这些观点指向了同一个方向:Token本身不是目的,而是手段。衡量Token消耗,最终是为了衡量它换回了什么。
结语
当这股靠燃烧算力来“假装努力”的歪风刮遍硅谷,管理者们终将面临一个极其冰冷的商业现实:在这场疯狂的内卷游戏里,还没有真正的超级英雄。眼下唯一的绝对赢家,只有那些躲在幕后的算力供应商。
不可否认,今天这些疯狂消耗额度的“Token成瘾者”,或许在未来真能借此摸索出工具的潜能,进化成传说中的百倍效率工程师。但这同样可能只是一场昂贵的职场行为艺术。一旦企业重新审视“有效产出”的真正定义,这座用算力吹起的泡沫随时会轰然倒塌。
无论这场荒诞的戏剧最终走向何种结局,有一点是确定的:未来的世界注定需要更庞大的数据中心。而当大浪淘沙之后,真正能在竞赛中胜出的,绝不会是那些沉迷于排行榜数字的“刷榜机器”,而是那些懂得把每一个Token都转化为实际业务价值的组织和人。
不过,在畅想这场生产力革命的最终胜利之前,最好先祈祷公司的财务负责人看到下个月的账单时,还能保持情绪稳定。
