
最近,黄仁勋在 GTC 大会上强调,Token 在人工智能时代扮演着重要角色,谁能在单位能耗下产生更多高价值的 Token,谁就能成为行业领袖。几乎在同一时间,腾讯开启了一项奖金总额达 600 万元的广告算法大赛,为全球算法专家提供了一个实践这一理念的平台。

近期,一些原本只在技术社区内部讨论的术语,如「Token」、「推理成本」、「智能体」、「工作流程自动化」等,因一场「龙虾热」而开始频繁出现在公众视野中。
此外,不少消费者也感受到了变化:手机和电脑的价格相继上调,厂商普遍解释称,这是因为存储芯片成本明显上升。
实际上,这两起事件都指向了一个共同的背景:应用层面的人工智能需求正迅速增长,而基础设施层面的行业准备尚不充分。算力、芯片、系统效率等原先隐藏在幕后的问题,正因人工智能需求的剧增而被推向了前台。一个显而易见的现象是,算力租赁市场已经出现了涨价趋势,并且这一趋势可能持续一段时间。对于希望抓住这一机会的企业来说,这无疑是一个重要的变化。

然而,对于那些希望在人工智能领域有所作为的人来说,这一变化中蕴含着新的机遇。越来越多的公司开始认识到,在短期内算力供应持续短缺的情况下,限制人工智能普及的可能并不是模型不够强大,而是算力利用效率不足。因此,如何用更少的计算资源实现更强大的智能,将成为接下来一段时间的重点。
一旦需求出现这样的变化,能够同时理解算法、系统和算力效率的人才自然会变得越来越抢手。
这种对高效人才的迫切需求,促使科技公司开始尝试将实际工程问题作为公开竞赛的题目,吸引外部人才参与解决。这类竞赛不仅是招募人才的方式,也是测试自身命题是否可解的一种方法。腾讯广告算法大赛就是一个典型的例子。

与往年类似,今年的比赛依旧聚焦于真实业务场景,所提供的数据来源于每日服务数十亿用户的广告系统。换句话说,这不是一道理论上的算法题,而是一次接触实际人工智能基础设施问题的机会,它代表了大公司面临的、尚未有系统性解决方案的工程难题。
与往年相比,今年的比赛有两个显著的变化:
其一是,比赛时隔多年再次与国际顶级学术会议 KDD 官方联动,重回国际舞台。
其二是赛道的开放。过去,这类比赛大多面向在校学生,而今年首次单独设立了工业赛道,允许在职算法工程师和技术团队参与。
比赛的奖金池及其他奖励也非常丰厚,学术赛道的冠军可以赢得高达 30 万美元(约合 200 万元人民币)的奖金,在国内几乎达到了顶峰。
这样的比赛,自然对应着前沿且复杂的问题,连出题者都期待着看到答案。如果找到了足够优秀的解决方案,它可能直接改写国内大公司技术基础设施的底层逻辑。
新的挑战:探索推荐系统的扩展法则
今年的赛题为何重要?因为它本质上是在问一个颠覆性的问题:推荐系统,是否像其他受人工智能大模型影响的领域一样,可以被「重做一遍」?
过去几十年,推荐系统一直是科技公司最重要的基础设施之一。它从海量信息中筛选出最符合用户需求的信息,并屏蔽信息爆炸带来的噪音。
但随着人工智能进入大模型时代,甚至进入智能体时代,推荐系统的演进也来到了一个新的转折点:一方面,像大模型那样的「统一架构+GPU高效计算」已经被证明可以处理所有问题;另一方面,推荐系统仍然停留在「拼装式工程」阶段,结构割裂、算力利用效率有待提升。
这是怎么回事呢?通常,在广告推荐系统中,模型需要解决两个完全不同的问题。
第一,理解用户的行为序列。比如一个人最近看了哪些视频、点了哪些商品、搜索了什么。这些行为是按时间顺序排列的,因此模型需要理解「顺序」。这类问题被称为序列建模。
第二,理解各种特征之间的组合关系。比如「女性+买过婴儿推车」,这些特征组合可能更应该推荐「安全座椅」。这类问题被称为特征交互。
问题在于,在工业界,这两件事通常是分开做的——一部分网络专门处理行为序列,另一部分网络专门处理特征交互,最后将结果合并。
在早期 CPU 时代,这种做法问题不大,但到了 GPU 时代,这种拼接式架构带来了很多问题。首先,信息在中间是断开的,很多复杂关系捕捉不到。其次,整个系统结构复杂,很多小模块无法充分利用 GPU 的性能。而且 CPU 和 GPU 之间需要频繁交换数据,效率很低。
主办方希望参赛者尝试将这两部分彻底合并,因此赛题被命名为「大规模推荐系统中的序列建模与特征交互统一」。

本次竞赛的核心任务架构。
这并非随意提出的赛题,而是基于大模型已经验证过的路径。像 Transformer 这样的统一架构已经证明,只要将各种数据用同一种方式表示,并交给同一套模型处理,就能更高效地利用算力,且规模越大效果越好,也就是所谓的扩展法则。然而,推荐系统仍然停留在拼凑的老结构中,难以享受到这种提升。这道题,实际上就是在尝试一件事:推荐系统能否也采用这一套方法,变得更简单、更统一,且越做越强。
当然,这件事做起来并不容易。核心难点在于,广告推荐场景的数据极其复杂——既有用户当前的静态信息,也有带有时间戳的行为流水,需要在一个统一架构中将这两种完全不同的数据「翻译」成模型能理解的语言并深度融合。同时,工业级数据规模庞大且极度稀疏,模型必须足够鲁棒。更苛刻的是,既需要预测准确,又需要运行速度快,必须在高端 GPU 上支持大规模高效训练和推理。值得注意的是,比赛严禁使用「model ensemble」这种刷榜技巧,只能依靠单一模型解决问题。
不过,从主办方提供的支持来看,这次比赛并非「只丢一道题就让选手自己摸索」。为了降低门槛,他们提供了一套可复现的、起点很高的基线——不仅有简单示例,还有基于 Transformer 的完整统一架构,包括 Token 化思路和核心网络,还会提供免费算力支持。
数据方面也不用担心,他们提供的数据直接来自腾讯广告的真实工业日志,规模和复杂度接近实际生产环境。

比赛从 3 月 19 日开始报名。总奖金池高达 88.5 万美元(约合 610 万元人民币)。其中学术赛道冠军奖金为 30 万美元(约合 200 万元人民币),工业赛道冠军奖金为 15 万美元(约合 100 万元人民币)。
为什么值得参加?
值得一提的是,为了奖励选手在扩展法则与统一架构方面的原创突破,大会还设置了两项技术创新奖,即便排名不在前列也有机会获奖,每项奖金为 4.5 万美元(约合 31 万元人民币)。
比赛结束后,表现优异的队伍成员有机会加入腾讯,亲手将方案应用到广告系统中验证实际效果。

到这里,相信很多同学已经跃跃欲试了,但也会有人担心:自己从未接触过推荐系统,现在开始学习来得及吗?
其实完全不用担心。回顾腾讯广告算法大赛历年的获奖名单,你会发现不少获奖者都是报名后才从零开始学习,边参赛边学习。最终不仅拿奖,还顺便找到了职业方向。比赛本身就是一个寻找答案的过程:既能验证自己是否适合这份工作,也能在高压下快速了解这个领域的真实面貌。
随着 Token 逐渐成为人工智能时代的通用货币单位,一个新的价值交换体系正在我们面前展开。对每一个个体来说,这或许正是那个稍纵即逝的窗口期。当新的秩序初具规模,率先参与其中的人,往往能收获最大的红利。如果能抓住机会参与其中,未来的你可能会感谢今天的这个选择。

比赛结束之后,Top 队伍选手将有机会加入腾讯,亲手把方案落地广告系统验证实际效果。
看到这里,相信很多同学已经跃跃欲试了,但也会有人担心:自己从来没碰过推荐系统,现在上车来得及吗?
其实完全不用慌。翻翻腾讯广告算法大赛历年的获奖名单,你会发现不少选手都是报名之后才从零开始啃,边赛边学。最后不仅拿了奖,还顺便摸清了自己的职业方向。比赛本身就是一个寻找赛题答案和人生答案的过程:既能验证自己是不是吃这碗饭的,也能在高压下快速摸清这个领域的真实样貌。
随着 Token 逐渐成为 AI 时代的基础货币单位,一个全新的价值交换体系正在我们面前展开。对每一个个体而言,这或许正是那个稍纵即逝的窗口期。当新秩序初具雏形,率先参与其中的人,往往能拥抱最大的红利。如果能抓住机会参与其中,未来的你可能会感谢今天的这个选择。
报名链接:https://algo.qq.com/?type=register&weixinadkey=f405ff9dc868ccb36f9ab519e2e97c4acd972f95787dcca5767fa4e51f72dc1a9b63b48b3ca29e1d697976022a005cd6&wx_aid=89409756818&wx_traceid=wx0cjtq2qvqfw2fy00&weixinadinfo=89409756818.wx0cjtq2qvqfw2fy00.126.1
