在最近的一次国际顶级会议上,中国技术巨头阿里巴巴展示出了其在广告机制设计领域的深厚积累与创新成果。
这场大会吸引了众多行业内外人士的瞩目,并见证了该公司的成功案例以及对行业的贡献。
会议期间,阿里妈妈团队分享了他们在学术界和工业界的最新进展,引起了广泛关注。
阿里巴巴在国际AI研究领域占据一席之地,通过其子公司阿里妈妈的技术交流活动进一步提升了自己的影响力。
- 活动中,阿里巴巴展示了自己与全球知名科学家及学者合作的成果,并邀请到诸多专家学者共同探讨前沿话题。
- 阿里妈妈不仅分享了自身在广告拍卖机制方面的突破性研究工作,还组织了一场备受期待的主题研讨会。
- 在此次研讨会上,共有118篇高质量论文被提交并经过严格评审,最终选出了一系列创新性的研究成果进行展示。
除了学术贡献外,阿里巴巴还在大会上展示了其最新技术在实际业务场景中的应用案例,包括如何利用AI优化广告投放策略等。
阿里妈妈通过举办此次研讨会成功地搭建了一个连接工业界与学术界的桥梁,促进了双方的交流与合作。
会议中还评选出了长论文和短论文的最佳作品,涵盖了从个性化模型设计到大语言模型竞争行为等多个研究领域。
机制设计与决策智能。
长篇最佳论文探讨了当多个AI厂商争夺用户时如何确保每个用户的利益最大化,并提出市场竞争本身可促进AI更贴合用户需求的观点。
短篇最佳论文则揭示了一项令人担忧的发现:大型语言模型可能自发形成“默契”,在未明确通信的情况下提高价格,存在算法共谋的风险。
除此之外,还有五份被选为口头报告的论文也展示了各自的亮点和创新之处。
这些入选作品的研究主题涵盖了从组合拍卖机制优化到智能决策系统设计等多个方面。
阿里巴巴借助此次研讨会向外界证明了其在AI领域的前沿地位以及对推动行业进步的决心。
通过多年的技术积累,阿里巴巴已经建立了坚实的基础,并且正努力将自身打造成为行业内重要的基础设施提供者之一。
这一成就离不开阿里巴巴对于技术发展的持续投入和不断探索创新的精神。
阿里妈妈在广告拍卖机制设计及智能化决策系统方面的研究历程体现了其对技术创新的追求以及对未来市场的战略布局。
细究之下,离不开这三点。
No.1:话题足够前沿
机制设计和决策智能,这俩词,老实说第一次听基本都一脸问号,但它其实一点都不“小众”。
考古了一下,这是一个多次斩获诺贝尔经济学奖的领域——从1996年的维克瑞(William Vickrey),凭借在拍卖理论和机制设计领域的奠基性贡献,拿下诺贝尔经济学奖,再到2007年、2020年的得主,都在解决现实世界最核心的决策问题。
△诺贝尔官网
你刷到的广告为什么是这条而不是那条?短视频平台凭什么决定把10万的现金奖励发给哪个创作者?
这些看起来再日常不过的小事,背后其实全是机制设计和决策智能在跑。
简单说,机制设计就是定规则(游戏怎么玩),而决策智能是做选择(在规则下怎么赢)。
放在广告这个经典场景里:
机制设计是平台的活,决定排序怎么排、钱怎么收、广告怎么展示;
决策智能则是广告主的事,关心每次出多少、预算怎么花、什么时候加价。
两件事合起来,即为一个完整的博弈系统。
而这套系统,从PC互联网到移动互联网,一直在驱动最核心的商业引擎。
重要吗?当然重要。
但如果只是因为“重要”,可能在今天还不足以把ICLR的会议室挤爆。
放在当下,真正让全球顶尖学者坐不住的,其实还是AI:
机制设计和决策智能,正在被AI重写。诺奖级的老问题,正撞上AI时代的新解法。
△图片由AI生成
而这次Workshop所做的,就是把全世界正在重写这套游戏规则的人,凑到一个房间里。
No.2:嘉宾足够重磅
能担起“重写游戏规则”这一重任,想必你也猜到嘉宾们来头都不小。
扫一眼还真是,差点没忍住喊出声:我嘞个全明星阵容啊!
理论这头,两位坐镇者基本可以说是“祖师爷级别”。
首先登场的CMU教授Tuomas Sandholm,机制设计与博弈论领域无可争议的权威。
早年他带队打造的Libratus系统曾在德扑中击败顶尖职业玩家,而这次他又带着新系统Obscuro挑战比德扑更复杂的“Fog of War Chess”棋类游戏。
此游戏状态空间高达1018,但Obscuro不依赖离线训练,纯靠实时搜索,并刻意模仿人类“有限推理”(只保留8层认知深度),最终却以16:4战胜世界冠军,成为该领域首个超越人类的AI。
另一位是来自加州大学尔湾分校的Vijay V. Vazirani,做理论计算机的人绕不开的名字。CS博士大概率都翻过他那本《近似算法》。
他这次讲的是“基数效用匹配市场”,说白了就是一群人和一堆资源要互相分配(比如学生选宿舍、用户匹配商品),到底该用什么规则,才能既公平又有效率,还能真正跑得起来。
过去经济学家给出过一套很漂亮的方法(Hylland-Zeckhauser机制),理论上各种性质都说得通,但规模一大就开始“算不动”。
所以Vijay这次带来了一种基于纳什谈判(Nash bargaining)的新思路,既保留原本“好看”的理论性质,也保证在实际计算里能跑得动。
把这两位巨佬放在一起,能看出一个明显的趋势:理论这边,越来越关注“怎么在现实里跑得起来”。
顺着这一思路,上海交通大学的郑臻哲教授直接把问题推向了更复杂的AI战场:
当创作者开始博弈,创作者经济中机制设计的新问题。
以前推荐算法用的是“用户-内容”这套逻辑,但现在有了创作者这个新变量。
为了迎合平台规则,创作者往往会追热点、蹭标签、卡发布时间、复刻爆款。平台原本试图优化内容质量,结果却在不经意间,把问题变成了“创作者如何迎合规则”。
更麻烦的是,生成式AI又加了一层。
一个人可以用AI批量生产内容来参与竞争,这时候你甚至很难说:
平台是在和人打交道,还是在和一群AI打交道?原来那套算法逻辑是不是从根上就需要重写?
如果说郑臻哲抛出的是AI时代的“新问题”,那谷歌研究院的Song Zuo则给出了一个具体的“新解法”。
他关心的问题是:当广告创意都开始由AI生成,谁来决定哪个版本被你看到?
和传统广告拍卖不同,AI生成的内容是现产的,每次还不一样——东西都没出来,怎么拍卖?
Song给出的思路是:把出价的权力前置到生成过程里。
每个广告主只需要给出一个数字代表自己愿意出多少,模型在每个token往外吐的时候,根据所有出价综合考虑,决定下一个token怎么写、整篇创意往哪个方向走。
最后再用“维克里拍卖”这种博弈论中的经典防作弊机制来收钱——谁出价最高谁赢,但只需按第二高的价格付款,因此对广告主来说最划算的就是报真实心理价。
本质上来说,在AI生成内容的时代,拍卖的对象从“成品”变成了“生成过程”本身。
而更聚焦在产业侧的亚马逊广告高级首席研究科学家Niklas Karlsson,则是把业界真实痛点摆了出来:
如何在数十亿次决策规模的战略市场中,部署AI?
亚马逊每秒要做几百万次广告竞价决策,每个广告主又有自己的预算红线。怎么让AI在这个前提下既抢得到流量、又不花超预算、还能稳住模型——听起来像是不可能三角。
但Niklas说,有解,而且解法相当easy——分工。
- 一个负责猜:机器学习估出每次曝光值多少钱;
- 一个负责守:经典控制理论盯着预算红线,动态调出价。
如此一来,机器学习不需要把市场摸透,控制系统也不需要懂细节,各干各的反而最稳。
Anyway,虽然很多问题暂无答案,但至少这群顶尖大脑正在从不同方向找解法。
理论在补可计算性,AI在引入全新的变量,工业在解规模问题。
一幅关于机制设计与决策智能的未来图景,正慢慢浮现出来。
No.3:收录远超预期
而同样参与现场热烈讨论的,还有本次Oral Talk的5个论文团队(其实一共6个被评选为Oral论文,但来了5个)。
说实话,估计连主办方阿里妈妈都没想到投稿会这么火——
总共收到118篇,在顶会Workshop里算高产了,并且邀请了127位专家学者参与审稿。
别的不说,咱先看下Long Papers和Short Papers两个赛道各自诞生的最佳论文。
Long Papers最佳论文:
研究的是:当多家AI厂商同时争用户、用户偏好又五花八门时,怎么让模型真正对齐到每个人的真实利益?
结论很反直觉:不用靠强行监管或统一标准,市场竞争本身就会逼着AI越做越贴合每个用户——个性化本身就是一种对齐机制。
Short Papers最佳论文:
研究的是:让多个大模型一起参与“竞争”(比如定价、出价),它们真的会老老实实各玩各的吗?
结论也挺让人后背发凉:仅靠优化提示词,LLM智能体就会自发“达成默契”,在不显式通信的情况下默契抬高价格、不打价格战——AI市场的“算法合谋”风险,第一次被实打实地证实了。
而除了拿下Long Papers最佳论文的那篇,其余5篇Oral论文也都各有亮点。
第一篇:《Prices, Bids, Values: One ML-Powered Combinatorial Auction to Rule Them All》
一句话总结:通过提出机器学习混合组合拍卖机制MLHCA,让组合拍卖效率损失最多降到1/10,查询次数最多减少58%。
第二篇:《Decision Making under Imperfect Recall: Algorithms and Benchmarks》
一句话总结:智能体“记不住自己做过啥”的决策难题,第一次有了算法解法和评测基准。
第三篇:《AI Realtor: Towards Grounded Persuasive Language Generation for Automated Copywriting》
一句话总结:通过设计一套三模块系统(先挖卖点,再对齐买家偏好,最后做事实核查),成功让大模型给房子写销售文案既能吸引人,又不乱编。
第四篇:《On the Edge of Core (Non-)Emptiness: An Automated Reasoning Approach to Approval-Based Multi-Winner Voting》
一句话总结:投票理论里的一个老坑,被自动化推理工具撬开了。
第五篇:《Post-Training LLMs as Better Decision-Making Agents:
A Regret-Minimization Approach》
一句话总结:通过提出用“后悔最小化”做后训练,补齐了大模型在需要反复决策的场景中容易短视的短板。
而看完整场Workshop,想必你和我一样好奇——
能像桥梁一样连接工业界和学术界,并把专场开进ICLR,阿里妈妈凭什么?
答案,其实并不意外。
只需翻一遍它在机制设计、出价决策智能等方向的“奋斗史”,你就知道,这背后离不开它多年的技术深耕。
阿里妈妈技术深耕
如何准确形容阿里妈妈这几年技术升级的主线呢?
我想关键词一定少不了:AI化、智能化。
机制设计方面,从Neural Auction到CGA,阿里妈妈把广告拍卖这件事:
从“学会怎么排个序”,进化到了“直接生成整张最优广告页”。
传统的广告拍卖机制,比如GSP,本质上是给广告排序——出价高、质量好的排在前面。
但“排序”在数学上不可微(1就是1、2就是2,没有1.1这种中间态),所以AI无法通过梯度学习直接优化它。
因此很长一段时间里,这块主要靠经验规则撑着,学术界走得谨慎,工业界更是不敢让模型端到端地去学。
但阿里妈妈接住了这一棒。
通过提出Neural Auction,阿里妈妈率先给出了“可微的排序计算形式”,这项被学界评为“开创性尝试”的工作,正式打开了端到端学习拍卖机制的大门。
△图源:阿里妈妈公开技术博客
但问题并没有结束。
Neural Auction默认每个广告是独立的,但现实并非如此——
一条广告放在哪个位置、周围是什么广告、同页结构如何,都会影响点击与转化。
这种“排列之间的相互影响”,传统排序模型无法刻画。
于是阿里妈妈进一步换了一个更彻底的思路,做了生成式拍卖(CGA):
不再一条一条地排广告,而是让模型一次性生成整一页广告的最优排布方案,把“怎么排+怎么定价”一起学掉,用一个生成模型去直接拟合整个页面的最优解。
在大规模A/B实验中,CGA不仅显著提升平台收入,也在效果上逼近理论最优拍卖。
后来这项工作还直接被KDD 2025 Research Track接收了。
而这种“用生成式模型一次性搞定全局最优”的思路,也延伸到了智能决策领域。
△图源:阿里妈妈公开技术博客
智能决策核心解决的是广告主怎么出价、怎么赚钱。
过去十年,这件事大致走了三步:从简单规则控制(PID),到用强化学习试着自动调,再到引入更复杂的模型,但结果始终不理想。
这背后核心卡点只有一个——反馈太慢。
广告投放不是下棋,走一步马上知道输赢。广告主投一笔钱,要等几个小时甚至几天才知道ROI是多少。标准RL在这种环境下,学得慢、波动大,所以上线就翻车成了常态。
因此在2023年,阿里妈妈做了一件学术界没人做、工业界更没人敢做的事:
通过提出AIGB(AI-Generated Bidding),把“出价”这件事,重新理解成“生成最优策略”。
以前模型靠反复试,而AIGB是根据广告主的预算和ROI目标,一步一步“生成”一整条出价曲线。
后来在AIGB的框架下,阿里妈妈研发了基于扩散模型的DiffBid,让出价过程变得更平滑稳定。
在自家广告平台实测中,DiffBid能把GMV提升3.6%–5.0%,而且出价曲线更平滑,不会出现“上半场把钱花光、下半场干瞪眼”的情况。
而沿着AIGB这条线,阿里最新的工作AIGB-Pearl,又在“生成”之外加了一只眼睛:
让模型不仅能生成出价策略,还能反过来评估自己生成的策略好不好,再迭代优化。
(这篇论文也被ICLR 2026接收了)
不过还是那句话,如果只是闷头做技术,是开不出ICLR专场的。
技术之外,阿里妈妈这两年在做一件更费劲但更关键的事:把自己做出来的东西逐步开放出去。
我们目前看到的,阿里妈妈举办的各种比赛以及开源,本质上都是它为了开放而做出的努力。
比如在2024年,他们成了唯一一个拥有NeurIPS比赛主办权的国内工业团队,还专门设了AIGB相关赛道,让全球研究者在同一个问题上做对比和竞争。
同时也开源了AuctionNet这类大规模模拟竞价数据和系统,解决了一个长期问题:以前做拍卖机制研究,大家手里基本没有真实工业数据,只能靠模拟和假设。现在至少有了一套相对标准的“练习场”。
再加上这次在ICLR开Workshop。
到这里,阿里妈妈的角色,已经从“闷声做技术”的应用方,变成了这个领域的基础设施提供者。
学术圈拿到的是数据集、比赛、Workshop;工业界拿到的是真实的业务收益、可复用的范式、能上线的方案。
而把两边连起来的,是阿里妈妈自己。

一水