最近,在Artificial Analysis的AI Video Arena排行榜上出现了一个名为HappyHorse-1.0的新模型,并迅速占据榜首位置。
自昨日起,该模型在文本转视频(不含音频)领域已领先于其他对手,目前其Elo分数已达1375分,比第二名Seedance 2.0高出约100分。

在图像转视频无音频赛道上,HappyHorse-1.0更是以1409的高分打破了历史纪录,显示出极其强大的竞争力。

这个得分差距极为显著。从第一名到第十名之间的分数差异通常仅为50分左右。
此外,在有声音轨的比赛项目中,HappyHorse-1.0同样取得了全球领先地位,超越了Seedance 2.0。

据悉,这款模型是由阿里淘天集团未来生活实验室的研究团队开发的,张迪是该团队的主要负责人。


Artificial Analysis通过数千名不知情用户的盲测来评定视频生成模型的表现,HappyHorse-1.0赢得了大多数人的选择。
屠榜视频Arena
我也亲自进行了体验,在多次测试中选择了它,并感受到其出色的性能。
在比较两个视频时,可以发现右侧的画面更为逼真、细腻。无论是色彩还是镜头运用都十分到位。
而左侧的天空背景虽然符合要求,但显得过于夸张和不自然。
先看第一个案例:

测试结果显示:右侧为「欢乐马」的作品,而左侧则是由Pyramid-Flow生成。
「欢乐马」的画面流畅自然,完美再现了“长枪短炮”的新闻发布会场景。
相对而言,左侧作品的开场略显突兀,并未营造出足够的现场感。
再来看看这个:

经过多次对比测试后发现,右侧「欢乐马」的作品往往更受欢迎。
HappyHorse-1.0采用了创新的技术架构,包括40层单流Transformer模型和高效的音视频同步生成能力。
它在性能上也有显著提升,在H100显卡上生成一段5秒的视频仅需38秒。其技术特点还包括多模态统一建模以及无CFG引导生成等创新方法。
接下来是第三个案例:

这款模型支持多种语言,包括但不限于中文、英语、日语、韩语、德语和法语。
据说HappyHorse-1.0的所有代码和技术报告将完全开源,涵盖基础模型及推理代码等多个方面。
关于它的研发背景,业内普遍认为最有可能的是阿里淘天未来生活实验室。张迪领导的研发团队是主要推手之一。
张迪毕业于上海交通大学,并在阿里巴巴集团担任过多个重要职位,如阿里妈妈大数据与机器学习架构负责人等。
他曾短暂任职于快手,负责大模型项目开发并推出了可灵系列视频生成工具。
最近,张迪又返回了阿里淘天未来生活实验室,继续领导相关研究工作。
至今为止,关于HappyHorse-1.0的官方网站和技术文档尚未公开发布。不过有消息透露该团队正加紧准备,并计划于近期正式推出。
团队成员们表示正在夜以继日地努力开发和完善这款模型,预计将在下个月底进行首次公开展示。
原生支持中文(包括粤语)、英语、日语、韩语、德语、法语。
更重要的是,据说完全开源——基础模型+蒸馏模型+超分+推理代码,都会开源出来。
或出自阿里淘天
关于Happy Horse-1.0背后是哪家公司,目前猜测主要集中在国内。
而在众多选项中,呼声最高的是阿里淘天未来生活实验室,由前快手Kling一号位张迪领导。

张迪,上海交通大学本硕毕业,职级P11,直接向淘天集团首席科学家兼阿里妈妈CTO郑波汇报。
他于2010年毕业后便加入阿里,担任资深技术专家,负责阿里妈妈大数据与机器学习工程架构。
2020年,他曾转战快手,历任技术副总裁、大模型与多媒体技术团队负责人。在快手,他牵头了可灵大模型的底层架构研发与应用落地,成功推出了可灵1.0/2.0视频生成模型。
2025年9月初,张迪加入哔哩哔哩,出任技术条线负责人。
2025年11月,张迪离开哔哩哔哩,重返阿里,担任淘天集团未来生活实验室负责人。
目前,Happy Horse-1.0还处于无官网(目前出现的几个官网都被打假了)、无技术报告、无代码库的状态。
有消息称团队现在每晚都在加班加点,10号会正式发布,也是可以期待一下了。
