最近,阿里ATH创新事业部对外宣布了他们的首款开放式世界模型HappyOyster。
该模型基于多模态架构设计,具备音视频生成、场景理解和实时互动等功能。
用户只需输入文本或图像信息,即可构建一个持续运行的虚拟物理空间。在这个空间里,各种元素如光照、重力以及物体运动遵循时间和逻辑上的连续性。
举例来说,在HappyOyster中创建的角色和背景可以随着视角变换而保持一致性。
与传统的生成视频流程不同,这款模型能够实时响应用户的指令,并根据这些指令不断更新场景。生成的数字世界还可以被其他用户进一步开发创作。
在实际应用中,用户可以通过调整镜头角度或控制角色动作来改变画面内容。HappyOyster能即时对这些变化做出反应,保持场景的真实性和连贯性。
智东西团队已经抢先体验了这款模型,并对其世界一致性给予了高度评价。无论是主角形象还是物体位置都表现得非常稳定,没有出现常见的变形或错乱现象。
自阿里CEO吴泳铭于三月带领组建ATH以来,该团队迅速推出了多项创新产品。在此之前,“生成视频”工具HappyHorse吸引了大量开发者关注,而此次发布的HappyOyster则标志着他们在“生成世界”领域的进一步探索。
目前这款模型正在内部测试阶段,并且还在不断优化中。
根据官方资料介绍,HappyOyster支持导演模式和漫游模式。其中,导演模式下用户可以创建最多3分钟的视频内容;而漫游模式则允许用户以第一人称视角探索虚拟世界。
在导演模式中,用户可以通过文本、语音或图像等方式实时调整场景,并即时看到效果变化。
测试过程中使用了480p清晰度和“Regular”与“Steady”设置。输入提示词后,HappyOyster能够迅速生成相应的视频内容。
视频中的角色和背景都保持良好的连贯性,没有出现明显的瑕疵或异常现象。
对于物理规律的处理上,虽然大部分情况下表现良好,但在某些特定场景下仍会出现一些问题。例如,在从窗户进入时,窗框可能会表现出不自然的变化。

在漫游模式中,用户可以自由地探索虚拟世界,并且随着视角的改变,周围的环境会自动调整以保持连续性。
使用第三人称视角进行测试后发现,生成的世界在视觉效果和物理规律方面表现得相当不错。然而,在控制角色移动时偶尔会出现卡顿现象。
除了现实风格之外,用户还可以使用HappyOyster创建各种不同的艺术形式如漫画、水墨画等。
这款模型的独特之处在于它能够模拟长时间跨度下的世界演变过程,并且可以实时接受用户的指令进行调整和优化。
阿里ATH的成立标志着阿里巴巴在AI领域的又一个里程碑。短短一个月内,他们已经推出了多款创新产品和技术工具。
今天阿里正式进入世界模型领域,为这一新兴赛道注入了新的活力。
同时,在同一时间点腾讯也发布了混元3D世界模型的最新版本,显示出各大科技公司正在竞相推出各自的解决方案以争夺市场份额。
这种快速迭代和激烈竞争的局面反映了当前世界模型技术领域的发展态势。
在漫游模式中,用户能以第一人称漫游,自由改变方向和镜头运动,突破原有画面边界,而世界则会持续生成并保持连贯。在这个世界里,物体的位置保持稳定,环境随时间持续存在,用户移动时视角与光照也会连续响应。
▲一个男人在废土世界中行走
我们在漫游模式下选择第三人称视角,输入提示词如下:
一位穿着冰蓝色长裙的银发女子站在冰封的湖面上。雪花围绕她飞舞,她的长发和裙摆随风飘动。背景是极光和雪山,冰面反射出她的身影和极光。镜头围绕她旋转,捕捉冰晶在阳光下折射的七彩光芒。
从视频清晰度来看,HappyOyster生成的世界画面清晰,漫游过程中视角转动、场景切换都十分流畅,光影效果会跟随视角自然变化,镜头旋转一周后,场景内物体位置依旧保持固定,没有出现漂移错乱。
在真实感与AI痕迹上,生成的环境与主角形象高度贴合提示词描述,人物无畸变、无穿模,整体自然真实,AI生成痕迹较弱。在指令遵循程度上,模型能准确响应操控指令,可顺畅控制角色行进方向,以及镜头的朝向与角度。
在物理规律层面,场景物体空间位置稳定,视角与光影的联动变化符合现实逻辑,整体物理表现连贯合理。
美中不足的是,无论是在导演模式还是漫游模式下,控制人物和镜头还会出现卡顿的情况。
在X上,也有用户分享出了自己的作品。她制作了一一个颜色鲜艳、光怪陆离的世界,在世界中有一个小男孩背着背包在行走。这位网友说(她)使用的是导演模式,分辨率480p,选择「常规」与「稳定」设定,然后输入提示词即可。
▲网友实例
除了现实风格,用户在HappyOyster中还可以生成漫画、水墨画、素描等不同画风 的世界。
▲漫画风格的世界,汽车川流不息
此外,世界中的主角也不仅仅局限于人类,在HappyOyster里,用户还可以创造以物品或动物、昆虫等为第一视角的世界。
▲足球视角在足球场上滚动
▲蚂蚁视角在衣服上爬行
二、对标谷歌Genie3,阿里押注“世界模拟器”路线
相比大语言模型相对成熟的模型架构和技术范式,世界模型仍属于前沿探索领域。
据HappyOyster团队介绍,阿里的HappyOyster与谷歌的Genie3同属于世界模拟器流派。区别于传统文生视频模型输入提示词、等待渲染、获得成片的被动流程,这一流派采用长时间跨度上的世界演化建模方式。
通过学习海量长视频数据,以及文本、动作指令、图像参考等多样控制信号,模型能够主动理解空间、物理与因果规律,预测情节和画面的演变,从而把“被动生成内容”转变为“主动模拟世界演化”。
此次阿里发布的HappyOyster采用了时间跨度更长的世界演化建模方式,使得模型能够保持高保真、长时序的动态场景生成。
同时,该模型在建模初始就设计了多样的控制信号,使模型能够在统一的时序框架下同时实现生成质量、长时序与实时可控性的协同优化。
结语:阿里入局,给世界模型再添一把火
阿里ATH创新事业部在2026年3月正式成立,到今天是整一个月。
在这一个月的时间里,ATH创新事业部发布了企业级AI原生工作平台“悟空”、AI开发工具秒悟Meoo、视频大模型HappyHorse,进度不可谓不惊人。
今天阿里ATH正式入局世界模型,给世界模型赛道再添一把猛火。
在阿里发布世界模型的同一天,腾讯也推出了混元3D世界模型2.0。前一天李飞飞的渲染引擎Spark 2.0开源,1月爱诗科技发布了世界模型PixVerse R1。
这4个月以来,世界模型更新的节奏快得让人喘不过气,也能从侧面反映出:世界模型已经开始真刀真枪地抢地盘了。
这场关于“谁能造出更真、更活、更好玩的数字世界”的较量,才刚刚热起来。
