最近,蚂蚁集团旗下的全模态AI助手灵光App新增了一项功能,名为“体验世界模型”,用户可以上传一张图片,并在手机上生成一段60秒的3D场景进行探索。
面向普通用户开放
这一新推出的LingBot-World-Fast技术源自蚂蚁灵波科技的开源项目。它能在480P分辨率下实现每秒16帧的画面实时生成,端到端延迟低于一秒,并具备高度动态表现力、时序一致性和通用性等优点。

灵光App的用户可以通过简单的操作进入这些虚拟世界并进行探索。同时,开发者和研究者也可以利用LingBot-World-Fast模型在本地环境中部署和进一步开发应用。
在本地部署中,该模型支持持续生成,并允许通过键盘、鼠标或文本提示来操控视角和改变环境设置。例如,用户可以轻松地调整天气状况或是变换画面风格等。
为了达到更高的实时交互效率,蚂蚁灵波团队为LingBot-World-Fast设计了一套专门的优化方案,在生成过程中仅聚焦于新增内容,从而提高生成速度而不影响画面质量、连贯性和一致性。
这样的技术不仅能够帮助机器人在数字环境中更好地理解和学习动作,同时也降低了游戏开发和创意内容制作的成本和时间。LingBot-World-Fast为具身智能研发提供了多样化的训练环境,并加速了从概念到实际体验的转化过程。
今年年初,蚂蚁灵波首次发布了LingBot-World-Base版本,凭借其出色的画质、长时间视频生成能力和物理一致性,在世界模型领域引起了广泛关注。
目前,LingBot-World-Fast及其源代码已经通过Hugging Face和Model Scope平台向社区开放。公众可以通过灵光App直接体验这项技术,而开发者则可以利用开源资源进行本地部署和更深入的研究。

量子位的朋友们