搜索: "视频生成模型"

共找到 23 篇相关文章

在AI视频生成这块，“遥遥领先”成真了

有消息称，字节跳动视频生成模型Seedance 2.1将于近期发布，预计生成效果较2.0版本提升20%。字节对字母AI表示，此消息为假消息。虽然Seedance 2.1未必会于近期发布，但是Seedance 2.0在海外热度大涨却是真的。原因在于，周末，一篇标题为《中国人工智能企业在视频生成竞赛中领跑美国对手》(Chinese AI groups pull ahead of US rivals i

科技2026/5/211 阅读

赋予视频生成「视觉思维链」：VChain显式建模时空规划与状态演变

当视频生成模型在视觉保真度上不断突破时，一个核心瓶颈正变得愈发清晰：模型是否真正理解了真实世界？能否推理出合理的演变过程？在具身智能、影视制作以及物理仿真等应用场景中，要求模型不仅要生成 “平滑的像素”，更要实现 “逻辑连贯的演化”。这种对物理规律与因果关系的建模能力，是当前基于大数据驱动的端到端生成模型面临的长期挑战。那么，我们能否将多模态大模型（MLLM）的推理能力，作为一种 “外脑” 注入到

科技2026/5/214 阅读

Seedance 2.1近期将发布，效果预计提升20%

5月19日消息，据AI普瑞斯独家获悉，字节跳动视频生成模型Seedance 2.1将于近期发布，预计生成效果较2.0版本提升20%。此外，字节跳动还将推出Seedance2.0低配版，比目前的fast版效果更好，但价格更低，预计是5毛一秒，可能要对市场上其他厂商的视频模型造成巨大冲击。据行业人士向AI普瑞斯透露，按日消耗占比计算，Seedance已占据市场超八成份额，可灵约占14%，万相2.7约占

科技2026/5/192 阅读

Seedance 2.0最强对手偷跑了

现在无论哪一家要发布视频模型，都免不了要被拉来和 Seedance 2.0 对比。而最近比较沉寂的 Google，似乎在悄悄憋一个大招，来重夺视频生成的王座。今天凌晨，有网友在 Gemini 中意外触发了一个全新的视频生成模型——Omni（全能）。在 Gemini 的聊天页面，直接显示着「用 Gemini Omni 来创作，认识一下我们全新的视频生成模型。重混你的视频、在对话中直接进行编辑、尝试丰

科技2026/5/122 阅读

HappyHorse模型上线MuleRun灰度测试，实现全天候便捷访问

MuleRun（骡子快跑）推出了一款名为HappyHorse的全新视频生成模型，用户可以全天候访问。量子位的朋友们 2026-04-28 13:42:39 量子位

AI2026/4/293 阅读

阿里推出全新应用「欢乐马」，抢先体验潜力新星

隐藏在幕后的「欢乐马」终于揭开了它的面纱。4月27日，阿里ATH团队发布了视频生成模型HappyHorse 1.0的首个版本。这款模型基于原生多模态架构设计，不仅能同时处理音视频内容，还能实现创作和编辑的一站式服务，免去了繁琐的操作过程。此前它在知名AI评测平台Artificial Analysis上的表现备受关注，无论是文字生成视频还是图像转换成视频，均获得了第一名的佳绩，使Seedance 2

科技2026/4/285 阅读

大厂豪掷数百亿争夺AI人才，字节跳动引领激战潮流

文丨辰聪出品丨师天浩观察（shitianhao01）4月20日，两则消息几乎同时砸进我的信息流。一则是字节跳动2025年净利润暴跌超70%，从2024年的330亿美元缩水到90多亿。另一则是阿里旗下视频生成模型HappyHorse-1.0宣布4月27日开放API测试，5月正式商用。两件事单看没什么，放在一起看，就有意思了。一个是在账面上“大出血”，一个是在战场上“亮新刀”。表面上八竿子打不着，实际

科技2026/4/212 阅读

多名关键高层同期离任引发OpenAI动荡：此前已停止Sora等项目

周五，OpenAI宣布其两名关键人物将离开公司，他们分别是Moonshots项目的领导者。这一人事变动发生在该公司调整战略方向、专注于企业级人工智能业务和超级应用开发之际。凯文·威尔(Kevin Weil)是科学研究项目负责人，而比尔·皮布尔斯(Bill Peebles)则是AI视频生成模型Sora的核心研究员，两人同时宣布离职。OpenAI此前已决定缩减包括Sora在内的几个面向消费者项目的规

科技2026/4/183 阅读

字节发布Seedance 2.0研究论文，深入解析四项关键技术特征及测评详情

近日，字节跳动团队发布了一份关于Seedance 2.0的技术报告，《Seedance 2.0: Advancing Video Generation for World Complexity》（《Seedance 2.0：推动视频生成应对复杂世界》），详细阐述了这款多模态视频生成模型的各项能力及测试成果。据悉，自今年二月初以来，Seedance 2.0已在豆包、即梦AI和火山引擎等平台投入使用，

科技2026/4/181 阅读

阿里新作HappyHorse击败Seedance：API将于4月30日正式启用

最近，阿里ATH创新事业部研发的一款名为HappyHorse-1.0的视频生成模型，在Arena.ai平台上低调上线并启动了测试阶段，目前正处于最终优化过程中，预计很快就会正式发布。据官方透露，这款模型在早期评估中表现出色，特别是在处理视频编辑任务时。现在它已进入最后调整期，计划在未来两周内进行版本更新。根据阿里巴巴内部的消息，该模型的API接口将在4月30日开放给公众使用。目前，已经向社区发布了

科技2026/4/152 阅读

高性能世界模型基线开源，高德加入CVPR 2026 WorldArena挑战赛

机器之心发布近两年来，视频生成模型如 Sora、Veo 和 Cosmos 等，在图像逼真度方面取得了显著进步，生成的画面已经很难区分真假。然而，这些模型是否真正理解了物理世界仍然是一个悬而未决的问题。实际上，当这些模型尝试生成机器人操作的视频时，经常会出现物体穿墙、凭空消失或时间顺序混乱等不符合物理学规律的现象。从「看起来像」到「真能用」，这条技术道路充满了挑战。针对这一问题，一场全球性的竞赛正在

科技2026/4/1327 阅读

阿里推出全新视频生成模型Wan2.7，称霸DesignArena排行榜

阿里巴巴的大模型Wan2.7在DesignArena的排行榜中位居榜首量子位的朋友们 2026-04-10 20:07:15 量子位

AI2026/4/121 阅读

欢乐马」横空出世超越Seedance 2.0：视频AI迎来新格局

当人们以为 Seedance 2.0 将要称霸时，却意外地出现了一匹黑马。周二晚，在知名的 AI 测试平台 Artificial Analysis 上，“HappyHorse-1.0”这个神秘视频生成模型突然登顶榜首，引起了整个 AI 社区的热烈讨论。它不仅在文字转视频和图像转视频上都排名第一，还将 Seedance 2.0 挤到了第二的位置。更令人惊讶的是它与对手的巨大差距：这款匿名模型仅上线一

科技2026/4/93 阅读

阿里推出千问APP新功能：万相2.7版视频生成技术实现简易编辑

据报道，阿里于4月3日发布了千问应用的最新版本，其中包括万相 2.7 视频生成模型，该模型具有视频编辑、续写和模仿动作的核心功能。视频编辑用户只需简短描述即可让千问对视频画面进行修改。例如，在镜头中添加人物、更换服装或调整背景，且能确保光影效果和细节自然和谐。除了提供多种创意风格的快速切换外，千问还支持用户自定义角色的动作和表情，并可编辑对话内容，同时保持口型和语调的一致性。此外，还可以改变拍摄角

科技2026/4/46 阅读

通义万2.7-Video发布：全面支持多模态内容创作与互动

最近，一项名为Wan2.7-Video的视频生成模型已经正式发布。这款创新工具能够处理包括文本、图像、音频和视频在内的多种输入模式，并专注于改进视频编辑与修改的技术。W2.7在视频编辑功能上表现出色，它允许用户通过简单的指令来局部调整画面内容，无需重新制作整个片段。具体来说，它可以实现元素的增加或删除（例如，“移除火车”）、物体替换（如“把胶片换成盘子”）以及修改物件属性（比如改变建筑物的颜色）。

科技2026/4/34 阅读

掌握核心，超越画质：解读阿里Wan2.7-Image创新技术｜甲子光年

千人千面、超长文本、指哪改哪，AI生图模型离生产力不远了。作者｜王艺过去一年，AI生图、生视频赛道的竞争烈度远超预期。国际上，GPT-Image系列持续迭代，Nano Banana Pro在多项基准测试中拉开身位；国内，可灵3.0、Seedance 2.0、Vidu Q3等模型你方唱罢我登场，在声画同步、视频生成长度、叙事连贯性方面卷出新高度。尽管图像和视频生成模型进展飞速，但目前的AI视频技术距

科技2026/4/39 阅读

机器人操控革新：732M模型力压7B，解锁视频中的物理洞察力

新智元报道机器人控制中的「数据困境」是业界长期关注的难题：要使机器人掌握精细操作，传统方法依赖大量人工标注的数据，这不仅耗资巨大，且耗时漫长。如何突破这一瓶颈？大规模视频生成模型通过学习海量视频数据，已经隐含地理解了物理世界的运作规则：物体如何移动、力如何传递、空间关系如何演变。这些知识与机器人操控所需的物理直觉高度契合。关键在于：能否将视频模型中的物理先验知识应用到机器人控制中？中山大学王广润教

科技2026/3/2811 阅读

昆仑万维发布“AIGC全能套件大模型”，视频、游戏、音乐多领域同步发力，彰显新一代AGI布局

江宇撰写，冰倩编辑昆仑万维旗下的天工AI在2026中关村论坛“人工智能主题日”上，发布了其最新的“AIGC全家桶大模型”系列，包括游戏世界模型Matrix-Game 3.0、视频生成模型SkyReels V4以及音乐生成模型Mureka V9。这些模型均已达到全球领先水平。在同一活动中，天工AI的董事长兼首席执行官周亚辉首次详细介绍了公司AGI战略的升级，从原先的六大方向精简为“4大模型+3大平台

科技2026/3/283 阅读

PixVerse在阿里云百炼平台首次发布三方视频生成模型

阿里云百炼平台迎来了PixVerse的首次亮相。量子位的朋友们 2026-03-27 11:30:49 量子位作为百炼平台的一

AI2026/3/283 阅读

全球视频模型迎来新王者！

最近，天工AI的SkyReels-V4登顶了全球视频生成模型榜单，成为业界关注的焦点。这个消息让许多人感到意外，毕竟目前的热门话题大多集中在“龙虾”上。一水 2026-03-19 14:55:36 量子位

AI2026/3/203 阅读