搜索: "视频生成模型"

共找到 23 篇相关文章

在AI视频生成这块,“遥遥领先”成真了

在AI视频生成这块,“遥遥领先”成真了

有消息称,字节跳动视频生成模型Seedance 2.1将于近期发布,预计生成效果较2.0版本提升20%。字节对字母AI表示,此消息为假消息。虽然Seedance 2.1未必会于近期发布,但是Seedance 2.0在海外热度大涨却是真的。原因在于,周末,一篇标题为《中国人工智能企业在视频生成竞赛中领跑美国对手》(Chinese AI groups pull ahead of US rivals i

科技1 阅读
赋予视频生成「视觉思维链」:VChain显式建模时空规划与状态演变

赋予视频生成「视觉思维链」:VChain显式建模时空规划与状态演变

当视频生成模型在视觉保真度上不断突破时,一个核心瓶颈正变得愈发清晰:模型是否真正理解了真实世界?能否推理出合理的演变过程?在具身智能、影视制作以及物理仿真等应用场景中,要求模型不仅要生成 “平滑的像素”,更要实现 “逻辑连贯的演化”。这种对物理规律与因果关系的建模能力,是当前基于大数据驱动的端到端生成模型面临的长期挑战。那么,我们能否将多模态大模型(MLLM)的推理能力,作为一种 “外脑” 注入到

科技4 阅读
Seedance 2.1近期将发布,效果预计提升20%

Seedance 2.1近期将发布,效果预计提升20%

5月19日消息,据AI普瑞斯独家获悉,字节跳动视频生成模型Seedance 2.1将于近期发布,预计生成效果较2.0版本提升20%。此外,字节跳动还将推出Seedance2.0低配版,比目前的fast版效果更好,但价格更低,预计是5毛一秒,可能要对市场上其他厂商的视频模型造成巨大冲击。据行业人士向AI普瑞斯透露,按日消耗占比计算,Seedance已占据市场超八成份额,可灵约占14%,万相2.7约占

科技2 阅读
Seedance 2.0最强对手偷跑了

Seedance 2.0最强对手偷跑了

现在无论哪一家要发布视频模型,都免不了要被拉来和 Seedance 2.0 对比。而最近比较沉寂的 Google,似乎在悄悄憋一个大招,来重夺视频生成的王座。今天凌晨,有网友在 Gemini 中意外触发了一个全新的视频生成模型——Omni(全能)。在 Gemini 的聊天页面,直接显示着「用 Gemini Omni 来创作,认识一下我们全新的视频生成模型。重混你的视频、在对话中直接进行编辑、尝试丰

科技2 阅读
阿里推出全新应用「欢乐马」,抢先体验潜力新星

阿里推出全新应用「欢乐马」,抢先体验潜力新星

隐藏在幕后的「欢乐马」终于揭开了它的面纱。4月27日,阿里ATH团队发布了视频生成模型HappyHorse 1.0的首个版本。这款模型基于原生多模态架构设计,不仅能同时处理音视频内容,还能实现创作和编辑的一站式服务,免去了繁琐的操作过程。此前它在知名AI评测平台Artificial Analysis上的表现备受关注,无论是文字生成视频还是图像转换成视频,均获得了第一名的佳绩,使Seedance 2

科技5 阅读
大厂豪掷数百亿争夺AI人才,字节跳动引领激战潮流

大厂豪掷数百亿争夺AI人才,字节跳动引领激战潮流

文丨辰聪出品丨师天浩观察(shitianhao01)4月20日,两则消息几乎同时砸进我的信息流。一则是字节跳动2025年净利润暴跌超70%,从2024年的330亿美元缩水到90多亿。另一则是阿里旗下视频生成模型HappyHorse-1.0宣布4月27日开放API测试,5月正式商用。两件事单看没什么,放在一起看,就有意思了。一个是在账面上“大出血”,一个是在战场上“亮新刀”。表面上八竿子打不着,实际

科技2 阅读
多名关键高层同期离任引发OpenAI动荡:此前已停止Sora等项目

多名关键高层同期离任引发OpenAI动荡:此前已停止Sora等项目

周五,OpenAI宣布其两名关键人物将离开公司,他们分别是Moonshots项目的领导者。这一人事变动发生在该公司调整战略方向、专注于企业级人工智能业务和超级应用开发之际。凯文·威尔(Kevin Weil)是科学研究项目负责人,而比尔·皮布尔斯(Bill Peebles)则是AI视频生成模型Sora的核心研究员,两人同时宣布离职。OpenAI此前已决定缩减包括Sora在内的几个面向消费者项目的规

科技3 阅读
字节发布Seedance 2.0研究论文,深入解析四项关键技术特征及测评详情

字节发布Seedance 2.0研究论文,深入解析四项关键技术特征及测评详情

近日,字节跳动团队发布了一份关于Seedance 2.0的技术报告,《Seedance 2.0: Advancing Video Generation for World Complexity》(《Seedance 2.0:推动视频生成应对复杂世界》),详细阐述了这款多模态视频生成模型的各项能力及测试成果。据悉,自今年二月初以来,Seedance 2.0已在豆包、即梦AI和火山引擎等平台投入使用,

科技1 阅读
阿里新作HappyHorse击败Seedance:API将于4月30日正式启用

阿里新作HappyHorse击败Seedance:API将于4月30日正式启用

最近,阿里ATH创新事业部研发的一款名为HappyHorse-1.0的视频生成模型,在Arena.ai平台上低调上线并启动了测试阶段,目前正处于最终优化过程中,预计很快就会正式发布。据官方透露,这款模型在早期评估中表现出色,特别是在处理视频编辑任务时。现在它已进入最后调整期,计划在未来两周内进行版本更新。根据阿里巴巴内部的消息,该模型的API接口将在4月30日开放给公众使用。目前,已经向社区发布了

科技2 阅读
高性能世界模型基线开源,高德加入CVPR 2026 WorldArena挑战赛

高性能世界模型基线开源,高德加入CVPR 2026 WorldArena挑战赛

机器之心发布近两年来,视频生成模型如 Sora、Veo 和 Cosmos 等,在图像逼真度方面取得了显著进步,生成的画面已经很难区分真假。然而,这些模型是否真正理解了物理世界仍然是一个悬而未决的问题。实际上,当这些模型尝试生成机器人操作的视频时,经常会出现物体穿墙、凭空消失或时间顺序混乱等不符合物理学规律的现象。从「看起来像」到「真能用」,这条技术道路充满了挑战。针对这一问题,一场全球性的竞赛正在

科技27 阅读
欢乐马」横空出世超越Seedance 2.0:视频AI迎来新格局

欢乐马」横空出世超越Seedance 2.0:视频AI迎来新格局

当人们以为 Seedance 2.0 将要称霸时,却意外地出现了一匹黑马。周二晚,在知名的 AI 测试平台 Artificial Analysis 上,“HappyHorse-1.0”这个神秘视频生成模型突然登顶榜首,引起了整个 AI 社区的热烈讨论。它不仅在文字转视频和图像转视频上都排名第一,还将 Seedance 2.0 挤到了第二的位置。更令人惊讶的是它与对手的巨大差距:这款匿名模型仅上线一

科技3 阅读
阿里推出千问APP新功能:万相2.7版视频生成技术实现简易编辑

阿里推出千问APP新功能:万相2.7版视频生成技术实现简易编辑

据报道,阿里于4月3日发布了千问应用的最新版本,其中包括万相 2.7 视频生成模型,该模型具有视频编辑、续写和模仿动作的核心功能。视频编辑用户只需简短描述即可让千问对视频画面进行修改。例如,在镜头中添加人物、更换服装或调整背景,且能确保光影效果和细节自然和谐。除了提供多种创意风格的快速切换外,千问还支持用户自定义角色的动作和表情,并可编辑对话内容,同时保持口型和语调的一致性。此外,还可以改变拍摄角

科技6 阅读
通义万2.7-Video发布:全面支持多模态内容创作与互动

通义万2.7-Video发布:全面支持多模态内容创作与互动

最近,一项名为Wan2.7-Video的视频生成模型已经正式发布。这款创新工具能够处理包括文本、图像、音频和视频在内的多种输入模式,并专注于改进视频编辑与修改的技术。W2.7在视频编辑功能上表现出色,它允许用户通过简单的指令来局部调整画面内容,无需重新制作整个片段。具体来说,它可以实现元素的增加或删除(例如,“移除火车”)、物体替换(如“把胶片换成盘子”)以及修改物件属性(比如改变建筑物的颜色)。

科技4 阅读
掌握核心,超越画质:解读阿里Wan2.7-Image创新技术|甲子光年

掌握核心,超越画质:解读阿里Wan2.7-Image创新技术|甲子光年

千人千面、超长文本、指哪改哪,AI生图模型离生产力不远了。作者|王艺过去一年,AI生图、生视频赛道的竞争烈度远超预期。国际上,GPT-Image系列持续迭代,Nano Banana Pro在多项基准测试中拉开身位;国内,可灵3.0、Seedance 2.0、Vidu Q3等模型你方唱罢我登场,在声画同步、视频生成长度、叙事连贯性方面卷出新高度。尽管图像和视频生成模型进展飞速,但目前的AI视频技术距

科技9 阅读
机器人操控革新:732M模型力压7B,解锁视频中的物理洞察力

机器人操控革新:732M模型力压7B,解锁视频中的物理洞察力

新智元报道机器人控制中的「数据困境」是业界长期关注的难题:要使机器人掌握精细操作,传统方法依赖大量人工标注的数据,这不仅耗资巨大,且耗时漫长。如何突破这一瓶颈?大规模视频生成模型通过学习海量视频数据,已经隐含地理解了物理世界的运作规则:物体如何移动、力如何传递、空间关系如何演变。这些知识与机器人操控所需的物理直觉高度契合。关键在于:能否将视频模型中的物理先验知识应用到机器人控制中?中山大学王广润教

科技11 阅读
昆仑万维发布“AIGC全能套件大模型”,视频、游戏、音乐多领域同步发力,彰显新一代AGI布局

昆仑万维发布“AIGC全能套件大模型”,视频、游戏、音乐多领域同步发力,彰显新一代AGI布局

江宇撰写,冰倩编辑昆仑万维旗下的天工AI在2026中关村论坛“人工智能主题日”上,发布了其最新的“AIGC全家桶大模型”系列,包括游戏世界模型Matrix-Game 3.0、视频生成模型SkyReels V4以及音乐生成模型Mureka V9。这些模型均已达到全球领先水平。在同一活动中,天工AI的董事长兼首席执行官周亚辉首次详细介绍了公司AGI战略的升级,从原先的六大方向精简为“4大模型+3大平台

科技3 阅读
全球视频模型迎来新王者!

全球视频模型迎来新王者!

最近,天工AI的SkyReels-V4登顶了全球视频生成模型榜单,成为业界关注的焦点。这个消息让许多人感到意外,毕竟目前的热门话题大多集中在“龙虾”上。 一水 2026-03-19 14:55:36 量子位

AI3 阅读