
Sora视频生成工具或将入驻ChatGPT 活跃用户数量现下降迹象
据报道,《The Information》在今天的午间消息中透露,OpenAI 正计划将 Sora 的视频生成技术集成到 ChatGPT 中。这一举措被视为 OpenAI 扩大用户群体整体策略的一部分。然而,随着视频生成功能的加入,ChatGPT 的运营成本可能会进一步增加。作为 OpenAI 在多模态人工智能领域的重要产品之一,Sora 目前与 Meta 和谷歌开发的相关文本转视频工具处于竞争状
共找到 31 篇相关文章

据报道,《The Information》在今天的午间消息中透露,OpenAI 正计划将 Sora 的视频生成技术集成到 ChatGPT 中。这一举措被视为 OpenAI 扩大用户群体整体策略的一部分。然而,随着视频生成功能的加入,ChatGPT 的运营成本可能会进一步增加。作为 OpenAI 在多模态人工智能领域的重要产品之一,Sora 目前与 Meta 和谷歌开发的相关文本转视频工具处于竞争状

从今年年初至今,视频生成领域的发展突飞猛进,尤其是生数科技推出的Vidu Q3模型,在多项关键指标上实现了飞跃:支持声画同步、长视频制作和人物仿真度提升等。作者|王艺生数科技的Vidu Q3具备音画同出能力,解决了此前AI视频生成中常见的音频与画面不匹配问题。这项功能让用户体验更加连贯流畅,进一步丰富了内容创作的可能性。此外,生数科技还优化了其模型在长视频制作中的表现,能够生成长达数十秒的高质量片

龙虾也能制作视频了?这听起来有些不可思议。 最近,网友在X上分享了一款名为“Open Claw”的视频生成工具“AIVideo Agent”,它改变了龙虾的新玩法。 该工具能够全天候不间断工作,自主完成整个视频创作流程。用户无需任何技术背景就能轻松使用:无须API密钥、技术设置或复杂配置。 用户只需用自然语言输入需求即可。 据官方宣传视频显示,它能帮你剪辑视频,并在你熟睡时自动发布到邮箱和各大社

在过去一年里,人们普遍认为大模型意味着更强的质量,但速度必然更慢。然而,袁粒课题组基于UniWorld-OSP2.0训练出了名为OSP-RealTime 14B的模型,在单块昇腾Atlas A3系列产品上实现了每秒生成十帧的实时文生视频效果,成为首个接近“交互式视频生成”的开源级扩散架构。UniWorld-OSP2.0通过FlashI2V解决了物理真实感问题,并利用冻结状态下的预训练视觉语言模型(

一份由大连理工大学、快手可灵团队及香港中文大学合作完成的研究报告最近公布,该研究的第一作者为王清和,一名专注于视频生成技术的大连理工三年级博士生,在导师卢湖川教授和贾旭的指导下进行相关工作,并在快手可灵团队中实习。最近一段时间,包括可灵3.0、Seedance 2.0在内的几款产品因其多镜头叙事能力在市场上迅速走红。这些产品能够一次生成多个高质量的导演级镜头,标志着视频生成领域已经从传统的单镜头生

智东西作者 三北编辑 漠影春节后的AI视频赛道,热闹得有点不像话。前几周,字节Seedance2.0刚在全球开发者社区刷了一波屏,引得不少海外网友注册中国手机号来体验。热度还没退,另一支在海外颇有名气的国产力量已经悄悄在权威榜单上插上了旗。2月26日,全球权威AI评估机构Artificial Analysis更新了文生视频/图生视频模型排行榜。国内头部AI视频生成企业爱诗科技旗下的PixVerse

新智元报道昆仑万维的SkyReels-V4是最新发布的视频生成模型,在全球AI竞赛中名列前茅。这款产品在众多竞争者中脱颖而出,其背后的技术革新令人瞩目。SkyReels-V4不仅具有卓越的功能性,还在创意和实际应用方面展现了巨大潜力。其核心竞争力在于全面的多模态输入能力和音视频联合生成技术。这种能力涵盖了从文本、图像到音频等多样化的数据类型组合使用,为用户提供了一个全新的创作工具平台。此外,Sky

该文章介绍了昆仑天工的最新视频生成模型SkyReels-V4,它能实现全场景、全流程以及多种模态下的视频生成和编辑任务。相较于之前的AI工具,SkyReels-V4提供了更为集成的工作流程,让创作者能够同时利用文本、图像与音频等多种形式的数据。SkyReels-V4在视觉质量、运动流畅度及声音自然度方面都有显著提升,并且实现了多个模态信息的整合生成。文章指出,该模型能根据输入的不同条件灵活地生成高

机器之心编辑部在全球具身智能领域的权威测评 WorldArena 榜单中,清华大学陈建宇(星动纪元创始人)和斯坦福大学切尔西·芬恩(PI 创始人)团队研发的 Ctrl-World 世界模型取得了优异的成绩:具身任务能力获得全球第一,并在主体一致性、轨迹精度、深度准确性及策略评估一致性四大核心维度上登顶;视频生成方面排名第二,仅次于阿里 Wan 2.6,超越谷歌 Veo 3.1 和英伟达 Cosmo

视频生成扩散模型体积日益增大:从 2B 到 5B 再到 14B 等,效果显著提升的同时,训练和推理的成本也急剧上升。社区希望利用量化技术缩小模型规模,降低显存及计算成本,使其能在更多设备上运行并实现低成本部署。然而实际情况并不乐观:一旦使用 3/4 比特,视频生成的量化感知训练(QAT)相比图像更加难以处理且稳定性较差,画质下降幅度更大——不是轻微减少质量,而是变得无法接受。图表展示了 CogVi

在2026年的开端,视频生成模型继续引发广泛关注。游戏科学创始人冯骥在微博上发布了一篇长文,分享了他体验字节跳动最新视频生成模型Seedance 2.0后的感受,形容其为“地表最强”,并感叹“AIGC的婴儿期已经结束”。冯骥认为,目前Seedance 2.0具有领先性、全能性和低门槛特性,能够大幅提升产能和推动视频普及。这得益于它在理解多模态信息(包括文字