搜索: "多模态内容"

共找到 3 篇相关文章

通义万2.7-Video发布：全面支持多模态内容创作与互动

最近，一项名为Wan2.7-Video的视频生成模型已经正式发布。这款创新工具能够处理包括文本、图像、音频和视频在内的多种输入模式，并专注于改进视频编辑与修改的技术。W2.7在视频编辑功能上表现出色，它允许用户通过简单的指令来局部调整画面内容，无需重新制作整个片段。具体来说，它可以实现元素的增加或删除（例如，“移除火车”）、物体替换（如“把胶片换成盘子”）以及修改物件属性（比如改变建筑物的颜色）。

科技2026/4/34 阅读

凤凰卫视与海天瑞声达成战略合作推动中文自然语言融入全球AI生态

凤凰网科技讯 3月31日，凤凰卫视在香港举办三十周年台庆的庆典，活动发布了多项重要合作。凤凰卫视执行副总裁兼运营总裁李奇与国内AI训练数据领域龙头企业——海天瑞声创始人、董事长贺琳出席仪式并交换文件，双方将携手深入挖掘海量音视频、文本及多语种、多模态内容，建设具备高知识密度和多元文化视角的高质量数据，为训练大模型逻辑推理、跨文化认知能力提供“黄金语料”。凤凰卫视三十周年台庆签约现场据凤凰卫视执行副

科技2026/3/312 阅读

可灵携手滑铁卢大学发布UniVideo：引领视频理解与创造新时代

在多模态内容的理解和生成领域，统一的多模型已经显示出显著的效果，但这些成果主要集中在图像处理上。近日，滑铁卢大学与快手可灵团队共同研发出了一种名为 UniVideo 的创新性系统。该系统能够在单一框架下执行视频理解、创建及编辑任务，并且基于一个多模态生成模型构建而成。UniVideo 采用双通道结构设计，将大规模多模态语言模型（MLLM）的指令理解和推理能力与多模态扩散 Transformer（M

科技2026/3/611 阅读

搜索: "多模态内容"

通义万2.7-Video发布：全面支持多模态内容创作与互动

凤凰卫视与海天瑞声达成战略合作 推动中文自然语言融入全球AI生态

可灵携手滑铁卢大学发布UniVideo：引领视频理解与创造新时代

凤凰卫视与海天瑞声达成战略合作推动中文自然语言融入全球AI生态