
不只能画图!谷歌推出Gemini Omni:只需动动嘴 AI自动帮你改大片
快科技5月20日消息,在Google I/O 2026上,谷歌正式发布Gemini Omni模型。该模型支持文本、图像、音频、视频作为输入,实现跨模态生成与编辑。其中在音频方面,目前该模型初期仅支持语音输入,但Google表示未来将很快扩展更多类型的音频输入能力。首发产品Gemini Omni Flash已在Gemini应用上线,后续将向企业客户开放API。该模型核心卖点在于深度视频编辑能力。用户
共找到 2490 篇相关文章

快科技5月20日消息,在Google I/O 2026上,谷歌正式发布Gemini Omni模型。该模型支持文本、图像、音频、视频作为输入,实现跨模态生成与编辑。其中在音频方面,目前该模型初期仅支持语音输入,但Google表示未来将很快扩展更多类型的音频输入能力。首发产品Gemini Omni Flash已在Gemini应用上线,后续将向企业客户开放API。该模型核心卖点在于深度视频编辑能力。用户

同样的暴论,有的大人物说,招来的是反驳;有的大人物说,招来的是嘲笑。5月中《财富》杂志扒出微软AI负责人穆斯塔法·苏莱曼今年2月的访谈,着力挖苦。苏莱曼在访谈中称“未来12-18个月内,大部分要在电脑前执行的专业任务将被AI自动完成”。《财富》杂志皮里阳秋地点评,这种话真的很像Anthropic老板阿莫迪2025年的腔调。同样的话,阿莫迪说,杨立昆会驳斥;苏莱曼说,被嘲笑成炒作都跟不上潮流。按《财

凤凰网科技讯 5月20日,第79届戛纳电影节期间,字节跳动旗下火山引擎携AI视频生成工具Seedance 2.0亮相。由美国AI视频平台Higgsfield基于Seedance 2.0打造的长片《HELL GRIND》将正式首映,成为全球首部时长95分钟的AI生成电影。该片仅由15人团队在14天内完成,制作成本不足50万美元,仅为传统同等规格影片的1%。据片方介绍,该技术在人物一致性与镜头连贯性方

凤凰网科技讯 5月20日,今日,首批搭载阿里云自研AI Agent(代号JVS Claw,昵称“龙虾”)的PC电脑正式上市。来酷、机械革命、机械师、雷神、京天华盛、攀升、宁美国度、技嘉、天钡、AOC等10余家品牌同步推出了笔记本电脑、台式机及mini主机等新品,均出厂预装JVS Claw智能助手,开机即可使用,无需用户手动下载安装。与传统AI工具需单独部署不同,这批Agent PC将AI能力深度集

快科技5月20日消息,据智己汽车官方消息,智己LS6上汽一亿台限定版正式上市,为纪念上汽集团达成一亿辆汽车交付里程碑推出,共两款车型,售价分别为23.49万元、25.49万元,限量发售5000台,6 月上旬开启交付。新车基于现款Max版本升级,加价一万元,标配520线超视域激光雷达+英伟达Thor芯片,AI算力达700TOPS,智驾硬件大幅提升。舒适性配置同步升级,新增二排座椅通风、按摩功能,并配

5月19日消息,据彭博社报道,苹果计划在iOS 27和iPadOS 27中加入AI写作辅助、语法检查、自然语言生成快捷指令,以及自定义壁纸生成等功能。知情人士称,苹果希望借此缩小自己与谷歌三星等对手在AI功能上的差距。分析称,苹果这轮计划影响的不是少数重度玩家,而是普通用户每天都会碰到的输入、整理和个性化场景。过去两年,很多AI产品飞速进步,但入口并不自然。用户需要打开一个单独的聊天框,把问题组

机器之心编辑部近日,谷歌 DeepMind 研究员 Lun Wang@lunwang1996,在 x 上发文宣布自己已经从 DeepMind 离职,结束了这段非常精彩的旅程,「我非常感谢曾经共事的人、我们一起打造的东西,以及我在将前沿 AI 研究推向生产环境过程中学到的经验。」Lun Wang 表示,在 DeepMind 的工作经历塑造了他对研究、产品、评估,以及如何真正大规模构建 AI 系统的理

新智元报道【新智元导读】攻克AI落地难题,清华团队推出RWAI框架与真实场景竞技场,通过标准化人机交互、任务集机制与人类反馈体系,显著提升产业应用效率。平台已实现落地周期缩短70%以上,并为AI开发者和企业提供了可复制的最佳实践。2026年,AI产业经历「模型能力突飞猛进」与「产业落地困难重重」的「冰火两重天」。在大厂相继发布新模型、Open Claw爆火之际,清华长三角研究院人工智能创新研究中心

新智元报道【新智元导读】教宗利奥十四世将于 5 月 26 日发布任期首份通谕,主题直指 AI,Anthropic 联合创始人、Claude 缔造者 Chris Olah 受邀同台。梵蒂冈同步成立 AI 委员会。一个两千年的古老机构,正试图用道德权威填补 AI 治理的真空——它覆盖的人口,比任何一部 AI 法案的管辖范围都大。一个拥有 14 亿信众、存续两千年的机构,把 AI 列为了头号议程,还拉上

智东西作者 杨京丽编辑 李水青智东西5月19日消息,今天凌晨,Anthropic宣布已收购开发者工具初创公司Stainless。此前,Stainless的软件被包括OpenAI和谷歌在内的多家公司广泛使用,收购完成后,其工具将只对Anthropic可用,不再向竞争对手开放。▲Anthropic宣布收购Stainless(图源:X)Anthropic和Stainless均未披露交易条款。据The I

中美AI竞争,进入“有限接触”时代。作者|王博 卫琳聪为期三天的美国总统特朗普访华之旅结束了,“压哨”随行的英伟达创始人、CEO黄仁勋也在中国的社交媒体上“逛了几天”南锣鼓巷,但是官方成果中没有出现AI芯片谈判的成果。美国贸易代表杰米森·格里尔(Jamieson Greer)在接受彭博电视台采访时表示,美国和中国没有就对中国的严格芯片出口管制进行深入谈判。“这不是双边会议上的主要讨论话题……我们在

太空算力融合了航天、AI、通信、能源、智算等多领域技术,涉及算力芯片、星间通信、供能散热、卫星制造以及火箭发射等环节,产业链条较长,更好赋能多业态跨领域的协同创新发展 文 |《瞭望》新闻周刊记者 陈燕 未来,渔民只需通过手机App向卫星发起查询,卫星便可借助高光谱相机精准定位金枪鱼位置,再通过在轨“智慧大脑”分析处理,将鱼群坐标、渔具使用建议及销售渠道指导等实用信息,精准传回渔民手中。
5月19日消息,据路透社刚刚报道,Meta 计划于当地时间 5 月 20 日(周三)在全球范围内裁员 10%,同时进行新一轮组织架构调整,旨在优化公司的人工智能工作流程。Meta 首席人事官 Janelle Gale 在一份内部备忘录中向员工表示,公司计划将 7000 名员工转移至与 AI 工作流相关的新项目,并取消部分管理岗位。随着组织负责人推进这些调整,许多人已将 AI 原生设计原则融入新的组

「核心提示」Agent创业的真正机会在基模够不着的角落。AI Agent正在成为越来越多人的“工作搭子”。今年5月的百度开发者大会上,李彦宏提出,AI时代的度量衡不该是消耗多少token,而是DAA(Daily Active Agents),即每天有多少Agent在给人类交付结果。这背后是大厂面向普通用户的Agent平台竞赛:字节Coze、百度AgentBuilder、腾讯元器、阿里百炼,几乎每家

新智元报道【新智元导读】5 月 19 日,OpenAI 联合创始人、「Vibe Coding」之父 Andrej Karpathy 宣布加入 Anthropic 预训练团队。他将组建新团队,用 Claude 加速预训练研究。一个做过Hinton和李飞飞学生、奥特曼同事、马斯克直属下属的人,为什么甘愿做 Dario Amodei 的「-2」?Anthropic 又为什么非要招他?5 月 19 日晚上

智东西作者 程茜 陈佳编辑 云鹏智东西5月20日报道,今日凌晨,在一年一度的谷歌I/O开发者大会上,谷歌接连甩出2款新模型、谷歌搜索25年最大升级、Claude Code谷歌版开发平台Antigravity 2.0、AI眼镜等多个大招!谷歌CEO桑达尔·皮查伊(Sundar Pichai)称,这次谷歌I/O大会的新发布,意味着其已正式迈入智能体驱动的Gemini时代。皮查伊一开场就放出了自

拼参数的模型时代已过去,接下来是拼生意的智能体时代。作者|徐珊5 月 20 日,美国加州山景城,Google CEO Sundar Pichai 又一次走上 Google I/O 的舞台,掌声热烈。今年他却没有像往年那样,一上来就亮出新模型。他先亮里一组数据展示 Google 过去一年的成果。Gemini App 达到 9 亿月活、AI Mode 达到 10 亿月活的、 Workspace 的用户


美国人工智能(AI)晶片制造商Cerebras Systems上市首日股价大涨68%,此前公司通过今年规模最大的首次公开售股(IPO)筹资55亿5000万美元(约71亿0000万新元),显示投资者对AI数据中心及相关晶片需求依旧强劲。 彭博社报道,总部位于美国加州森尼韦尔的Cerebras星期四(5月14日)在纽约挂牌,收报每股311.07美元,高于185美元的IPO发行价。该股盘中一度因波动剧