搜索: "Gemini"

共找到 41 篇相关文章

AI掌控生活新纪元:Gemini系统仅19.99美元终身服务引发热议

AI掌控生活新纪元:Gemini系统仅19.99美元终身服务引发热议

新智元报道一个新时代正在开启,告别了聊天机器人的时代,谷歌将人工智能技术嵌入到了Android系统的深处,使其成为一种能够主动管理各种事务的智能系统。在2026年二月的一次更新中,AI的发送按钮消失了,取而代之的是「预设指令」功能。这一改变彻底颠覆了原有的游戏规则。从前那种用户提问、机器回答的方式已经不复存在,现在Gemini可以根据时间、位置和个人数据主动执行任务。据悉,在2026年,Googl

科技1 阅读
基于隐空间动力学的大模型RL探索新视角——寻求平衡之道

基于隐空间动力学的大模型RL探索新视角——寻求平衡之道

强化学习已成为推动大型模型性能飞跃的关键技术手段。从OpenAI的o3、DeepSeek-R1到Gemini 3,这些前沿模型通过不断微调强化训练来提升解决复杂推理任务的能力。然而,在这一过程中也逐渐暴露出一个问题:随着训练的深入,策略分布趋向集中,探索能力随之减弱,最终导致优化欠收敛和性能瓶颈。这种现象从根本上说是由于在强化学习中探索与利用之间的不平衡造成的,并且在稀疏奖励的可验证奖励强化学习(

科技3 阅读
谷歌发布Gemman 4开源版本,310亿参数挑战顶级模型性能

谷歌发布Gemman 4开源版本,310亿参数挑战顶级模型性能

Google DeepMind 最近公布了其最新的开源模型 Gemma 4:该模型拥有大约 300 亿个参数,在性能上与市面上的其他主流开源项目不相上下。Gemma 是一个由 Google 开发的开源系列,它和谷歌自家的闭源产品 Gemini 共享基础技术。Gemma 的所有权重都向公众开放,任何人都可以获取、修改或部署这些模型。该系列的上一版本 Gemma 3 发布于 2025 年三月,至今已过

科技2 阅读
千问成功了,而 Gemini 失败了的事情

千问成功了,而 Gemini 失败了的事情

摘要:尽管“Gemini叫Uber”和“千问直接打车”的功能看似相似,但实际上两者有着本质的区别。前者仅限于让AI操控应用程序界面完成任务,而后者则是真正赋予了AI深层次的推理能力,使其能够深入参与到实际的服务履约过程中。凤凰网科技 出品作者|Dale在中国的人工智能领域中,有两家公司始终保持着独立的发展路线,并未被行业热潮所左右:DeepSeek和千问。前者专注于AGI信念的研究与技术革新;后者

科技1 阅读
谷歌即将在4月3日推出开源大模型Gemma 4,独家报道!中国开发者可自由访问

谷歌即将在4月3日推出开源大模型Gemma 4,独家报道!中国开发者可自由访问

据消息人士透露,谷歌 DeepMind 计划在 4 月 3 日(北京时间)凌晨发布其开源大模型 Gemma 系列的新版本——Gemma4。据悉,这一更新将允许中国内地的开发者直接访问和使用该模型。谷歌于今年推出的 Gemma 是一款开源大型语言模型产品线,它与谷歌旗舰闭源大模型 Gemini 使用了相同的底层技术框架。此前,该系列已推出了多个版本,并在全球开源大模型领域中与 Meta 的 Lla

科技1 阅读
谷歌干掉「请再说一次」!Gemini 3.1毫秒级接话,实时Agent时代来了

谷歌干掉「请再说一次」!Gemini 3.1毫秒级接话,实时Agent时代来了

新智元报道【新智元导读】语音AI最烦人的一句话,可能终于要被谷歌干掉了。Gemini 3.1 Flash Live 正在逼近「像人与人说话那样响应」的体验:不仅更快、更自然,连在交通声、电视声这样的真实噪音里,也更能听清你在说什么。刚刚,谷歌把语音AI最烦人的一句话狠狠干掉了:「请再说一次。」这次谷歌新发布的 Gemini 3.1 Flash Live,直接瞄准了现实生活中最乱、最吵的那些场景。h

科技1 阅读
谷歌干掉“请再说一次”!Gemini 3.1毫秒级接话,实时Agent时代来了

谷歌干掉“请再说一次”!Gemini 3.1毫秒级接话,实时Agent时代来了

【新智元导读】语音AI最烦人的一句话,可能终于要被谷歌干掉了。Gemini 3.1 Flash Live 正在逼近「像人与人说话那样响应」的体验:不仅更快、更自然,连在交通声、电视声这样的真实噪音里,也更能听清你在说什么。刚刚,谷歌把语音AI最烦人的一句话狠狠干掉了:「请再说一次。」这次谷歌新发布的 Gemini 3.1 Flash Live,直接瞄准了现实生活中最乱、最吵的那些场景。https:

科技3 阅读
语音助手革命来袭!谷歌新品让对话变高效,或成Siri升级王牌?

语音助手革命来袭!谷歌新品让对话变高效,或成Siri升级王牌?

江宇撰写,冰倩编辑谷歌在3月26日的凌晨发布了其最新的语音和音频模型Gemini 3.1 Flash Live,这款模型已在Gemini应用、Search Live以及Google AI Studio中上线,其中包括一个开发者预览版本。此次更新主要提升了实时语音代理的功能,语音可以直接控制应用开发,Gemini App的实时多模态对话功能也得到了加强,多项测试结果表明,该模型的表现优于其他同类产品

科技2 阅读
硅谷初创企业发新模型挑战谷歌,性能媲美竞品,价格更亲民三成!

硅谷初创企业发新模型挑战谷歌,性能媲美竞品,价格更亲民三成!

近日,硅谷初创企业Luma AI发布了其最新图像模型Uni-1,该模型结合了图像理解和图像生成的功能,具有强大的思考和创作能力。据测试结果显示,Uni-1的性能与Google的Gemini 3 Pro相当,在高分辨率图像生成方面成本降低了大约10%到30%,并且在空间理解能力方面超越了谷歌Nano Banana 2和OpenAI GPT Image 1.5。Luma AI成立于2021年,最初以D

科技2 阅读
谷歌Gemini能否稳坐硅谷救星宝座?Meta和苹果纷纷求援

谷歌Gemini能否稳坐硅谷救星宝座?Meta和苹果纷纷求援

当遇到棘手问题时,借用谷歌的力量或许是个不错的选择。最近,Meta公司遭遇了一些挫折,最明显的例子就是新模型“牛油果”的开发进度被推迟。这一推迟的原因相当直接,模型的性能没有达到预期目标,它甚至还不如去年三月发布的Gemini 2.5,更不用说去年十一月的Gemini 3.0了。在一些内部讨论中,有一项被忽视的细节是,公司高层曾考虑过在“牛油果”尚未准备好之前,先使用Gemini作为过渡方案。今年

科技1 阅读
Gemini盘后股价攀升6%,季度财报表现强劲

Gemini盘后股价攀升6%,季度财报表现强劲

Gemini加密货币交易所的股票在盘后交易中显著上涨,原因是信用卡使用率上升和费用结构的调整,以及该公司公布的强劲第四季度业绩。Gemini在周四披露,其第四季度营收同比增长39%,达到了6030万美元,这一数字超过了分析师预期的5170万美元。Gemini报告称,第四季度净亏损为1.408亿美元,相比去年同期的2700万美元亏损进一步扩大。全年亏损总额为5.85亿美元,高于2024年的1.566

区块链1 阅读
股价下滑战略调整引发 Gemini 面临诉讼风波

股价下滑战略调整引发 Gemini 面临诉讼风波

Gemini正因其九月首次公开募股期间和之后对投资者的误导行为,在纽约遭遇一起拟议集体诉讼。该诉讼由股东于本周四在曼哈顿联邦法院提起,针对Gemini、其联合创始人泰勒和卡梅伦·温克莱沃斯,以及公司的其他高级管理人员。原告马克·梅斯文指出,Gemini在其IPO文件中声称是一家致力于扩大用户基础和国际布局的加密货币交易平台,但事实上却突然转向了预测市场的商业模式。Gemini于九月在纳斯达克上市,

区块链2 阅读
谷歌启用Gemini增强地图功能,导航革命即将来临,内置广告模式浮出水面?

谷歌启用Gemini增强地图功能,导航革命即将来临,内置广告模式浮出水面?

据报道,谷歌正在将其Gemini人工智能技术融入地图服务的一项新功能中。该公司正积极地将AI工具更深入地集成到其广泛的产品线中。谷歌地图的高级副总裁米里亚姆·丹尼尔在一篇博文中透露,名为“询问地图”的新按钮将配备一个聊天机器人,使用户能够提出超出常规导航范围的问题。用户现在可以询问诸如“哪里有提供充电服务且无需排队购买咖啡的地方?”或“今天晚上是否有带灯光的公共网球场可供使用?”等问题。谷歌声称

科技1 阅读
QQ浏览器荣登a16z全球AI应用榜单,成国内独一家入选产品

QQ浏览器荣登a16z全球AI应用榜单,成国内独一家入选产品

在3月10日,硅谷知名风险投资公司Andreessen Horowitz(a16z)公布了第六次发布的《Top 100 Gen AI Consumer Apps》榜单。作为中国唯一上榜的AI浏览器,QQ浏览器与ChatGPT、Gemini和DeepSeek一同进入了全球顶级行列。     这份榜单依据SimilarWeb提供的网站访问量数据以及Sensor Tower的月度活

AI1 阅读
万事达卡启动加密货币合作项目,汇集行业顶尖专家与名人

万事达卡启动加密货币合作项目,汇集行业顶尖专家与名人

全球加密货币合作伙伴项目由万事达卡发起,该项目集合了数字资产与支付行业内的85多家企业,共同推进区块链支付清算系统的建设。通过这项计划,旨在促进加密公司、金融机构及支付服务提供商之间的合作,随着数字货币在国际转账和支付等领域的作用日益突出。其中包括币安、Circle、Gemini、Paxos、Ripple等知名交易所以及Polygon、Solana、Crypto.com等区块链网络和相关基础设施供

区块链1 阅读
谷歌推出革命性AGI平台!全新多模态融合模型问世,性能领跑业界

谷歌推出革命性AGI平台!全新多模态融合模型问世,性能领跑业界

新智元报道谷歌近日发布了首个原生全模态 Embedding 模型 Gemini Embedding 2,它实现了文本、图像、音频视频以及 PDF 的无缝整合,构成了一个统一的向量空间,显著提升了检索效率。类似于生成式 AI 大模型在表达方面的功能(即“嘴”),Embedding 模型则扮演着理解和检索的角色,也就是负责记忆的部分。过去,这种记忆机制一直处在分裂的状态之中。Gemini API 已经

科技4 阅读
谷歌突破性技术:融合文本、图像、视频与音频的全新龙虾也能理解的多媒体空间

谷歌突破性技术:融合文本、图像、视频与音频的全新龙虾也能理解的多媒体空间

原生,启动! 谷歌最近推出了首个原生多模态嵌入模型 Gemini Embedding 2。 这款新模型的核心创新在于,它能够将文本、图像、视频、音频和文档等不同形式的数据映射到同一个统一的嵌入空间中。 其输入能力涵盖了多种数据类型: 文本格式支持最多8192个token 图像请求可以处理6张图片,格式为PNG或JPEG 视频长度限制在120秒以内,格式包括MP4和MOV 音频可以直接嵌入,无需

AI1 阅读
Jeff Dean畅谈未来:每位开发者将管理50个智能体,编写需求成为关键能力

Jeff Dean畅谈未来:每位开发者将管理50个智能体,编写需求成为关键能力

这是一次关于AI技术发展及其对软件工程影响的深入对话,探讨了从模型设计到应用实践等多个方面。 本次访谈中,Jeff Dean分享了他对当前大语言模型的看法,并强调了未来的发展趋势。 在讨论多模态能力时,Dean指出,早期强调视频输入是为模型提供最高带宽的沟通方式。 关于Gemini项目的起源和进展,Dean提到多个团队独立研发算力分散的问题及整合后的成果。 谈话中还探讨了在编程任务上使用AI助手

AI4 阅读