
谷歌推出革命性AGI平台!全新多模态融合模型问世,性能领跑业界
新智元报道谷歌近日发布了首个原生全模态 Embedding 模型 Gemini Embedding 2,它实现了文本、图像、音频视频以及 PDF 的无缝整合,构成了一个统一的向量空间,显著提升了检索效率。类似于生成式 AI 大模型在表达方面的功能(即“嘴”),Embedding 模型则扮演着理解和检索的角色,也就是负责记忆的部分。过去,这种记忆机制一直处在分裂的状态之中。Gemini API 已经
共找到 33 篇相关文章

新智元报道谷歌近日发布了首个原生全模态 Embedding 模型 Gemini Embedding 2,它实现了文本、图像、音频视频以及 PDF 的无缝整合,构成了一个统一的向量空间,显著提升了检索效率。类似于生成式 AI 大模型在表达方面的功能(即“嘴”),Embedding 模型则扮演着理解和检索的角色,也就是负责记忆的部分。过去,这种记忆机制一直处在分裂的状态之中。Gemini API 已经

2026年3月10日,全球领先的AI终端品牌荣耀(HONOR)在深圳举办了一场名为“屏实力 展锋芒”的荣耀Magic V6新品发布会。这款手机在世界移动通信大会(MWC 2026)上首次亮相后,在国内市场正式推出。作为荣耀AHI理念下的首款旗舰级产品,它体现了技术的人文关怀和无边界体验的理念。 自从荣耀Magic V系列问世以来,一直在推动折叠屏行业的发展。此次发布的荣耀Magic V6不仅

新智元报道Karpathy让Agent在一夜之间进行了上百次实验后,仅用630行代码的autoresearch项目开源了——这意味着现在只需要一块GPU就能拥有一个永不休息的研究实验室。今日,Karpathy发布了一条引起全AI界轰动的消息:这种感觉就像是AGI之后的世界一样。我什么都没碰,先去蒸桑拿了。昨日他用这种方式表达了自己的感受:这是一种AGI时代的感觉,而他对自己的表述相当随意——放下手

新智元报道为了增强Agent的能力,Karpathy连续进行了110次实验,并最终将其命名为「autoresearch」,并宣布开源了这个项目——一个仅包含630行代码的小型AI研究实验室。最近,一位知名的技术专家在社交媒体上发布了一条消息,引发整个AI行业的热烈讨论:他用轻松的语气说:「这就是后AGI时代的感受。」然后便离开了去蒸桑拿。在这段对话中,Karpathy表达了他对技术进步的感受——即

新智元报道从百度时期的模糊感知,到OpenAI的曲折验证,再到Anthropic的安全架构确立,Dario Amodei始终在追问同一个问题:当智能爆炸发生时,谁应该掌握AGI的方向盘?他的回答是:不应有人独自掌控。夜深人静,在旧金山的一间办公室里,昏黄灯光下滚动着GPT-2早期训练曲线的图像。Dario Amodei凝视着那条指数增长的线,心跳加速。他并非在浏览代码。他看到了人类未来的命运。「如

该论文的第一作者为北京大学硕士生安睿川,他是在张文涛教授和鄂维南院士的共同指导下完成的研究工作。研究重点在于统一生成理解模型以及以数据为中心的人工智能领域。安睿川已发表过4篇关于一作或共一作者身份的论文,并曾在微软亚洲研究院实习。该项目的通讯作者由北京大学的张文涛教授担任。在AGI-Next前沿峰会上,姚顺雨提出了一个极具争议的观点:大模型实现高价值应用的关键在于能否有效利用上下文信息。近期Ope

云鹏、心缘撰写 漠影编辑在3月1日的巴塞罗那MWC 2026全球发布会上,荣耀隆重推出了备受瞩目的“机器人手机”Robot Phone,并现场展示了其首款消费级人形机器人。同时发布的还有最新旗舰折叠屏手机Magic V6系列。荣耀CEO李健与新的人形机器人握手,旁边展示的是Robot Phone。发布会期间,荣耀展出的人形机器人稳健地走上舞台开始跳舞,给现场观众带来了强烈的视觉冲击力。海外观众对此

MiniMax是一家总部位于上海的通用人工智能(AGI)企业,在近期发布了自上市以来的第一份业绩报告,这也是该公司在香港交易所挂牌后的首份年度财报。最近的一次电话会议上,MiniMax创始人兼首席执行官闫俊杰透露,截至2026年2月,公司的ARR(年度经常性收入)已超过1.5亿美元(约合人民币10.3亿元)。财报数据显示,2025年MiniMax的总收入达到了7903.8万美元(约合人民币5.43

智东西报道3月1日,在西班牙巴塞罗那举行的2026世界移动通信大会(MWC 2026)前夕,荣耀举办了全球发布会,推出了搭载第五代骁龙8至尊版处理器的新一代折叠屏旗舰手机荣耀Magic V6,以及该公司首款机器人手机荣耀Robot Phone。荣耀Magic V6将成为第一款利用高通传感器中枢实现全面个性化终端侧体验的设备。在此次发布会上,高通技术公司高级副总裁兼智能手机业务总经理Chris Pa

三份合同,三种功能——AGI 已经不是技术问题了。作者|桦林舞王可能是科技史上最多的一笔融资,出现了。2026 年 2 月 27 日,OpenAI 宣布完成 1100 亿美元融资,估值 7300 亿美元。这轮融资背后,Amazon 投了 500 亿美元,Nvidia 和软银各投了 300 亿美元。所有人都在讨论这笔钱有多大、这个估值有多高、这场军备竞赛有多疯狂。但反复看了几遍合同条款之后,我们发现

近日,谷歌正式发布了其最新的图片生成和编辑模型Nano Banana 2(Gemini 3.1 Flash Image),该模型已在谷歌的多种产品中上线。Nano Banana 2在功能与速度上进行了全面提升,在世界知识、图像质量、推理能力和主体一致性等方面均有所突破。同时,它在基准测试中的表现优于GPT-Image 1.5、Seedream 5.0 Lite和Grok Imagine Image

新智元报道曾经,硅谷是全球程序员的梦想之地:四点的冲浪、无限量的零食和静音的手机。然而到了2026年,这里却变成了世界上最昂贵的人力剥削场所。OpenAI与Anthropic的顶尖人才正在用健康乃至家庭作为代价,为AGI这个贪婪无底洞提供燃料。2026年2月8日,硅谷的秘密被Business Insider一举揭露。这篇报道迅速引发热议,标题中赫然出现了十

本文为网易智能《态度AGI》对话摘录。文章作者:杨霞清、袁宁在CES2026期间,笔者刚听完黄仁勋的演讲后遇到了吴军。那周,拉斯维加斯迎来了大约14.8万名来自世界各地的企业家、创业者、投资者以及分析师和记者等人士。人们在讨论AI带来的机遇时热情高涨,晚间的各种小型研讨会密集举行,大家积极地相互建立联系。然而,在这