搜索: "多模态融合"

共找到 4 篇相关文章

商汤SenseNova U1:以统一架构革新多模态融合技术

商汤SenseNova U1:以统一架构革新多模态融合技术

机器之心编辑部每当人们逐渐熟悉某种玩法之际,新的创意又紧随而来。最近,一股热潮席卷全网,那就是 OpenAI 推出的 GPT Image 2,它不仅擅长生成美观图片,还引领了「信息图生成」的新潮流。从知识卡片到数据图表,再到攻略长图和科普海报,只需一句话就能产出一张布局精美的信息清晰、质感出色的图像,其迅速走红的速度堪比当年吉卜力风格的风靡。然而,国内用户若想体验 GPT Image 2,则会遇到

科技12 阅读
抢先了解顶尖会议论文!机器之心ICLR 2026研讨会,邀您下周六相聚北京

抢先了解顶尖会议论文!机器之心ICLR 2026研讨会,邀您下周六相聚北京

在2026年,人工智能的发展正以前所未有的速度改变着技术的边界。大型模型训练效率不断提高、具身智能从实验室走向实际应用的步伐加快以及多模态融合技术逐渐成熟等一系列进展描绘了当前最令人振奋的人工智能发展图景。与此同时,代理技术(Agent)的进步正在重新定义人机协作的可能性,并引发了关于如何使这些智能体具备持续学习和自主决策能力的研究热潮。在这样一个背景下,一年一度的 ICLR 成为了观察全球人工智

科技21 阅读
谷歌推出革命性AGI平台!全新多模态融合模型问世,性能领跑业界

谷歌推出革命性AGI平台!全新多模态融合模型问世,性能领跑业界

新智元报道谷歌近日发布了首个原生全模态 Embedding 模型 Gemini Embedding 2,它实现了文本、图像、音频视频以及 PDF 的无缝整合,构成了一个统一的向量空间,显著提升了检索效率。类似于生成式 AI 大模型在表达方面的功能(即“嘴”),Embedding 模型则扮演着理解和检索的角色,也就是负责记忆的部分。过去,这种记忆机制一直处在分裂的状态之中。Gemini API 已经

科技13 阅读
上海年轻学者研发出学术领域的开放型机械臂项目

上海年轻学者研发出学术领域的开放型机械臂项目

在发布会上,大圣这一全新科学智能体正式亮相,它拥有原生多模态融合能力、自驱动验证机制和场景验证Skills体系。 大圣的展示涉及了药物研发案例,通过干湿闭环实验来证明AI建议的有效性。例如,在药物研发中,模型会提出候选分子,然后在自动化实验室里进行合成测试,并根据反馈迭代模型。 上海库帕思科技有限公司和上海气象局的合作展示了大圣如何以高保密性和高效的方式处理PB级数据,同时保持安全性和资源消耗的低

AI4 阅读