
上海交大与深势科技推出Innovator-VL:引领科学大模型新时代
在当前通用大模型(LLM)迅速发展的背景下,AI for Science(科学智能)正成为人工智能领域新的竞争焦点。然而,科研人员面临的现实是严峻的:现有的多模态科学模型通常依赖于海量且难以获取的数据,并且训练过程如同“黑箱”,不易复现和改进。我们是否真的需要大量数据来教会AI理解科学?近日,上海交通大学、深势科技(DP Technology)、记忆张量(MemTensor)及中国科学院理论物理研
共 1375 篇文章

在当前通用大模型(LLM)迅速发展的背景下,AI for Science(科学智能)正成为人工智能领域新的竞争焦点。然而,科研人员面临的现实是严峻的:现有的多模态科学模型通常依赖于海量且难以获取的数据,并且训练过程如同“黑箱”,不易复现和改进。我们是否真的需要大量数据来教会AI理解科学?近日,上海交通大学、深势科技(DP Technology)、记忆张量(MemTensor)及中国科学院理论物理研

存储芯片短缺不仅仅是简单的缺货问题。作者|王艺在深圳华强北地区,存储芯片已经成为了一种新的硬通货。自去年年中以来,存储芯片的价格一直在攀升,部分型号的芯片价格已上涨了十多倍。令存储芯片买家感到更加焦虑的是,三星、美光和SK海力士这三家主要供应商减少了供应量,只向授权代理商出售少量库存。据一位不愿透露姓名的技术专家(启哥)表示,由于中间分销商囤积货物,佰维存储和江波龙等公司的股价近期受到了市场热炒的

“赋予智能体最高权限,无异于将装填好的武器交到一只猴子手中。”最近,马斯克再次发表了一番辛辣的批评言论。前不久,Meta的一位高级安全官员在使用OpenClaw整理邮件时遭遇了系统失控的情况。该智能体狂热地删除邮件,迫使这位顶尖的安全专家不得不采用物理断电的方式强行终止其行为。OpenClaw确实展现出了卓越的自动化处理能力,但这一事件无情地揭露了它背后的潜在风险。如何在赋予AI强大执行能力的同时

DeepSeek团队最近在ArXiv上低调发布了一篇论文,介绍了一个新的智能体推理框架DualPath。该研究针对Agent长文本推理场景中的I/O瓶颈问题,提出了解决方案:通过优化KV-Cache的加载速度来减少计算资源被存储读取拖累的情况。DualPath打破了传统的从外部存储直接加载到预填充引擎(Storage-to-Prefill)模式,引入了第二条路径——从外部存储加载至解码引擎再传输给

静态3D资产缺乏动力学信息,而真实物理标签又过于昂贵——物理仿真如何实现规模扩展?何恺明团队的最新论文GeoPT提出了一种新的解决方案。GeoPT创新性地引入了合成动力学(Synthetic Dynamics),将静态几何数据提升到动态空间中,使模型能够从无标签数据中学习粒子轨迹变化,并理解物理现象的本质。在相同精度条件下,GeoPT可以显著减少60%的物理仿真所需的数据量。我们现在来看看具体是如

新智元报道DeepMind 最新论文介绍了一种名为AlphaEvolve的技术,它将算法源代码视作基因组,并利用Gemini执行遗传操作,以进化出全新的博弈论算法。AlphaEvolve创新性地「繁殖」出了一批前所未有的博弈论算法。这些算法不仅在性能上超越了人类精心设计的经典方案,在底层机制的创造性方面也令人惊叹——它们采用了一些人类研究者从未设想过的反直觉方法。传统的人类算法设计不再局限于简单的

智东西消息显示,近日马斯克旗下人工智能初创公司xAI的一位关键成员宣布离职。2月27日,曾在谷歌DeepMind任职的托比·波赫伦(Toby Pohlen)在社交媒体上发布了一则公告,表明他即将离开xAI。▲托比·波赫伦(Toby Pohlen)官宣离职推文据报道,在xAI成立之初的12名创始团队成员中,已有超过一半的人离职。其中值得注意的是,在今年二月就有十一位核心成员选择了离开。此外,xAI初

华尔街纷纷撤离,黄仁勋却在大胆押注。作者|周永亮2月25日晚上,全球资本市场再次将目光聚焦英伟达。英伟达作为AI时代的标杆企业,在这次财报中呈现了一份令人瞩目的业绩:单季度收入达到680亿美元,同比增长73%;净利润429.6亿美元,同比激增94%,环比增长35%。非GAAP标准下,其毛利率也超出预期升至75.2%,创下一年半以来的新高。英伟达在2026财年全年营收突破2159亿美元大关,数据中心

2月27日,OpenAI宣布完成了一轮规模达1100亿美元的融资,其中亚马逊投资了500亿美元,英伟达和软银分别注资300亿美元。此轮融资将公司估值推高至7300亿美元,比去年10月份二级市场融资时的5000亿美元有了显著增长。该公司预计随着融资推进,还会有更多投资者加入进来。OpenAI首席执行官萨姆·奥特曼周五在接受采访时说:“我们对这次交易感到非常兴奋。人工智能将无处不在,并正在重塑整个经济

出品|虎嗅科技组作者|赵致格头图|视觉中国一直以来,Anthropic在行业内被公认为最注重伦理和AI安全的公司之一。其CEO达里奥·阿莫迪多次强调,该公司推迟了Claude的发布是因为对安全性的重视,最终导致ChatGPT抢占了市场先机。然而,在2月25日,Anthropic发表声明表示将调整之前的安全承诺。在竞争日益激烈和政府监管不到位的情况下,它决定不再严格遵守《负责任扩展政策》(Respo

据报道,京东集团于2月27日与中国邮政DHL集团签署了一份合作备忘录,双方计划在创新物流和电子商务服务方面进行深入合作,并将共同开发一体化解决方案以连接中欧两地的品牌、商家及消费者。

2026.02.27文章字数约为2634字,预计阅读时间大约为4分钟。2月26日北京时间,三星在其Galaxy Unpacked发布会上推出了最新的Galaxy S26系列手机,并且谷歌宣布与三星合作,在S26系列的安卓系统中加入AI功能,旨在帮助用户实现订餐、叫车和购物等复杂任务的自动化处理。在其他AI手机助手大多依赖“无障碍权限”这一技术路径的情况下,市场猜测谷歌是否会进一步开放安卓底层系统的

电动知家报道,福特汽车公司计划在全球范围内召回近440万辆汽车,这一决定是由美国国家公路交通安全管理局在周四发布的召回通知所确认的。召回的原因是一个软件故障,该故障可能导致拖车尾灯、转向灯和刹车与牵引车辆失去连接并停止工作,增加了碰撞的风险。此次全球召回的约440万辆汽车中,大部分集中在北美市场,其中美国本土大约有438万辆,加拿大则约为60万辆。受影响车型包括福特最畅销的F系列皮卡和广受欢迎的S

文| 陈桥辉从Tech星球独家获得的消息得知,近期美团在其主应用程序中推出了一个名为“饭团漫社”的新漫画板块,该板块不仅包含了传统的漫画作品,还加入了AI生成的漫画内容,并且所有这些内容都免费向用户开放播放,这标志着美团正式进军备受瞩目的漫画领域,成为了最新加入这一领域的互联网巨头之一。从饭团漫社的内容安排可以看出,它提供的漫画涵盖了青春、古风、都市以及末世等多个热门主题,每部作品的集数从几集到四

扎克伯格用两亿美元的天价合同也没能留住这位顶级大牛。2月26日,OpenAI成功挖走Meta仅工作了七个月的大牛庞若鸣。庞若鸣曾被视为苹果AI团队的核心人物,在Meta只待了几个月便决定放弃那份令人惊叹的过亿期权激励,转而加入奥特曼领导的公司。据知情人士透露,OpenAI对庞若鸣展开了长达数月的挖角行动。尽管庞若鸣曾向同事表示他在Meta工作得很愉快,并且基础设施团队状态良好,但他最终还是选择了离

谷歌于2月26日深夜正式推出了Nano Banana 2,其最大的特点就是价格亲民。它在确保生成图像的质量不受影响的同时,将单张图片的成本削减了一半,并且能够提供快速的出图速度和专业级别的画质效果。根据AI模型评测平台Arena.ai发布的榜单显示,Nano Banana 2以1279分的成绩超越了GPT-Image-1.5以及自家的上一代产品Nano Banana Pro;在单张图片编辑方面获得

马斯克再次跳过了所有正式流程,没有官方博客、技术文档甚至在宣传推文中还犯了拼写错误。然而,在这种典型的“马斯克风格”下,Grok 4.20 Beta 版悄然上线并完成了更新。正如之前所言,Grok 4.20 引入了一种快速学习机制,能够持续进化。自公测开始以来,它每周都会通过用户的真实互动进行迭代,不再等待下一次大型版本的更新。对于目前的 Grok 4.20 版本,xAI 的官方介绍为“四名代理”

大规模预训练模型虽然表现出色,但在处理“长对话、多轮交互和跨任务”等复杂场景时,依然面临两大挑战:其一为上下文窗口的限制,在对话持续增长的情况下容易出现信息过载;其二是中间环节的信息丢失问题,即便能容纳所有数据也不一定能有效利用。因此,引入“外部记忆系统”成为必要:将对话内容储存于长期记忆,并在需要时进行检索。然而这一方案的实际应用却带来高成本的问题:频繁调用大模型执行总结和提取、实时解决冲突以及

机器之心编辑部在全球具身智能领域的权威测评 WorldArena 榜单中,清华大学陈建宇(星动纪元创始人)和斯坦福大学切尔西·芬恩(PI 创始人)团队研发的 Ctrl-World 世界模型取得了优异的成绩:具身任务能力获得全球第一,并在主体一致性、轨迹精度、深度准确性及策略评估一致性四大核心维度上登顶;视频生成方面排名第二,仅次于阿里 Wan 2.6,超越谷歌 Veo 3.1 和英伟达 Cosmo

当前时间序列预测模型普遍采用基于极大似然估计的方法,使用 MSE 作为损失函数。然而,在标签序列存在自相关性的情况下,这种方法会导致偏差。最近,北京大学林宙辰教授团队提出了一种新的方法,即将时间序列预测问题转化为条件分布对齐的问题,并引入了一个新的损失函数来最小化预测值和实际标签之间的 Wasserstein 距离。这一创新不仅保证了训练过程的无偏性,还充分考虑到了自相关性的几何结构。这项工作为利