
何恺明团队推出GeoPT,开创性预训练方法助力模型自主学习真实物理法则
静态3D资产缺乏动力学信息,而真实物理标签的成本又极高—— 物理仿真的扩展性该如何实现? 何恺明团队的最新研究提出了一种新的解决方案GeoPT—— GeoPT创新地引入了合成动力学(Synthetic Dynamics),将静态几何提升至动态空间,使模型能在无标签数据中通过学习粒子轨迹演化来获取物理直觉。 在同等精度条件下,GeoPT最多可以减少60%的物理仿真数据需求。 接下来让我们进一步
共 307 篇文章

静态3D资产缺乏动力学信息,而真实物理标签的成本又极高—— 物理仿真的扩展性该如何实现? 何恺明团队的最新研究提出了一种新的解决方案GeoPT—— GeoPT创新地引入了合成动力学(Synthetic Dynamics),将静态几何提升至动态空间,使模型能在无标签数据中通过学习粒子轨迹演化来获取物理直觉。 在同等精度条件下,GeoPT最多可以减少60%的物理仿真数据需求。 接下来让我们进一步

苹果前基础模型团队负责人、上海交大校友庞若鸣,在加入Meta半年后,再度转职。 最新消息显示,他已经于上周离职并加盟OpenAI。该信息已获得OpenAI发言人的确认。 OpenAI对庞若鸣的招募行动由来已久,数月前就开始了积极的努力以吸引他加入。 当初庞若明加盟Meta时,所签订的薪酬协议总价值超过2亿美元(约14亿元人民币),将在未来几年内分批支付,具体数额与达成特定目标直接相关。 他的离职

今天,云知声正式发布了Unisound U1-OCR 文档智能基础大模型。 作为首个工业级文档处理平台的基础模型,它凭借“性能领先、值得信赖、易于使用、高效部署和高度适配”五大核心优势,突破了传统文档处理的限制,并确立了行业新标准。 文档智能是指运用人工智能技术自动读取并理解文档影像内容,进行分类及关键信息提取。 传统的OCR解决方案(1.0版)以CRNN为代表,只能识别文字。新一代方案(2.0

2月26日,全球最大AI开源社区Hugging Face发布了最新的排行榜,阿里千问3.5模型包揽了前四名的位置,成为全球最热门的开源模型之一。据了解,新上榜的三款中型千问3.5模型在多个榜单中的表现均明显优于GPT-5 mini,并且其原生多模态能力和代理功能强大,性能达到了中等尺寸模型的新高度。部分模型甚至可以直接部署在消费级显卡上,在开源不到24小时内便成功登顶。最新一期全球开源模型排行榜显

字节Seed开始运用化学原理来研究大型模型。 深度推理像是共价键,自我反思类似氢键,而自我探索则像范德华力? 传统的长思维链推理通常将AI的思考过程视为线性结构。 实际上,在很多情况下,后续的重要结论需要返回去验证早期提出的假设。 CoT忽略了这种非线性的依赖关系。 在论文《思想的分子结构》中,字节Seed首次为大模型定义了长链思维的分子式结构。 这种分子拓扑结构里,三种键是如何相互作用的?

Anthropic再次引起市场关注。 昨日,IBM股价大幅下跌13.15%,创下自2000年以来的最大单日跌幅,市值从约2408亿美元降至2087亿美元,缩水了超过310亿美元。这表明人工智能技术的迅速发展已经让该公司成为了新的受害者。 导致这一现象的原因是Anthropic发布了一篇博客文章,介绍了其Claude Code工具可以对使用COBOL语言的老系统进行现代化改造。而COBOL业务正是

全球首个深度思考的扩散模型诞生! 它摒弃了传统的自回归模式,成为世界上生成速度最快的模型。 对比之下,传统自回归的“打字机式”输出方式(逐个token按顺序生成)就像乌龟一样慢: 实际测试结果显示,在英伟达GPU上运行的Mercury 2扩散推理大语言模型可实现每秒1009个tokens的速度。 这一速度比GPT-5(mini版)和Claude-4.5(haiku版本)等传统模型快了五倍之多

英伟达又一次超越了自己—— 2026财年,英伟达发布了最后一个季度的财报。不出预料,依旧刷新多项纪录: 单季营收达到681亿美元(约4678亿元),同比增长73%,环比增长20%。 数据中心单季收入为623亿美元(约4280亿元),同比增长75%,环比增长22%。 全年总营收达2159亿美元(约14831亿元),同比增长65%。 这份财报无疑给资本市场带来了巨大的信心,“AI鬼故事”的阴影也一

在2025年12月之前,AI编程与之后的编程相比截然不同。 这一观点是由Vibe Coding的提出者Karpathy提出的。 要准确描述过去两个月里AI对编程的影响并不容易。这种变化不是渐进式的,而是在去年12月份发生的突然转变。 作为最积极采用AI编程技术的程序员之一,Karpathy承认,在去年12月之前,尽管Coding Agent有不错的表现,但实际上并没有多大用处。 然而从12月

Perplexity也加入了这场激烈的龙虾大战。 该公司在推特上宣布,推出了一款名为Perplexity Computer的新产品,这是一款基于浏览器的全能型通用数字助手。 据官方介绍,这款工具能够进行推理、任务分配、搜索、构建、记忆管理、编码以及项目部署和管理工作流程等操作。 它几乎涵盖了日常所需的所有场景功能。 Perplexity的首席执行官Aravind Srinivas表示,Per

中美AI同步加速:47天内30次更新,中国最强主场究竟在哪里? 2026年的AI开局没有旁观者。 在硅谷那边,从1月1日Meta发布的Llama4 Swarm到Google最新的Gemini 3.1 Pro,每两三天就有一项新技术引发行业热议。 而在中国这边,据

在32倍压缩率下性能超越现有技术25个百分点,破解长文本压缩难题 | ICLR 2026 面对高压缩率时,为什么现有的上下文压缩方法会出现性能骤降的现象?当模型将32K长度的文档压缩至1K时,为何会表现出明显的性能下降? 阿里巴巴未来生活实验室的研究团队发现,这

春节期间,“千问帮我”成为了新的年俗习惯,用户只需一句话就能轻松下单,超过400万60岁以上的老年人也体验到了这种便捷的AI服务。 大年初七(2月23日),据千问发布的数据显示,在春节期间,有近两亿次“一句话下单”的操作发生在千问平台上。平均而言,全国每十个人中

千寻智能凭借近20亿元融资和突破百亿元估值,在新一年中成为具身智能领域的焦点。 近日,千寻智能成功获得多轮融资,总额接近20亿人民币,其企业价值也已超越百亿大关。 这种多元化且全面的资本注入表明市场正在经历一场“去泡沫化”的过程——即投资者不再仅仅押注于概念性项

DeepSeek在GitHub上的连续更新让华尔街再次感受到了紧张:“DeepSeek第二时刻”即将到来。 就从十几个小时前开始,DeepSeek的GitHub仓库开始频繁地进行代码合并操作。 CNBC也对此发表了预警文章,预测纳斯达克市场可能会因为这次更新再次

中兴通讯聚焦“连接+算力”,助力具身智能行业创新与发展 近日,由中兴通讯主办、上海市计算机学会与上海交通大学计算机学院协办的“2026年具身智能机器人学术研讨会”在上海成功举办。本次大会以“人机共生,智塑未来”为主题,汇聚了清华大学、上海交通大学、复旦大学等国

黑客揭露了苹果隐藏的硬件秘密!你的MacBook中内置有加速度计和陀螺仪,即使你不曾告知售后人员电脑是否摔过,它们都能记录相关信息。 苹果官方文档没有提及这些传感器接口,但它们实际上存在于每一台MacBook之中。 亏贼! 比如轻轻晃动或转动电脑,屏幕上的数据显

Kimi在春节档赚取了相当于一年的收入!这顿“龙虾大餐”让各大厂纷纷出手抢夺。 年刚过完,Kimi就先一步将「龙虾」装入口袋。 而这一系列操作还未平息,公司的财务数据也开始飙升—— 近20天的收入已经超过了去年全年的总收入,估值也一路攀升至700亿元人民币。 (

在ICRA 2026大会上,中兴通讯发布了RealMirror平台,这是一个开放源代码的视觉语言行动平台,旨在促进具身智能的研究与应用普及。 具身智能的目标是创建能够感知、理解并操作物理环境的智能体。这一领域正推动人工智能从抽象计算向更贴近人类物理行为的方向发展

千问3.5在Hugging Face社区中位居榜首,前十名开源模型中有八款来自中国 于2月24日,全球最大的AI开放平台Hugging Face发布了最新的开源大模型排行榜,其中阿里巴巴最新发布的原生多模态模型千问3.5荣登榜首。该模型自除夕夜发布以来,迅速引起