搜索: "基础模型"

共找到 26 篇相关文章

马斯克宣布Grok V9-Medium 1.5T完成训练：两到三周发布

布IT之家 5 月 25 日消息，马斯克今日宣布，Grok 基础模型 V9-Medium（1.5T、1.5 万亿参数量）已完成训练。马斯克透露，该模型的评估结果相当不错。在补充训练中，加入了大量 Cursor 数据，未来还会继续添加更多数据。马斯克表示，微调工作正在进行中，强化学习将于几天后开始，距离公开发布还有 2 到 3 周。相比目前支撑所有 Grok 生产端流量的 0.5T V8-Small

科技2026/5/251 阅读

牛津、微软等发布音视频智能综述：梳理大模型时代的AVI研究全景

GPT-4o 一边看屏幕一边和你语音对话；Veo-3、MovieGen、Seedance 2.0 直接把原生音轨纳入视频生成链路；HappyHorse 这类近期模型也开始探索音视频联合生成；OpenVLA 让机器人” 听音辨物”—— 音视频大模型，正在从” 加在视觉模型旁边的一个 ASR”，进化成 omni-modal 基础模型的核心能力之一。NUS 联合牛津、多伦多、UTD、HKUST、QMUL

科技2026/5/252 阅读

杨立昆的一个转推，宣布Meta AI“已死”

文 | 象先志前几天，Julia Kempe在X上发了一条告别帖：宣布即将离开Meta，下个月起加入牛津的Ellison Institute of Technology，继续做foundation models（基础模型）的基础研究。但在杨立昆几小时内转推了她。也许这位研究员并不为人所熟知，只要知道，他是杨立昆离职后，Meta内部研究方向最接近他的人，是纽约大学数学系Silver Professo

科技2026/5/192 阅读

百度最强模型来了！五大场景深度实测，搜索能力突出

智东西编译刘煜编辑陈骏达智东西5月9日报道，今日，百度推出新一代基础模型文心5.1。百度称，文心5.1将总参数压缩至约1/3、激活参数压缩至约1/2，使用业界同规模模型约6%的预训练成本，实现同级别模型基础效果领先。不过，百度并未明确说明这一“6%成本”的具体对标模型范围与口径。在LMArena 5月7日更新的文本生成大模型排行榜中，文心5.1全球总排名第14。与前面OpenAI、xAI的模型

科技2026/5/104 阅读

清华打破多模态音频生成通才困境：Omni2Sound 音频基础模型开源

近年来，音频生成技术发展迅猛。随着应用场景的复杂化，业界呈现出一个显著趋势：音频生成模型正从单一条件控制走向多模态协同控制。研究者期望在一个统一的模型架构中，同时支持文本生成音频（T2A）、视频生成音频（V2A）以及视频-文本联合生成音频（VT2A）。相比为每个任务独立部署专用模型的传统做法，统一模型能大幅降低架构冗余与部署成本，为用户提供更为灵活的音频生成方式。然而，随着研究的深入，业界发现了一

科技2026/5/98 阅读

南大团队推出OrthoReg：简洁正交正则化技术，解析任务算术核心原理

刘尚格是南京大学的一名硕士生，在本研究中担任第一作者；澳大利亚伍伦贡大学的Lei Wang教授、新加坡南洋理工大学的Dacheng Tao教授以及南京大学的高阳教授等，共同参与了这项工作；而该文的通讯作者则是南京大学副教授李文斌。在当前的大模型环境下，微调已成为使基础模型适应特定任务的一项标准操作。然而，当面对多个已经微调好的专家模型时，如何将它们的能力合并到单一模型中，则成为了新的挑战。传统的联

科技2026/5/85 阅读

GPT-5.5 Instant全面上线，ChatGPT迎来重大更新，告别“废话文学”和AI幻觉

据报道，在美国时间周二，OpenAI发布了名为GPT-5.5 Instant的新基础模型，并将它设为ChatGPT的默认版本。取代了原来的GPT-5.3 Instant。该公司表示，这款新模型不仅保持了低延迟的特点，还在法律、医疗和金融等敏感领域显著减少了“幻觉”现象的发生。在一个月前，OpenAI已经推出了标准版GPT-5.5，并强调在编程任务和知识密集型作业方面有显著的性能改进。根据测试数据，

科技2026/5/67 阅读

揭秘DeepSeek“开眼”技术内幕

近日，DeepSeek发布了多模态技术报告《视觉原语思考》（Thinking with Visaul Primitives），详细披露了其新推出的识图模式背后的创新机制。该识图模式采用了名为DeepSeek-V4-Flash的基座模型，参数量达到284B，并拥有13B激活多模态推理模型。这一模型尚未正式命名，但DeepSeek已经确认未来会将其整合进基础模型中进行发布。据介绍，传统的思维链主要在语

科技2026/5/13 阅读

域數據應用新框架：銀河通用LDA與具身GPT-2的本體世界探索之旅

银河通用LDA定义了一种全新的全域数据利用方式，并推出跨本体的“隐式世界-动作基础模型”LDA-1B，旨在推进具身GPT-2时代的到来。 Jay 2026-04-29 10:23:06 量子位

AI2026/4/303 阅读

家用机器人学会整理：摆放鞋子、折叠衣物、互动宠物——全球首个通用模型问世 | 实录附赠

4月21日，自变量机器人公司召开发布会，宣布推出家庭机器人计划的全新一代产品。该公司创始人兼首席执行官王潜以及联合创始人兼首席技术官王昊详细解析了WALL-B的技术架构、数据策略和训练机制，并预告5月25日将有首批搭载WALL-B的新一代机器人入驻实际住宅环境。WALL-B是自变量公司自主研发的第二代具身智能基础模型，也是全球首款基于世界统一模型（World Unified Model, WUM）

科技2026/4/254 阅读

家务机器人即将进入家庭生活杂乱无章的日子还能持续多久？

近期，具身智能公司自变量机器人推出了一款基于世界统一模型架构（WUM）的全新基础模型——WALL-B，并宣布将在35天后将搭载这一新模型的新一代家用机器人投入市场。自变量机器人目前，距离产品上市仅剩下33天。自变量机器人的首次进入家庭标志着“具身智能从实验室迈向现实生活”的重要尝试，同时也是一场对现有技术能否满足复杂生活环境挑战的公开测试。此前，在一次发布会中，自变量创始人兼CEO王潜曾表示：在普

科技2026/4/239 阅读

GPT-2时代来临：π0.7版本推动机器人革新

一家名为Physical Intelligence的新创公司，仅成立两年便在人工智能领域引起了轰动。该公司最近发布的机器人基础模型π0.7具备了执行从未明确训练过任务的能力。比如，在未见过任何相关数据的情况下，该工业机器人能够成功折叠T恤，并使用空气炸锅烹饪红薯，这些成果让整个湾区的AI社区感到震惊。更为引人注目的是，这种能力并非刻意设计的结果，而是在模型训练过程中自然产生的“涌现”现象。Phys

科技2026/4/193 阅读

黄仁勋谈英伟达投资策略：曾经的不被看好成就了今天的包容性投资

据报道，英伟达首席执行官黄仁勋在最近的一次采访中表示，公司选择对众多AI相关企业进行广泛的投资，而不是将赌注押在少数几个可能的成功者上。黄仁勋在接受《Dwarkesh》播客采访时说，“鉴于目前市场上有许多实力强劲的基础模型公司，我们更倾向于积极参与其中，而非提前预测谁将成为最终的赢家。”他解释称，这样做有两个主要原因：首先，英伟达并不认为自己有义务去挑选未来的行业领导者；其次，从公司的历史经验来看

科技2026/4/162 阅读

日企巨擘结盟，AI领域绝地反击，前景几何？

文 | 舒书日本软银、NEC、本田和索尼四家公司在4月12日联合创立了名为“Japan AI Foundation Model Development Co.”的企业，旨在推动日本本土基础模型的研发及产业应用。各公司持股比例均约为10%，计划招募约一百名AI开发人员，并由一位来自软银的高管担任公司的最高领导职务。此外，包括日本制铁在内的三家大型银行也作为少数股东参与了此次项目投资。这次合作并非普通

科技2026/4/133 阅读

具身智能竞赛新趋势：通用型AI火爆背后的实质较量不再是模型比拼

最近，一家名为 Generalist AI 的公司发布了他们的 GEN-1 模型，这在具身智能领域引起了轰动。该公司首席执行官佩特·弗洛伦斯甚至认为机器人技术即将迎来类似“ChatGPT时刻”的突破。根据 Generalist 官方资料，GEN-1 在多个任务上达到了99%的成功率，并且比以往快了三倍的执行速度。此外，它还具备处理意外情况的强大恢复能力。这些显著的特点表明具身基础模型首次接近了一个

科技2026/4/118 阅读

中美AI战略差异下的中兴观点：政府与企业如何在竞争中实现智能化转型？

在全球人工智能产业迈向规模化应用的关键节点上，不同企业对于AI商业化路径的选择愈发明确。美国科技巨头持续在基础模型研发方面投入巨资甚至出现内耗现象，而中国企业在政企市场则加快了将AI技术转化为实际生产力的步伐。在此背景下，中兴通讯于4月9日在北京举办了2026年中兴通讯中国生态合作伙伴大会。面对新时代的挑战和机遇，该公司展示了其在“全连接”基础上向“连接+计算力”的双轮驱动战略转型的阶段性成果，

科技2026/4/92 阅读

高精度机器人超越GPT-3：任务完成率达99%，展现灵活应变能力

这家原本默默无闻的硅谷机器人 AI 公司，或许很快就会受到更多关注。今天，Generalist 正在尝试将大模型技术完全应用于机器人领域，并首次对外公布了其最新一代基础模型 GEN-1。效果相当惊人：来自官方账号比起前代产品 Gen-0 平均仅64%的成功率，GEN-1 在多项任务中已经达到了99%，包括折叠 T 恤和维护吸尘器等操作，能够连续运行数百次而无需人工干预。先看数据。现在的机器人不再是

科技2026/4/54 阅读

理想汽车推出全新自动驾驶模型MindVLA-o1：感知更精准，思考更深入

在今天的 NVIDIA GTC 2026 大会上，理想汽车基座模型团队负责人詹锟分享了关于该公司下一代自动驾驶基础模型 MindVLA-o1 的主题演讲《MindVLA-o1：开启全能范式 —— 探索下一代统一视觉-语言-动作自动驾驶大模型》。该模型通过五大创新技术：3D 空间感知、多模态思考、统一行为生成、闭环强化学习和软硬件协同设计，构建了一个面向物理世界的自动驾驶基础模型。具体来说，Mind

科技2026/3/173 阅读

阿里全面布局Token：吴泳铭掌舵新事业群

阿里巴巴宣布新架构今日，阿里巴巴正式成立Alibaba Token Hub（ATH）事业群，由阿里巴巴CEO吴泳铭直接管理。据悉，Alibaba Token Hub的核心目标是“创造Token、输送Token、应用Token”。新成立的ATH事业群下辖五大事业部，包括通义实验室、MaaS业务线、千问事业部、悟空事业部及AI创新事业部，涵盖了从基础模型研发到个人与企业端AI应用的完整产业链。各事业部

科技2026/3/175 阅读

多家知名企业争相进军小龙虾养殖产业

近期，不仅仅是腾讯注意到了“安装龙虾”的机会。年初时有报道指出，科技圈被一款名为OpenClaw的产品引爆，随后国内多家云服务提供商纷纷加入了这一行列，包括腾讯云、阿里云、移动云等。在模型制造商方面，根据相关消息，在OpenClaw平台上，来自中国初创企业的基础模型占据了主导地位。阶跃星辰Step 3.5 Flash的调用量已升至全球首位，紧随其后的是MiniMax M2.5、Trinity La

科技2026/3/99 阅读