搜索: "大模型"

共找到 400 篇相关文章

Mythos首个报告出炉：全球数十亿设备裸奔！30天挖出10000致命漏洞

新智元报道【新智元导读】A厂的玻璃翼计划首战告捷，Mythos 30天内就挖出1万个致命漏洞，甚至拦截了150万美元电诈！面对雪片式的报告，人类程序员也崩溃求饶了：「求别挖了，根本修不完啊！」就在刚刚，Anthropic又发布了一条震撼全球科技圈与安全圈的消息。「玻璃翼计划」的首月战报，正式公布了！在这场秘密行动中，Anthropic首次动用了下一代顶级大模型——Claude Mythos Pre

科技2026/5/231 阅读

苏姿丰大胆预测：AI智能体时代，CPU将重新成为紧缺资源，年增长超35%

过去两年，AI算力的主角几乎只有一个：GPU。训练大模型需要GPU，推理大模型需要GPU，英伟达的股价、数据中心收入和供应链话语权，也都建立在这个判断上。但AMD CEO苏姿丰现在给出了另一个说法：AI智能体会把CPU市场重新拉起来。5月22日， Nikkei Asia报道称，苏姿丰再次预计，到2031年，CPU市场年增长率可能超过35%。这和过去3% 到4% 的历史增速相比，是一次非常激进的上

科技2026/5/231 阅读

曝Anthropic正洽谈微软自研芯片合作，Q2营收暴涨至700亿元将首度盈利

智东西编译陈佳编辑漠影智东西5月22日消息，据外媒The Information昨日援引知情人士报道，美国AI大模型独角兽Anthropic正在与微软洽谈，计划租用搭载微软自研AI芯片的服务器，以获取更多算力来满足旗下AI产品快速增长的需求。这笔谈判仍处于早期阶段，最终未必会达成协议。微软目前在向客户供应专用AI芯片方面落后于对手亚马逊和谷歌，拿下Anthropic这个客户，将成为微软自研芯片

科技2026/5/231 阅读

人大孟澄团队&华为提出集成剪枝视角下的MoE新架构

本文已被 ICML2026 接收，第一作者康欣来、共同第一作者薛敦耀来自中国人民大学统计与大数据研究院。通讯作者为中国人民大学孟澄助理教授与华为基础大模型部研究员陈汉亭。导语近年来，Mixture-of-Experts（MoE）已经成为大模型扩展的重要架构之一。相比稠密 Transformer，MoE 通过稀疏激活机制，在每个 token 上只调用少量专家，从而在控制计算成本的同时扩大模型容量。然

科技2026/5/232 阅读

前Kimi后训练负责人宋鸿涌创业，聚焦通用机器人基座模型

大模型 RL 老兵Flood Sung 切入机器人赛道。作者丨张贤AI科技评论独家消息，前月之暗面后训练与强化学习负责人宋鸿涌（Flood Sung）已于 2025 年 12 月离职，创立机器人公司「北京十六号机器人科技有限公司」（XVI Robotics），公司业务方向聚焦通用人形机器人基座模型。（本文作者长期关注机器人&具身智能赛道，欢迎添加微信交流：zhangxian2021）企查

科技2026/5/224 阅读

官方揭秘！为啥AI总会一本正经地胡说八道：普通人2招就能解决

快科技5月22日消息，当前AI杜撰历史事件、编造虚假法律条文、伪造学术参考文献的现象已屡见不鲜。它带来的危害早已超越简单的“口误”范畴，不断侵蚀公众对AI的信任。就在上个月，全国首例AI幻觉侵权纠纷案正式宣判，这一标志性事件意味着AI幻觉已从单纯的技术问题，升级为亟待解决的法律与社会问题。随着大模型深度融入我们的工作与生活，其潜在风险正影响着越来越多的普通人。那么，到底什么是AI幻觉？为什么AI总

科技2026/5/221 阅读

智谱推出GLM-5.1高速版：400 tokens/s 30秒生存成复杂网页代码

凤凰网科技讯 5月22日，智谱宣布面向部分企业客户推出GLM-5.1高速版API“GLM-5.1-highspeed”，模型输出速度达到400 tokens/s。智谱称，这一速度刷新了当前全球大模型厂商API的速度上限。该模型基于旗舰级GLM-5.1能力开发，打破了此前“高速模型几乎总是轻量级模型”的行业惯例，首次在国产大模型中实现旗舰级能力与极致低延迟的兼顾。高速版由智谱GLM团队与TileRT

科技2026/5/222 阅读

击碎AI泡沫论，Anthropic首度盈利

前沿模型公司的利润表，终于出现了正数。据《华尔街日报》报道，Anthropic正在迎来一个关键季度：公司预计2026年第二季度收入将超过109亿美元，较第一季度的48亿美元增长超过一倍，并首次实现季度营业利润。路透社随后跟进，称Anthropic二季度预计营业利润约5.59亿美元。过去几年，关于AI泡沫的质疑一直没有消失。大模型固然火热，但也确实是太烧钱了：训练模型要钱，推理服务要钱，GPU、数据

科技2026/5/222 阅读

运营商开卖AI流量包，救命稻草还是新管道？

Token经济学，一场新的三国杀。文｜白鸽编｜王一粟在卖Token这件事上，三大运营商平台，开始正面与云厂商和大模型厂商们交锋。日前，中国电信、中国移动、中国联通相继推出面向个人和企业的Token套餐，将AI大模型的计算能力以类似“流量包”的形式明码标价销售。上海移动喊出“1元40万Tokens”的价格，中国电信推出最低9.9元/月的个人套餐，中国联通则为上海OPC客户提供免费3000万Toke

科技2026/5/221 阅读

千问接入全新一代大模型Qwen3.7-Max

凤凰网科技讯（作者/许婧）5月22日，阿里巴巴发布全新一代千问旗舰模型Qwen3.7-Max，并同步接入千问APP、PC端及网页端（qianwen.com）。用户将千问APP更新至6.9.7及以上版本后，点击底部胶囊或在下拉菜单中切换即可使用该模型。在第三方机构Artificial Analysis公布的最新全球大模型榜单中，Qwen3.7-Max获得56.6分，排名全球第五、国产第一。多项评测

科技2026/5/221 阅读

教大模型终身学习！中科大连发两篇顶会，突破「知识注入」双重困境

新智元报道【新智元导读】中科大团队首先推出动态多模态知识注入基准MMEVOKE，解构遗忘机制，并在此基础上提出全新双阶段框架KORE。通过「知识树」自动增强与「零空间」协方差约束微调，为大模型终身学习开辟了全新路径。当前主流大型多模态模型（LMMs）通过海量数据的预训练存储了丰富的静态知识，并在多模态理解与指令跟随上取得了巨大成功。然而，现实世界瞬息万变，大模型的既有知识面临「上线即过时」的严峻挑

科技2026/5/221 阅读

AI首次证明数学核心猜想：80年的经典难题，被OpenAI搞定了

机器之心编辑部我们正在进入科学的黄金时代？本周四，OpenAI 宣布用 AI 大模型推翻了离散几何学中的一个核心猜想：如果你在平面上放置 n 个点，有多少对点之间的距离恰好为 1？「Erdős 单位距离问题」（Erdős Unit Distance Problem）是组合几何中最著名的经典难题之一，由数学家保罗・埃尔德什（Paul Erdős）于 1946 年提出。近 80 年来，数学家们认为最佳

科技2026/5/221 阅读

消息称“AI 六小龙”月之暗面拆除VIE架构，估值超200亿美元冲刺香港IPO

IT之家 5 月 21 日消息，科技媒体 Digitimes 今天（5 月 21 日）发布博文，报道称“AI 六小龙”之一的月之暗面正拆除 VIE（可变利益实体）与红筹结构，目标为赴港上市扫清监管障碍。IT之家注：“AI 六小龙”指的是中国大模型领域最具代表性的六家初创公司：智谱 AI、MiniMax、月之暗面（Kimi）、阶跃星辰、百川智能、零一万物。消息称月之暗面已通知股东，计划拆除现有离岸公

科技2026/5/212 阅读

赋予视频生成「视觉思维链」：VChain显式建模时空规划与状态演变

当视频生成模型在视觉保真度上不断突破时，一个核心瓶颈正变得愈发清晰：模型是否真正理解了真实世界？能否推理出合理的演变过程？在具身智能、影视制作以及物理仿真等应用场景中，要求模型不仅要生成 “平滑的像素”，更要实现 “逻辑连贯的演化”。这种对物理规律与因果关系的建模能力，是当前基于大数据驱动的端到端生成模型面临的长期挑战。那么，我们能否将多模态大模型（MLLM）的推理能力，作为一种 “外脑” 注入到

科技2026/5/213 阅读

时薪800、学历硕士起：大厂热抢的AI数据“炼金师”到底在做什么？

智东西作者陈骏达编辑心缘在公众的传统认知里，AI数据标注始终带着某种“数字流水线”的色彩。它通常意味着坐在电脑前，重复处理着图片、语音或文本，比如给自动驾驶图像逐一框出行人与车辆，为语音系统一句句校对字幕，或者按照既定规则为数据打上标签。其低门槛、低薪资、机械性的特质，堪比AI时代的“电子厂”。但当大模型浪潮席卷AI行业之后，数据标注行业开始出现一种出人意料的变化。虽然传统数据标注工作

科技2026/5/211 阅读

智象未来超两千亿参数图像大模型HiDream-O1-Image-Pro发布，融资持续提速

智象未来超两千亿参数图像大模型HiDream-O1-Image-Pro发布，融资持续提速量子位的朋友们 2026-05-20 22:09:25 量子位

AI2026/5/212 阅读

苏姿丰对话李开复：AI转型必须CEO亲自挂帅，不能只靠CIO

5月19日，AMD AI 开发者日在上海举办。活动现场，AMD CEO 苏姿丰与零一万物CEO李开复围绕“AI 智能体新范式”这一话题展开对话，讨论 AI 从“大模型”走向“多智能体协作”后，计算架构、软件生态以及产业形态可能发生的变化。AI 能否接管一个企业职能部门，甚至有朝一日运营整个公司？企业 AI 转型，到底应该听 CEO 的，还是 CIO？每一位开发者，在 AI 时代将会扮演怎样的角色？

科技2026/5/203 阅读

阿里云发布Agent全栈架构：真武M890性能提3倍 Qwen3.7-Max登顶国产榜首

凤凰网科技讯 5月20日，阿里云今日宣布围绕Agent（智能体）进行全栈技术革新，涵盖底层真武AI芯片、Agentic Cloud、千问大模型及推理平台。阿里云资深副总裁刘伟光表示，此举旨在应对Agent突破临界点后带来的海量并发需求，从底层算力到上层应用全面重构基础设施。在硬件算力层面，阿里云推出基于新一代AI芯片真武M890的磐久AL128超节点服务器。该设备搭载自研ICN Switch 1.

科技2026/5/202 阅读

智象未来发布超两千亿参数图像大模型，并宣布完成新一轮亿级融资

凤凰网科技讯 5月20日，智象未来在北京举办开放日，发布基于原生全模态架构Unified Transformer的图像大模型HiDream-O1-Image-Pro，参数量超2000亿。该模型将图像像素、文本标记与任务条件统一纳入连续共享标记空间，在通用文生图、高保真文字渲染、图像编辑等任务上取得SOTA表现。此前，采用同架构的8B开源版本HiDream-O1-Image曾在Artificial

科技2026/5/202 阅读

谷歌Gemini取消按次计费全面转向算力计量，最高阶Ultra会员降至200美元

凤凰网科技讯 5月19日，谷歌官方宣布对Gemini计费与订阅体系进行重大调整。受到大模型及智能体（Agent）算力消耗暴增的影响，谷歌正式取消了原有的每日固定提问次数限制，转而采用与微软GitHub Copilot类似的“基于算力消耗（Compute-based）”的新计量模式。新规则将综合考量用户提示词的复杂度、所调用功能（如视频生成、深度研究等）以及对话历史的长度。用户的算力额度将每5小时刷

科技2026/5/202 阅读