
智能体式思考崛起,林俊旸离职后首度长文发声
在3月26日的夜晚,前阿里大模型技术负责人林俊旸在社交媒体平台上发布了一篇长文,这是他在从阿里巴巴离职后首次发表关于他对大模型发展方向的见解以及对未来人工智能阶段的预测。林俊旸指出,过去两年间,整个行业对大模型的评估方式和核心期望发生了重大变化。OpenAI的o1展示了“思考”可以作为一种训练出来的技能。紧随其后,DeepSeek-R1展示了推理式后训练不仅可以在实验室环境中复现,还能进一步扩展。
共找到 201 篇相关文章

在3月26日的夜晚,前阿里大模型技术负责人林俊旸在社交媒体平台上发布了一篇长文,这是他在从阿里巴巴离职后首次发表关于他对大模型发展方向的见解以及对未来人工智能阶段的预测。林俊旸指出,过去两年间,整个行业对大模型的评估方式和核心期望发生了重大变化。OpenAI的o1展示了“思考”可以作为一种训练出来的技能。紧随其后,DeepSeek-R1展示了推理式后训练不仅可以在实验室环境中复现,还能进一步扩展。

头图由AI生成近日,一家由北京大学背景的团队创立的人工智能编程初创公司——硅心科技,发布了其最新研发的轻量级模型aiX-apply-4B。这款模型仅需4B的参数量和256K的上下文支持,能够在消费级显卡上进行部署。该模型专为企业级代码修改任务设计,能够自动识别修改意图,精确定位目标代码区域,并保持原有代码格式和上下文结构的完整,将修改后的代码无缝融入原始文件。在基准测试中,aiX-apply模型在

DeepSeek公司现诚招17个与Agent相关的职位。 梦晨 2026-03-25 14:39:13 量子位 显示出公司从基础模

3月23日,全球大模型聚合路由平台OpenRouter发布的数据显示,过去一周(3月16日至3月22日),国产大模型的总调用量连续第三周超越美国同类产品,且领先幅度持续扩大。据统计,上周模型调用量前十名中(不重复计算小米测试版与正式版),国产模型占据了五个席位,包括小米MiMo-V2-Pro、阶跃星辰Step 3.5 Flash、MiniMax M2.5、DeepSeek V3.2以及智谱GLM5

最近,量子位公众号 QbitAI 发布了一篇关于DeepSeek公司的报道。该工程师名叫郭达雅,是V2、V3、R1等一系列模型的重要作者。郭达雅在学术领域和竞赛中有着卓越的表现,被誉为“中山大学雷军”。据郭达雅自述,他博士入学后的第三天就完成了毕业所需的论文发表要求。他还在腾讯广告算法大赛中多次夺冠,并在微信大数据挑战赛中获得第一名。郭达雅在真人秀《燃烧吧!天才程序员》中展现了顶尖的编程能力。离职

DeepSeek的核心工程师郭达雅正面临新的职业选择。 克雷西 2026-03-22 15:03:33 量子位 郭达雅将花落谁家?

作者|周一笑邮箱|[email protected]北京时间3月20日,AI编程工具Cursor发布了自研模型Composer 2,宣称是公司首次对基座模型进行“继续预训练结合强化学习”的成果。发布博客里没提基座模型的来源,措辞像是在说,这是Cursor自己从头炼出来的。不到两小时,一个名叫Fynn的开发者在调试Cursor的API时,截获了Composer 2的真实模型ID,kimi

据报道,在中美两国的AI技术差异中,美国企业倾向于采用封闭源代码的方式,而OpenAI也因此被戏称为ClosedAI。相比之下,中国的科技企业则大多采取开放源代码的策略。无论是阿里巴巴的Qwen,还是深度求索的DeepSeek,抑或是智谱的GLM、稀宇的MiniMax,以及月之暗面的Kimi等,全球范围内开源的AI大模型大多由中国公司主导。国产开源AI大模型不仅降低了全球用户的使用成本,还吸引了美

近日,一款名为“Hunter Alpha”的未知模型在 OpenRouter 平台上引起了广泛讨论,一度成为调用量最高的大模型之一,许多网友猜测其可能是“DeepSeek V4”的早期版本。3 月 19 日凌晨,小米公司正式确认“Hunter Alpha”为自家产品,并宣布推出 MiMo-V2-Pro、Omni 和 TTS 三款大模型,供用户限时免费试用一周。小米 MiMo 大模型项目负责人罗福莉

近日,小米公司发布了其MiMo大模型系列的三项重大更新:旗舰基座模型MiMo-V2-Pro、全模态代理模型MiMo-V2-Omni以及语音合成大模型MiMo-V2-TTS,旨在增强智能体的能力。最近,匿名模型Hunter Alpha和Healer Alpha在API聚合平台OpenRouter的日榜上多次登顶,引发热议。这两个模型实际上是MiMo-V2-Pro和MiMo-V2-Omni的早期测试版

此时此刻,恰如彼时彼刻。OpenClaw,这只红遍大江南北的卡通龙虾,火爆程度不逊于同是漂洋过海而来的饕餮美食麻辣小龙虾。这场轰轰烈烈的“养虾运动”,让人想起DeepSeek r1横空出世那会儿,本地部署“一机难求”的盛况。作为一款开源、本地优先、可自托管的AI Agent框架,OpenClaw推动AI应用再下一城,宣告“能办事”的AI打工人时代正式到来。抛开应用门槛和维护成本不谈,用户为了享受A

昨日,智能纪元 AGI 报道称,前 DeepSeek 研究员、现任小米 MiMo 大模型项目负责人的罗福莉博士发布了一篇重要论文,该论文与北京大学合作开发了一种名为 ARL-Tangram 的统一资源管理系统。ARL-Tangram 采用了一种统一的动作级公式和灵活的调度算法,能够在满足不同硬件资源限制的同时,最大限度地减少动作完成时间,并实现定制化的异构资源管理。在实际的智能体强化学习任务中,A

真是让人惊讶!乐天集团在3月17日发布了Rakuten AI 3.0,称其为日本国内性能最为卓越的大型AI模型之一,拥有约7000亿的参数量,并且专门针对日语进行了优化,采用Apache 2.0开源许可,并获得了日本经济产业省和NEDO的GENIAC项目资金支持。然而,在发布仅仅12小时之后,这款备受瞩目的AI模型就曝出了重大问题。当天下午,有人查看了Rakuten AI 3.0在Hugging

在展望2025年的DeepSeek时代之后,2026年则被视作OpenClaw的崛起之年,即所谓的“龙虾时代”。那么,OpenClaw的真实价值何在?它的未来又将如何发展?面对如此快速迭代的人工智能领域,我们又应该如何以正确的态度拥抱它?3月11日,复旦大学教授、上海市数据科学重点实验室主任肖仰华与AI招聘平台TTC创始人肖玛峰应邀参与了一场关于OpenClaw的讨论直播。龙虾系统或许预示着人工智

摘要:将广告植入搜索框中一直是一门生意,如今这门生意已经扩展到了AI对话框中。在315晚会上,这种针对AI大模型的“投毒”行为被首次曝光。凤凰网科技 出品作者|赵子坤3月15日,央视315晚会揭露了GEO产业链的问题。根据业内爆料,央视财经记者在多个网络平台上搜索到了名为GEO的业务。该业务通过向AI平台输入虚假数据,影响其搜索结果。凤凰网科技早在2025年中就发现了这一隐蔽现象,当时的研究显示D

DeepSeek什么时候发V4?AI圈所有人都在猜,但正确答案可能只有梁文锋知道。豆包、千问、元宝……无论大厂还是小厂,他们都在在春节期间扎堆发布新版本,生怕晚一步就被V4的光芒盖过。换成任何一个正常的CEO,面对这种全行业翘首以盼的局面,早就把半成品推出去了。先占住声量,再慢慢迭代,这是互联网行业的基本操作。但梁文锋偏不。跟他关系近的同行说了句大实话:“团队稳,底子厚,不会草率发布。”外媒报道,

3·15曝光后,GEO“AI投毒”生意,仍在继续。今日,《科创板日报》记者调查发现,闲鱼等平台已屏蔽“GEO优化”等直白关键词,但改用“引擎优化”等隐蔽词搜索,仍能发现相关商家正在售卖。有服务商向记者报价:软件服务398元/月或1980元/年,代运营则高达3980元/季度至9800元/年,并承诺覆盖豆包、DeepSeek、ChatGPT等主流AI平台。快思慢想研究院院长田丰向记者称,GEO黑产的本

近日,一笔重要的智算中心建设项目在DeepSeek创始人梁文峰的家乡湛江宣告完成。该项目总投资额为4.6亿元人民币,并已确定由中时讯、中通服中睿和云天励飞组成的联合体负责执行,报价约为4.2亿元。中标公告详细显示了这一项目将分三个阶段进行建设。一期计划采用云天励飞自主研发的国产推理加速卡X6000;二、三期则会部署公司最新一代芯片产品,分别规划为3000和5000张卡的规模。此外,湛江市发布的消息

机器之心编辑部昨日晚间,推特博主「青龍聖者」发布了一张截图,疑似预告 DeepSeek V4 即将问世。然而不久后,该博主进行了澄清,称自己无法确定截图的真实性,并指出另一张展示 DeepSeek V4 参数详情的图片为虚假信息。今天清晨,全球知名的大型模型集成平台 OpenRouter 惊喜上架了两款新型神秘模型「Hunter Alpha」和「Healer Alpha」。其中,「Hunter A