
阿里AI变革风起 林俊旸退出引发“千问转型”热议
人工智能红包大战余温犹存之时,千问团队却曝出重大变动。林俊旸在社交平台上于3月4日凌晨宣布:“我将卸任。再见了,亲爱的Qwen。”AI如今已成为阿里战略的核心部分,因此林俊旸的离职引发了广泛关注。阿里巴巴园区 网络图三月初,在新年开工之际,阿里巴巴高层罕见地齐聚杭州云谷学校讨论人工智能时代的前景。同时,集团也将大模型的品牌统一为“千问”。随着AI战略价值日益突出,以林俊旸为首的团队成员所承受的压力
共找到 179 篇相关文章

人工智能红包大战余温犹存之时,千问团队却曝出重大变动。林俊旸在社交平台上于3月4日凌晨宣布:“我将卸任。再见了,亲爱的Qwen。”AI如今已成为阿里战略的核心部分,因此林俊旸的离职引发了广泛关注。阿里巴巴园区 网络图三月初,在新年开工之际,阿里巴巴高层罕见地齐聚杭州云谷学校讨论人工智能时代的前景。同时,集团也将大模型的品牌统一为“千问”。随着AI战略价值日益突出,以林俊旸为首的团队成员所承受的压力

白铂 博士 华为 2012 实验室理论研究部主任 信息论首席科学家引言在本系列的第二篇《信号处理篇》中,我们引入了一些信息论的概念和方法来理解语义嵌入/向量化。本篇将完全从信息论的角度出发,深入解读原论文,探讨大模型背后的第一性原理¹。1948 年,Shannon 发表了题为 A Mathematical Theory of Communication 的划时代论文,奠定了现代数字通信的理论基础,

机器之心编辑部在人工智能时代,我们已经习惯了通过说话来解决各种问题:无论是请求一个表格还是完成复杂的任务,只要用语言说明清楚目标和限制条件,“小龙虾”就可以自动执行。现在,只需掌握语言技能就能操作越来越复杂的技术系统。大模型之所以能够迅速融入各个行业领域,关键在于它们建立在一个成熟且广泛使用的文本接口之上。但是,当问题涉及到空间时情况就变得不那么简单了。例如,如果要修改一个房间的布局或让机器人在新

Web3天空之城|城主视角:就像其他关注AI领域的朋友们一样,今天早上看到一条重要新闻:Qwen(通义千问)的技术负责人林君扬在社交媒体上宣布离职。初见此消息时,我的第一反应是惊讶和不解。通常来说,在一家大型公司中,部门负责人的变动每天都在发生。然而这次不同寻常之处在于,Qwen 大模型正处于一个非常关键的发展阶段。Qwen 图像生成模型及编程辅助工具等产品在市场上备受好评,尤其是在开源领域占据

近日,阿里巴巴的千问大模型团队迎来了一位重要成员的告别。 通义千问项目负责人林俊旸在社交媒体上宣布了这一消息,并表示自己将离开千问团队。 值得一提的是,在他离职前的一天晚上,千问团队刚刚发布了一个名为Qwen3.5的新模型版本,包括0.8B、2B、4B和9B四个不同大小的版本,这些模型全部开源且可供商业使用。 林俊旸的工作获得了特斯拉CEO马斯克的认可。 最近的一次动态显示,林俊旸仍在积极参与

新智元报道本文探讨了如何在给定硬件约束条件下使大语言模型达到最优性能的研究成果,并揭示了软硬协同设计的重要性。研究表明,传统的堆算力方法并不足以充分发挥芯片的潜力,优化架构才是关键所在。马赫100自研芯片与星环OS操作系统、MindVLA智能驾驶大模型共同构成了理想汽车完整的技术栈,并通过软硬协同设计实现高效能利用。在传统模式中,开发团队通常需要花费数月时间才能为新硬件找到最优的架构方案。然而,借

最近,中国的人工智能企业在更新迭代方面动作频频。春节期间,字节跳动和阿里巴巴相继推出了多模态技术创新成果,其中Seedance 2.0引发了全球范围内的广泛讨论。作为国家层面的大模型研发团队,科大讯飞也一直活跃在人工智能应用的第一线。在新年之前发布了星火X2大模型以展示其核心技术升级后,该公司又于2月28日推出了新的AI学习机T90系列,进一步加快了人工智能技术向实际应用的转化。这些发布背后体现了

全球大模型公司终于有了一个真正的财务指标基准。 自香港交易所上市以来仅52天,MiniMax就发布了其首次年度业绩报告: 2026年2月,ARR达到了惊人的1.5亿美元,而2025年的总收入较上一年度增长了约158.9%,毛利更是同比飙升437%。同时,亏损率显著降低。 其意义在于:作为全球首份大模型公司的年报,它为市场了解“大模型如何实现商业化”提供了宝贵的视角,并成为衡量中国AI公司在国际竞争

美军近期对伊朗发动袭击时采用了AI大模型“克劳德”。(央视新闻曾报道)《华尔街日报》援引美国《参考消息》称,据匿名消息来源透露,在最近的空袭中,美军使用了由Anthropic公司开发的大语言模型“克劳德”,尽管美国总统特朗普在几天前下令停止与该公司合作。据报导,五角大楼利用人工智能(AI)处理情报、确定目标及模拟不同场景。这表明Anthropic公司的模型已融入美军的决策系统中。此外,在针对委内瑞

新智元报道当硅谷公司Taalas将大模型「物理焊死」进芯片引发全球半导体行业的关注时,上海交通大学、辉羲智能及微软亚洲研究院的研究团队已更进一步——他们采用ROM+SRAM异构架构,使端侧LLM推理速度提升至20,000 tokens/s,极大地提升了端侧算力。最近,硅谷初创公司Taalas提出的「模型即芯片」方案引起了全球半导体界的深入讨论和反思。他们绕过了所有热门概念,直接将AI大模型物理焊接

该论文的第一作者为北京大学硕士生安睿川,他是在张文涛教授和鄂维南院士的共同指导下完成的研究工作。研究重点在于统一生成理解模型以及以数据为中心的人工智能领域。安睿川已发表过4篇关于一作或共一作者身份的论文,并曾在微软亚洲研究院实习。该项目的通讯作者由北京大学的张文涛教授担任。在AGI-Next前沿峰会上,姚顺雨提出了一个极具争议的观点:大模型实现高价值应用的关键在于能否有效利用上下文信息。近期Ope

过去人们常常依赖公有云服务来获取AI能力,但随着OpenClaw等智能体工具的广泛使用,无论是个人开发者还是企业都更加倾向于拥有一个能在本地7×24小时运行、能够即时响应指令的“数字员工”。然而,云端方案存在的数据隐私风险和持续高昂的成本问题导致工业级智能体在大规模应用时遇到瓶颈,独立部署大模型服务已经成为构建自主可控AI能力的关键选择。 众智FlagOS是一款完全开源的AI系统软件栈,支持多种异

据报道,DeepSeek V4 或将于下周正式发布,该产品将原生支持图片、视频与文本的生成功能。国内知名 AI 大模型企业杭州深度求索(DeepSeek)计划于近期推出其最新旗舰大模型 DeepSeek V4。据悉,这款新模型具有多模态交互、编程能力提升、长文本处理优化及国产算力适配等多项改进。在长文本处理方面,DeepSeek V4 的上下文窗口被扩展至超过 100 万个 Token,是上一代产

随着人工智能(AI)技术在社会各领域的广泛应用,美国五角大楼也开始采取行动。据《防务新闻》网站报道,军工巨头洛克希德·马丁公司宣布成功测试了一项新技术,该技术利用AI增强F-35战斗机的目标识别能力。这次名为“守望先锋计划”的试验在内利斯空军基地进行,旨在将机器学习模型集成到战机的信息系统中。新的AI大模型能够根据周边环境生成数字化信息,并向飞行员提供潜在目标的建议,这标志着战术AI首次独立提出作

新智元报道【新智元导读】Meta联合多所高校发布首个可规模化自动生成第一视角音视频理解数据的引擎EgoAVU ,让多模态大模型首次真正「听懂世界」。现在最强的多模态大模型,虽然能接收声音和视频输入,但无法做到真正的「同时理解」。在第一视角视频任务中,模型经常会出现各种问题,比如完全忽略音频信息、错误判断声源位置、用视觉线索「猜声音」,也就是说,现在的多模态大模型只会看,但不会听。而这正是当前具身智

新智元报道【新智元导读】微信搜一搜,免费AI家庭医生上线!智诊科技连更4天,把顶尖医疗大模型塞进好伴AI微信小程序,无需下载注册,子女就可以在群里随时监护父母健康。2026年,14亿人的健康意识已经觉醒了。2026年开春,资本市场正迎来一场由AI驱动的医疗健康产业变革,AI在医疗领域正式迈入商业爆发期!截至2月25日收盘,AI医疗板块延续了年初以来的强劲态势。Choice数据显示,中证医药及医疗器

本论文的第一作者杨庆越是中国科学技术大学 2021 级硕博连读生,师从王杰教授,主要研究方向为大模型推理加速与高效推理系统。她曾在 NeurIPS、ICLR 等顶级会议发表论文 3 篇,获华为优秀实习生等荣誉。本工作完成于其在华为诺亚方舟实验室科研实习期间,与中国科学技术大学 MIRA Lab 和华为团队合作完成。近日,中科大王杰教授团队(MIRA Lab)和华为诺亚方舟实验室(Huawei No

本文第一作者朱子瑞为新加坡国立大学四年级博士生,本科毕业于清华大学,研究方向为多模态大模型和后训练优化。通讯作者为 TikTok 内容智能负责人 Kanchan Sarkar、Meta杨振恒博士(相关工作完成于其在 TikTok 任职期间)以及新加坡国立大学校长青年教授尤洋老师。文章速览长视频会使 MLLM 的视觉 token 规模快速增长,但推理阶段的计算与上下文预算有限,难以对全量帧进行处理。

中国人工智能企业智谱自上市以来股价持续上涨,因发布新一代旗舰大模型GLM-5时出现三个错误而公开道歉,并导致其股价急剧下跌。智谱于今年一月在香港交易所挂牌交易,在星期一(2月23日)的开盘价即下跌13.8%,收盘时跌幅扩大至22.76%。同属港股大模型领域的一家竞争对手MiniMax,当日也下跌了13.35%。据报道,智谱和另一家公司MiniMax在上周五(20日)的总市值曾一度超过六百亿港元(

春节刚过不久,国内大模型领域的竞争愈发激烈。众多互联网巨头纷纷投入重金:字节豆包、阿里千问和腾讯元宝合计投放超过40亿元的红包活动,吸引用户积极参与互动。数据显示,在除夕夜当晚,豆包AI互动次数达到19亿次,而千问平台上的“一句话下单”操作近2亿次。据悉,春节期间这些公司的员工几乎都没有休息时间。腾讯元宝团队期待着DeepSeek的新模型发布以便立即集成到自家产品中……然而DeepSeek并未如期