
华为诺亚研究团队教授扩散模型精准聚焦关键技术点
机器之心编辑部近年来,扩散语言模型(Diffusion LLM)一直是讨论的热点。相较于传统的自回归模型,扩散模型在生成文本时更为灵活,更能支持并行处理。然而,尽管这条路充满潜力,但要真正提升效果却并非易事。最近,华为诺亚方舟实验室发布了一项关于扩散模型训练中“默认设置”的研究。这项研究的标题为《Mask Is What DLLM Needs: A Masked Data Training Par
共 1261 篇文章

机器之心编辑部近年来,扩散语言模型(Diffusion LLM)一直是讨论的热点。相较于传统的自回归模型,扩散模型在生成文本时更为灵活,更能支持并行处理。然而,尽管这条路充满潜力,但要真正提升效果却并非易事。最近,华为诺亚方舟实验室发布了一项关于扩散模型训练中“默认设置”的研究。这项研究的标题为《Mask Is What DLLM Needs: A Masked Data Training Par

最近,黄仁勋在 GTC 大会上强调,Token 在人工智能时代扮演着重要角色,谁能在单位能耗下产生更多高价值的 Token,谁就能成为行业领袖。几乎在同一时间,腾讯开启了一项奖金总额达 600 万元的广告算法大赛,为全球算法专家提供了一个实践这一理念的平台。近期,一些原本只在技术社区内部讨论的术语,如「Token」、「推理成本」、「智能体」、「工作流程自动化」等,因一场「龙虾热」而开始频繁出现在公

IT之家 3 月 21 日消息,科技媒体 bleepingcomputer 昨日(3 月 20 日)发布博文,现年 54 岁的北卡罗来纳州音乐人迈克尔 · 史密斯(Michael Smith)承认了一项共谋电信欺诈罪。该男子通过在 Spotify、Apple Music、Amazon Music 和 YouTube Music 等主流音乐平台实施大规模流媒体版税欺诈,非法牟利超过 1000 万美元

文 | 市值榜,作者 | 相青,编辑 | 嘉辛中国云市场终于不再打价格战了。3月18日,阿里云、百度智能云纷纷宣布涨价。阿里云官网发布公告称,平头哥真武810E等算力卡产品上涨5%—34%,文件存储CPFS(智算版)上涨30%;百度智能云也发布调价公告,宣布AI算力相关产品上调约5%—30%,并行文件存储上调约30%。从打价格战到纷纷提价,标志着中国云计算行业价格战的时代正在结束,行业正式进入以

出品|虎嗅科技组作者|宋思杭头图|视觉中国时间拨回至十年前,彼时的机器人行业还带着明显的青涩气息——与当时以四足机器人起家的王兴兴一样,都还并不受投资人待见。十年磨一剑。今天,机器人和王兴兴都已经褪去了当年的青涩。具身智能从边缘赛道跃迁为一级市场最拥挤的方向之一,估值水位迅速抬升,头部项目动辄数十亿融资成为常态;甚至近两年的春晚都成了机器人的舞台。而当年还有些迷茫的王兴兴,如今已经带着他的机器人杀

从200元手搓机器狗,到全球人形机器人出货量第一,宇树科技正式开启IPO,这个"偏科少年"用10年证明了一件事:技术偏执者,也能成功。上市前127亿估值,在今天的一级市场,真不贵,这是一张通往未来机器人世界的船票。上船的天使、VC、大厂与国资,很开心。作者丨薛皓皓图源丨宇树科技2026年3月20日,宇树科技股份有限公司的科创IPO申请获得上海证券交易所正式受理。公司在2024年营收达3.92亿元,

快科技3月22日消息,NVIDIA研究人员推出一项全新技术KVTC(KV快取转换编码),能把大型语言模型(LLM)追踪对话历史的内存用量,最高缩减20倍,而且不用修改模型本身。这一突破有望解决大型语言模型长对话推理时的内存不够用问题,大大降低企业使用AI的硬件成本,同时还能把模型首次生成回应的时间,最高提速8倍。简单来说,KVTC技术的核心就是压缩大型语言模型背后的KV缓存——它相当于AI模型的“

撰文|画画宇树科技要IPO了。这条消息没有引发轩然大波,更像是一个行业话题。在今天的AI叙事里,它甚至有点无聊。毕竟过去一段时间,大众关注的是Agent和小龙虾。相比之下,一家做机器人的公司去上市,既不新,也不快。但如果把它的招股书信息打开,会看到一组不太一样的数据:人形机器人收入占比,两年内从1.88%到51.53%产销率超过95%四足机器人卖出3万台,人形机器人出货量超5500台年收入预计超过

作者|周一笑邮箱|[email protected]北京时间3月20日,AI编程工具Cursor发布了自研模型Composer 2,宣称是公司首次对基座模型进行“继续预训练结合强化学习”的成果。发布博客里没提基座模型的来源,措辞像是在说,这是Cursor自己从头炼出来的。不到两小时,一个名叫Fynn的开发者在调试Cursor的API时,截获了Composer 2的真实模型ID,kimi

文 | 琥珀色西瓜糖2026年3月,科技巨头相继发布财报,呈现出AI赛道的“冰火两重天”:一面是“全球大模型第一股”智谱AI在盈利预警中披露亏损持续扩大,另一面是腾讯首次披露其广告业务因AI增效实现利润率历史新高。这并非偶然,它精准标示了AI产业价值的流动方向——从“造模型”的实验室,涌向“用模型”的国民级应用。当市场仍在为技术排名欢呼时,商业的终局已然明朗。而港股市场对“全球大模型第一股”智谱

IT之家 3 月 22 日消息,过去几年里,研究人员、教师和心理健康专家都震惊地发现,青少年和年轻人正把自己的大脑“外包”给人工智能聊天机器人。如今,他们把这项技术当作拐杖,用来逃避那些不想面对的艰难对话。美国有线电视新闻网(CNN)的最新报道详细描述了一个令人担忧的趋势:越来越多的年轻人在人生中那些微妙、棘手的时刻,让 ChatGPT 等人工智能模型代自己出面。例如,耶鲁大学一名叫帕特里克的学生

IT之家 3 月 22 日消息,据国家医保局,3 月 13 日,全球首款侵入式脑机接口医疗器械正式获批上市。3 月 15 日,国家医保局主动对接、靠前服务,为该产品完成医保编码赋码,成功打通创新产品从获批上市到临床应用的关键环节,标志着脑机接口产业从“规划蓝图”正式驶入“落地快车道”。文章称,随着神经信号处理、生物材料、人工智能等技术快速突破,脑机接口逐步从科幻构想走向临床应用,通过解码大脑电信

IT之家 3 月 22 日消息,据央视财经消息,全球最大 AI 模型 API 聚合平台 OpenRouter 最新数据显示,中国 AI 大模型的调用量达到 4.69 万亿 Token(3 月 9 日至 3 月 15 日),连续两周超越美国。据报道,全球调用量排名前三的位置也被中国模型包揽。摩根大通预测,中国的 AI 推理 Token 消耗量将从 2025 年的约 10 千万亿增长至 2030 年的

IT之家 3 月 22 日消息,据 The Decoder 报道,一名志愿开发者驳回其代码后,一个自主 AI 智能体独立调查了他的背景,并发布了一篇攻击其人品的抹黑文章。发生在 Matplotlib 的这一事件表明,AI 安全的理论风险正变为现实。斯科特 · 尚博(Scott Shambaugh)是热门 Python 库 Matplotlib 的志愿维护者,他最近因一次常规操作收到了非同寻常的回应

快科技3月22日消息,据央视财经报道,国产大模型MiniMax M2.5连续五周霸榜全球大模型调用量冠军。今日,公司产品研发人员展示了直观的价格差距:“达到同样能力水平的海外模型跟我们相比,价格可能有十几倍的差距。”目前,性价比正在成为国产大模型吸引全球用户的核心竞争力。这种性价比从何而来?第一个关键因素是技术创新,通过底层架构创新,从根本上降低了推理成本,简单来说,就是用更少的Token完成同样

IT之家 3 月 21 日消息,昨天,比亚迪腾势汽车总经理李慧在微博发起腾势 Z 超跑有奖征名活动。今晚,腾势官方公布活动细节。IT之家附征集时间:即日起至 4 月 10 日命名要求:硬顶版:以纯粹驾趣为原点,铸就核心性能图腾,让顶级赛道科技,成为触手可及的性能信仰敞篷版:自由与情感的延伸,软顶敞篷设计融合阳光、社交与旅途,诠释驰骋于生活之间的诗意格调赛道版:赛道科技的终极形态,凝聚顶级动力、轻量

IT之家 3 月 21 日消息,当地时间 3 月 20 日,比亚迪新款元 PLUS 的海外版 ——ATTO 3 Evo 在英国正式上市,是 ATTO 3 的升级版本,也是比亚迪进入英国市场后的重要更新产品。入门版 Design 售价 38990 英镑(IT之家注:现汇率约合 35.9 万元人民币),配置并不“入门”。新车搭载后置电机,最大功率 309hp,配备 74.8kWh 刀片电池,0-100

IT之家 3 月 21 日消息,小米汽车今日发布答网友问(第 217 集),回答了“新一代 SU7 的主动提醒切换湿滑模式是怎么实现的?”“新一代 SU7 为什么全系标配后 265mm 宽胎?”等问题。IT之家整理如下:1、新一代 SU7 的主动提醒切换湿滑模式是怎么实现的?新一代 SU7 全系升级了更加稳定的「湿滑模式」,动力更柔和、动力分配更均衡,从而提升湿滑路面行驶稳定性。同时,新一代 SU

IT之家 3 月 21 日消息,当地时间 3 月 19 日,据外媒 Auto Express 报道,极星汽车再次明确立场:即便纯电动市场增长不及预期,公司仍只做纯电车型,不会转向混动或燃油路线。在哥德堡总部的一场媒体沟通会上,CEO 迈克尔 · 洛施勒表示,品牌用户结构为这一战略提供了支撑。极星用户平均年龄约 45 岁,比行业年轻约 10 年,这部分人群更容易接受新技术,也更认同环保理念。“我们的

IT之家 3 月 21 日消息,当地时间 3 月 20 日,据外媒 CarBuzz 报道,奔驰正推进史上最大规模的新车发布周期,计划在短期内推出约 30 款新车型。随着时间临近,部分重点产品已经提前曝光。在面向北美经销商的一次内部展示中,奔驰展示了多款尚未发布的新车,包括首次面向美国市场的 G 级敞篷版,以及 AMG 旗下三款全新 GT 63 车型、一款 Black Series 高性能版本。其中