
搜索: "ICLR"
共找到 16 篇相关文章


抢先了解顶尖会议论文!机器之心ICLR 2026研讨会,邀您下周六相聚北京
在2026年,人工智能的发展正以前所未有的速度改变着技术的边界。大型模型训练效率不断提高、具身智能从实验室走向实际应用的步伐加快以及多模态融合技术逐渐成熟等一系列进展描绘了当前最令人振奋的人工智能发展图景。与此同时,代理技术(Agent)的进步正在重新定义人机协作的可能性,并引发了关于如何使这些智能体具备持续学习和自主决策能力的研究热潮。在这样一个背景下,一年一度的 ICLR 成为了观察全球人工智

从局部模仿到全面规划:离线强化学习的新篇章丨ICLR'26
在处理复杂的连续任务时,现有的生成式离线强化学习方法常表现出其局限性。这些方法产生的路径往往陷入局部合理但全局失调的状态。它们过于关注即时的步骤而忽略了最终的目标。针对这一问题,厦门大学与香港科技大学联合提出了一种创新算法——MAGE(即“魔法师”,Multi-scale Autoregressive Generation)。与传统序列生成方法不同,MAGE采用了自顶向下的递进生成策略,首先构建宏

从局部描绘到全局规划:离线强化学习的新突破丨ICLR’26
ICLR'26会议探讨了离线强化学习方法从局部优化向全局布局转变的新策略。 一水 2026-04-06 13:35:27 量子位

早于DeepSeek Engram!用「查表」重置Transformer记忆 | ICLR
新智元报道【新智元导读】ICLR论文STEM架构率先提出「查表式记忆」架构,早于DeepSeek Engram三个月。它将Transformer的FFN从动态计算改为静态查表,用token索引的embedding表直接读取记忆,彻底解耦记忆容量与计算开销。近年来,随着大模型规模与知识密度的持续爆发,研究人员开始重新审视一个底层问题:模型的参数究竟该如何组织,才能最高效地承担「记忆」的功能?在传统的

315曝光GEO投毒产业链?别慌!CMU首提无毒的合作式AutoGEO
新智元报道【新智元导读】ChatGPT上线广告、315曝光GEO投毒产业链,AI搜索商业化的隐忧接连浮出水面。龙虾热背后,3000元就能让AI搜索信口开河,离全面「瞎说」还有多远?来自CMU的ICLR 2026论文AutoGEO提供了一种不同的思路:合作式GEO,在提升内容可见度50.99%的同时保持搜索质量不受损。2026年初,OpenClaw龙虾热席卷科技圈,全民养「虾」的狂欢背后,AI正以前

Nature重磅:AI写的论文,在顶会同行评审击败55%人类,单篇15美元
新智元报道【新智元导读】刚刚,Nature盖章AI独立科研时代!全新Scaling Law显现,人类死守的学术铁王座,正发生不可逆的转移。一篇长达数十页的学术论文,在人类设定研究主题和实验边界后,系统自动完成了从实验到写作的大部分流程。从论文正文、实验代码、图表和投稿稿件,主要由系统端到端自动生成。它被投递到顶尖机器学习会议ICLR 2025某workshop的同行评审流程中,三位匿名审稿人不知道

谷歌一夜塌房!干崩内存股论文被曝抄袭,华人学者血泪控诉
新智元报道【新智元导读】把闪存股一夜干崩的谷歌顶会论文,出大事了。TurboQuant的核心方法,两年前就被一位华人学者做完、发完顶会、代码全部开源了。谷歌不仅没正面提及,而且还恶意操纵实验数据把成果贬成「次优」,即使收到邮件也拒不改正,这就是大科技公司赤裸裸的学术霸凌!就在刚刚,谷歌塌房了!前几天,谷歌一篇即将在ICLR 2026亮相的新论文,直接把存储巨头美光和西部数据的股价干崩了。Cloud

ICLR 2026北京研讨会开幕,聚焦「AI龙虾」与全球模型革新方向
在 2026 年,人工智能领域迎来了一项名为「龙虾」(OpenClaw) 的技术革新,这一具有高度主动性和逼真互动体验的私人助理助手,成为了新一代人机交互的典范。与此同时,世界模型的概念得到了前所未有的关注。年初,英伟达创始人黄仁勋在 CES 2026 的发布会上隆重推出了世界模型平台 Cosmos,近期图灵奖得主 Yann LeCun 的世界模型创业公司 AMI Labs 也完成了 1.03 亿

单步极速生成!清华团队革新机器人动作去噪技术
在强化学习领域,生成式策略(例如 Diffusion Policy 和 Flow Matching)展现了强大的多模态分布拟合能力,但其多步迭代采样导致的高延迟一直是实时控制的一个难题。清华大学智能驾驶课题组 iDLab 和加州大学伯克利分校人工智能研究院 BAIR 在 ICLR 2026(口头报告,Top 1%)联合发表的研究成果《Mean Flow Policy with Instantane

人大北航破解难题:VLA系统稳定性受挑战,ICLR26热议机器人故障问题
新智元报道最新研究发现,当机器人从一个动作转换到另一个动作时,它们的视觉系统可能会被本体感觉所压制而失效。中国人民大学和北京航空航天大学的研究团队提出了GAP算法,该算法能够动态调整本体信号的学习权重,在视觉方面创造更多的学习机会,从而提高机器人的精确操作能力。机器人在执行任务过程中获得的状态反馈信息通常来自于本体觉,这种感觉与视觉的协调作用被认为能增强其处理复杂控制任务的能力。不过,最近的研究显

中科大华为诺亚TAPPA:时序视角的统一解释框架
本论文的第一作者杨庆越是中国科学技术大学 2021 级硕博连读生,师从王杰教授,主要研究方向为大模型推理加速与高效推理系统。她曾在 NeurIPS、ICLR 等顶级会议发表论文 3 篇,获华为优秀实习生等荣誉。本工作完成于其在华为诺亚方舟实验室科研实习期间,与中国科学技术大学 MIRA Lab 和华为团队合作完成。近日,中科大王杰教授团队(MIRA Lab)和华为诺亚方舟实验室(Huawei No

ICLR 2026 | LightMem:降低大型模型的长期记忆成本
大规模预训练模型虽然表现出色,但在处理“长对话、多轮交互和跨任务”等复杂场景时,依然面临两大挑战:其一为上下文窗口的限制,在对话持续增长的情况下容易出现信息过载;其二是中间环节的信息丢失问题,即便能容纳所有数据也不一定能有效利用。因此,引入“外部记忆系统”成为必要:将对话内容储存于长期记忆,并在需要时进行检索。然而这一方案的实际应用却带来高成本的问题:频繁调用大模型执行总结和提取、实时解决冲突以及

我的秃头换来的论文,你却用ChatGPT瞬间看完?这起学术风波让科学家们愤怒不已
作者 | 刘春出品 | 网易科技全球顶尖的人工智能学术会议正遭遇AI技术的巨大冲击。 这看似是一个讽刺的情节,却在现实中上演了。最新数据显示,在ICLR 2026会议上,超过一万五千份评审意见是由人工智能系统撰写而成的。 想象一下,你耗费大量精力撰写的论文可能根本无人过目,只是被直接交给AI工具生成了一些“标准”的反馈,并且这些反馈中甚至还包含了对文中不存在的数据错误指责。 曾经被视为严谨的同行评

ICLR 2026:新一代图灵测试——VLA技术在生物实验室的应用
目前对 VLA 模型的研究和测试大多集中在家用场景(如摆放餐具、折叠衣物),而对于专业科学环境,特别是生物实验室的应用则较少探索。生物实验室因其流程结构化、操作精度高以及多模态交互复杂等特点,是评估 VLA 模型在精确操作、视觉推理及指令执行能力方面的理想场地。最近,香港大学MMLAB 罗平教授团队和上海交通大学穆尧教授团队合作的项目“AutoBio”已被 ICLR 2026 接受,并且获得了同行

在32倍压缩率下性能超越25个百分点 解决长文本压缩问题 | ICLR 2026
在32倍压缩率下性能超越现有技术25个百分点,破解长文本压缩难题 | ICLR 2026 面对高压缩率时,为什么现有的上下文压缩方法会出现性能骤降的现象?当模型将32K长度的文档压缩至1K时,为何会表现出明显的性能下降? 阿里巴巴未来生活实验室的研究团队发现,这
