搜索: "ICLR"

共找到 25 篇相关文章

中科大华为诺亚TAPPA：时序视角的统一解释框架

本论文的第一作者杨庆越是中国科学技术大学 2021 级硕博连读生，师从王杰教授，主要研究方向为大模型推理加速与高效推理系统。她曾在 NeurIPS、ICLR 等顶级会议发表论文 3 篇，获华为优秀实习生等荣誉。本工作完成于其在华为诺亚方舟实验室科研实习期间，与中国科学技术大学 MIRA Lab 和华为团队合作完成。近日，中科大王杰教授团队（MIRA Lab）和华为诺亚方舟实验室（Huawei No

科技2026/3/15 阅读

ICLR 2026 | LightMem：降低大型模型的长期记忆成本

大规模预训练模型虽然表现出色，但在处理“长对话、多轮交互和跨任务”等复杂场景时，依然面临两大挑战：其一为上下文窗口的限制，在对话持续增长的情况下容易出现信息过载；其二是中间环节的信息丢失问题，即便能容纳所有数据也不一定能有效利用。因此，引入“外部记忆系统”成为必要：将对话内容储存于长期记忆，并在需要时进行检索。然而这一方案的实际应用却带来高成本的问题：频繁调用大模型执行总结和提取、实时解决冲突以及

科技2026/2/275 阅读

我的秃头换来的论文，你却用ChatGPT瞬间看完？这起学术风波让科学家们愤怒不已

作者 | 刘春出品 | 网易科技全球顶尖的人工智能学术会议正遭遇AI技术的巨大冲击。这看似是一个讽刺的情节，却在现实中上演了。最新数据显示，在ICLR 2026会议上，超过一万五千份评审意见是由人工智能系统撰写而成的。想象一下，你耗费大量精力撰写的论文可能根本无人过目，只是被直接交给AI工具生成了一些“标准”的反馈，并且这些反馈中甚至还包含了对文中不存在的数据错误指责。曾经被视为严谨的同行评

科技2026/2/2624 阅读

ICLR 2026：新一代图灵测试——VLA技术在生物实验室的应用

目前对 VLA 模型的研究和测试大多集中在家用场景（如摆放餐具、折叠衣物），而对于专业科学环境，特别是生物实验室的应用则较少探索。生物实验室因其流程结构化、操作精度高以及多模态交互复杂等特点，是评估 VLA 模型在精确操作、视觉推理及指令执行能力方面的理想场地。最近，香港大学MMLAB 罗平教授团队和上海交通大学穆尧教授团队合作的项目“AutoBio”已被 ICLR 2026 接受，并且获得了同行

科技2026/2/2612 阅读

在32倍压缩率下性能超越25个百分点解决长文本压缩问题 | ICLR 2026

在32倍压缩率下性能超越现有技术25个百分点，破解长文本压缩难题 | ICLR 2026 面对高压缩率时，为什么现有的上下文压缩方法会出现性能骤降的现象？当模型将32K长度的文档压缩至1K时，为何会表现出明显的性能下降？阿里巴巴未来生活实验室的研究团队发现，这

AI2026/2/2620 阅读