搜索: "ICLR"

共找到 25 篇相关文章

中科大华为诺亚TAPPA:时序视角的统一解释框架

中科大华为诺亚TAPPA:时序视角的统一解释框架

本论文的第一作者杨庆越是中国科学技术大学 2021 级硕博连读生,师从王杰教授,主要研究方向为大模型推理加速与高效推理系统。她曾在 NeurIPS、ICLR 等顶级会议发表论文 3 篇,获华为优秀实习生等荣誉。本工作完成于其在华为诺亚方舟实验室科研实习期间,与中国科学技术大学 MIRA Lab 和华为团队合作完成。近日,中科大王杰教授团队(MIRA Lab)和华为诺亚方舟实验室(Huawei No

科技5 阅读
ICLR 2026 | LightMem:降低大型模型的长期记忆成本

ICLR 2026 | LightMem:降低大型模型的长期记忆成本

大规模预训练模型虽然表现出色,但在处理“长对话、多轮交互和跨任务”等复杂场景时,依然面临两大挑战:其一为上下文窗口的限制,在对话持续增长的情况下容易出现信息过载;其二是中间环节的信息丢失问题,即便能容纳所有数据也不一定能有效利用。因此,引入“外部记忆系统”成为必要:将对话内容储存于长期记忆,并在需要时进行检索。然而这一方案的实际应用却带来高成本的问题:频繁调用大模型执行总结和提取、实时解决冲突以及

科技5 阅读
我的秃头换来的论文,你却用ChatGPT瞬间看完?这起学术风波让科学家们愤怒不已

我的秃头换来的论文,你却用ChatGPT瞬间看完?这起学术风波让科学家们愤怒不已

作者 | 刘春出品 | 网易科技全球顶尖的人工智能学术会议正遭遇AI技术的巨大冲击。 这看似是一个讽刺的情节,却在现实中上演了。最新数据显示,在ICLR 2026会议上,超过一万五千份评审意见是由人工智能系统撰写而成的。 想象一下,你耗费大量精力撰写的论文可能根本无人过目,只是被直接交给AI工具生成了一些“标准”的反馈,并且这些反馈中甚至还包含了对文中不存在的数据错误指责。 曾经被视为严谨的同行评

科技24 阅读
ICLR 2026:新一代图灵测试——VLA技术在生物实验室的应用

ICLR 2026:新一代图灵测试——VLA技术在生物实验室的应用

目前对 VLA 模型的研究和测试大多集中在家用场景(如摆放餐具、折叠衣物),而对于专业科学环境,特别是生物实验室的应用则较少探索。生物实验室因其流程结构化、操作精度高以及多模态交互复杂等特点,是评估 VLA 模型在精确操作、视觉推理及指令执行能力方面的理想场地。最近,香港大学MMLAB 罗平教授团队和上海交通大学穆尧教授团队合作的项目“AutoBio”已被 ICLR 2026 接受,并且获得了同行

科技12 阅读
在32倍压缩率下性能超越25个百分点 解决长文本压缩问题 | ICLR 2026

在32倍压缩率下性能超越25个百分点 解决长文本压缩问题 | ICLR 2026

在32倍压缩率下性能超越现有技术25个百分点,破解长文本压缩难题 | ICLR 2026 面对高压缩率时,为什么现有的上下文压缩方法会出现性能骤降的现象?当模型将32K长度的文档压缩至1K时,为何会表现出明显的性能下降? 阿里巴巴未来生活实验室的研究团队发现,这

AI20 阅读