搜索: "助理教授"

共找到 5 篇相关文章

港中文新优化器Pion:在等谱流形上更新大模型

港中文新优化器Pion:在等谱流形上更新大模型

本文作者施柯煊和李瀚轩是香港中文大学计算机科学与工程系博士生,邱泽钜是德国马克斯普朗克研究所博士生,温研东是西湖大学助理教授,Simon Buchholz是德国马克斯普朗克研究所研究员,刘威杨是香港中文大学计算机科学与工程系助理教授。当大语言模型不断迈向百亿乃至千亿参数规模时,人们的核心关注已不再仅仅是 “如何更快收敛”,而是逐渐转向两个更加本质的问题:其一,是如何在训练过程中维持稳定性;其二,是

科技2 阅读
国仁对话:Token成本太高,免费模式绝对走不通?这场对话透Agent商业闭环

国仁对话:Token成本太高,免费模式绝对走不通?这场对话透Agent商业闭环

智东西作者 陈佳编辑 程茜4月21日,2026中国生成式AI大会在北京开幕,23位嘉宾围绕AI算力基础设施、大模型、AI智能体等热点话题,畅谈生成式AI与大模型算力需求、投融资机遇、OpenClaw热、商用落地等生成式AI焦点议题。开幕式中场的高端对话环节,智东西联合创始人、总编辑张国仁与香港大学助理教授、博士生导师、Nanobot团队负责人黄超,网易有道LobsterAI项目负责人、智能硬件研发

科技2 阅读
人大孟澄团队&华为提出集成剪枝视角下的MoE新架构

人大孟澄团队&华为提出集成剪枝视角下的MoE新架构

本文已被 ICML2026 接收,第一作者康欣来、共同第一作者薛敦耀来自中国人民大学统计与大数据研究院。通讯作者为中国人民大学孟澄助理教授与华为基础大模型部研究员陈汉亭。导语近年来,Mixture-of-Experts(MoE)已经成为大模型扩展的重要架构之一。相比稠密 Transformer,MoE 通过稀疏激活机制,在每个 token 上只调用少量专家,从而在控制计算成本的同时扩大模型容量。然

科技4 阅读
探索下一代语言模型:LangFlow引领新范式挑战传统扩散算法

探索下一代语言模型:LangFlow引领新范式挑战传统扩散算法

研究团队成员包括:Yuxin Chen,现为伊利诺伊大学厄巴纳-香槟分校硕士一年级学生;Chumeng Liang 和 Hangke Sui 均为该校博士生;Ge Liu 则是该校计算机科学系的助理教授。Liu 实验室专注于扩散及流模型领域,并已发表了包括 Riemannian Consistency Model (RCM)、Statistical Flow Matching 等在内的多项成果,其

科技4 阅读
谢赛宁终加盟LeCun团队 新公司斩获10亿美元投资

谢赛宁终加盟LeCun团队 新公司斩获10亿美元投资

Yann LeCun(杨立昆)迎来了新的合作伙伴! 深度学习领域的重要人物之一,图灵奖得主Yann LeCun最近有了重大动作。 他主导成立的初创公司Advanced Machine Intelligence(AMI)—— 宣布已成功筹集10.3亿美元种子资金,并且在融资前估值已达35亿美元。 同时,纽约大学助理教授、DiT框架作者谢赛宁也加入了这一行列。他的个人主页已经更新为AMI的联合创始人兼

AI4 阅读