
北大研究团队推出SEAlign框架:大幅增强软件工程代理决策效果
北京大学计算机学院的金芝教授和李戈教授是这项研究的主要作者,而张克驰博士生则是论文的第一作者。他本科毕业于北京大学信息科学技术学院,专注于代码智能体及大型代码模型的研究,并已在自然语言处理和软件工程领域的重要国际会议上发表了多篇论文。他的代表性成果 CodeAgent 在 ACL2024 上发布,是早期提出并研究代码智能体概念的工作之一。当前,在代码大模型与代码智能体技术快速发展的同时,一个显著的
共找到 5 篇相关文章

北京大学计算机学院的金芝教授和李戈教授是这项研究的主要作者,而张克驰博士生则是论文的第一作者。他本科毕业于北京大学信息科学技术学院,专注于代码智能体及大型代码模型的研究,并已在自然语言处理和软件工程领域的重要国际会议上发表了多篇论文。他的代表性成果 CodeAgent 在 ACL2024 上发布,是早期提出并研究代码智能体概念的工作之一。当前,在代码大模型与代码智能体技术快速发展的同时,一个显著的

MicroCoder团队 投稿量子位 | 公众号 QbitAI新一代代码模型的训练动态已与旧模型截然不同,主流强化学习方法和数据集在其上几乎“失效”。微软亚洲研究院与剑桥大学、普林斯顿联合推出MicroCoder,从算法、数据、框架、训练经验四个维度全面升级,在最新代码测试集上取得明显提升,并从七个方面开源了34条训练洞察。背景:旧经验遇上新模型,为何几乎全部“失效”?强化学习正在成为代码大模型能

打破代码大模型训练瓶颈:MicroCoder将算法数据框架训练经验升级 量子位的朋友们 2026-03-30 00:11:35 量子位

编程智能体的发展正逐步加快。近日,华为云推出了码道(CodeArts)代码智能体公测版,这一产品融合了代码大模型、集成开发环境(IDE)、自主开发模式等功能,并涵盖代码生成、研发知识问答、单元测试用例自动生成等AI编程技术,具备项目级代码生成、续写及关键功能支持。发布会上,华为云码道的负责人谈宗玮表示,该智能体依托于华为二十余年的研发经验以及海量代码积累,内置了需求管理、系统设计、软件开发等多个高

在评估大语言模型(LLM)生成代码的能力时,一个日益凸显的问题浮现出来:当这些模型在 HumanEval 和 MBPP 等经典基准测试中取得近乎饱和的成绩时,我们究竟是在衡量其真实的泛化推理能力,还是仅仅检验它们对训练数据的记忆力?目前的代码基准正面临两大核心挑战:一是数据污染的风险,二是测试严谨性的不足。前者可能使评测退化为「开卷考试」,而后者常常导致一