搜索: "代码大模型"

共找到 4 篇相关文章

打破代码大模型训练瓶颈:MicroCoder将算法数据框架训练经验升级

打破代码大模型训练瓶颈:MicroCoder将算法数据框架训练经验升级

MicroCoder团队 投稿量子位 | 公众号 QbitAI新一代代码模型的训练动态已与旧模型截然不同,主流强化学习方法和数据集在其上几乎“失效”。微软亚洲研究院与剑桥大学、普林斯顿联合推出MicroCoder,从算法、数据、框架、训练经验四个维度全面升级,在最新代码测试集上取得明显提升,并从七个方面开源了34条训练洞察。背景:旧经验遇上新模型,为何几乎全部“失效”?强化学习正在成为代码大模型能

科技0 阅读
华为推出AI编程新工具,结合智谱和DeepSeek技术,同类任务Token用量锐减30%

华为推出AI编程新工具,结合智谱和DeepSeek技术,同类任务Token用量锐减30%

编程智能体的发展正逐步加快。近日,华为云推出了码道(CodeArts)代码智能体公测版,这一产品融合了代码大模型、集成开发环境(IDE)、自主开发模式等功能,并涵盖代码生成、研发知识问答、单元测试用例自动生成等AI编程技术,具备项目级代码生成、续写及关键功能支持。发布会上,华为云码道的负责人谈宗玮表示,该智能体依托于华为二十余年的研发经验以及海量代码积累,内置了需求管理、系统设计、软件开发等多个高

科技4 阅读
北京航空航天大学发布Code2Bench:推动代码大模型评估体系革新,终结单纯刷分现象

北京航空航天大学发布Code2Bench:推动代码大模型评估体系革新,终结单纯刷分现象

在评估大语言模型(LLM)生成代码的能力时,一个日益凸显的问题浮现出来:当这些模型在 HumanEval 和 MBPP 等经典基准测试中取得近乎饱和的成绩时,我们究竟是在衡量其真实的泛化推理能力,还是仅仅检验它们对训练数据的记忆力?目前的代码基准正面临两大核心挑战:一是数据污染的风险,二是测试严谨性的不足。前者可能使评测退化为「开卷考试」,而后者常常导致一

科技15 阅读