搜索: "编程模型"

共找到 7 篇相关文章

GLM-5.1上线,编程表现贴Opus 4.6开大,Coding plan瞬间断货

GLM-5.1上线,编程表现贴Opus 4.6开大,Coding plan瞬间断货

梦瑶 发自 凹非寺量子位 | 公众号 QbitAI智谱GLM-5.1,突然上线!官方公告只有寥寥两句:GLM-5.1现已面向GLM Coding Plan全部用户(Lite/Pro/Max)开放。ModelKey:GLM-5.1别的没再多说,只是默默甩出Coding Evaluation评测结果——在编程能力上相比上一代GLM-5直接飙升近10分。甚至嘛,距全球最强编程模型Claude Opus

科技3 阅读
硅谷巨头Cursor陷争议!500亿公司涉嫌模仿Kimi,中国开源社区反应强烈

硅谷巨头Cursor陷争议!500亿公司涉嫌模仿Kimi,中国开源社区反应强烈

新智元报道昨日,人工智能领域发生了一件令人震惊的大事:Cursor公司刚刚推出的编程模型Composer 2,在短短24小时内就被网友质疑其实质是基于Kimi模型的。这一事件迅速在社交媒体上引发了广泛关注,连科技大佬也纷纷加入讨论。今日,整个AI社区都被这一消息所震撼。3月19日,估值即将达到500亿美元的AI编程独角兽Cursor,发布了他们最新的编程模型Composer 2。该模型一经发布,便

科技1 阅读
顶尖模型在新基准BeyondSWE测试中仅通过45%,AI取代程序员尚需时日

顶尖模型在新基准BeyondSWE测试中仅通过45%,AI取代程序员尚需时日

新智元报道AI编程模型在SWE-bench上的表现十分出色,但仅限于处理小型仓库的简单修补工作。BeyondSWE则提出了一种新的评估方法,旨在测试AI模型在跨仓库检索、领域知识理解、依赖关系升级和从零构建系统等方面的能力,结果显示顶尖模型的通过率骤降至45%以下,揭示了它们在实际工程思维方面的不足。近两年来,SWE-bench几乎是衡量Code Agent性能的唯一标准。从最初的解决率不到30%

科技1 阅读
Kimi的「注意力残差」引发热议,重新定义焦点方向

Kimi的「注意力残差」引发热议,重新定义焦点方向

自2015年ResNet诞生以来,「将输入直接加到输出上」这一简单的机制,几乎统治了所有神经网络架构。近期,沿用了十年的残差机制迎来了重大变革,「注意力机制」成为了其替代方案。这一创新甚至影响到了OpenAI的研究人员,包括负责开发o1/o3系列、Codex编程模型及GPT-4 STEM能力的Jerry Tworek,他深受启发,认为需要重新评估现有的一切,「深度学习2.0」时代即将到来。这一突破

科技1 阅读