
Karpathy:自去年12月以来,AI编程迎来根本性变革
在2025年12月之前,AI编程与之后的编程相比截然不同。 这一观点是由Vibe Coding的提出者Karpathy提出的。 要准确描述过去两个月里AI对编程的影响并不容易。这种变化不是渐进式的,而是在去年12月份发生的突然转变。 作为最积极采用AI编程技术的程序员之一,Karpathy承认,在去年12月之前,尽管Coding Agent有不错的表现,但实际上并没有多大用处。 然而从12月
共找到 266 篇相关文章

在2025年12月之前,AI编程与之后的编程相比截然不同。 这一观点是由Vibe Coding的提出者Karpathy提出的。 要准确描述过去两个月里AI对编程的影响并不容易。这种变化不是渐进式的,而是在去年12月份发生的突然转变。 作为最积极采用AI编程技术的程序员之一,Karpathy承认,在去年12月之前,尽管Coding Agent有不错的表现,但实际上并没有多大用处。 然而从12月

在许多大型模型及代理的训练过程中,常见的方式是仅依据结果来判断:如果最终答案正确,则给予奖励;反之则得零分。对于简单的问答任务,这种方法尚可适用;但当涉及到需要多轮对话、搜索和编写代码等复杂过程的任务时,这种评价方式就显得过于简化了。因此,在差之毫厘的情况下与一开始就走错方向的情况之间,仅凭结果评判无法区分其优劣;训练过程中也无法识别出哪些失败更为关键,人工细粒度的评分又难以应对开放环境和多模态任

商业系统正从“以人为主导的操作中心”转向“为智能体定制的设计模式”。作者|苏霍伊硅谷又一家公司加入了“千亿美元俱乐部”。据悉,美国时间2月24日,Stripe与投资者达成协议,启动新一轮员工股份回购计划。该计划估值1590亿美元,旨在提高现任及离职员工所持股份的流动性。作为可编程金融服务公司,本轮融资主要由Thrive Capital、Coatue和a16z等机构提供。Stripe自身也动用了部分

MiniMax再次推出了备受期待的功能,现在OpenClaw可以实现真正的“一键部署”。平台上还有超过一万名专家智能体供用户调用。 马年复工以来,各大企业纷纷采取新策略,力求抢占OpenClaw这一市场高地。 此次MiniMax在他们的Agent平台中引入了M

面向Terminal-Bench交互任务的数据规模化生产管线首次公开发布!开源了一套完整的自动化数据构建算法构建了1655个高可靠CLI任务环境镜像通过291条轨迹数据实现了20%的解决率提升在Agentic Coding领域,基于SWE-bench的数据管线研究已取得显著进展。过去一年里,业界涌现了许多相关工作,如SWE-Gym、SWE-Smith和R2

Anthropic 更新了 Claude Cowork 插件系统,并引入了一款名为「杀死」软件的新功能。当前,Claude 可以接入企业内部常用的工具,如 Slack、Salesforce 和 Excel 等。这些插件可以在 Cowork 以及任何基于 Claude Agent SDK 构建的系统中运行。所有用户体验的更新都将对全体 Cowork 用户开放