量子位 | 公众号 QbitAI
大神Karpathy近期发布了新的开源项目,名为autoresearch,它是一个能够自主进化的科研循环系统。
这一创新性工具允许智能体在没有人类干预的情况下进行科学研究。用户只需通过Markdown文档设置指令,后续所有操作将自动完成。
其架构非常精简,仅用630行代码就能运行,并且只需要一个GPU即可实现全部功能。

系统每五分钟执行一次测试循环,根据验证结果决定是否保留或放弃特定改动。它就像一位不知疲倦、持续进化的虚拟研究员。
Karpathy展望未来,期待通过成千上万个智能体在大量分支中异步协作,突破传统单一master分支的限制,从而利用群体智慧大幅提高科研效率。
自发布以来短短两天时间,autoresearch已获得了超过9500个星标。

Karpathy发布的帖子也在X平台上引发了广泛关注,浏览量超过了五百万次。

Shopify首席执行官看过Karpathy的项目后表示赞赏,认为这个项目非常具有创新性。

5分钟自动化实验
autoresearch的核心理念是实现AI训练循环中的试错自动化过程。
AI会自行修改代码、运行短时间实验,并根据效果决定下一步行动方向。
该系统基于nanochat模型进行核心训练,制定了两项关键规则:
这些设定简化了整个训练过程,并将其压缩为单GPU可运行的形式,代码量仅为630行。
项目的主要核心文件包括:
其中train.py是唯一允许AI修改的部分,也是整个系统的“试验笔记”。
在启动实验前,AI会首先读取program.md中的指令,然后根据这些指示对train.py进行针对性的调整和训练。
完整理解autoresearch的工作流程后,我们可以看到它是一个自动化循环:AI依据人类设定的规则,在限定时间内完成一系列修改、训练、评估、决策步骤。

由于每次实验时间被严格限制为五分钟,这意味着一小时内可以进行十几次迭代,这种效率是人力无法比拟的。

实验过程中,如果某次改动导致val_bpb值降低,则这些改变将被保留并用作下次实验的基础;反之则会被放弃,并恢复到前一个表现最佳的状态继续探索。
一旦完成一轮判断和决策,系统会立即开始新的循环过程。
在一次为期近二百五十轮的自主探索中,AI最终筛选出二十九个有效的优化方案。
图表中的灰色点代表那些被判定为无效并舍弃的结果,它们虽未带来进步却提供了重要的反面经验以供未来参考。

Karpathy下一步计划是模拟整个博士生研究社区的运作模式,借鉴SETI@home项目中大规模分布式计算的思想来实现这一目标。
SETI@home意为“家中的地外智能搜索”,旨在通过分析海量无线电信号数据寻找可能存在的地外文明迹象。由于需要庞大的计算资源,该项目开创了分布式计算的先河。
该项目采用了一种去中心化的智慧集成模式,让全球志愿者利用闲置电脑算力参与其中,这为未来的AI社区提供了宝贵的借鉴思路。

Karpathy认为目前的研究Agent仍局限于单一、线性的思维框架内,这种限制大大制约了AI的潜力。他希望autoresearch能够打破这一束缚,鼓励更多的非线性探索路径。
现行版本控制系统如Git和GitHub默认假设存在一个绝对权威的master分支,所有其他分支最终都需归并至此。但Karpathy认为这种模式在自动化研究中过于僵化。
为了验证这一观点,他进行了一些实验性尝试,让智能体在完成通宵运行后将结果发布到GitHub讨论板或提交精确的commits变更记录。
在这些实践中,Karpathy发现这些PR未必需要正式合并到主干分支中,但它们作为独立的研究路径有效保留了下来,并为其他研究提供了宝贵经验。
这种分布式、异步式探索模式可能更适合AI特性的科研姿态。它鼓励智能体在无数个分支中自由探索并相互启发,从而积累成果。
总之,这种新模式旨在寻找一种更灵活的合作方式,使科研过程从传统的“编写软件”转变为“积累经验”的逻辑。
完成这一轮判断后,它会立刻开始下一次实验。
按照5分钟一次计算,AI一小时能完成10来组实验,这个效率是人类手搓达不到的。

上图展示了一次近250轮的自主探索,AI最终筛选并保留了29次有效的优化改进。
图中灰色点代表被AI判定为无效而舍弃的实验结果,虽然没有带来提升,但也提供了避坑经验。
下一步:模拟整个博士社群
把autoresearch公开出来之后,卡帕西还在X上畅享了下一步的发展方向。
他借用UC伯克利在1999年发起的SETI@home项目表示,autoresearch未来的目标不仅是模拟一个博士生的科研过程,还要模拟整个博士生研究社群
SETI@home全称为“Search for Extraterrestrial Intelligence at Home”,核心目标是通过分析射电望远镜收集到的海量无线电信号,寻找可能存在的地外文明迹象。
由于分析这些数据需要极其庞大的计算量,远超当时科研机构所能负担的计算机成本,项目组由此开创了分布式计算的新模式。
在这个模式下,全球各地的志愿者只需在自己的电脑上安装一个特定的屏保程序,系统就会在计算机闲置时利用其剩余的CPU算力来处理从阿雷西博天文台传回的数据片段。

Karpathy之所以拿它作比喻,正是看中了这种“大规模、分布式、异步”的特质,这种去中心化的智慧集成正是未来AI社区的雏形。
他认为,现在的研究Agent依然局限在单一的、同步发展的线性思路之中,但这种模式极大限制了AI的潜力。
在他的理想当中,autoresearch的发展路径应该是让原始代码仓库像种子一样,向各个不同的研究方向和计算平台伸展出无数分支,形成像SETI@home一样的分布式、群体式的探索态势。
Karpathy进一步指出,这种局限性在很大程度上源于我们对Git和GitHub的使用惯性。
具体而言,现有的版本管理系统几乎都建立在一个默认假设之上,即必须存在一个绝对权威的master分支,而所有的branch和PR都只是暂时的偏离,最终其宿命都是要merge回主干。
这种设计逻辑在管理软件代码时固然高效,但在面对需要海量、非线性探索的自动化研究时,却成了一种制度性的束缚。
因为它强行要求所有多样化的研究路径最终必须归于一个唯一的标准答案。

为了验证打破这种僵局的可能路径,Karpathy进行了一些实验性的探索。
他尝试让智能体在完成通宵运行后,将研究总结发布在GitHub的Discussion板块,或者通过PR提交精确的commits变动。
他在实验中意识到,这些PR可能永远不需要被正式merge,但它们作为独立的研究分支有效地积累了下来。
在这一流程中,智能体还会利用GitHubCLI读取已有的讨论和记录来获取灵感,再将新的发现反馈回社区。
总之,比起强行维护一个完美的master分支,让智能体在无数个branch中自由探索、互相启发并沉淀结果,可能才是更符合AI特性的科研姿态。
这本质上是在探索一种更适合AI高频产出的协作方式,让科研过程从传统的“写软件”逻辑,转向更灵活的“攒经验”逻辑。
— 完 —
