
Python逆天改命!开源Hermes首次击败OpenAI Codex
新智元报道【新智元导读】一个纯Python写的开源项目,竟把OpenAI用Rust写的王牌给秒了!最终战绩6比5,Hermes直接上演工程暴力美学,解释型语言终于逆天改命。一个纯Python写的开源项目,竟击溃了OpenAI王牌!今天,全网都被Hermes Agent的硬核实力狠狠刷屏了:在针对真实世界CLI任务的11项基准测试中,它以6:5的战绩,直接把Codex按在地上摩擦。在这场备受瞩目的对
共找到 40 篇相关文章

新智元报道【新智元导读】一个纯Python写的开源项目,竟把OpenAI用Rust写的王牌给秒了!最终战绩6比5,Hermes直接上演工程暴力美学,解释型语言终于逆天改命。一个纯Python写的开源项目,竟击溃了OpenAI王牌!今天,全网都被Hermes Agent的硬核实力狠狠刷屏了:在针对真实世界CLI任务的11项基准测试中,它以6:5的战绩,直接把Codex按在地上摩擦。在这场备受瞩目的对

新智元报道【新智元导读】有人晒出开源项目:GPT-5.5连续狂飙150小时,自主挑战诺奖级AlphaFold2!它用拓扑「单纯形」重构蛋白质折叠逻辑,虽然性能暂未登顶,却展示了AI科学家的恐怖潜力:秒回滚、零情绪、全自动进化。科研范式,真要变天了。就在最近,GitHub上一个名为SimplexFold 的开源项目突然火出了圈。它的共同作者名单里,居然出现了这样一个名字——GPT-5.5!Meta的

机器之心转载最近一段时间,Agent 又一次成为 AI 圈最热的关键词。OpenClaw 这类开源项目走红之后,关于 Agent 的讨论迅速升温:Agent 到底是什么?应该怎么做?长期会演进到哪里?这些问题重新被摆到台面上。近日,王云鹤在知乎上围绕这一问题发表了一篇文章,讨论了自己对Harness Engineering的看法,引起了AI 社区的关注与讨论。机器之心经授权转载,让我们看下他对Ha

“抱歉,我无法直接访问这些网站。”每次想让AI读个外部网站的信息,看到这句话头都要炸了。不过,GitHub有个开源项目OpenCLI把这事儿解决了:网站变命令行。目前20k+ Star,还在涨!!Reddit讨论、B站热门、Arxiv论文,以前开浏览器一个个翻的东西,现在终端一行命令直接出结构化数据。而且不只是网页,现在OpenCLI连微信、Telegram、Discord这些私域聊天记录都给打通

机器之心编辑部如果只看这场 Meetup 的嘉宾名单,你大概会先想到海外芯片巨头,或者某家国际 AI 基础设施公司。毕竟,SGLang、TileLang、Triton 、Mooncake…… 这些今天大模型推理栈里最活跃、也最有存在感的开源项目,几乎都有核心开发者来到现场。但真正把这群人聚到一起的,竟然是摩尔线程。这才是这件事最值得看的地方。它说明一件事:国产 GPU 厂商开始不只是追着生态跑,而

近日,DeepSeek-V4模型成功开源并在Hugging Face平台的开源项目排名中迅速攀升至榜首。此项目的相关技术报告详细披露了其针对华为昇腾与英伟达芯片优化、架构升级及预训练和后训练阶段改进等方面的技术细节。DeepSeek-V4在推理、知识获取和代码能力等关键领域均有显著提升,整体性能可比肩GPT-5.4和Claude Opus 4.6这些顶级闭源模型。此外,该版本首次以“百万上下文”作

新智元报道DeepSeek V4 引人注目,其参数量达到惊人的1.6万亿,并且在Codeforces竞赛中排名人类选手第二十三位,KV缓存仅前代的十分之一。在同一周内,Kimi K2.6也宣布开源,支持数百万token的上下文和300个子Agent协同工作,模型参数量更是达到了2.6万亿。两家公司在中国AI领域中的地位显赫,它们的技术进步与发布时间高度契合,似乎有意为之。回顾过去一年半的时间线,D

新智元报道五周前,黄仁勋在GTC大会上隆重推出了个人AI操作系统OpenClaw,然而现在就连英伟达自身都不愿使用最新版本了。在3月16日的大会现场,身穿皮夹克的老黄亲自宣布OpenClaw是“人类历史上增长最快的开源项目”。OpenClaw被视为一种面向个人用户的AI操作系统。它与Mac和Windows在电脑领域的地位相似。然而,就在大家为这项创新热烈鼓掌的时候,没有人预料到它仅仅五周后就会陷入

随着AI技术的发展,单个智能体的功能已经从基本的“可用”提升到了更高的水平,然而现在更需要的是团队协作来完成复杂的任务。在这种背景下,华为支持下的开源项目openJiuwen社区发布了最新的成果——龙虾Agent(JiuwenClaw)。此次更新中最重要的新功能是多智能体协同能力,可以实现不同角色间的分工合作和互相协作。例如,在一个项目里,调研、分析、执行与审核等任务由不同的AI助手来完成,它们之

今日,蚂蚁灵波正式对外公布了其流式三维重建模型 LingBot-Map 的开源项目。该技术仅需使用普通 RGB 摄像头便能在视频采集过程中实时完成相机位姿估计及场景的三维结构重建,无需复杂的硬件设备支持,填补了实时空间感知领域的一项关键技术空白。流式三维重建领域的关键挑战在于如何平衡几何精度、时序一致性和运行效率。传统的三维重建方法往往采用“先采集再处理”的方式,而流式重建则要求系统在接收新画面的

百度近期正式向公众开放了其文心大模型团队开发的ERNIE-Image图形生成系统,该系统的参数规模仅为8B,在仅需24GB显存的消费级GPU上就能运行。在多个国际评估标准中,ERNIE-Image表现出色,在GenEval、OneIG等关键测试中的综合得分均列开源模型之首。尤其在文字渲染方面,其性能与Nano Banana等商业闭源系统处于同一水平线上。此外,团队还同时发布了ERNIE-Image

新智元报道一位名为Peter Steinberger的开发者发帖称,他收到了一封来自Anthropic的邮件,导致他的Claude账号被封。这一消息在社交媒体上迅速传播,并引发了广泛的讨论和关注。据了解,Steinberger是开源项目OpenClaw的创始人,该项目目前拥有超过24.7万颗GitHub星标。他收到的邮件中并没有明确说明封号的具体原因,只是提到存在一些“可疑信号”需要调查。在短短几

最近,在GitHub平台上出现了一个名为“张雪峰.skill”的开源项目,并引起了大量讨论和关注。该项目的资料页面显示,它基于已故知名教育咨询师张雪峰生前出版的五本书籍、十几篇深度访谈文章及三十多条经典语录开发而成,还包括了他的一些关键咨询服务记录。开发者通过整合这些资源,成功捕捉并再现了张雪峰特有的咨询风格和决策方式,并将它们转化为一个AI智能体技能包。使用这个技能包时,用户可以通过对话的形式获

近日,Claude发布了名为“企业版”的Agent服务,随即被一款开源项目超越了。 西风 2026-04-09 14:59:04 量子位

全球AI开源社区正聚焦于字节跳动推出的超级智能体 DeerFlow 2.0。截至2026年4月3日,该项目在GitHub上的关注度极高,Star数量已达57k,Fork数超过6.9k,有近200位全球开发者参与贡献,成为国产开源AI领域的一颗新星。作为今年最具影响力的国产开源项目之一,DeerFlow 2.0自发布以来便在GitHub的Trending榜单上占据首位,热度持续不减。与之前的1.0版

在4月2日的直播活动中,浪潮信息发布了企业级OpenClaw方案「企千虾」,旨在为企业的规模化部署、管理和应用提供一套安全高效且易于操作的整体解决方案。该方案通过实操演示展示了如何在元脑服务器上进行本地化安装,并利用沙箱隔离和底层系统控制来解决私有化部署中的安全问题及权限管理难题。此外,「企千虾」与开源项目ClawManager深度融合,在数千个OpenClaw实例的本地环境中实现了一键部署、集群

Google DeepMind 最近公布了其最新的开源模型 Gemma 4:该模型拥有大约 300 亿个参数,在性能上与市面上的其他主流开源项目不相上下。Gemma 是一个由 Google 开发的开源系列,它和谷歌自家的闭源产品 Gemini 共享基础技术。Gemma 的所有权重都向公众开放,任何人都可以获取、修改或部署这些模型。该系列的上一版本 Gemma 3 发布于 2025 年三月,至今已过

最近,互联网上又出现了一项新奇的现象:员工离职后仍可通过AI数字人继续工作。据悉,在GitHub平台上有人发布了一个名为“colleague-skill”的开源项目,该项目旨在让已离开的同事实现所谓的“赛博永生”。通过训练模型学习和分析前员工的工作数据、文档及聊天记录等信息,即使他们不再在职,也能借助AI继续完成一部分工作任务。目前已有网友透露,其公司已经将离职同事的数据转化为数字人形态,并让他们

据报道,当前中国科技公司正在引领全球开源AI大模型的发展趋势,而美国的大型科技企业则倾向于闭源策略。不过,为了防止完全失去市场竞争力,这些美国巨头也会偶尔推出一些开源项目作为象征性举措。谷歌即将发布的Gemma 4便是其中之一。关于Gemma 4的消息已经流传了一段时间,近日,该模型背后的团队DeepMind创始人、首席执行官Demis Hassabis在推特上透露了相关信息。他提到的是四颗钻石的

克雷西 发自 凹非寺量子位 | 公众号 QbitAIOpenClaw火了之后,一个问题也自然浮现——如果你是一个管理者,想给整个公司人手配一只虾,该怎么办?听上去就是多开几个实例的事,但实际上,想要规模化部署,就必须考虑用户权限管理、资源配额、审计能力等等一系列问题。然而,OpenClaw的设计从一开始就为单个用户准备,在个人场景下没表现出缺陷,但放到企业,前面这些能力的缺失,就会变成真实的障碍。