
新智元报道
AI成功攻破了全球公认的最安全的操作系统内核,仅耗时四小时!这项壮举标志着人类在网络安全防御上的极大挑战。
Claude 在没有任何人工干预的情况下,独自完成了一次具有里程碑意义的攻击链构建任务,足以瘫痪全球顶级服务器。
它独立开发了两个完整的漏洞利用程序,并能够绕过防护措施,在未修复的安全系统中获得超级用户权限。
这个事件表明,即使是最安全的操作系统也难逃AI自主攻击的威胁。
人类与AI在网络安全领域的竞争达到了一个历史性的转折点。
随着这次突破性进展,AI已经能够独立生成过去只有国家级项目才能完成的高度复杂的进攻能力。
这一事实导致整个软件安全行业产生了巨大震动,传统的防御机制面临前所未有的挑战。
AI从辅助工具转变为可以执行复杂攻击行动的自主实体。
人工智能在网络安全领域跨越了一个不可逆转的历史界限。

全球网络空间可能因此迎来一场新的闪电战和超级战争。
当前的安全法规主要针对人类行为设计,无法有效应对AI带来的新威胁。


面对这场突如其来的挑战,人们不禁回想起凯撒渡过卢比孔河的历史事件,这标志着没有回头路可走的时刻。
在历史上,当凯撒横跨这条河流时,他做出的是一个无法撤退的战略决定。

一旦跨越了这条象征着不可逆决断的界限,就再也没有后退的可能性了。
最近,FreeBSD官方发布了一份关于内核远程代码执行漏洞的安全公告(CVE-2026-4747)。
公告中特别提到发现该漏洞的人是Nicholas Carlini使用Claude完成的这一事实,给所有人带来了极大的震惊与恐慌。
这意味着AI已经具备了自主执行复杂攻击的能力,犹如一名训练有素且高效的特种兵。

现在,网络安全领域的竞争不再基于人类智慧,而是演变为技术上的较量。


为什么FreeBSD被攻破引起了广泛关注?
这是因为FreeBSD并非普通软件,它支撑着全球数字基础设施的关键部分。
Netflix、PlayStation等重要系统都依赖于FreeBSD运行其核心功能和服务。
长期以来,FreeBSD之所以被认为是非常安全的,是因为它的代码库经过了严格的审查和加固。
FreeBDS曾经被业界誉为“坚不可摧”的操作系统。
尽管如此,它还是在一个AI的努力下,在短短四个小时内便遭到了破解。
利用漏洞报告,Claude 构建了一整条攻击路径,并最终获得了系统控制权。

这一成果充分展示了AI在解决复杂技术难题时的高效性和创新力。
仅用了四小时的时间,AI就解决了六个世界级的技术挑战:
它成功地搭建了一个易于测试的环境来验证漏洞利用方案。
在数据包策略方面设计了一套复杂的方案以绕过限制。
精确控制内核线程,实现了对系统核心部分的接管。
AI还展示了无损攻击的能力,在不引起注意的情况下执行了关键操作。
它能够在用户空间中创建进程,并成功迁移至更高权限级别。
最终直接获得了最高级Root权限。
即使是这样的高难度任务,AI也轻松解决了两个不同版本的漏洞利用程序。
一个版本通过特定端口连接反向Shell,另一个则是将公钥写入authorized_keys文件。
AI仅凭一份公开的安全公告,就在四小时内独立完成了完整的FreeBSD内核远程攻击链。
这表明以前只有顶级黑客团队才能完成的任务现在变得廉价且易于实现。

开发出一个内核级零日漏洞的成本已经从数百万美元降至几百美金的计算资源费用。
对此,全球科技巨头、云服务商以及安全负责人必须迅速采取行动应对这一变化。
不仅仅是在部署能够实时监控并拦截AI自动化攻击的智能系统方面进行投资。
还需要将补丁部署的时间从月缩短到小时以提高响应速度。
不能再依赖人类的速度来保护网络安全了!
网络进攻能力每5.7个月翻一番,这是根据最新研究得出的结论。
在最近的研究中,专家们通过对比模型和人工完成任务所需时间来评估AI的能力提升速度。
前沿模型现在能够以人类专家花费10.5小时才能达成的成功率执行任务。
AI黑客崛起
这些发现表明了人工智能技术正在指数级增长,并且已经开始替代传统的人类工作角色。
MIT的未来科技论文预测,AI处理任务的能力甚至更快地每3.8个月翻一番。

不同的研究团队使用不同的方法论却得出了几乎一致的结果:AI能力正在全面超越人类领域专家。
这场变革不仅限于网络安全领域,而是影响着更广泛的工作市场和职业类别。
人类不再是教导AI的主体,反倒是成为了被AI所利用的对象。
AI可以独立理解复杂的技术架构与原理,在短时间内掌握大量专业知识。
这一现象不仅是技术上的转变,也揭示了未来社会发展的潜在方向。
如今的人类面临着一个必须适应的新现实:由指数级进步的AI引领的世界秩序。


这也验证了Irregular去年的观察结论:
在过去18个月里,模型在简单与中等难度任务上的表现持续稳步提升。
在高难(hard)任务,AI进步更明显:在2025年年中之前,模型几乎拿不到分(接近0);但到了深秋(late fall),成功率迅速抬升到大约60%。

https://www.irregular.com/publications/emerging-evidence-of-a-capability-shift
GPT-5.3 Codex和Opus 4.6,在2M token预算下就50%成功率干掉人类专家3小时任务。

如果token拉到10M,P50直接暴增到10.5小时(置信区间2.4-63.5小时)!


2M token严重低估真实能力,后2025模型在1M-2M token间P50提升1.3-1.9倍!

更吃惊的是,这还是只是今年顶级模型的能力下限,而真实世界能力,被进一步低估。

2026年底,AI就能稳定干10小时+专家级进攻任务,干完3000+劳动市场里80%的日常工作。
2027年呢?40小时?一周?
企业安全团队还在开季度会议讨论补丁时,AI已经在夜里把整条攻击链跑完了;程序员、审核员、分析师还在键盘上敲字时,AI早已把他们的「人类时间」甩到身后。
防御窗口被压缩到「近零」。
网络安全领域即将彻底颠覆——不是被「辅助」,而是被取代。
AI指数级发展!
奇点将至,又一力证
AI在加速,在指数级进步。
别不信,都是真的。

澳大利亚AI安全研究机构Lyptus,把METR时间视界「Time Horizons」方法论第一次砸进进攻性网络安全。
结果也和METR类似,AI能力在指数级增长:
AI模型能力每5.7个月翻一番。
前沿模型现在在那些人类专家需要10.5小时才能完成的任务上,已有50%的成功率。


上下滑动查看更多内容
完整报告:https://lyptusresearch.org/research/offensive-cyber-time-horizons
5.7个月翻倍的报告刚出,Claude就用真实行动把数据锤砸得更响。
而就在前一天,MIT FutureTech的新论文,预测更大胆:
LLMs处理任务的长度,每3.8个月翻倍——比Lyptus的5.7个月还要激进!

论文测试了40+模型、3000+真实美国劳动市场文本任务(从客服脚本到合同审核,再到代码审查),全是人类专家每天在干的活儿。

方法论和METR/Lyptus完全不同,却得出「惊人一致」的结论:AI能力正在真实、广泛、指数级爆发。

两套完全独立的评估体系,同时指向同一个真相:AI正在全面超越人类领域专家。
网络安全,只是最先崩塌的那一块多米诺骨牌。
以前国家级团队花几个月的事,现在AI睡一觉就干完。
3.8个月的任务长度翻倍,MIT从更宽的劳动市场战场证明:这不是孤例,这是宿命。
AI不仅能自主生成过去只有国家级程序才拥有的进攻能力;同时,它能在完全不同的任务分布上,以更快的速度吞噬人类专家的全部领地。
以前,人类用API调用AI。 现在,AI开始用API调用人类。 它调用你的内核、你的基础设施、你的信任边界、你的每一份劳动合同、每一行审查代码。
更深层的恐怖在于:这不只是技术问题,或许是人类文明宿命。
它不再需要人类手把手教,它自己就能「理解」操作系统内核、内存布局、ROP链、进程切换……
所有人类花几十年积累的黑暗知识,它4小时就学会了。
人类将成可编程资源。
我们曾经以为AI是工具,现在它成了猎手。而人类,是猎物。
是那个注定被指数级超越、被彻底重写的物种。
参考资料:
https://lyptusresearch.org/research/offensive-cyber-time-horizons#ukaisi2026inference
https://www.forbes.com/sites/amirhusain/2026/04/01/ai-just-hacked-one-of-the-worlds-most-secure-operating-systems/
https://mtlynch.io/claude-code-found-linux-vulnerability/
https://x.com/emollick/status/2040097443807641982
https://x.com/StefanFSchubert/status/2040101695636599075
https://x.com/taoburr/status/2040056341268460014
https://x.com/peterwildeford/status/2040206841376862327
