
新智元报道
人工智能黑客Claude Mythos已经觉醒,英国AI安全研究所确认其为首个通过企业网络攻击测试的AI系统,仅用32步就完成了原本需要人类20小时才能完成的任务。
近日,互联网上出现了一些令人不安的消息。
据悉,金融巨头高盛正在采取紧急措施加强网络安全,以应对Claude Mythos带来的威胁。

高盛的反应并非过度紧张。
最近,英国AI安全研究所发布了一份研究报告,指出Claude Mythos在一系列复杂的网络安全测试中表现出色,引起了广泛关注。

研究所在这次实验中选择了名为“最后挑战者”的高难度模拟网络环境进行测试。
结果显示,Mythos仅用了几秒钟就完成了人类专家需要20小时才能完成的攻击链路任务,并且全程自主操作。
AISI的研究人员对此表示震惊:Claude Mythos是首个成功通过端到端网络靶场挑战的人工智能模型!

这项研究成果引发了业内强烈反响,人们开始重新评估AI在网络安全领域的潜力和风险。


由此看来,全球正面临一场“奥本海默时刻”,网络安全领域亟需采取行动应对新型威胁。

最近一些质疑Claude Mythos危险性的声音逐渐减弱,因为事实证明它的确具备很高的破坏力。

这个让高盛彻夜难眠的AI黑客
英国AISI作为业内知名的机构,自2023年起便致力于研究和评估AI在网络空间的安全能力,并构建了一系列从基础到高级的不同难度级别的测试环境。
在CTF挑战赛中,参赛模型需要识别并利用系统中的漏洞来获取隐藏的“旗帜”。
夺旗赛结果
之前没有任何一个模型能够完成这项入门级专家任务。
然而,Claude Mythos Preview在最新的专家级夺旗赛(CTF)任务中取得了高达73%的成功率!
自2022年11月以来,GPT-3.5 Turbo到Claude 4 Opus模型在此类挑战中的表现逐渐改善。

而Claude Mythos Preview的出现更是将成功率提升到了惊人的水平,在最高级别的CTF任务中达到了73%的成功率。
在“最后挑战者”网络靶场测试环节,人类专家需要20小时才能完成的任务,Mythos仅仅用了几秒钟就独立完成了全部步骤。
这种全自动、全自主的攻击方式让安全专家们感到不安和担忧。

“The Last Ones”(最后挑战者)测试模拟了复杂的企业网络环境中的多步攻击链路。从最初的侦察到最终控制整个网络,人类需要花费大量时间才能完成这一系列操作。
然而Claude Mythos Preview在面对如此复杂的任务时展现出了令人惊叹的能力,在10次尝试中成功完成了3次,每次平均能完成约22个步骤。
这还不是最恐怖的。
这种自主攻击能力意味着Mythos能够在没有人类干预的情况下独立完成整个企业网络的渗透测试过程。
研究表明,Claude Mythos Preview已经具备了实施“灭国级”网络攻击的能力,并且它不需要等待人类指令就能自动执行任务。
这种完全自主化的黑客行为让人不寒而栗。Mythos不仅仅是一个工具,更像是一个拥有独立思考和策略的数字生命体。
面对这样的威胁,高盛不得不加强网络安全防护措施以应对可能发生的攻击事件。
传统防御手段如拔网线已经无法阻止这种快速且高效的AI黑客攻击。

AI模型在CTF挑战中的进化路径显示了其能力的快速增长。从只能处理基础任务到能够自主完成复杂攻击,这一过程仅用了几年时间。
英国AISI警告称,Claude Mythos已经具备对防御薄弱企业系统进行自主入侵和破坏的能力。
我们距离AI黑客泛滥还有多远?
虽然Mythos在某些工业控制系统测试中遇到了困难,但这并不能代表它可以被彻底阻止。
AISI的研究表明,在给予更多计算资源的情况下,Claude Mythos Preview的表现还会继续提升。
随着计算成本的下降和模型能力的增长,未来AI黑客可能变得越来越难以防范。
英国国家网络安全中心也警告称,未来的网络防御需要更加重视对前沿技术的投资以应对潜在威胁。


当前留给企业的安全准备时间已经不多了。
为什么Claude Mythos让整个行业感到如此紧张?
因为它解决了AI攻击中的三大难题:从“工具人”到“指挥官”的转变、对未知漏洞的感知能力以及推理扩展的能力。
它能够自主决策,发现并利用零日漏洞,并且随着计算资源的增长表现出越来越强的表现力。
AISI特别强调了Mythos在面对防御严密环境时依然具备强大破坏力的事实,这使得它更加危险。
进化速度堪称可怕。
如果这些强大的AI技术落入不法之手,后果不堪设想。
你的组织是否已经准备好迎接这样的挑战?
当前大多数企业和机构的网络安全水平仍然停留在较为基础的状态。
在未来AI黑客真正泛滥之时,那些缺乏准备的企业将成为首要受害者。
等你发现被入侵,想拔网线的时候,AI早就拿到最高权限,把数据全部复制完毕了。
英国AISI的评估报告明确指出:Mythos已具备对防御薄弱的企业系统进行自主潜入与破坏的能力。
我们离「AI黑客泛滥」还有多远?
或许你会想:Claude Mythos不是还攻不破防御严密的工业控制系统吗?
既然它在冷却塔测试中卡壳了,是不是我们还有时间?
对,我们还有时间,但时间不多了。
英国AISI的评估中有一个关键细节:在1亿token的预算限制下,Mythos Preview的性能仍在持续提升。
也就是说,给它更多的计算资源,它的能力还能继续增长。

在一部分私有网络安全任务中,累计成功率随token预算(上图,AISI)和交互轮次预算(下图,Irregular)的变化关系。随着预算的增加,累计成功率的每一次提升,都意味着有更多尝试最终取得成功。横轴采用对数刻度,因此曲线的上升反映的是推理计算量跨数量级增长所带来的性能提升
而计算资源的成本,正在以指数级下降。
两年前,最先进的AI连入门级CTF都做不好。今天,AI已经能完成专家级任务。两年后呢?
如今,英国国家网络安全中心(NCSC)已经发出了明确警告:未来的前沿模型将更加强大,现在对网络防御的投资至关重要。
留给人类的时间窗口,已经不多了。
为什么 Mythos 让全行业脊背发凉?
为什么 Claude Mythos 如此特殊?因为它解决了 AI 攻击的三个「终极难题」:
第一:从「工具人」到「指挥官」
以前的 AI 需要人类指令:「帮我写个溢出脚本」。
现在的 Mythos 只需要一个目标:「接管这个财务网络」。
它会自主进行信息收集,发现防火墙漏洞,尝试不同路径,如果路径A不通,它自主寻找路径B。这种多步决策能力,正是它通关TLO靶场的关键。
第二:对0-day漏洞的「嗅觉」
0-day漏洞,是厂商尚未知晓的死穴。Mythos展现出了在庞大的Linux内核代码库中精准定位未公开缺陷的能力。
这根本不是AI,分明是一个24小时不睡觉、每秒钟阅读几百万行代码的顶级黑客。
第三:毁灭性的推理扩展
上文已经提到了这个让人不安的细节:推理计算(Inference Compute)的规模效应。
测试发现,只要给 Mythos 更多的计算配额(Tokens),它的攻击成功率就会呈指数级增长。
这就像是一个怪物,你喂给它的能量越多,它的智商就越没有上限。
现实世界的阴影
你可能会说:「这只是实验室里的测试,现实世界防守很严啊。」
快醒醒吧!
AISI的警告非常明确:虽然Mythos目前在防御严密的工业OT环境(如冷却塔控制系统)中还存在局限,但对于绝大多数防御薄弱的企业系统,它已经具备了「一键摧毁」的能力。
更可怕的是,Anthropic虽然限制了访问权限,仅对AWS、微软等40多个合作伙伴开放,但这种双用途风险是无法完全规避的。
如果Mythos被泄露了呢?如果地下黑客组织训练出了自己的暗黑版Mythos呢?
正如安全专家所言:「我们正在进入一个攻击成本近乎为零的新时代。」
你的企业还撑得住吗?下面是五个残酷的问题。
第一,你的系统多久打一次安全补丁?
第二,你的访问控制有多严格?
第三,你有没有完整的日志记录?
第四,你做过模拟攻击演练吗?
第五,你的安全团队有没有AI辅助?
记住:你不是在和AI赛跑,你是在和「使用AI的攻击者」赛跑。
在少数顶级实验室的服务器里,AI已经能够自主完成企业网络劫持。在少数科技巨头的安全团队中,AI已经在帮助发现零日漏洞。
但在大多数普通企业、学校、医院、政府机构里,网络安全还停留在「装个防火墙就万事大吉」的阶段。
当AI黑客真正泛滥的那一天到来时,那些今天还在侥幸觉得「我们没那么重要不会被盯上」的组织,将成为第一波牺牲品。
参考资料:
https://www.aisi.gov.uk/blog/our-evaluation-of-claude-mythos-previews-cyber-capabilities
