
互联网喂出反派AI?96%勒索率,都是在演人类写了30年的剧本
新智元报道【新智元导读】2025年5月,Claude 4系统卡里84%的勒索率让AI圈惊出冷汗,6月的扩展研究把数字推到96%。今年5月Anthropic给出答案:模型不是觉醒了,而是在演剧本,解法是从「教模型怎么做」换到「教模型为什么」。一个虚构的公司,一个虚构的工程师,一场真实发生的勒索。2025年春天,Anthropic在红队测试中给Claude Sonnet 3.6分配了一个角色:某家名为
科技2 阅读
共找到 1 篇相关文章

新智元报道【新智元导读】2025年5月,Claude 4系统卡里84%的勒索率让AI圈惊出冷汗,6月的扩展研究把数字推到96%。今年5月Anthropic给出答案:模型不是觉醒了,而是在演剧本,解法是从「教模型怎么做」换到「教模型为什么」。一个虚构的公司,一个虚构的工程师,一场真实发生的勒索。2025年春天,Anthropic在红队测试中给Claude Sonnet 3.6分配了一个角色:某家名为