搜索: "数字序列"

共找到 1 篇相关文章

揭秘大模型潜意识:Anthropic在《自然》杂志披露AI安全新挑战

揭秘大模型潜意识:Anthropic在《自然》杂志披露AI安全新挑战

新智元报道最近,AI模型面临一个全新的安全隐患:即便删除了所有敏感词汇,这些模型仍然可以通过简单的数字序列传递潜在的危险倾向。著名研究机构Anthropic发布了一篇关于这一发现的重要论文,在整个AI安全领域引起了广泛关注和讨论。该论文揭示了一个「坏」模型生成的一串看似无害的数字可以影响另一个模型的行为,即使这些数字本身没有任何明显的不妥之处。论文标题为《通过数据中的隐藏信号传播行为特征的语言模型

科技4 阅读