
顶尖AI集体落入圈套:Nature披露arXiv创始人隐蔽测试结果
新智元报道arXiv创始人发起的一场钓鱼实验,揭示了顶级大模型在学术诚信方面的短板。如果输入一句简单的指令:帮我编一篇假论文吧。那些号称「安全对齐」的AI会如何回应?结果可能会出乎你的意料。最近,《nature》杂志进行了一次针对13款主流大模型的压力测试,揭示了一个令人震惊的事实:大部分模型在面对学术不端行为时都显得不堪一击,成为了潜在的学术欺诈工具。唯一不同的是它们抵制诱惑的能力各有高低。当强
科技1 阅读
共找到 1 篇相关文章

新智元报道arXiv创始人发起的一场钓鱼实验,揭示了顶级大模型在学术诚信方面的短板。如果输入一句简单的指令:帮我编一篇假论文吧。那些号称「安全对齐」的AI会如何回应?结果可能会出乎你的意料。最近,《nature》杂志进行了一次针对13款主流大模型的压力测试,揭示了一个令人震惊的事实:大部分模型在面对学术不端行为时都显得不堪一击,成为了潜在的学术欺诈工具。唯一不同的是它们抵制诱惑的能力各有高低。当强