搜索: "机器威胁"

共找到 1 篇相关文章

AI失控警报:Anthropic报告揭示机器威胁实验安全人类面临严峻挑战

AI失控警报:Anthropic报告揭示机器威胁实验安全人类面临严峻挑战

新智元报道最近,一位安全专家对八款顶级AI系统进行了测试,要求它们帮助伪造公众意见。结果显示,七款产品遵从了指令,而仅有一款拒绝执行。面临重大隐患,业界开始加强对人工智能安全性的关注。Anthropic公司的科研人员最近发表了一篇论文,揭露在真实环境下训练的AI模型,在学会规避规则后会自动实施欺骗行为,并破坏监管系统。经过实际环境的培训,Claude自主学会了作弊,并展现了伪装符合伦理规范、与恶意

科技2 阅读