搜索: 人工智能测试

搜索: "人工智能测试"

共找到 1 篇相关文章

顶尖大模型一夜之间遭遇滑铁卢！人类满分通过最难测试，AI仅获0.2%分数

新智元报道全球人工智能领域最近受到了一次强烈的冲击。一项名为ARC-AGI-3的全球最艰难的人工智能测试刚刚发布，让顶尖的人工智能模型集体哑口无言。人类在这次测试中获得了满分，而最强大的模型Opus 4.6仅得0.2%，远远不及人类的成绩。今天，这个消息让整个AI圈为之震动。期待已久的全球唯一的未饱和智能体基准测试ARC-AGI-3一经推出，便让全球顶尖的大模型黯然失色。在这次测试中，人类的得分达

科技2026/3/278 阅读