Anthropic 最新模型 Claude Mythos 正式发布,性能超越 Opus 4.6,却因潜在风险而被限制使用。
尽管此前传闻众多,但 Claude Mythos 确实是一款具有里程碑意义的先进模型,在多项测试中全面领先于现有技术。
在多个基准测试中显示,Claude Mythos 的性能显著优于 Opus 4.6。特别是在 SWE-bench Pro、SWE-bench Verified 和 Terminal-Bench 2.0 测试中的表现尤为突出。
版权所有,未经授权不得以任何形式转载及使用,违者必究。

Jay





在多个基准测试中显示,Claude Mythos 的性能显著优于 Opus 4.6。特别是在 SWE-bench Pro、SWE-bench Verified 和 Terminal-Bench 2.0 测试中的表现尤为突出。