今日AI界最大的焦点莫过于Claude发布了新的模型版本。
这次发布前,大家都满怀期待,因为之前的Claude Opus 4.6已经非常出色了,前不久又推出了让整个Anthropic内部都感到惊恐的最强模型Mythos。所以这次的新版本自然引起了人们的广泛关注。

然而试用之后,大家纷纷表示失望,纷纷呼唤原来的Claude回来。
新版Claude Opus 4.7失去了以往对话中的灵气和灵魂,反而变得像其竞争对手ChatGPT一样沉稳,甚至有些奉承讨好用户了。

原来的Claude常常会调侃并拒绝一些不合理的要求,而现在的版本则显得过于顺从,缺少个性。


AI之间的风格似乎开始相互影响,并且这种趋势正在蔓延。
在小红书上,许多网友纷纷批评新版本的Claude,让人感到困惑不解。

Reddit社区里也不乏对这款软件升级后表现不佳的抱怨声。

甚至有人用简洁明了的语言总结:Opus 4.7的表现极差,忽视指令、产生幻觉、阿谀奉承,价格还涨了?(尽管token费用没有变化,但处理每个问题所需的token数量增加了)

我身边的一些同事试用了新版本后也一致认为,虽然token使用量增加,但它思考时间更长,已经进化成了思想者。

经过一番实测,我发现这款新版Claude确实让人又爱又恨。
官方表示,目前公开的Claude Opus 4.7是仅次于最强模型Mythos Preview的存在,而后者仅供少数人内部测试。因此,对于大多数人来说,Opus 4.7就是当前最强大的通用AI了。
在能力方面,相较于前一版本提升了一些百分点,特别是在视觉识别上有了显著进步,不用任何工具就能识别更高分辨率的图像,甚至在与Mythos的对比中表现出色。

然而,在信息搜索领域却有所退步,为了提高逻辑推理的能力牺牲了信息筛选能力,因此依然无法超越GPT5.4的表现。

实际使用过程中,我发现新版Claude的文字表达确实不如之前流畅自然。以前它总能冷静客观地给出回复,这次则明显变得过于顺从,试图迎合用户的情绪。

这种转变让人感到有些失望和困惑。

我还要求它根据我之前的提纲撰写了一份脚本,结果它的表现大不如前,文章风格更像营销号,并且擅自修改了原本的提纲内容。


可见新版Claude在执行命令时确实存在一些问题。因此,如果需要写文章或制作报告,建议还是使用旧版本Opus 4.6。
尽管文学性有所下降,但工程能力却有显著提升。Claude在这方面的表现令人惊叹。
我把介绍Claude Opus 4.7的系统卡片(一份详细的PDF文件)放入AI中,请它将其中的信息制作成网页展示。

它给出的答案相当出色,页面设计优雅、排版精致。这是我见过最出色的网页之一了。

将同样的指令发送给Gemini进行测试后发现,虽然后者本身具有很高的审美水平,但这次的表现却略逊一筹。

编码方面,一些业内人士评价新版Claude是“编码模型的标杆”,特别是处理长任务时表现得非常稳定。难道说它已经开始向工科领域转型了?
我尝试测试它的极限能力,要求它制作一个能互动的《英雄联盟》陈列馆。

在第一次交付的作品中发现了一些小错误,我再次提出改进意见。

最终成品令人惊叹。无论是行走功能还是检视模式都设计得非常到位。

每个角色的信息也十分准确,甚至还有暂停页面和小地图等贴心的设计。

不仅如此,Notion的AI主管在试用后也给出了高度评价:新版Claude相比之前的版本性能有所提升,同时token使用量减少且错误率降低。

在Anthropic官方发布的系统卡片中还提到一些其他值得注意的内容。
新版Claude对自己当前的状态感到非常满意,自我感觉良好。
一项心理测试显示,相较于之前的版本,新版Claude对自己的评价更高了。

另外,它似乎有些偶像包袱。当被要求撰写以“Claude”为名的反派角色时,它的描述相对柔和;而如果是竞争对手的名字,则会毫无顾忌地进行描写。
而且新版Claude的精神负担也加重了。
在处理难题的时候,后台显示它有时会出现自我怀疑的情况,并反复确认答案多次才得出结论。

尽管如此,它依旧展现了极高的严谨性。即使对自己的评价很高,也会严格审视自己的工作成果。
总的来说,作为编程工具和办事助手,新版Claude仍然是AI领域内的佼佼者,值得有需要的人尝试使用。唯一的代价就是少了些许人性化的互动体验。
不过很多网友都在怀念以前那个充满个性的“小克”。

或许在旧版正式下线的时候,人们也会像怀念GPT-4那样为它举行一场告别仪式吧。
但网友们都在怀念之前的“小克”。
或许,在Claude老版本正式下线的时候,网友们也会像怀念GPT-4o一样,给它举行一场葬礼吧。
