ChatGPT的免费版模型刚刚更新了,这次升级带来了更低的幻觉发生率、更强的记忆能力以及更简洁的回答。
开发者特别提醒那些最近主要使用深度思考模型的用户回来看看新版本。
今天ChatGPT的默认模型迎来了一次重大更新。
幻觉现象减少了近一半,达到了52.5%。
此外,新版本还增加了“记忆来源”功能,帮助用户了解先前对话中的哪些信息影响了当前的回答。
免费用户也能用。
最关键的四点:
- 回答变得更加简洁,去除了不必要的追问和多余的表情符号,并且避免了复杂的格式化。
- 开发者特别提醒那些最近主要使用深度思考模型的用户回来看看新版本。
- 作为默认设置,首要任务是提高准确性并减少编造信息的情况。
- 更温暖、更自然的语气
相较于前代产品,在事实准确性的提升方面尤为显著,特别是在医疗、法律和金融等高风险领域内,虚假陈述减少了52.5%。
第一刀先砍幻觉
对于用户之前标记为存在错误的问题对话中,不准确性降低了37.3%。
例如在解决代数问题时,GPT-5.5 Instant能够发现并修正用户的计算错误,并求解出正确的二次方程结果。
这次更新对默认模型来说意义非凡。
很多人每天向ChatGPT咨询合同条款、报销事项、疾病解释等问题,如果模型给出的解答不准确,将给用户带来更大的困扰。
在数学测试AIME 2025中,准确性从65.4%提升到了81.2%。
测试科学推理能力的GPQA也取得了显著进步,其准确率上升至85.6%。
解读和分析科学图表的能力基准测试CharXiv的结果显示准确率提高到81.6%,从之前的75.0%增加。
在评估模型处理文本与图像中专家级问题能力的MMMU-Pro测试中,准确率也有所提升,达到76.0%。
OmniDocBench 测试(用于提取复杂文档中的结构化数据)的结果显示错误率从14.6%下降至12.5%。
简洁明了也是一种能力的体现
在提高准确性的同时,还解决了另一个长久存在的问题。
GPT-5.5 Instant在回答时更加简洁和集中,同时保留了核心信息。
以前,在回答同一个问题时可能会先列出一大段免责声明,接着是层层递进的列表,并且有时还会追问一句“你希望我继续吗”?
现在OpenAI采取了一种更为实用的方法:减少过度格式化、不必要的追问以及多余的符号使用。
在这个案例中,新版使用的词汇量减少了30.2%,行数也缩减了29.2%。
同时,它还掌握了恰到好处的语气,既非正式又实用且符合职场规范,并避免了过度解释的情况。
答得太长。
该版本为不同的情况提供了有针对性的答案,注重解决问题而非个人评价。
OpenAI认为,虽然GPT-5.3 Instant的回答更为全面,但在某些方面显得过于复杂,对于简单的提示来说可能超出了用户的需求。
新版模型具备更强的记忆功能,并且让用户能够更好地控制这些记忆的使用。
它能更有效地利用之前对话中的上下文信息,包括邮箱、历史记录和上传过的文件等。
关键在于它知道何时引入过去的记忆会使回答更加准确,而不是在每次回复中都引用过去的信息。
新版本还加入了“记忆来源”功能,会向用户提供影响当前回应的历史记忆信息。
如果某条历史记录不再适用,用户可以对其进行修改或删除。
自5月5日起,新版模型GPT-5.5 Instant将陆续向所有ChatGPT用户推出,并替代现有的默认版本GPT-5.3 Instant。
对于API来说,新的更新被称为chat-latest。
老版不会立即消失,付费用户还可以通过模型配置继续访问旧版本三个月后才会停止服务。
个性化增强功能首先会在Plus和Pro用户的网页端上线,随后将在移动端推出。Free、Go、Business以及Enterprise级别的账户后续几周内也将陆续更新。
这次OpenAI还引入了“记忆来源”功能,会向用户显示哪些记忆影响了本次回复。
如果某条记忆过时了,用户还可以更正或删除。
什么时候能用上?
GPT-5.5 Instant从5月5日开始向所有ChatGPT用户滚动上线,替代GPT-5.3 Instant作为默认模型。
API里对应的是chat-latest。
旧模型不会立刻消失,付费用户还能在模型配置里继续访问GPT-5.3 Instant三个月,之后再退役
个性化增强功能会先向Plus和Pro用户的网页端推出,移动端随后上线。Free、Go、Business、Enterprise会在后续几周扩展。
参考链接:
[1]
https://openai.com/index/gpt-5-5-instant/

梦晨