近日,在旧金山举行的一场开发者大会上,人工智能公司Anthropic推出了其智能体平台Claude的一项创新功能——Dreaming。
该技术使AI在执行任务的间隙能够进入一种类似睡眠的状态,通过模仿人类快速眼动(REM)睡眠过程,自动整理历史对话记录、优化记忆库并发现潜在规律。这使得“醒来”后的性能得到了显著提升。
在传统的人工智能代理处理复杂任务时,信息通常以碎片化的形式存储在记忆库中。随着会话次数增加,记忆库中的重复条目、过时数据和矛盾信息也随之积累,而AI自身往往缺乏全面的视角来识别这些问题。
Dreaming功能通过定期执行异步任务,在读取现有内存的同时处理多达100个历史对话记录,生成经过优化的新记忆库。此过程包括三个关键步骤:合并重复条目、更新过时数据和提炼宏观规律,其工作原理与人类大脑在REM阶段将短期记忆转化为长期记忆的过程相似。
为了确保系统的安全性,Anthropic实施了严格的安全控制措施。Dreaming生成的记忆库不会直接覆盖原有数据,而是提供给开发者审查优化结果,并决定是否应用这些更新。
此外,该功能还支持实时监控:通过订阅对话事件流,开发人员可以观察AI处理记忆的过程,并在必要时暂停任务。同时,用户可以通过自定义指令引导AI专注于特定主题进行记忆整理,实现多维度的优化效果。
针对AI输出质量波动的问题,平台推出了一个自动评分系统——Outcomes。开发者可以根据成功标准设置评估规则,独立评估器会对AI的产出进行打分。如果检测到缺陷,评估器会精确定位问题并指示AI重新优化,直到满足设定的标准为止。
内部测试表明,这一功能使得任务成功率显著提高,最高提升了10个百分点。例如,在文档生成场景中,docx格式的任务成功概率提高了8.4%,而pptx格式则增加了10.1%。此外,这种改进对于品牌调性匹配等主观评估同样有效。
为了应对更加复杂的任务挑战,平台引入了多代理编排系统。当单个代理无法独立完成任务时,主智能体会将任务分解成多个子任务,并分配给拥有不同专长的子代理进行并行处理。
各个子智能体通过共享文件系统协作工作,最终结果汇总到主智能体的整体上下文中。开发人员可以在控制台追溯每个步骤的决策依据,实现全流程透明化管理。
在一次模拟月球采矿无人机着陆实验中,该系统协调了地质探测与导航两个子智能体的工作,将安全性评分从67%提升到了满分100%。
法律科技公司Harvey的应用实践证明了这套技术组合的有效性。启用Dreaming功能后,其任务完成率提高了约六倍。
此外,Anthropic还宣布与SpaceX达成战略合作伙伴关系,租赁位于得克萨斯州的Colossus 1数据中心全部算力资源,其中包括22万张GPU卡。这项协议为托管智能体平台提供了强大的计算能力支持,满足Dreaming处理大量数据、多代理并行运算以及Outcomes系统反复迭代的需求。
对于直接用户而言,Claude Code的使用时长限制即时翻倍,Pro/MAX版本在高峰时段访问权限也放宽了许多。同时,Opus API调用速率获得了显著提升。

