搜索: "Harness"

共找到 23 篇相关文章

Haiku性能突飞猛进,借助Meta-Harness媲美Opus!

Haiku性能突飞猛进,借助Meta-Harness媲美Opus!

新智元报道未来某一天,AI智能体是否能够自主调整参数、修复错误呢?最近,斯坦福大学IRIS实验室的博士生Yoonho Lee与麻省理工学院和威斯康星大学的研究人员合作发表了一篇新论文,颠覆了传统的人工调优方法。该研究团队阵容强大,包括机器人学习领域的知名学者Chelsea Finn以及DSPy框架的主要作者Omar Khattab。过去的优化工作多集中在模型参数、训练数据和RLHF上。然而,Met

科技13 阅读
Claude秘诀大曝光!Harness威力尽显

Claude秘诀大曝光!Harness威力尽显

Anthropic团队的Prithvi Rajasekaran分享了一项研究,探讨了如何随着模型能力的提升,调整用于构建复杂应用的Agent Harness框架。研究从使用Opus 4.5模型开始,逐步简化并优化,最终在Opus 4.6模型上测试其有效性。初始阶段,团队使用Opus 4.5模型构建了一个复杂的Agent Harness框架,包含多个组件,如sprint结构、planner和eval

科技4 阅读
MiniMax推出M2.7 Agent大模型,首度揭示模型自主进化历程

MiniMax推出M2.7 Agent大模型,首度揭示模型自主进化历程

稀宇科技于3月18日发布了新一代Agent旗舰大模型M2.7,首次展示了“模型自我进化”的路径。该模型通过构建Agent Harness体系,据称能够使模型深度参与自身训练与优化流程。在部分研发场景中,M2.7可以承担约30%至50%的工作量,并在内部测试中实现了约30%的效果提升。在SWE-Pro中,涵盖多种编程语言的测试,M2.7以56.22%的正确率与GPT-5.3-Codex持平;在代码生

科技3 阅读