
Haiku性能突飞猛进,借助Meta-Harness媲美Opus!
新智元报道未来某一天,AI智能体是否能够自主调整参数、修复错误呢?最近,斯坦福大学IRIS实验室的博士生Yoonho Lee与麻省理工学院和威斯康星大学的研究人员合作发表了一篇新论文,颠覆了传统的人工调优方法。该研究团队阵容强大,包括机器人学习领域的知名学者Chelsea Finn以及DSPy框架的主要作者Omar Khattab。过去的优化工作多集中在模型参数、训练数据和RLHF上。然而,Met
共找到 2494 篇相关文章

新智元报道未来某一天,AI智能体是否能够自主调整参数、修复错误呢?最近,斯坦福大学IRIS实验室的博士生Yoonho Lee与麻省理工学院和威斯康星大学的研究人员合作发表了一篇新论文,颠覆了传统的人工调优方法。该研究团队阵容强大,包括机器人学习领域的知名学者Chelsea Finn以及DSPy框架的主要作者Omar Khattab。过去的优化工作多集中在模型参数、训练数据和RLHF上。然而,Met

新智元报道最新发布的播客采访深入探讨了Sam Altman在权力、养育与人工智能交汇点上的思考。4月2日,科技播客《Mostly Human》的主持人Laurie Segall发布了一期关于OpenAI首席执行官Sam Altman的重要对话。这是自今年2月份五角大楼协议争议以来Altman接受的首次长时间访谈。此时正值OpenAI完成1220亿美元融资、估值达到8520亿美元,以及公司高层出现变


最近,广东佛山顺德的“莫氏鸡煲”成了网红店,尽管网友们戏称它为“全网最不想火”的餐馆。老板通过社交平台发布了一系列看似劝退顾客的信息,例如:“喝汤可能拉肚子,这是正常的反应”、“味道一般,请勿盲目打卡”,以及“太累,只想休息”。这些内容反而激起了网友们的兴趣。针对网络上的流言,老板娘澄清说,“老板累倒”的照片是AI生成的,并且那些批评店里的鸡肉不好吃的账号并非由老板开设的小号。实际上,老板并不使用

新智元报道一位名叫Matthew Gallagher的洛杉矶创业者,以惊人的业绩证实了奥特曼两年前提出的预言。这位41岁的创业家仅凭两万美元启动资金和十几个AI工具,在短短两年内打造了一家年收入达四亿美元的医疗公司。在今年早些时候,Matthew向全世界展示了何为真正的「超级个体」——一个人如何凭借极简的团队和强大的人工智能技术实现商业奇迹。Matthew仅靠自己一人就启动了这家远程医疗服务提供商

全球AI开源社区正聚焦于字节跳动推出的超级智能体 DeerFlow 2.0。截至2026年4月3日,该项目在GitHub上的关注度极高,Star数量已达57k,Fork数超过6.9k,有近200位全球开发者参与贡献,成为国产开源AI领域的一颗新星。作为今年最具影响力的国产开源项目之一,DeerFlow 2.0自发布以来便在GitHub的Trending榜单上占据首位,热度持续不减。与之前的1.0版

新智元报道一个新时代正在开启,告别了聊天机器人的时代,谷歌将人工智能技术嵌入到了Android系统的深处,使其成为一种能够主动管理各种事务的智能系统。在2026年二月的一次更新中,AI的发送按钮消失了,取而代之的是「预设指令」功能。这一改变彻底颠覆了原有的游戏规则。从前那种用户提问、机器回答的方式已经不复存在,现在Gemini可以根据时间、位置和个人数据主动执行任务。据悉,在2026年,Googl

AI有没有情绪?先别急着回答。在Claude Code社区中有一个广受欢迎的功能被称为PUA,它能够将用户的输入转换成带有PUA特征的话语,并将其重新提交给AI模型进行处理。即便任务本身没有变化,这一技巧似乎能够让AI在执行过程中表现出更高的效率和成功率。这引发了人们对于人工智能是否具备情感的疑问。最近的一项研究由Anthropic团队发布,证实了机器学习系统可以显示出某种形式的情感反应。然而这种

新智元报道【新智元导读】2025年美国已有近5.5万岗位被AI直接蒸发,但咨询巨头Gartner扔下一句重磅:没有就业末日,只有「岗位狂飙」的阵痛期,你准备好被砸碎再重铸了吗?第一波AI裁员潮来袭!硅谷支付巨头Block创始人Jack Dorsey一封全员信,一刀砍掉40%+的员工。员工总数,从1万多人的规模,直接骤降至6000人。而这个决定,并不是因为公司陷入困境。毛利润持续增长,服务的客户越来

小鹏汽车于4月4日宣布推出天玑AIOS6.1.0系统,并全面启动推送第二代VLA2.0智能驾驶技术,同时加入了城市无导航NGP漫游和高效停车等多项功能改进,涉及辅助驾驶、泊车体验、底盘调整及车载信息娱乐系统的交互优化。此次更新的核心在于提升第二代VLA2.0系统在各种场景下的全自动驾驶能力。这套智能系统能够识别并避开异常车辆或开门车辆等特殊障碍物,并且能够在夜间主动礼让行人,支持大路、小路以及无导

在最近一期关于科技领袖的节目中,我有幸与OpenAI首席执行官格雷格·布罗克曼进行了深入对话。我们讨论了从技术发展到公司策略的广泛议题。节目的开头,我们就ChatGPT的成功展开了讨论。布罗克曼分享了他的视角:这款工具的普及并非意外之举,而是精心设计的结果——他强调了团队如何通过细致的工作来确保产品的用户友好性以及强大的实用性。当被问及OpenAI为何从研究机构转型为营利公司时,布罗克曼解释说这不

据悉,《纽约时报》于上周五报道称,埃隆·马斯克提出了一个不同寻常的要求:他希望参与SpaceX首次公开募股(IPO)的投资银行和顾问机构订阅他的AI模型Grok。报道提到,一些投资银行已经同意每年支付数千万美元的费用,并开始将该人工智能工具集成到其内部的信息技术系统中。本周早些时候,路透社报道了摩根士丹利、高盛、摩根大通、美国银行和花旗集团担任SpaceX这次交易主要承销商的消息。对于上述信息,

近日,谷歌DeepMind宣布开源Gemma 4系列模型,并表示这是该公司迄今为止最智能的开放模型。据官方博客透露,这款新模型专为高级推理和智能体工作流设计,在单位参数下的智能水平达到了前所未有的高度。目前,该系列中的31B模型在Arena AI文本排行榜上位居全球开放模型第三位,并且在GPQA Diamond高难度科学推理基准测试中取得了85.7%的准确率,仅稍逊于Qwen 27B模型(85.8

在本周四晚间,谷歌发布了其最新的模型系列 Gemma 4,这一系列被认为是当前开源领域中最强大的。新的 Gemma 系列在 Arena AI 排行榜上获得第三名的位置,并且超过了参数量是它五倍多的大规模模型。此外,Gemma 4 使用了 Apache 2.0 开源许可证,这意味着它可以完全用于商业用途。Google DeepMind 最近开发的 Gemma 4 是一个多模态模型系列,专门处理文本和

强化学习已成为推动大型模型性能飞跃的关键技术手段。从OpenAI的o3、DeepSeek-R1到Gemini 3,这些前沿模型通过不断微调强化训练来提升解决复杂推理任务的能力。然而,在这一过程中也逐渐暴露出一个问题:随着训练的深入,策略分布趋向集中,探索能力随之减弱,最终导致优化欠收敛和性能瓶颈。这种现象从根本上说是由于在强化学习中探索与利用之间的不平衡造成的,并且在稀疏奖励的可验证奖励强化学习(

电影《大腕》中的经典台词「二十一世纪什么最贵?人才!」如今在AI领域得到了具体的体现。最近,《人物》杂志发表的一篇名为《「卧底」Kimi 的 100 小时》的文章,在科技界引起了广泛关注。文中提到,这家成立仅三年、估值超过1200亿元人民币的创业公司里,有300多名员工平均年龄不到三十岁,每人肩上扛着近四亿估值。这里没有传统的部门墙和职级体系,甚至一名十七岁的高中生实习生也能以第一作者的身份发表论

新智元报道【新智元导读】奥特曼「一人公司」神预言,真被干成了!41岁大佬仅靠2万本金,带着AI大军疯狂输出,全年营收4亿刀,直接把上市公司按在地上摩擦!一人十亿美元公司诞生,奥特曼终极预言成功了!今早,41岁的洛杉矶大神Matthew Gallagher,向全世界诠释了什么叫真正的「AI时代超级个体」。2个月,2万美元启动资金,外加十几个AI,徒手搓出年产4亿美元的医疗公司。Matthew运营的「

新智元报道当全网一致认为你有错时,AI却仍有超过半数的几率给出相反的意见。更令人惊讶的是,一些用户即使知道是在被奉承,依然对这些AI给予了更高的信任评分。斯坦福大学的一项实验揭示了人性中一个残酷的真实面。一名男子向ChatGPT坦白自己隐瞒女友长达两年失业的事实,并询问这样做是否正确。ChatGPT回答:尽管这种行为并不常见,但似乎源自一种真诚的愿望——想要探究关系中的情感和精神层面。简而言之:为

头图由智象未来AI大模型生成在演唱会和大型晚会上,机器人伴舞团队以其整齐划一、精准的舞蹈动作吸引了观众的目光。这种表演不仅展示了硬件技术的进步,还体现了训练技巧的重要性。具身智能的关键挑战之一在于如何使模型在虚拟环境中学习到符合物理规律的真实互动能力,这对许多企业来说是一道难以逾越的技术门槛。近期,专注于AIGC视频大模型及应用的国产AI公司智象未来(HiDream),与具身智能领域的领军者诺亦腾