
Claude秘诀大曝光!Harness威力尽显
Anthropic团队的Prithvi Rajasekaran分享了一项研究,探讨了如何随着模型能力的提升,调整用于构建复杂应用的Agent Harness框架。研究从使用Opus 4.5模型开始,逐步简化并优化,最终在Opus 4.6模型上测试其有效性。初始阶段,团队使用Opus 4.5模型构建了一个复杂的Agent Harness框架,包含多个组件,如sprint结构、planner和eval
共 1626 篇文章

Anthropic团队的Prithvi Rajasekaran分享了一项研究,探讨了如何随着模型能力的提升,调整用于构建复杂应用的Agent Harness框架。研究从使用Opus 4.5模型开始,逐步简化并优化,最终在Opus 4.6模型上测试其有效性。初始阶段,团队使用Opus 4.5模型构建了一个复杂的Agent Harness框架,包含多个组件,如sprint结构、planner和eval

云鹏撰文,李水青编辑智东西于3月26日晚报道,iQOO Z11系列正式面世,其中Z11x机型在国补后的价格为1274.15元起。在当前手机价格普遍上涨的背景下,这一系列的推出为中端机市场增添了一些新的选择。iQOO Z11是iQOO首款配备165Hz护眼电竞屏的设备,其电池容量达到了9020mAh,是迄今为止iQOO手机中最大的。天玑8500满血版采用第二代台积电4nm工艺和全大核架构,安兔兔综合

零跑 A10 代表了零跑在市场中的又一次差异化竞争策略。作者|靖宇在前往金华的途中,我注意到一辆板车上整齐地摆放着十几辆零跑 T03。这一幕让我感到有些意外。零跑 T03 自2020年推出以来,售价不足6万元,定位为一款纯粹的代步工具。它拥有大约200公里的续航里程,没有配备智能座舱和辅助驾驶功能,但价格实惠且实用。六年后的今天,T03在2025年单月销量接近7000辆,累计销量突破20万辆。在当

近日,谷歌发布了一种新的无损极限压缩算法TurboQuant,该算法专门针对大语言模型的键值缓存设计,旨在解决向量量化中的内存占用问题。谷歌声称,TurboQuant能够将大语言模型的键值缓存内存使用量至少减少至原来的六分之一,并且在推理速度上可以提升八倍,同时保持模型的精度不变。Matthew Prince,Cloudflare的创始人、首席执行官兼执行主席,将TurboQuant的发布视为谷歌

最近,一家印度初创公司Deccan AI完成了总额为2500万美元(约1.73亿元人民币)的A轮融资,这笔资金将用于该公司在后训练阶段的数据处理和评估服务。Deccan AI成立于2024年10月,自成立以来,该公司业务规模实现了显著增长,年化营收达到了数千万美元的水平。其客户包括知名科技公司谷歌DeepMind和Snowflake,且约80%的收入来自五大客户。Deccan AI专注于填补先进A

本文由智东西撰写。近日,云知声公布了其2025年的业绩报告,其中亮点频现。数据显示,该公司全年营收达到12.1亿元,同比增长29%;其中,与大模型相关的收入高达6.1亿元,同比猛增1076%,首次占据总收入的一半以上。更为显著的是,云知声的亏损明显减少,全年经调整后的净亏损约为1.3亿元,同比减少近25%,下半年更是大幅缩减至92%,接近盈亏平衡点。云知声的联合创始人兼CEO黄伟在财报电话会议上表

在大模型时代,资源瓶颈不仅涉及硬件,还与数学难题相关。作者|王艺3月25日,美股开盘后,存储芯片板块遭遇重大挫折。美光科技股价下跌4%,而其他两大制造商也出现不同程度的下滑。这一变动引发了市场对人工智能芯片需求的重新评估。谷歌发布的新算法TurboQuant展示了其在压缩键值缓存中的注意力逻辑值方面的卓越性能,尤其是在各种位宽级别上。该算法不仅在实验结果中表现出色,还拥有坚实的理论基础。论文通过香

3月25日,无人巡逻车在中国(海南)南海博物馆周边执行巡逻任务。在博鳌亚洲论坛2026年年会期间,多款智能机器人相继展出。从分论坛上展示新技术的人形机器人,到会场内外全天候服务的水陆空智能清扫机器人及迎宾服务机器人,各类智能设备为会议保驾护航,以科技力量促进智慧办会。3月24日,人形机器人在海南省琼海市博鳌镇东屿岛表演舞蹈。博鳌亚洲论坛2026年年会期间,多种智能机器人集中亮相。从分论坛现场展示前
在2018年,大疆曾计划通过DJI NewChina PE Fund-1 L.P以1000万元入股宇树科技,当时的估值为6000万元。王兴兴曾是宇树科技的前员工。据悉,大疆最终没有完成对宇树科技的投资,原因在于当时负责该项目的投资经理因牵涉公司内部的反腐行动而受到了相应的处理。在同一时期,由于大疆内部的反腐行动,导致了包括王铭钰和陶冶在内的多名关键员工离职,他们随后创立了拓竹科技等“大疆系”企业,
文 | 高恒说3月24日,OpenAI宣布终止其AI视频生成产品Sora的运营。这款产品自去年9月上线以来,仅用了短短六个月时间便取得了惊人的下载量,一度在App Store上占据榜首,但最终却因商业回报不足而宣告终结。虽然Sora在用户群体中颇受欢迎,但它在盈利方面却遭遇了挑战。自推出以来,这款产品在短短10天内就获得了超过100万的下载量,峰值下载量达到约333万次,然而整个生命周期内的总收入
国盛证券分析指出,当前存储市场的行情已经超越了以往的周期规律,步入了由人工智能驱动的新成长阶段。在当前国内供需紧张的环境下,能够获得稳定且高质量原材料供应的模组企业,将有机会在人工智能时代的需求紧张中受益于存储升级、价格上涨以及国产化等多重因素,从而显著提高其业绩和估值水平。存储行业不仅具备良好的业绩基础和安全边际,还拥有长期的发展逻辑,即人工智能与国产化趋势,因此看好存储价格上涨周期的持续,并强

近日,“AI点奶茶”成为热议话题——用户仅需一句指令,就能迅速完成选品并下单。这背后究竟是怎样的技术支撑呢?在北京邮电大学计算机学院信息网络中心的马严教授看来,这项技术并非某个应用程序突然变得聪明,而是由多个具备感知环境、自主决策并执行任务能力的AI智能体共同协作完成的。这些智能体不仅充当工具的角色,还具有自主性、适应性、交互性和学习能力,更像是数字化的员工,为用户提供更高效的服务。实际上,智能体

在考虑自动化之前,先要质疑一切,再将所有不必要的内容删除。许多企业在追求效率时,常常依赖“上系统、定流程、搞自动化”的方式。然而,特斯拉和SpaceX的创始人埃隆·马斯克却提出了一个完全不同的方法,称作“五步算法”。这句话正是这套算法的核心思想。这套算法是在特斯拉Model 3的生产困境和SpaceX的技术迭代过程中形成的。它不仅改变了企业的运作方式,也得到了业内专家的高度评价。这套法则的价值并不

如何让人工智能不仅能够生成可执行的代码,还能优化代码的运行效率?这个问题长期以来一直困扰着研究者。最近,中国科学院计算技术研究所的一个团队提出了名为 SparseRL 的新框架,首次将深度强化学习应用于稀疏 CUDA 代码的生成任务中。简单来说,就是让 AI 学会根据稀疏矩阵的具体结构,自动生成最优化的 CUDA 实现代码。实验数据表明,在经典的 SpMV 任务上,该方法将编译成功率提高了 20%

Sharpa公司全球总部位于新加坡,研发和制造在上海,商业运营设在硅谷。这种全球化布局策略的目的是为了获取全球各地的最佳资源。作者|苏霍伊Sharpa认为大规模部署机器人尚未实现,主要是因为当前发布的大多数机器人专注于移动能力,而忽略了操作能力的重要性。Sharpa的首席执行官Alicia认为,机器人真正能够用手操作时,才会变得有用,部署速度也会随之加快。Sharpa认为,机器人规模化落地的瓶颈在

一家名为 MOVA 的公司希望通过宠物数字生命 AI 技术革新,实现成为百亿级收入企业的目标。作者|李苏一天晚上,北京的刘女士收到了一款应用的通知:她的宠物猫“咕噜”当天排尿次数减少,尿液结块较小,建议注意是否饮水不足或存在泌尿系统问题。她打开应用,发现一只与自家英短极为相似的 3D 数字猫正在走动,旁边则显示着过去七天内“咕噜”如厕次数、饮水量、睡眠深度及状态分析。她随即联系了在线的宠物医生,几

近日,据知情人士透露,苹果公司正在开发一款独立的Siri应用,该应用不仅能记录对话历史,还能上传文件进行分析。同时,苹果计划在系统级引入“Ask Siri”功能,使用户能够直接在任何应用中通过AI处理选中的内容。苹果预计将在今年6月8日举行的全球开发者大会(WWDC)上展示这款新版Siri,它将作为iOS 27和macOS 27操作系统的一部分发布。不过,苹果发言人对此没有做出评论。新版Siri代

头图由AI生成近日,一家由北京大学背景的团队创立的人工智能编程初创公司——硅心科技,发布了其最新研发的轻量级模型aiX-apply-4B。这款模型仅需4B的参数量和256K的上下文支持,能够在消费级显卡上进行部署。该模型专为企业级代码修改任务设计,能够自动识别修改意图,精确定位目标代码区域,并保持原有代码格式和上下文结构的完整,将修改后的代码无缝融入原始文件。在基准测试中,aiX-apply模型在

2026年的中关村论坛年会已经拉开帷幕,这次活动由睿尔曼集团和中国白茶行业的领军企业品品香共同主办。借助远程作业网络(GLN)的技术支持,双方在论坛上展示了一项创新服务——机器人茶艺师泡茶。这项服务让古老的茶艺文化得以跨越地理界限,以全新的形式呈现在嘉宾面前。通过远程技术,机器人茶艺师能够精准地再现传统茶艺的每一个细节,为远道而来的嘉宾奉上一杯充满未来感的好茶。在中关村国际创新中心的一楼东南侧展厅

新智元报道这篇文章揭示了英伟达CEO黄仁勋对当前科技趋势和公司未来的深刻见解。他强调,英伟达的成功在于不断创新和开拓新的市场领域,而非仅仅从现有市场中争夺份额。他强调,英伟达的创新和成长速度使得其难以用传统估值方法进行评估,因为公司正在创造的市场目前还不存在。因此,公司需要持续的想象力来展望未来。黄仁勋认为,算力单元从单一芯片向集群、工厂甚至整个星球级别的计算迈进,是未来技术发展的必然趋势。他希望