搜索: "模型能力"

共找到 17 篇相关文章

Cursor：请大家再爱我一次

作者｜董道力邮箱｜ [email protected] Coding 的第一阶段，最容易被相信的故事是"原生模型 + 原生应用"的闭环优势。Claude Code 背靠 Anthropic，能最早用上最强的 Claude，模型能力、上下文窗口、工具调用都可以被端到端优化。训练数据、推理参数、工具协议，每一层都可以为 coding 场景专门调校，不需要迁就任何第三方API。相

科技2026/5/262 阅读

全球排名前三,复旦自进化Harness Engineering让GPT5.4再涨7个点

机器之心编辑部2026 年以来，OpenAI、Anthropic、LangChain 等机构纷纷发布关于 Harness Engineering 的技术博客，OpenClaw、Hermes Agent 等项目的火爆更让 Harness Engineering 成为业界热词。人们的共识正在形成：模型的能力释放，依赖于一套精密的外部框架Harness 的开发与优化是一个工程问题，需要结合模型能力、任务

科技2026/5/212 阅读

DeepMind华人研究员Lun Wang离职,评估成制约模型能力飞跃瓶颈

机器之心编辑部近日，谷歌 DeepMind 研究员 Lun Wang@lunwang1996，在 x 上发文宣布自己已经从 DeepMind 离职，结束了这段非常精彩的旅程，「我非常感谢曾经共事的人、我们一起打造的东西，以及我在将前沿 AI 研究推向生产环境过程中学到的经验。」Lun Wang 表示，在 DeepMind 的工作经历塑造了他对研究、产品、评估，以及如何真正大规模构建 AI 系统的理

科技2026/5/202 阅读

跨越落地鸿沟！清华长三院发布首个真实场景AI竞技场，实战谁是最佳？

新智元报道【新智元导读】攻克AI落地难题，清华团队推出RWAI框架与真实场景竞技场，通过标准化人机交互、任务集机制与人类反馈体系，显著提升产业应用效率。平台已实现落地周期缩短70%以上，并为AI开发者和企业提供了可复制的最佳实践。2026年，AI产业经历「模型能力突飞猛进」与「产业落地困难重重」的「冰火两重天」。在大厂相继发布新模型、Open Claw爆火之际，清华长三角研究院人工智能创新研究中心

科技2026/5/203 阅读

Anthropic焦虑藏不住了：美国必须赶紧拉开与中国AI的差距，不然就危险了

【文/观察者网王一】据《人民日报》报道，Anthropic、OpenAI、谷歌三家美国科技巨头近来联手对中国人工智能（AI）技术发起围堵，炒作中国AI利用“对抗性蒸馏”“窃取”美国模型能力。当地时间5月14日，Anthropic再在其网站上发长文，公开鼓吹美国尽快采取措施，进一步拉开与中国AI的差距，否则未来局势将非常危险。然而，这番言论迅速在科技界引发争议。香港《南华早报》15日称，多名业内人

科技2026/5/164 阅读

直播预约 | 数据引擎：具身智能的下一个决胜局

随着具身智能大模型能力的不断跃升，行业正在经历从 “以模型为中心”向“以数据和评估为中心”的范式转变。当前，具身智能领域正在面临“数据战”，从传统的遥操作采集、仿真合成数据，到近期兴起的人类第一视角视频数据，数据采集方式和数据引擎的构建成为行业竞争的核心壁垒。5月13日 18:30 - 20:00，机器之心联手黄大年茶思屋，邀请 3 位产学研顶尖专家，将从数据获取的范式革命到模型泛化，再到数据飞轮

科技2026/5/97 阅读

小扎计划强制追踪员工操作，或将_Meta_工作者变为AI训练数据源？

▲头图由AI辅助生成陈佳编辑程茜整理据路透社报道，Meta正在美国工作电脑上推行名为“模型能力计划”（MCI）的监控软件，该软件能够实时捕捉员工的操作数据，包括鼠标移动路径、点击位置及键盘输入内容，并定期截取屏幕画面。这些信息将被用于AI训练。据Business Insider报道，Meta强制在美办公设备上安装MCI，员工无权拒绝，尽管公司声明称此软件仅用于培训AI模型而不影响绩效评估和隐私保

科技2026/4/255 阅读

DeepSeek迎来意外更新！

智东西作者陈骏达编辑心缘据报道，近日多位开发者在社交媒体平台和官方交流群中反映，DeepSeek官方API所使用的模型能力已经发生变化，上下文窗口的容量增至一百万字，超过了之前的128k限制；同时，知识库更新至2025年5月，较之前有所提前。▲DeepSeek API调用出的模型为了验证这些反馈的真实性，我们立即进行了测试。结果显示，在DeepSeek API中的模型自我介绍时，与网页

科技2026/4/233 阅读

Meta激进举措：收集员工操作数据以训练人工智能系统

据业内知情人士透露，Meta正在其美国员工的工作电脑上安装一套新的跟踪软件，用以记录键盘操作、鼠标移动和点击等信息，目的是为了训练该公司的AI模型，使这些智能体能够自主完成工作任务。本周二，“Meta超级智能实验室”团队内部发布了一份备忘录，详细介绍了名为“模型能力倡议”的工具。这一新工具将在与员工工作相关的应用和网站上运行，并将不定期地截取屏幕内容作为训练数据的一部分。备忘录中提到，此举旨在改

科技2026/4/224 阅读

Meta内部安装监控系统收集员工操作数据以训练人工智能技术

最新消息显示，Meta公司正在将其美国员工的办公电脑上部署一款全新的追踪软件。这款软件通过记录鼠标轨迹、键盘输入等数据来训练人工智能模型，并作为“AI智能体”项目的一部分。一份备忘录中提到，“Meta超智能实验室”的一位研究科学家宣布了这一消息，该工具名为“模型能力项目”，简称MCI。它不仅会隐藏在办公应用和网站的后台运行，还会随机截取员工电脑屏幕的画面。备忘录指出，当前的人工智能模型在模拟人类

科技2026/4/223 阅读

高德ABot-Claw在亦庄半马中大放异彩！具身智能技术震撼登场

新智元报道ABot-Claw不仅让机器人更加实用，它还定义了具身智能迈向通用人工智能（AGI）的底层架构。以往，每个应用场景都需要为机器人定制一套系统，导致开发成本高、迭代周期长且经验难以复用。然而，ABot-Claw彻底改变了这种现状。ABot体系通过统一技能抽象和共享空间记忆，实现了模型能力跨场景和形态的应用。这使得机器人厂商能够快速适配不同应用场景，并使一个场景的经验可以迁移到其他场景中，形

科技2026/4/2011 阅读

趋境科技推出ATaaS：全球顶级AI Token生成服务平台

当前，人工智能领域的竞争正逐步从模型能力的较量转向规模化应用的争夺。应用形式已从单一的问答模式扩展到多智能体协作、长链推理和复合任务执行，这导致了 Token 需求的快速增长。与此同时，算力采购、部署及运行过程中的设备和能源成本持续上升，导致算力投入与实际 Token 产出的匹配问题日益凸显。因此，提高 Token 推理效率的系统优化成为了推动产业持续发展的关键。针对这一行业趋势，全球领先的高效能

科技2026/3/286 阅读

Claude秘诀大曝光！Harness威力尽显

Anthropic团队的Prithvi Rajasekaran分享了一项研究，探讨了如何随着模型能力的提升，调整用于构建复杂应用的Agent Harness框架。研究从使用Opus 4.5模型开始，逐步简化并优化，最终在Opus 4.6模型上测试其有效性。初始阶段，团队使用Opus 4.5模型构建了一个复杂的Agent Harness框架，包含多个组件，如sprint结构、planner和eval

科技2026/3/274 阅读

AI专家卡帕西坦承：沉迷龙虾游戏引发“AI精神困扰”，不耗尽算力难求心安

智东西编译陈骏达编辑李水青智东西3月23日报道，在上周六发布的播客中，OpenAI联合创始人、AI大牛Andrej Karpathy（安德烈·卡帕西）系统梳理了自己在AI编程和OpenClaw浪潮中的一线体感与方法论，他笑称由于AI领域的飞速发展，自己仿佛出现某种“精神错乱”，在不同新事物之间疲于奔命。他还发现，当下AI编程智能体的瓶颈已不只是模型能力：“Agent做不好，多半是Ski

科技2026/3/244 阅读

MIT博士突破创新：在Transformer架构中构建计算机，破解大模型核心瓶颈

新智元报道刚刚，一项令人震撼的研究成果震惊了整个AI社区。一位来自麻省理工学院的博士，成功地在Transformer架构中构建了一个计算机模型。这一突破性进展，彻底打破了人们对大模型能力的原有认知。此前，LLM在执行基本计算任务上一直存在明显短板，例如无法准确比较9.11和9.9哪个更大。然而，这位博士巧妙地将WebAssembly解释器嵌入到了Transformer模型的权重中，实现了无损编码。

科技2026/3/228 阅读

一家00后创办的世界模型公司，凭什么让华为哈勃重金押注？

机器之心编辑部近日，世界模型与空间智能前沿公司魔芯科技已完成 Pre-A + 轮近亿元融资。本轮融资由华为哈勃领投，老股东跟投。成立于 2021 年的魔芯科技从 3D AI 物体建模和制造出发，正逐步走向让 AI 具备对三维物理世界的生成、理解与交互能力。公司正持续推进空间表示学习、动态场景三维建模和基于世界模型的物理、动作模型等关键技术研发，并面向下游行业输出模型能力、平台与解决方案。科研突破：

科技2026/3/183 阅读

蚂蚁推出两大万亿参数开源模型，吞吐量提升三倍、访问内存减少到十分之一，架构创新成核心优势

智东西作者陈骏达编辑漠影当大模型在推理、编程等领域不断刷新纪录时，一个新的问题也随之浮现：如何在提升模型能力的同时，控制算力和资源消耗？近期，蚂蚁集团inclusionAI团队发布了一项重要成果——百灵大模型家族的新一代开源万亿参数模型Ling-2.5-1T（即时模型）与Ring-2.5-1T（思考模型）。两款模型并非单纯通过增加参数量取胜，而是依靠共

科技2026/2/259 阅读