搜索: "机器之心"

共找到 49 篇相关文章

AI参数之争：API使用者引发热议，社区讨论激烈

机器之心编辑部最近，arXiv 上发布了一篇论文，作者是李博杰，他在文中提出了一种名为「不可压缩知识探针」的评估框架。该框架旨在仅通过黑盒 API 调用来逆向推算任意 LLM 的参数量。论文标题为《Incompressible Knowledge Probes: Estimating Black-Box LLM Parameter Counts via Factual Capacity》研究人员长

科技2026/5/22 阅读

腾讯推出新版混元CL-bench，助力大模型理解日常场景

机器之心发布我们对“个人助手”的构想正在变得越来越现实。一个能够深入日常生活场景的AI助手，必须具备从细微之处学习和理解的能力，以解决复杂的实际问题。在AGI-Next前沿峰会上，腾讯姚顺雨提出了一个贴近生活的例子：当你询问AI“今天吃什么”，其回答的质量可能受限于它不知道你是否感到寒冷、是否有偏好的饮食习惯、最近与朋友的对话内容以及家庭成员的需求等信息。因此，未来的AI助手需要关注的是对生活场景

科技2026/5/21 阅读

DeepSeek发布最新多模态技术框架，聚焦视觉基础单元研究

机器之心编辑部随着五一假期的到来，DeepSeek 最新发布了一项技术进展。前一天，陈小康在 X 平台上的一则消息引发了公众对 DeepSeek 多模态功能的关注。一些用户已经能够在 DeepSeek 的网站和应用程序中体验其多模态特性。刚刚，DeepSeek 在 Github 上正式发布了他们的多模态模型，并公开了技术报告。这是一个全新的推理范式，具有开创性的意义。欢迎访问项目主页：https:

科技2026/5/12 阅读

商汤SenseNova U1：以统一架构革新多模态融合技术

机器之心编辑部每当人们逐渐熟悉某种玩法之际，新的创意又紧随而来。最近，一股热潮席卷全网，那就是 OpenAI 推出的 GPT Image 2，它不仅擅长生成美观图片，还引领了「信息图生成」的新潮流。从知识卡片到数据图表，再到攻略长图和科普海报，只需一句话就能产出一张布局精美的信息清晰、质感出色的图像，其迅速走红的速度堪比当年吉卜力风格的风靡。然而，国内用户若想体验 GPT Image 2，则会遇到

科技2026/4/293 阅读

国产世界模型夺冠，领先谷歌、英伟达等企业继续领跑全球

机器之心发布最近，全球权威的具身世界模型评估平台 WorldArena 更新了最新的排名榜单。流形空间团队研发的世界模型 Worldscape 0.2 凭借其在遵守物理法则和多源交互理解上的显著进步，在本次评比中取得了全球第一的成绩。这一成果不仅展示了国产世界模型在生成复杂动态场景以及具身控制方面的高精度、强泛化及物理真实性，还吸引了包括英伟达、谷歌在内的国际巨头以及国内的星动纪元、极佳视界等公司

科技2026/4/280 阅读

00后团队开源OpenAI的Chronicle订阅功能仅两天后

机器之心发布最近，在人工智能领域又发生了令人瞩目的事件。4月20日，OpenAI 推出了名为 Chronicle 的工具，这使得 AI 能够直接「查看屏幕」并持续记忆上下文信息。这意味着什么？它不仅让对话更加流畅，还改变了交互方式。无论是编写代码、编辑文档还是调整设计稿，无需再反复向 AI 说明细节，因为它能够自行获取和记住相关信息。然而，目前要使用这项功能需要订阅 ChatGPT Pro 版本，

科技2026/4/272 阅读

三个漏洞导致Claude功能受损：Anthropic确认代码问题根源

机器之心编辑部今日的人工智能领域热闹非凡，先是 OpenAI 推出了备受瞩目的 GPT5.5，紧接着 DeepSeek v4 也如约而至。在这波庆祝热潮中，Anthropic 发布了一份郑重的声明，虽然没有推出新产品，但内容同样引人注目：关于 Claude Code 的性能问题确实存在，但这背后有其缘由……过去一个月里，部分用户反馈了 Claude Code 质量下降的问题。经过调查后，Anthr

科技2026/4/252 阅读

DeepSeek启动密集更新：Tile Kernels与DeepEP V2升级亮相

机器之心编辑部深度搜索公司（DeepSeek）最近在GitHub上进行了频繁的更新活动，推出了一个新的开源代码库Tile Kernels，并对现有的DeepEP代码库进行了升级至版本V2。距离上次他们悄然更新Mega MoE和FP4 Indexer还不到一周时间。Tile Kernels用户可以在以下链接找到该项目：https://github.com/deepseek-ai/TileKernel

科技2026/4/248 阅读

谷歌组建特战队深化AI编程领域布局，或预示布林回归创业初心？

机器之心编辑部谢尔盖・布林因 Anthropic 的压力而采取了激进的措施。最近有消息指出，谷歌内部成立了一支由研究人员和工程师组成的特别团队，旨在提升其 AI 编程模型的能力，目标是让更多的编码工作实现自动化，并推动 AI 自主进行研究。据悉，这支特别队伍由 DeepMind 的工程师 Sebastian Borgeaud 领导，他曾负责 Gemini 预训练项目的工作。谷歌创始人谢尔盖・布林及

科技2026/4/223 阅读

Claude Code与Codex相似度随更新频率增加而提升

机器之心编辑部近日，OpenAI 宣布了其最新的大模型 GPT-5.4-Cyber 的问世，这款新模型给人们带来了强烈的熟悉感。新发布的这款产品，在目标群体、应用场景乃至推广策略上都与 Anthropic 几日前推出的 Claude Mythos 非常相似。双方的竞争态势已经毫无保留地展现在了公众面前，《纽约时报》的最新报道标题也明确指出了这一点：“与 Anthropic 类似，OpenAI……”

科技2026/4/212 阅读

掘金数据时代，百亿级身感数据市场启动：全球首创数据云商城登场

机器之心发布帕西尼日前宣布其“具身智能数据云商城”正式对外开放，该平台由帕西尼联合京东云、腾讯云和百度智能云共同打造。通过与三家顶尖的云计算服务提供商合作，“具身智能数据绿洲”应运而生。这一平台以强大的云端计算能力和海量高质全模态实采数据为基础，旨在为全球的具身智能研发、模型迭代及产业智能化升级注入新的动力，并解决“数据荒漠”的问题。该平台独家提供具备82自由度的人类手部五指动作数据，同时融合30

科技2026/4/191 阅读

全球首测启动：EverOS智能体记忆自进化新篇章

机器之心发布EverMind 公司近期推出了EverOS，这是一个全新的AI记忆系统，它超越了现有产品的功能限制，为智能代理（Agent）提供了更强大的上下文理解和长期记忆能力。通过引入独特的Skills自进化机制和多模态检索技术，EverOS不仅提升了任务成功率，还显著压缩了执行路径长度。EverMind 的最新发布标志着AI从传统数据处理工具向具有持久记忆的数字伴侣转变的重要一步。这个系统的核

科技2026/4/1522 阅读

揭秘数学界的神秘粒子：单一运算符涵盖全部基础函数

机器之心编辑部使用一个简单的二元运算符结合常数 1 是否能够演绎出现代科学计算器上的所有基本函数？最近，计算机科学领域迎来了一项突破性研究。这一简化复杂数学系统的底层革新被认为具有革命意义。该论文的作者是来自波兰雅盖隆大学（Uniwersytet Jagielloński）的 Andrzej Odrzywołek。论文标题：《从单一运算符生成所有初等函数》论文链接：https://arxiv.or

科技2026/4/1518 阅读

Psi-R2模型凭借10万小时训练数据，无需对齐技术，在MolmoSpaces竞赛中夺冠！

机器之心发布具身智能正在步入一个新的发展阶段。一个日益明确的趋势是，单纯依赖真实机器的数据传输，并不足以将机器人成功引入大规模的应用场景中。这背后的逻辑不难理解：数据采集成本高昂、耗时长且难以完全反映实际情况。实验室里可行的演示在工厂或仓库的实际操作环境中往往面临速度、成本和稳定性的挑战。因此，下一阶段的竞争不仅在于谁能做出一个演示，更在于谁能够有效转化人类的操作经验到机器人可以学习和部署的能力。

科技2026/4/135 阅读

高性能世界模型基线开源，高德加入CVPR 2026 WorldArena挑战赛

机器之心发布近两年来，视频生成模型如 Sora、Veo 和 Cosmos 等，在图像逼真度方面取得了显著进步，生成的画面已经很难区分真假。然而，这些模型是否真正理解了物理世界仍然是一个悬而未决的问题。实际上，当这些模型尝试生成机器人操作的视频时，经常会出现物体穿墙、凭空消失或时间顺序混乱等不符合物理学规律的现象。从「看起来像」到「真能用」，这条技术道路充满了挑战。针对这一问题，一场全球性的竞赛正在

科技2026/4/1317 阅读

谷歌官方发布教程：轻松获取龙虾连Gemma 4，无需额外购买token

机器之心编辑部许多用户都在他们的 iPhone 上运行 Gemma 4，并对其互动体验给予了积极的反馈。尽管模型能够流畅地回答简单问题，但在处理较长对话或进行深度思考时速度较慢，且可能导致手机发热和电池快速耗尽。最近，一些技术爱好者开始在电脑上尝试另一种方法：将 Gemma 4 连接到龙虾（OpenClaw）系统中运行。初始阶段，这种做法仅限于少数人的实验。例如，一位博主声称，在 Mac Stud

科技2026/4/113 阅读

抢先了解顶尖会议论文！机器之心ICLR 2026研讨会，邀您下周六相聚北京

在2026年，人工智能的发展正以前所未有的速度改变着技术的边界。大型模型训练效率不断提高、具身智能从实验室走向实际应用的步伐加快以及多模态融合技术逐渐成熟等一系列进展描绘了当前最令人振奋的人工智能发展图景。与此同时，代理技术（Agent）的进步正在重新定义人机协作的可能性，并引发了关于如何使这些智能体具备持续学习和自主决策能力的研究热潮。在这样一个背景下，一年一度的 ICLR 成为了观察全球人工智

科技2026/4/1017 阅读

七天内Claude Code份额缩水过半？逆向工程师揭露七大漏洞

机器之心编辑部近期，Claude Code 负责人 Boris Cherny 面临着前所未有的挑战，因其开发的这款备受推崇的人工智能系统，在频繁更新的同时也暴露出一系列问题。最近引发广泛关注的是其模型思考深度大幅下降的问题。有人发现，从今年1月底约2200字符到2月下旬骤降至720字符，降幅超过67%，到了3月初更是进一步跌至560字符。开发者对此表示，“Claude 的表现已经退步到无法执行复杂

科技2026/4/81 阅读

Claude订阅服务限制OpenClaw，用户怒斥：享用功能须额外付费！

机器之心编辑部Anthropic 对 OpenClaw 采取了措施？近日，许多使用 OpenClaw 的用户收到了来自 Anthropic 发送的一封邮件通知。邮件中提到，从太平洋时间4月4日上午12点开始，Claude订阅将不再包括对OpenClaw等第三方工具的支持。尽管用户仍可通过他们的 Claude 账户登录这些平台并使用服务，但需要额外支付费用。可以选择购买额外的用量套餐（当前有折扣优惠

科技2026/4/54 阅读

技能竞赛狂潮

机器之心编辑部在 2026 年 4 月的这几天，科技圈的目光被 GitHub 上一场诡异的开源狂欢所吸引。随着大模型技术的进一步普及，一种以.skill为后缀的项目如雨后春笋般涌现，并以前所未有的速度在各大社交平台上引发裂变。起初，这似乎只是程序员群体中常见的一种极客式幽默。有人在 GitHub 上发布了一个名为「同事.skill」的项目。该项目声称，只要提供某位同事的飞书聊天记录、钉钉文档和工作

科技2026/4/53 阅读