
微软:Claude Code的token,我也烧不起了
连微软都用不起 Token 了?有网友爆料,本周微软取消了内部的 Claude Code 授权,原因是基于 token 的计费方式使得成本过高,即使对于一家拥有近乎无限云资源的公司而言也难以承受。图源:X 博主 @HedgieMarkets该网友认为,AI 补贴时代正在终结。微软这家公司曾经砸 130 亿美元投资 OpenAI,还为 Anthropic 提供了大部分的 Azure 云计算资源,但现
共找到 27 篇相关文章

连微软都用不起 Token 了?有网友爆料,本周微软取消了内部的 Claude Code 授权,原因是基于 token 的计费方式使得成本过高,即使对于一家拥有近乎无限云资源的公司而言也难以承受。图源:X 博主 @HedgieMarkets该网友认为,AI 补贴时代正在终结。微软这家公司曾经砸 130 亿美元投资 OpenAI,还为 Anthropic 提供了大部分的 Azure 云计算资源,但现

在AI技术迅速发展的背景下,计算架构正面临前所未有的挑战。最新数据显示,截至今年三月,国内每天的人工智能调用量已经达到了惊人的140万亿次token,相较于去年年底的100万亿以及两年前初期的10亿量级,增幅分别高达四成和超过一千倍。这种激增的背后,是AI技术在各种场景中的广泛应用,包括智能体、多模态交互及长文本推理等领域。当前市场对高吞吐量、低功耗计算资源的需求日益迫切,而传统的存储技术和带宽限

▲头图由AI辅助生成近日,据知情人士透露,《信息》杂志报道指出,Anthropic承诺在未来五年内向谷歌云支付约2000亿美元(约合人民币1.37万亿元)用于训练和部署Claude的计算能力支出。4月30日,谷歌公布其一季度云业务待交付订单总额翻倍至超过4600亿美元(约合人民币3.15万亿元),其中Anthropic所占份额已超四成。这一单笔交易规模对谷歌来说具有重要意义。在去年的公告中,Ant

5月7日的报道指出,在第一季度业绩激增80倍的情况下,新兴的人工智能企业Anthropic正面临前所未有的计算资源压力。在本周三于旧金山召开的一次开发者会议上,公司首席执行官达里奥·阿莫代表达了对于此前仅按10倍增长预测进行规划的误判所带来的近期算力瓶颈问题的关注。“这是我们当前在计算能力上所遇到的主要挑战。”阿莫代说道。他进一步指出,为了尽快满足开发者的需要,公司正在加速扩大其基础设施规模。为

在具身人工智能研究领域,正经历着从传统感知模式向视觉主导的全面转型。视觉在机器人与环境互动中扮演关键角色,被视为解锁通用机器人智能、促进仿真到现实无缝过渡的重要工具。然而,在追求高保真度的同时,研究人员常常面临计算资源和训练效率之间的权衡困境:高质量的视觉渲染需求大量算力;构建精细模型耗时且低效;现有平台存在兼容性问题,阻碍了具身智能研究的发展。为应对这些挑战,清华大学智能产业研究院(AIR)DI

OpenAI宣布,在美国签署了总计约10吉瓦的人工智能计算资源合约,这一成就比原计划提前了数年时间完成,表明公司在加速数据中心扩建方面已经取得了显著进展。根据OpenAI官网博客于4月29日星期三发布的信息显示,该公司在过去三个月内新增锁定的算力资源约为3吉瓦,其中包含来自亚马逊的2吉瓦和另一尚未公开来源的1吉瓦。OpenAI还透露,公司正在考虑更多的选址方案,并计划在未来几年大幅扩展其计算能力

从 DeepSeek-R1 到 Kimi K2.5,利用强化学习(RL)来优化大型模型的推理性能已成为关键方法。然而,在 RL 后训练过程中存在一个重要问题:这种训练方式是否遵循特定规律?能否通过给定参数量、计算资源和数据规模,准确预测出 RL 训练所能达到的效果?中国科学技术大学与上海人工智能实验室等机构的研究团队对此进行了系统性的研究。他们使用 Qwen2.5 系列密集模型(从0.5B到72B

智东西编译 ZeR0编辑 漠影据报道,谷歌近日宣布向Anthropic PBC注入100亿美元的初始投资,并在满足特定业绩目标后可能进一步追加300亿美元的投资承诺,此举旨在帮助该公司显著提升其计算资源。Anthropic是一家由OpenAI前高管创立的企业,在成立两年内迅速成长为全球估值最高的大型模型公司之一。今年2月,该公司完成了价值30亿美元的G轮融资,投后估值达到了惊人的3800亿美元,并

4月24日,人工智能公司Anthropic在其技术回顾报告中承认,近期对其Claude模型进行了三项调整,导致该模型性能有所下降。然而,他们明确否认了为了节省计算资源而故意降低其智能水平的说法,并表示相关问题已经得到解决。近来,关于Claude模型被人为削弱的质疑在AI社区内广泛流传。许多开发者和技术专家通过各种在线论坛反馈称,在处理复杂任务时,该模型的表现急剧下滑,甚至出现幻觉现象,同时Tok

亚马逊于4月21日宣布,将与人工智能初创公司Anthropic扩大基础设施合作协议,并同意在未来几年内向该公司提供最高可达250亿美元的资金支持。此前,亚马逊已累计投资80亿美元。Anthropic在周一的一份公告中透露,计划未来十年内在亚马逊的AWS平台上投入超过千亿美元用于采购技术,包括定制开发的Trainium AI芯片。此外,Anthropic还预定了一项最高达5吉瓦电力容量的服务,专门

近日,OpenAI对其Agents SDK进行了功能更新。新增的原生沙箱执行环境提升了智能体的安全运行能力,并支持在指定工作空间内处理文件和使用经授权工具;同时实现了管控框架与计算资源分离的设计,增强了系统的安全性、稳定性和可扩展性。此次更新中,OpenAI通过API向所有用户开放了新的功能。定价模式沿用标准API计费方式,根据token使用量及工具调用次数来收费。全新引入的沙箱和管控框架首先会在

近期,专注于人工智能研究的公司 DeepSeek 发布了新的招聘信息,招募数据中心高级运维工程师和高级交付经理,其中最高薪资可达每月3万元。此次招聘是DeepSeek首次公开招聘与计算硬件相关的实地职位,这表明该公司已从纯粹的研发阶段扩展到了建设和运营物理算力设施的实际操作层面。DeepSeek 自建的数据中心选址在乌兰察布市。作为内蒙古自治区主要的计算资源集群的一部分,并且还是国家“东数西算”工

近日,腾讯云推出了两个面向云端服务的新产品——CloudQ和AndonQ。云计算经过多年发展,已经变得越来越便捷,可以通过API调用即刻获得所需计算资源。然而,在管理多个云平台环境时,操作体验仍然复杂繁琐。维护人员需要在不同的控制台之间来回切换进行重复性工作;架构师在处理跨云问题时要逐一检查日志,效率低下;技术管理者主要依赖人工汇总Excel来评估风险,智能实时监控仍有待提高……目前,随着大模型和

据悉,在人工智能产业日益激烈的竞争环境中,OpenAI本周向投资者发布了一份内部文件,批评竞争对手Anthropic在规模上远远不及自己,并指出后者正面临计算能力的瓶颈。内部备忘录透露,OpenAI计划在未来十年内将自身的算力提升至30吉瓦(Gigawatts),而预计到2027年底,Anthropic的算力水平可能仅达到7至8吉瓦左右。“即使按照其乐观预测的最大值计算,我们依然拥有显著的优势,

据报道,在4月7日,Anthropic周一宣布与谷歌和博通达成新的基础设施协议,预订了数吉瓦的下一代TPU算力。这批新增算力预计从2027年开始逐步投入运行,旨在支持Claude的研发和全球部署。业务数据的增长推动了该公司在计算能力上的扩张。进入2026年后,公司核心产品的企业需求显著增加。截至当前,其年度收入已超过300亿美元,相比2025年底的90亿美元实现了巨大飞跃。今年2月宣布G轮融资时,


浙大研究小组解决了多模态模型过度自信的问题,通过先调整置信度再优化计算资源分配来实现。 听雨 2026-03-22 15:17:19 量子位

机器之心编辑部OpenAI 推出了一项全新的竞赛:你准备好了吗?这次的挑战显得有些出人意料。参赛者需要在 FineWeb 数据集上尽可能减少验证损失,同时将模型及其训练代码的总大小控制在 16MB 之内,并且要在 8 张 H100 GPU 上于 10 分钟内完成训练。这种设定几乎堵住了所有通过堆砌参数和计算资源来解决问题的方法。剩下的,参赛者只能依靠巧妙的设计、极致的压缩技术、策略性的选择以及工程

英伟达Blackwell B200的计算资源浪费高达60%,但普林斯顿大学团队通过研发FlashAttention-4算法,将这一问题大幅改善,利用率提升至71%。 闻乐 2026-03-18 08:31:26 量子位

新智元报道追觅科技给出的答案是:把算力搬到太空!OpenClaw消耗大量计算资源的问题似乎即将得到解决。在3月11日AWE(中国家电及消费电子博览会)前夕,「芯际穿越」这一尖端芯片品牌的发展备受瞩目。芯际穿越正向着下一代智能技术的核心发起挑战。通过先进的芯片技术,他们成功打破了传统算力的局限,引领了智能科技的新潮流。这是对全球现有计算能力极限的一次正式宣战。比马斯克更敢想200万颗算力星座想要理解