搜索: "Token"

共找到 194 篇相关文章

谷歌全家桶，都被新模型“污染”了

距离谷歌的Gemini 3.5 Flash发布已经一周多了。皮查伊在谷歌发布会上口口声声地表示，Gemini 3.5 Flash性能比3.1 Pro还强，说它是Agent时代的底座。可结果呢？网上对Gemini 3.5 Flash的评价，除了速度快这唯一的优点外，全是缺点。输出的内容错误多、啰嗦、干活token消耗量爆炸……谷歌Antigravity负责人瓦伦·莫汉（Varun Mohan）在5月

科技2026/5/271 阅读

月吞100万亿Token！AI中转站OpenRouter赚爆了

【新智元导读】每周25万亿tokens的真实流量、估值一年翻倍——OpenRouter拿下1.13亿美元B轮融资。Token中转站这生意，真的赚疯了。就在昨天，OpenRouter宣布完成1.13亿美元B轮融资，谷歌母公司Alphabet旗下成长基金CapitalG领投，英伟达NVentures等知名风投悉数跟进。a16z和Menlo Ventures这些老股东也继续加码。估值直接飙到了13亿美元

科技2026/5/271 阅读

小米大模型永久降价99%，正面对标DeepSeek？

文 | 影子备忘录此前，DeepSeek宣布API降价，紧接着，小米也宣布其大模型永久降价，最高可达99%。时间线上看，5月22日，DeepSeek宣布V4-Pro模型API价格永久降价75%，缓存命中输入低至每百万Tokens 0.025元人民币。仅过了5天，5月27日，小米就祭出杀招：MiMo-V2.5系列API永久降价，最高降幅99%，Pro版缓存命中输入降到与DeepSeek相同的0.02

科技2026/5/271 阅读

刚刚，支付宝推出全球首个Token Pay服务，还让Agent帮你花钱

智东西作者李水青编辑心缘智东西5月26日报道，刚刚，蚂蚁集团旗下支付宝亮出AI支付“全家桶”：全球首个Token Pay服务、AI钱包产品，连同此前已落地的AI付与AI收，正式构成一套覆盖授权、支付、结算、管理、安全的全栈AI原生支付体系。可以说，这是一套面向智能体经济的完整基础设施：从用户如何放心让Agent花钱，到商家如何让全网Agent来购物，再到Token的即用即充，支付宝在AI时代重

科技2026/5/271 阅读

对话清程极智核心团队：不是所有Token都是好Token

智东西智东西5月26日报道，今天，北京AI Infra创企清程极智举办了一场小范围媒体沟通会，系统性地梳理了其成立以来的技术脉络与产品版图。清程极智成立于2023年底，核心团队来自清华大学计算机系高性能所，在高性能计算等领域有丰富经验。截至2026年3月，清程已完成3轮融资，投资方包括北京市人工智能产业基金、联想、中科创星等知名产业基金。目前，清程极智已经推出了智能计算软件栈八卦炉（Bagualu

科技2026/5/271 阅读

“Token”必须死？

文章转载于腾讯科技作者：晓静“我语言的局限，即意味着我世界的局限。”（ Die Grenzen meiner Sprache bedeuten die Grenzen meiner Welt. ）哲学家维特根斯坦在1921年写下这句话时，他谈论的是人类认知的边界。一百年后，这句话精确地描述了大语言模型面临的结构性困境，如果AI的“语言”就是离散token序列，那么它的“世界”永远被困在tok

科技2026/5/272 阅读

昆仑万维天工AI发布Agent模型SkyClaw-v1.0 支持百万token上下文

凤凰网科技讯 5月26日，昆仑万维集团旗下天工AI正式发布高性能Agent模型SkyClaw-v1.0及轻量化版本SkyClaw-v1.0-lite。该模型支持百万token上下文，深度适配工具调用、代码生成、文件编辑、交互式应用构建等真实工作流场景。据官方介绍，SkyClaw-v1.0在主流Agent评测中表现超过Minimax 2.7、DeepSeek V4 Flash等模型，在OpenCla

科技2026/5/261 阅读

微软按下 vibe coding 暂停键：烧 token 已经比员工贵了

烧 token 在 YC 的语境里不是支出，是替代。作者｜张勇毅2026 年 5 月 14 日，微软已经开始取消大部分员工的 Claude Code 内部许可。截止日期是 6 月 30 日——也是微软财年最后一天。仅仅 6 个月前，微软还在做完全相反的事——2025 年 12 月，它把 Claude Code 开放给数千名员工，包括工程师、产品经理、设计师，鼓励所有人都用 vibe coding

科技2026/5/261 阅读

全球AI大模型周调用量五连涨，国产AI连续4周超美国

-Flash登顶，Kimi K2.6跌出榜单《每日经济新闻》根据OpenRouter最新数据测算，上周（5月18日至5月24日）全球AI大模型总调用量为28.9万亿Token，较此前一周增长7.4%，连续五周上涨，大模型调用需求仍在持续释放。其中，上榜的AI大模型中，中国AI大模型周调用量达9.223万亿Token，环比增长19.89%；同期美国AI大模型周调用量为4.93万亿Token，环比增长

科技2026/5/251 阅读

FlashAR：仅用0.05%数据，让预训练好的自回归图像模型飞起来

背景：自回归图像生成的崛起与推理瓶颈大语言模型的成功让 "next-token prediction" 这套范式从文本延伸到了图像领域。把图像用视觉分词器编码成离散 token，再一个接一个的预测出来 —— 这就是自回归（AR）图像生成的核心思路。从早期的 PixelCNN、iGPT、Parti，到近期的 Emu3.5、LlamaGen、Lumina-mGPT、GLM-Image，AR 模型的生成

科技2026/5/251 阅读

DeepSeek-V4-Pro API 永久降价；iPhone 17 系列中国激活 3000 万；五角大楼再曝外星人文件｜极客早知道

DeepSeek-V4-Pro API 宣布永久降价，调整为原定价的 1/45 月 22 日消息，DeepSeek 官方今日宣布，DeepSeek-V4-Pro 模型 API 价格将于 2026 年 5 月 31 日结束 2.5 折优惠活动后，正式调整为原定价的 1/4。DeepSeek-V4-Pro 的 API 原价为：输入（缓存命中）：0.1 元 / 百万 Tokens输入（缓存未命中）：12

科技2026/5/241 阅读

“五类人AI替代不了，企业做第二名最稳妥” | 昆仑万维方汉

“烧多少Token”这件事，正变得越来越有意思。大多数人一个月也就烧几百万Token，而“小龙虾”创始人在OpenAI一个月就烧了6000亿。即使在同一家公司，普通用户和重度用户之间，Token消耗也可能相差几个数量级。Token消耗量，正在成为AI时代新的硬核实力指标。听到这儿，你是不是已经开始焦虑了？但在2026中国AIGC产业峰会上，昆仑万维董事长兼CEO方汉却笑着说：大可不必这位经历过完整

科技2026/5/241 阅读

人大孟澄团队&华为提出集成剪枝视角下的MoE新架构

本文已被 ICML2026 接收，第一作者康欣来、共同第一作者薛敦耀来自中国人民大学统计与大数据研究院。通讯作者为中国人民大学孟澄助理教授与华为基础大模型部研究员陈汉亭。导语近年来，Mixture-of-Experts（MoE）已经成为大模型扩展的重要架构之一。相比稠密 Transformer，MoE 通过稀疏激活机制，在每个 token 上只调用少量专家，从而在控制计算成本的同时扩大模型容量。然

科技2026/5/232 阅读

微软：Claude Code的token，我也烧不起了

连微软都用不起 Token 了？有网友爆料，本周微软取消了内部的 Claude Code 授权，原因是基于 token 的计费方式使得成本过高，即使对于一家拥有近乎无限云资源的公司而言也难以承受。图源：X 博主 @HedgieMarkets该网友认为，AI 补贴时代正在终结。微软这家公司曾经砸 130 亿美元投资 OpenAI，还为 Anthropic 提供了大部分的 Azure 云计算资源，但现

科技2026/5/232 阅读

顶流里最快！智谱，你是在「喷」代码吧

顶流里最快！智谱，你是在「喷」代码吧十三 2026-05-22 11:05:00 量子位 400 tokens/s

AI2026/5/231 阅读

智谱推出GLM-5.1高速版：400 tokens/s 30秒生存成复杂网页代码

凤凰网科技讯 5月22日，智谱宣布面向部分企业客户推出GLM-5.1高速版API“GLM-5.1-highspeed”，模型输出速度达到400 tokens/s。智谱称，这一速度刷新了当前全球大模型厂商API的速度上限。该模型基于旗舰级GLM-5.1能力开发，打破了此前“高速模型几乎总是轻量级模型”的行业惯例，首次在国产大模型中实现旗舰级能力与极致低延迟的兼顾。高速版由智谱GLM团队与TileRT

科技2026/5/222 阅读

运营商开卖AI流量包，救命稻草还是新管道？

Token经济学，一场新的三国杀。文｜白鸽编｜王一粟在卖Token这件事上，三大运营商平台，开始正面与云厂商和大模型厂商们交锋。日前，中国电信、中国移动、中国联通相继推出面向个人和企业的Token套餐，将AI大模型的计算能力以类似“流量包”的形式明码标价销售。上海移动喊出“1元40万Tokens”的价格，中国电信推出最低9.9元/月的个人套餐，中国联通则为上海OPC客户提供免费3000万Toke

科技2026/5/221 阅读

清华等提出TaH：跳过93%无效迭代，准确率反而提升

来自清华大学、无问芯穹、上海交通大学等机构的研究团队提出Think-at-Hard（TaH）：一种面向小模型的选择性潜空间迭代方法，让 Looped Transformer 只在真正困难的 token 上多想一步，在跳过 93% 的额外迭代的同时，于 9 个数学、问答、代码基准上取得 3.0%–6.8% 的稳定提升。本文的共同第一作者为清华大学电子系 NICS-EFC 实验室四年级直博生傅天予和大

科技2026/5/221 阅读

三大运营商推出“词元套餐”，有什么用？

近日，中国电信推出试商用“词元（Token）套餐”，提供面向个人和开发者的多档位选择，最低月费9.9元起，中国移动和中国联通也在积极布局。消息一出，立即引发广泛关注，有网友表示，还没搞懂词元是什么，运营商都有套餐了。“词元套餐”到底是什么？和消费用户有啥关系？怎么用？一起来看↓各运营商的“词元套餐”有何不同？据记者了解，三大运营商提供的套餐和计价方式各有不同。中国电信推出了轻享版、畅享版、尊享版三

科技2026/5/212 阅读

中国移动在全国上线词元（Token）套餐，最低5元/月

IT之家 5 月 21 日消息，据新华社今日报道，中国移动宣布在全国上线词元（Token）套餐。此次中国移动创新推出统一算力量纲，其将不同模型、不同规格的词元消耗统一封装为标准积分，旨在解决多模型量纲不统一的问题。据中国移动相关负责人介绍，该套餐价格最低为 5 元月包，包含一定数量的词元，适合轻度体验用户。中国移动的词元套餐已实现全国用户全覆盖。除了基础算力套餐，中国移动还将词元和云电脑、云手机

科技2026/5/211 阅读