搜索: "CUDA"

共找到 13 篇相关文章

两大芯片巨头打起来了

界面新闻记者 | 宋佳楠6月1日，芯片产业上演极具戏剧性的一幕——英伟达高调杀入英特尔深耕数十年的PC芯片腹地，英特尔则强势加码英伟达主场的数据中心与AI芯片赛道。在台北国际电脑展GTC Taipei 2026大会现场，英伟达公布面向Windows系统个人电脑的全新超级芯片RTX Spark，该芯片采用NVIDIA Blackwell RTX GPU，拥有6144个CUDA核心和第五代Tenso

科技2026/6/22 阅读

DeepSeek V4芯模协同背后，国产算力生态开始飞轮加速

henry 发自凹非寺量子位 | 公众号 QbitAIDeepSeek V4发布，比模型本身更受关注的，是一个根本性的转变：国产算力生态正在从过去“芯片被动适配模型”的单向奔赴，迈向“芯模协同”的新阶段。之前，昇腾与不少模型进行过协同探索，但V4是第一次在大规模、高强度、工程化的尺度上，验证了这种“芯模协同”的可行性与效率。而这，恰恰是过去CUDA+英伟达体系最深的一层护城河——模型、框架、芯片

科技2026/5/291 阅读

机器之心编辑部过去十年，AI 卡的是算力；未来十年，物理 AI 卡的是数据。而数据的前提，是仿真。没有可规模化的仿真世界，就没有可规模化的机器人数据；没有统一的仿真标准，就不会有真正的物理 AI 生态。仿真，正在成为物理 AI 时代的 CUDA。CUDA 曾经把 GPU 计算变成 AI 时代的统一底座。今天，仿真正成为物理 AI 时代新的标准层。物理 AI 的核心瓶颈已经变了回望过去的技术演进，每

科技2026/5/133 阅读

跨过算力之河的DeepSeek，美团LongCat着手打造新船挑战前行之路

本文探讨了未来数字世界的核心商品——Token，并分析其在人工智能时代的重要性。黄仁勋于2026年的GTC大会上，定义了AI时代的底层通货，并将数据中心比喻为生产智能的工厂。在过去几年里，全球绝大多数此类“工厂”都依赖英伟达的GPU和CUDA生态进行运作。然而，这种情况引发了人们对算力供应链单点依赖的关注，尤其是在全球人工智能市场Token供给方面的问题。2026年4月24日，DeepSeek

科技2026/5/23 阅读

谷歌为何转向专属性能计算，放弃通用算力？

近日，在Cloud Next 2026大会上，谷歌推出了第八代TPU，该版本将训练与推理任务分离为两个独立的芯片：TPU 8t用于大规模训练，而TPU 8i则专攻高效推理。这一设计创新标志着该公司在专业化算力领域迈出了一大步，并引发了行业对于未来AI计算发展方向的深入探讨。谷歌TPU 8i在过去的十年中，英伟达凭借其GPU以及CUDA生态系统几乎垄断了整个AI市场，成为推动全球人工智能发展的核心力

科技2026/4/2514 阅读

顶尖AI企业抛弃CUDA？黄仁勋直言：“你们的前提有误”

关于英伟达分配有限资源的方式，确实存在一种独特的方法，并非单纯基于出价最高者优先获得。这种策略背后的原因在于，我们更倾向于支持那些有助于推动行业发展的新型云服务公司，而不是简单地追求利润最大化。此外，通过这种方式确保了市场供需的合理平衡，同时还能维持良好的客户关系。为了确保供应与需求之间的最佳匹配，英伟达采取了一种谨慎而全面的方法来进行预测和订单处理。首先，在收到具体订单之前，我们无法提供任何承诺

科技2026/4/203 阅读

顶级AI厂商为何弃用CUDA？黄仁勋直言：“你们的前提有误”

你提到英伟达采取了一种独特的资源分配方式，并非单纯以价高者优先，而是更多地考虑“希望这些新型云服务公司能存在”，因此会将一些资源分配给像CoreWeave、Crusoe和Lambda这样的公司。为何你们会选择这种方式？这种市场描述是否准确？衡宇 2026-04-19 12

AI2026/4/202 阅读

深度访谈实录：黄仁勋警告美国，DeepSeek与华为合作加剧紧张局势

我们讨论了英伟达在AI领域的领先地位，尤其是在架构优化方面的努力。黄仁勋强调了持续创新的重要性，并指出摩尔定律的终结意味着更多地依赖于计算机科学的进步而非仅仅依靠半导体物理学。黄仁勋解释说，CUDA的成功在于其灵活性和广泛的生态系统支持。他提到未来的模型可能需要针对不同架构进行深度优化，而英伟达的目标是保持领先地位并推动技术栈每层的发展。我们探讨了英伟达是否会利用较老的节点来满足市场需求的增长。黄

科技2026/4/173 阅读

英伟达CEO黄仁勋：加速计算助力公司独立崛起为业界领军企业

在 Dwarkesh Patel 的播客节目中，英伟达首席执行官黄仁勋强调，即便没有人工智能的推动，凭借加速计算策略，公司依然能够发展成为行业内的领军企业。黄仁勋在访谈中详细讨论了公司的战略定位及其对行业的理解。他指出，加速计算一直是英伟达的核心支柱，并通过 GPU 和 CUDA 架构的结合使用实现了前所未有的处理效率提升——最高可达 100 到 200 倍。黄仁勋认为，在没有 AI 技术革新的情

科技2026/4/164 阅读

深寻科技梁文锋爆料：V4版本四月底面世

经过多次延期传言之后，备受期待的DeepSeek V4终于要发布了。《创智记》从多位内部人士那里了解到，梁文锋近日在公司内部会议中宣布，预计将于四月下旬正式推出新一代旗舰大模型DeepSeek V4。据此前消息透露，这款新版本将拥有超过万亿参数规模以及百万级的上下文窗口，并且首次实现了与国产芯片如华为昇腾等的深度兼容，标志着中国AI产业在摆脱对CUDA依赖方面取得了重要进展。令人注目的是，在3月2

科技2026/4/102 阅读

GLM-5.1开源突破Opus4.6纪录，CUDA专家热议仅14小时后即遭逆袭

开源模型首超Opus4.6！智谱GLM-5.1登场，14小时后CUDA专家被冲了十三 2026-04-08 14:29:23 量子位

AI2026/4/94 阅读

中科院团队研发SparseRL技术：实现深度强化学习自动优化CUDA代码性能

如何让人工智能不仅能够生成可执行的代码，还能优化代码的运行效率？这个问题长期以来一直困扰着研究者。最近，中国科学院计算技术研究所的一个团队提出了名为 SparseRL 的新框架，首次将深度强化学习应用于稀疏 CUDA 代码的生成任务中。简单来说，就是让 AI 学会根据稀疏矩阵的具体结构，自动生成最优化的 CUDA 实现代码。实验数据表明，在经典的 SpMV 任务上，该方法将编译成功率提高了 20%

科技2026/3/266 阅读

GTC分析由7位专家完成，结果令英伟达尴尬不已

“英伟达承认GPU并非推理最优解，AI算力叙事逻辑改写。”作者丨刘伊伦杨依婷GTC 2026，主角不再是GPU。黄仁勋用一整场发布会证明：英伟达的战场已经转移。过去十年，英伟达用CUDA生态和Tensor Core，将GPU推至AI计算的中心位置，GPU既是训练引擎，也是推理主力，包揽一切。而在这场被视为AI基础设施风向标的发布会上，叙事重心开始从“更强的GPU”，转向“如何组织算力”。从Ver

科技2026/3/208 阅读