搜索: "CUDA"

共找到 6 篇相关文章

深度访谈实录:黄仁勋警告美国,DeepSeek与华为合作加剧紧张局势

深度访谈实录:黄仁勋警告美国,DeepSeek与华为合作加剧紧张局势

我们讨论了英伟达在AI领域的领先地位,尤其是在架构优化方面的努力。黄仁勋强调了持续创新的重要性,并指出摩尔定律的终结意味着更多地依赖于计算机科学的进步而非仅仅依靠半导体物理学。黄仁勋解释说,CUDA的成功在于其灵活性和广泛的生态系统支持。他提到未来的模型可能需要针对不同架构进行深度优化,而英伟达的目标是保持领先地位并推动技术栈每层的发展。我们探讨了英伟达是否会利用较老的节点来满足市场需求的增长。黄

科技1 阅读
英伟达CEO黄仁勋:加速计算助力公司独立崛起为业界领军企业

英伟达CEO黄仁勋:加速计算助力公司独立崛起为业界领军企业

在 Dwarkesh Patel 的播客节目中,英伟达首席执行官黄仁勋强调,即便没有人工智能的推动,凭借加速计算策略,公司依然能够发展成为行业内的领军企业。黄仁勋在访谈中详细讨论了公司的战略定位及其对行业的理解。他指出,加速计算一直是英伟达的核心支柱,并通过 GPU 和 CUDA 架构的结合使用实现了前所未有的处理效率提升——最高可达 100 到 200 倍。黄仁勋认为,在没有 AI 技术革新的情

科技2 阅读
深寻科技梁文锋爆料:V4版本四月底面世

深寻科技梁文锋爆料:V4版本四月底面世

经过多次延期传言之后,备受期待的DeepSeek V4终于要发布了。《创智记》从多位内部人士那里了解到,梁文锋近日在公司内部会议中宣布,预计将于四月下旬正式推出新一代旗舰大模型DeepSeek V4。据此前消息透露,这款新版本将拥有超过万亿参数规模以及百万级的上下文窗口,并且首次实现了与国产芯片如华为昇腾等的深度兼容,标志着中国AI产业在摆脱对CUDA依赖方面取得了重要进展。令人注目的是,在3月2

科技2 阅读
中科院团队研发SparseRL技术:实现深度强化学习自动优化CUDA代码性能

中科院团队研发SparseRL技术:实现深度强化学习自动优化CUDA代码性能

如何让人工智能不仅能够生成可执行的代码,还能优化代码的运行效率?这个问题长期以来一直困扰着研究者。最近,中国科学院计算技术研究所的一个团队提出了名为 SparseRL 的新框架,首次将深度强化学习应用于稀疏 CUDA 代码的生成任务中。简单来说,就是让 AI 学会根据稀疏矩阵的具体结构,自动生成最优化的 CUDA 实现代码。实验数据表明,在经典的 SpMV 任务上,该方法将编译成功率提高了 20%

科技5 阅读
GTC分析由7位专家完成,结果令英伟达尴尬不已

GTC分析由7位专家完成,结果令英伟达尴尬不已

“英伟达承认GPU并非推理最优解,AI算力叙事逻辑改写。”作者丨刘伊伦 杨依婷GTC 2026,主角不再是GPU。黄仁勋用一整场发布会证明:英伟达的战场已经转移。过去十年,英伟达用CUDA生态和Tensor Core,将GPU推至AI计算的中心位置,GPU既是训练引擎,也是推理主力,包揽一切。而在这场被视为AI基础设施风向标的发布会上,叙事重心开始从“更强的GPU”,转向“如何组织算力”。从Ver

科技6 阅读