搜索: "算力需求"

共找到 5 篇相关文章

解码加速15倍!EdgeRazor助推大模型在PC/移动端“狂飙”

解码加速15倍!EdgeRazor助推大模型在PC/移动端“狂飙”

近年来,大语言模型参数的持续膨胀,带来了极高的显存占用和算力需求,在 PC、手机和 IoT 等资源受限的端侧设备上部署前沿大模型十分困难。因此大语言模型轻量化的研究势在必行,量化(Quantization)成为主流的轻量化方案。然而,量化端侧部署目前受制于 “不可能三角”:后训练量化(PTQ)在极低比特下精度崩塌;量化感知训练(QAT)算力成本极高;而现有的量化感知蒸馏(QAD)又缺乏灵活性。由南

科技1 阅读
真武M890只是开胃菜!阿里平头哥首曝路线图:V900+J900两年两代

真武M890只是开胃菜!阿里平头哥首曝路线图:V900+J900两年两代

快科技5月20日消息,在2026阿里云峰会上,平头哥在发布新一代训推一体AI芯片真武M890的同时,首次对外公开了真武系列芯片的完整产品路线图。未来两年将陆续推出算力更强的真武V900与真武J900两代芯片,以满足Agentic时代千行百业的AI算力需求。作为本代旗舰,真武M890内置144GB HBM显存,片间互联带宽达到800GB/s,整体性能是前代真武810E的3倍,原生支持FP32到FP4

科技2 阅读
投资550亿美金!马斯克芯片工厂梦想渐成真

投资550亿美金!马斯克芯片工厂梦想渐成真

当大型AI算力需求方选择自主建造芯片工厂时,这不仅是一个商业决策,更具有深远的战略意义。作者|桦林舞王回溯到上世纪八十年代,日本半导体产业曾一度占据全球市场半数以上的份额。美国对此感到不安,并非因为缺乏芯片供应,而是意识到国家如果不能自主掌控“硅”资源,就将战略命脉交给了他人。这促使了《半导体协议》的诞生以及Intel公司的复兴,最终迎来了今天的《芯片法案》。时隔四十年,类似的担忧如今以一种更为个

科技12 阅读

专家预测算力需求将持续旺盛

近日,《国家数字经济创新发展试验区(上海)实施方案》由上海市人民政府办公厅发布,并提出要促进算力资源的互联互通。该方案强调提升上海市算力监测调度平台和长三角(上海)算力互联互通平台的能力,探索建立区域间的算力资源共享机制,推动跨地域算力调用和使用需求的增长。同时计划升级智能计算基础设施,部署新一代国产高性能智算集群。万联证券分析指出,在人工智能应用大规模普及以及词元调用量显著增加的情况下,AI基础

科技2 阅读
在AI浪潮中,算力共享成为新一代程序员的便利工具

在AI浪潮中,算力共享成为新一代程序员的便利工具

共绩科技的创始人认为,当前的算力市场存在供需错位的问题,他看到了一个机会——通过连接有闲置算力资源和个人用户、网吧及小规模机房与需要弹性算力需求的AI应用公司来解决这个问题。作者|徐珊为了更好地理解共绩科技的理念,我们需要了解它如何运作。首先,该平台可以让个人消费者以毫秒为单位租用相关算力,解决了传统大型云服务商由于价格昂贵且服务响应时间过长而无法满足弹性需求的问题。共绩团队意识到,随着AI技术的

科技2 阅读