搜索: "GPU"

共找到 26 篇相关文章

壁仞科技业绩翻番:硬科技创新驱动百亿级营收增长穿越AI算力浪潮

当前全球人工智能产业正处于技术突破迈向大规模应用的关键阶段,一场围绕自主计算能力和系统效率的深刻变革正在展开。在这一背景下,壁仞科技(06082.HK)作为港股市场中罕见的GPGPU股票,最近公布了其2025年度业绩报告。数据显示,在报告期内,该公司实现了10.35亿元人民币的收入,同比增长了207.2%;毛利率也提升至53.8%,相较于前一年度增长了63个基点。尽管研发支出较上年大幅增加78.5

科技2 阅读
“杭州六小龙”第一股来了!浙大校友创业,年入8亿冲刺IPO

“杭州六小龙”第一股来了!浙大校友创业,年入8亿冲刺IPO

群核科技,进入港股IPO最终冲刺阶段。3月29日,根据港交所信息,群核科技已经顺利通过港交所上市聆讯,来到上市前最后阶段。一旦顺利完成上市,群核科技将成为“空间智能第一股”,同时也将成为“杭州六小龙”中首家完成IPO的企业。群核科技成立于2011年,总部位于杭州,是一家以GPU集群和人工智能技术为核心的空间智能企业。公司由董事长黄晓煌陈航朱皓联合创立,旗下拥有酷家乐、Coohom、群核空间智能平台

科技2 阅读
李想:理想芯片团队论文被2026 ISCA Industry Track录用

李想:理想芯片团队论文被2026 ISCA Industry Track录用

【CNMO科技消息】3月30日,理想汽车CEO李想发文表示,理想马赫100芯片研发团队的论文被2026 ISCA Industry Track录用,他对谢炎及其团队表示祝贺。全新一代理想L9李想介绍称,此次获得全球权威学术评审认可的马赫100芯片,采用了为AI原生设计的数据流架构。与传统由指令驱动的GPGPU不同,传统架构下数据在计算单元和全局内存间反复搬运,规模扩大时瓶颈愈发明显。而马赫100的

科技1 阅读
中兴推出AI超节点,挑战GPU性能,力降token成本

中兴推出AI超节点,挑战GPU性能,力降token成本

新智元报道中兴通讯通过其超节点技术,成功绕开了传统GPU芯片性能的瓶颈,提供了一种系统级的最优解。从系统级协同架构出发,中兴超节点通过六大维度的全方位创新,即硬件架构、高速互联、功耗管理、集群扩展、软件栈及多厂家GPU兼容,全面提升了AI算力的性能和效率。中兴超节点技术的核心优势在于其系统级整合能力,通过硬件和软件的深度协同优化,实现对物理算力的有效调度和利用。这不仅提高了系统的整体效率,还为用户

科技1 阅读
国产工作站如何让OpenClaw告别GPU闲置?

国产工作站如何让OpenClaw告别GPU闲置?

最近,光合组织发起的“龙虾局”全国线下OpenClaw体验活动吸引了众多开发者和AI技术爱好者的积极参与。这项活动从成都一路扩展至昆山、天津及杭州等地,参与者携电脑到场,享受免费安装服务并领取免费的Token算力资源。随着活动的火热进行,普通用户在部署AI Agent时遇到的一些疑问也开始显现。例如,本地部署AI Agent所需的硬件配置是什么?不少人陷入了盲目追求高性能GPU的误区,认为只有购买

科技1 阅读
百万美元算力待命,解出此题方能加入OpenAI

百万美元算力待命,解出此题方能加入OpenAI

机器之心编辑部OpenAI 推出了一项全新的竞赛:你准备好了吗?这次的挑战显得有些出人意料。参赛者需要在 FineWeb 数据集上尽可能减少验证损失,同时将模型及其训练代码的总大小控制在 16MB 之内,并且要在 8 张 H100 GPU 上于 10 分钟内完成训练。这种设定几乎堵住了所有通过堆砌参数和计算资源来解决问题的方法。剩下的,参赛者只能依靠巧妙的设计、极致的压缩技术、策略性的选择以及工程

科技1 阅读
GTC分析由7位专家完成,结果令英伟达尴尬不已

GTC分析由7位专家完成,结果令英伟达尴尬不已

“英伟达承认GPU并非推理最优解,AI算力叙事逻辑改写。”作者丨刘伊伦 杨依婷GTC 2026,主角不再是GPU。黄仁勋用一整场发布会证明:英伟达的战场已经转移。过去十年,英伟达用CUDA生态和Tensor Core,将GPU推至AI计算的中心位置,GPU既是训练引擎,也是推理主力,包揽一切。而在这场被视为AI基础设施风向标的发布会上,叙事重心开始从“更强的GPU”,转向“如何组织算力”。从Ver

科技5 阅读
黄仁勋GTC大会关键演讲:企业须掌握“养虾”之道|三万字详尽记录

黄仁勋GTC大会关键演讲:企业须掌握“养虾”之道|三万字详尽记录

今天,我非常激动地向你们展示NVIDIA的最新技术,包括推理和转折点、人工智能工厂、OpenClaw智能体革命,以及物理人工智能和机器人的全球大规模部署。我们在推理和转折点方面取得了巨大进展,这标志着人工智能技术的重要转折点,为未来的发展奠定了坚实的基础。我们的人工智能工厂利用GPU和DPU加速,能够实现大规模生成和训练模型,这是推动人工智能发展的关键因素。我们宣布成立NVIDIA AI基金会,旨

科技1 阅读
英伟达预测:2027年末AI芯片营收将突破1万亿美元

英伟达预测:2027年末AI芯片营收将突破1万亿美元

英伟达公司预计,截至2027年底,其Blackwell和Rubin晶片将至少创造1万亿美元的收入。这一预测标志着该公司在人工智能计算领域持续增长的势头。原先的预测显示,到2026年底,这些晶片将带来5000亿美元的销售额。在GPU技术大会上,公司首席执行官黄仁勋宣布了新的预测,并将预测期延长至2027年。GPU技术大会是英伟达每年一度的技术盛会,自2009年起在加利福尼亚州圣何塞举办。

财经1 阅读
英伟达揭晓2026至2028年战略蓝图,新一代CPU Rosa首次亮相

英伟达揭晓2026至2028年战略蓝图,新一代CPU Rosa首次亮相

英伟达在 2026 年的 GTC 大会上披露了 Rubin 和 Feynman 两个产品系列的未来规划,首次公开了与 Feynman GPU 相配的 CPU 的代号为 Rosa。关于 Groq LPU 的发展,英伟达计划在 Rubin 世代推出支持 NVFP4 数据格式的 LP35,这款产品预计会在 2027 年面世,与 Rubin Ultra 的发布时间相近;而在 Feynman 世代,LP40

科技1 阅读
卡帕西发布开源AI代理自学习平台,每轮实验仅需5分钟,两天内吸引近万关注者

卡帕西发布开源AI代理自学习平台,每轮实验仅需5分钟,两天内吸引近万关注者

量子位 | 公众号 QbitAI大神Karpathy近期发布了新的开源项目,名为autoresearch,它是一个能够自主进化的科研循环系统。这一创新性工具允许智能体在没有人类干预的情况下进行科学研究。用户只需通过Markdown文档设置指令,后续所有操作将自动完成。其架构非常精简,仅用630行代码就能运行,并且只需要一个GPU即可实现全部功能。系统每五分钟执行一次测试循环,根据验证结果决定是否保

科技11 阅读
卡帕西推出开源Agent自我进化平台,五分钟完成一次试验,两天收获近万星标

卡帕西推出开源Agent自我进化平台,五分钟完成一次试验,两天收获近万星标

AI研究者Karpathy推出了一项新的开源项目——autoresearch,一个致力于实现科研自动化循环系统的创新工具。 该项目旨在通过编写Markdown文档来指导智能体的科研任务,随后所有后续步骤都由AI自主完成。 整个框架简洁明了,仅有630行代码,并且可以在单个GPU上运行。 autoresearch系统每五分钟自动进行一次测试评估,并依据结果决定是否保留或放弃试验中的变更。 Ka

AI15 阅读
Karpathy深夜惊叹“后AGI时代”:AI整晚修改代码百余次,他自己则去汗蒸放松

Karpathy深夜惊叹“后AGI时代”:AI整晚修改代码百余次,他自己则去汗蒸放松

新智元报道Karpathy让Agent在一夜之间进行了上百次实验后,仅用630行代码的autoresearch项目开源了——这意味着现在只需要一块GPU就能拥有一个永不休息的研究实验室。今日,Karpathy发布了一条引起全AI界轰动的消息:这种感觉就像是AGI之后的世界一样。我什么都没碰,先去蒸桑拿了。昨日他用这种方式表达了自己的感受:这是一种AGI时代的感觉,而他对自己的表述相当随意——放下手

科技2 阅读
硅谷巨头纷纷撤离GPU领域,英伟达豪掷千金逆风翻盘

硅谷巨头纷纷撤离GPU领域,英伟达豪掷千金逆风翻盘

新智元报道去GPU化的浪潮势不可挡,英伟达难以阻止。OpenAI对英伟达的性能不满,转而选择谷歌TPU;Anthropic则投资巨额资金转向TPU路线。老黄为了自救不得不高价收购Groq。如今,算力竞赛正式进入能效至上的新时代:谁能率先突破「每焦耳每微秒」的技术极限,谁便有可能在未来十年内占据主导地位。黄仁勋将在两周后登上GTC 2026的演讲台。他早些时候透露:“我们准备了几款前所未有的全新芯片

科技3 阅读
Groq推即用型推理芯片,OpenAI率先采用;英伟达转舵放弃GPU LPUs计划

Groq推即用型推理芯片,OpenAI率先采用;英伟达转舵放弃GPU LPUs计划

英伟达即将迎来重大架构更新。 3月圣何塞GTC大会期间,黄仁勋将推出一套全新的AI推理系统。 这款系统的核心是一颗为推理优化设计的新芯片。 而这枚新芯片的首个大客户已经确定——刚完成1100亿美元融资的OpenAI。 更加值得关注的是,这款芯片采用的底层架构并非英伟达自主研发,而是由Groq团队打造的LPU(语言处理单元) 架构。 这意味着英伟达首次在其核心AI算力产品线上大规模引入了外部设计。

AI2 阅读
复旦大学与辉羲携手突破LLM硬件瓶颈!实现2万token/s推理速度,或将告别GPU时代?

复旦大学与辉羲携手突破LLM硬件瓶颈!实现2万token/s推理速度,或将告别GPU时代?

新智元报道当硅谷公司Taalas将大模型「物理焊死」进芯片引发全球半导体行业的关注时,上海交通大学、辉羲智能及微软亚洲研究院的研究团队已更进一步——他们采用ROM+SRAM异构架构,使端侧LLM推理速度提升至20,000 tokens/s,极大地提升了端侧算力。最近,硅谷初创公司Taalas提出的「模型即芯片」方案引起了全球半导体界的深入讨论和反思。他们绕过了所有热门概念,直接将AI大模型物理焊接

科技14 阅读
巨额投资落地:新AI基础设施项目启用逾1.9万台英伟达GPU

巨额投资落地:新AI基础设施项目启用逾1.9万台英伟达GPU

陈佳编辑 程茜据外电报道,澳大利亚AI基础设施公司Firmus赢得了一份价值约6.6亿美元(约合47亿元人民币)的合同,在墨尔本建设AI数据中心,并计划部署大约18,400块英伟达GB300 GPU。公开信息显示,成立于2019年的Firmus最初专注于加密挖矿芯片散热技术,后转向了AI基础设施领域。该公司已与英伟达建立了合作关系,并参与其数据中心生态系统建设,目前正筹备上市并加快在澳大利亚的布局

科技2 阅读