搜索: "架构创新"

共找到 6 篇相关文章

2026鲲鹏昇腾开发者大会在北京举办 发布多项创新技术

2026鲲鹏昇腾开发者大会在北京举办 发布多项创新技术

5月22日,以“心怀挚爱,共绽光芒”为主题的鲲鹏昇腾开发者大会2026(KADC2026)在北京中关村国际创新中心举办。本次大会上,昇腾、鲲鹏多项创新技术发布,涵盖鲲鹏与昇腾超节点架构创新、软件开源开放及易用性持续提升等。据介绍,在AI计算领域,昇腾超节点天然亲和Agent负载,引领算力基础设施建设新范式。昇腾CANN全面开源开放、兼容主流开源生态、Mind系列软件升级,为 AI 开发者提供全流程

科技1 阅读
梁文锋与DeepSeek的十万亿美元棋盘

梁文锋与DeepSeek的十万亿美元棋盘

新智元报道【新智元导读】DeepSeek正用开源、降价和底层架构创新,重画AI硬件生态的成本曲线,把目标指向十万亿美元产业与AGI的星辰大海。DeepSeek最近动作频频。先是5月22日,彭博社爆出他们正在推进700亿元人民币的融资,投前估值高达450亿美元。同一天,DeepSeek官宣V4-Pro API永久降价75%——把促销价直接焊死成正价。一边向投资人要钱,一边向开发者让利。这操作,多少有

科技2 阅读
国产大模型MiniMax M2.5连续5周全球大模型调用量冠军

国产大模型MiniMax M2.5连续5周全球大模型调用量冠军

快科技3月22日消息,据央视财经报道,国产大模型MiniMax M2.5连续五周霸榜全球大模型调用量冠军。今日,公司产品研发人员展示了直观的价格差距:“达到同样能力水平的海外模型跟我们相比,价格可能有十几倍的差距。”目前,性价比正在成为国产大模型吸引全球用户的核心竞争力。这种性价比从何而来?第一个关键因素是技术创新,通过底层架构创新,从根本上降低了推理成本,简单来说,就是用更少的Token完成同样

科技3 阅读
阿里巴巴推出三款升级版千问3.5模型,成本降至每百万令牌0.2元

阿里巴巴推出三款升级版千问3.5模型,成本降至每百万令牌0.2元

阿里推出三款新的中型千问3.5模型在2月25日,继春节期间开源Qwen3.5-397B-A17B之后,阿里继续发布了千问3.5系列的三项新成果。此次发布的三个规模适中的新模型包括Qwen3.5-35B-A3B、Qwen3.5-122B-A10B和Qwen3.5-27B。这些模型通过架构创新和训练技术的进步,性能上超过了前代旗舰产品Qwen3-235B-A22B以及Qwen3-VL,即便是在中等规模

国内9 阅读
蚂蚁推出两大万亿参数开源模型,吞吐量提升三倍、访问内存减少到十分之一,架构创新成核心优势

蚂蚁推出两大万亿参数开源模型,吞吐量提升三倍、访问内存减少到十分之一,架构创新成核心优势

智东西作者 陈骏达编辑 漠影当大模型在推理、编程等领域不断刷新纪录时,一个新的问题也随之浮现:如何在提升模型能力的同时,控制算力和资源消耗?近期,蚂蚁集团inclusionAI团队发布了一项重要成果——百灵大模型家族的新一代开源万亿参数模型Ling-2.5-1T(即时模型)与Ring-2.5-1T(思考模型)。两款模型并非单纯通过增加参数量取胜,而是依靠共

科技9 阅读