搜索: "性能提升"

共找到 7 篇相关文章

没有先进光刻机也能造出高端芯片,华为发表的“韬(τ)定律”是什么?

没有先进光刻机也能造出高端芯片,华为发表的“韬(τ)定律”是什么?

过去半个多世纪,全球半导体产业始终遵循着一个核心规律——摩尔定律。1965年,英特尔联合创始人戈登·摩尔提出,芯片上的晶体管数量大约每两年翻一倍。其背后的本质,是通过不断缩小晶体管尺寸,在同样面积内集成更多晶体管,从而推动芯片性能提升、成本下降。过去几十年间,从90nm(纳米)、28nm一路演进到如今的3nm、2nm,半导体产业基本沿着“几何缩微”的路线持续发展。但随着先进制程不断逼近物理极限,这

国内2 阅读
G²RPO-A破解小模型推理难题,开启性能增强新模式

G²RPO-A破解小模型推理难题,开启性能增强新模式

在大模型时代,许多专业人士或许都遇到过类似的问题:当尝试将 DeepSeek-R1 和 OpenAI-o1 这样的卓越推理能力移植到小规模语言模型(SLMs)上时,实际效果往往不尽如人意。尽管现有的强化学习方法 GRPO 对于 7B+ 参数量的大模型来说非常有效,但一旦应用于更小型的模型中,比如 1.7B 或者参数量更少的情况下,性能提升就显得十分有限。针对小规模语言模型在强化学习中的推理难题,香

科技3 阅读
动态路由革新:RouteMoA助力多智能体系统高效协同无需预推理

动态路由革新:RouteMoA助力多智能体系统高效协同无需预推理

一篇论文已被 ACL 2026 收录,主要作者来自上海交通大学自动化与感知学院 IWIN 中心团队。该团队的负责人是关新平教授,导师包括陈彩莲教授和乐心怡教授,南洋理工大学陶大程教授亦有参与合作。其他研究人员则分别来自腾讯、上海人工智能实验室以及香港中文大学等机构。论文的第一作者王骥泽为该校博士生,专注于大型模型智能体的研究。在最近几年里,随着大语言模型的进步,从单一模型的性能提升逐渐转向多个模型

科技3 阅读
DeepSeek V4报告内容丰富详实!揭秘484天迭代历程

DeepSeek V4报告内容丰富详实!揭秘484天迭代历程

DeepSeek的V4版本发布了,它在长文本处理效率方面取得了重大突破。为了实现极致的长文性能,V4采取了激进的方法,在未来的研究中将会更加全面地探索简化路径的可能性。V4论文详细介绍了其架构和优化措施,包括百万token处理能力的关键改进。这些成果表明DeepSeek在追求高效的同时保持了稳定的进步节奏。论文强调,尽管V4实现了显著的性能提升,但在未来还有进一步精简的空间,并指出几个研究方向如新

科技2 阅读
揭秘GPT-6真容

揭秘GPT-6真容

最新的消息显示,OpenAI即将发布其备受瞩目的新模型——GPT-6。据称这款代号为“土豆”的项目已经进入最后阶段,并定于4月14日推出。该模型被业内视为实现通用人工智能(AGI)的关键一步。知情人士透露,GPT-6将具备显著的性能提升,在代码编写、逻辑推理和智能体任务方面超越前代产品。此外,它还实现了多模态功能的一次性整合,能够处理文本、音频、图像及视频等多种格式的数据。模型的最大亮点之一是其超

科技10 阅读
北汽集团选定禾赛激光雷达供应多家车型,预计下半年启动量产交货

北汽集团选定禾赛激光雷达供应多家车型,预计下半年启动量产交货

今日下午,禾赛科技对外宣布其新款 ATX 焕新版已经获得北汽集团多款车型的定点,并将于 2026 年下半年开始量产交付。据悉,ATX 焕新版配备了 256 条激光线束,最佳角分辨率达到了 0.08° x 0.05° 的水准,测距范围最远可达 230 米(在反射率为 10% 的情况下),每秒点频高达 3,840,000 点。与上一代产品相比,这款焕新版的性能提升了整整一倍,并且内部集成了光子隔离技术

科技6 阅读
过多的AI智能体并不意味着更强:信息冗余限制了大规模语言模型代理的发展

过多的AI智能体并不意味着更强:信息冗余限制了大规模语言模型代理的发展

近年来,基于大语言模型的多智能体系统(MAS)在复杂推理任务中得到了广泛应用。传统方法通常让多个独立生成决策的代理通过投票或辩论等方式进行聚合,从而提高算术、常识推断及专业问答等领域的准确率。当test-time compute成为常见的性能提升策略时,一个自然而然的问题随之产生:随着agent数量的增加,MAS是否能够持续增强其能力?直观上来看,这种想法似乎是合理的:类似ensemble或sel

科技5 阅读