搜索: "计算资源"

共找到 12 篇相关文章

百万美元算力待命,解出此题方能加入OpenAI

百万美元算力待命,解出此题方能加入OpenAI

机器之心编辑部OpenAI 推出了一项全新的竞赛:你准备好了吗?这次的挑战显得有些出人意料。参赛者需要在 FineWeb 数据集上尽可能减少验证损失,同时将模型及其训练代码的总大小控制在 16MB 之内,并且要在 8 张 H100 GPU 上于 10 分钟内完成训练。这种设定几乎堵住了所有通过堆砌参数和计算资源来解决问题的方法。剩下的,参赛者只能依靠巧妙的设计、极致的压缩技术、策略性的选择以及工程

科技1 阅读
追觅芯际挑战马斯克:发射200万卫星,超越OpenClaw的Token热潮

追觅芯际挑战马斯克:发射200万卫星,超越OpenClaw的Token热潮

新智元报道追觅科技给出的答案是:把算力搬到太空!OpenClaw消耗大量计算资源的问题似乎即将得到解决。在3月11日AWE(中国家电及消费电子博览会)前夕,「芯际穿越」这一尖端芯片品牌的发展备受瞩目。芯际穿越正向着下一代智能技术的核心发起挑战。通过先进的芯片技术,他们成功打破了传统算力的局限,引领了智能科技的新潮流。这是对全球现有计算能力极限的一次正式宣战。比马斯克更敢想200万颗算力星座想要理解

科技1 阅读
最新研究破解LLM推理低效之谜:告别过度思考的困境

最新研究破解LLM推理低效之谜:告别过度思考的困境

大语言模型在数学计算、指令执行和智能决策方面表现突出,展现出强大的思考能力。然而,在实际应用中,一个问题逐渐显现:大语言模型的推理成本难以控制。在一些看似简单的任务上,模型有时会过度思考,生成冗长且发散的答案,浪费大量计算资源却未能提高准确性。我们称这种现象为“过度思考”。对于复杂问题而言,由于预算限制,模型可能在关键环节草率作答,导致错误频出,这被称为“思考不足”。目前主流的做法是通过统一减少推

科技5 阅读
熬夜开发10亿Token项目,打造OpenClaw专属龙虾助手Qclaw

熬夜开发10亿Token项目,打造OpenClaw专属龙虾助手Qclaw

朋友们好!Openclaw现在非常受欢迎!然而不少朋友还在等待观望,因为安装过程复杂让他们感到困扰。光是依赖环境的配置就已经让一些人望而却步了,更不用说在完成安装后还需要通过命令行来重启、调整设置或更换模型。很多用户都表示这个门槛确实太高了。因此,我经过半个月的努力和耗费大量计算资源开发了一个名为Qclaw的OpenClaw管理工具,它既简单又全面!使用这款软件,你可以轻松地在本地安装OpenCl

科技1 阅读
交通大学推出JTok模块:在密集计算与混合专家模型之外的全新扩展方案,能耗降低三分之一

交通大学推出JTok模块:在密集计算与混合专家模型之外的全新扩展方案,能耗降低三分之一

最近的研究表明,通过改进模型架构可以显著提升大型语言模型的性能和效率。本文介绍了一项由交通大学团队开发的新技术——JTok-M。JTok-M是一种创新性的方法,它利用token-indexed参数来扩展模型容量,从而提高计算资源的有效利用率。传统的Scaling Law主要关注于两个方面:增加模型参数的数量(N)和使用更多的训练数据(D)。然而,这种方法在实际应用中面临着诸多挑战,如成本高昂、效率

科技6 阅读
DeepSeek发布V4框架预览论文:利用闲置网卡提升智能体推理效率

DeepSeek发布V4框架预览论文:利用闲置网卡提升智能体推理效率

DeepSeek团队最近在ArXiv上低调发布了一篇论文,介绍了一个新的智能体推理框架DualPath。该研究针对Agent长文本推理场景中的I/O瓶颈问题,提出了解决方案:通过优化KV-Cache的加载速度来减少计算资源被存储读取拖累的情况。DualPath打破了传统的从外部存储直接加载到预填充引擎(Storage-to-Prefill)模式,引入了第二条路径——从外部存储加载至解码引擎再传输给

科技7 阅读
DeepSeek发布论文预告:V4框架利用闲置网卡提升智能体推理效率

DeepSeek发布论文预告:V4框架利用闲置网卡提升智能体推理效率

DeepSeek团队的技术成果备受关注,当全球都在期待其GitHub仓库更新至V4时—— 他们与北京大学、清华大学合作,在ArXiv上低调发布了一篇论文,并推出了一个全新的针对智能体的推理框架:DualPath。 这一举措与最近讨论的算力话题紧密相关。 DualPath的核心在于解决Agent在处理长文本时出现的I/O瓶颈问题,通过加快从外部存储加载KV-Cache的速度,确保计算资源不会因为数

AI2 阅读
谷歌新举措能否破解智能算法的瓶颈问题?

谷歌新举措能否破解智能算法的瓶颈问题?

新智元报道传统的人工智能模型在稀疏奖励的环境中往往难以学会分层思考,因为激励机制不足。近日,谷歌团队通过引入元控制器来操控模型内部残差流,使智能体具备了“跳跃式思维”的能力。这项研究揭示了大型模型内部可以自发形成类似人脑的层次化决策结构,为人工智能在复杂多步任务中的训练提供了新的方法。人们普遍认为,AI智能体面临的主要挑战是计算资源不足?实际上,真正的问题在于奖励过于稀疏以及路径过长。在稀疏奖励和

科技2 阅读
ChatGPT广告正式启动,免费用户的计算资源费用即将产生;奥特曼透露本周将推出新款模型

ChatGPT广告正式启动,免费用户的计算资源费用即将产生;奥特曼透露本周将推出新款模型

出品 | 网易智能作者 | 辰辰免费的好事终于走到了尽头。随着ChatGPT广告业务的正式启动,这家全球领先的AI公司已经开始向免费用户的屏幕投放广告了。毕竟,再美好的梦想也需要资金支持。但这还不是最热闹的。为了争夺人工智能领域的霸主地位,OpenAI与其死敌Anthropic已经彻底摊牌——从超级碗赛场上的直接嘲讽到推特上的公开对骂,双方的火药味浓烈至极。在这场激烈的竞争中,CEO奥特曼向全体员

科技12 阅读