搜索: "模型能力"

共找到 6 篇相关文章

趋境科技推出ATaaS:全球顶级AI Token生成服务平台

趋境科技推出ATaaS:全球顶级AI Token生成服务平台

当前,人工智能领域的竞争正逐步从模型能力的较量转向规模化应用的争夺。应用形式已从单一的问答模式扩展到多智能体协作、长链推理和复合任务执行,这导致了 Token 需求的快速增长。与此同时,算力采购、部署及运行过程中的设备和能源成本持续上升,导致算力投入与实际 Token 产出的匹配问题日益凸显。因此,提高 Token 推理效率的系统优化成为了推动产业持续发展的关键。针对这一行业趋势,全球领先的高效能

科技4 阅读
Claude秘诀大曝光!Harness威力尽显

Claude秘诀大曝光!Harness威力尽显

Anthropic团队的Prithvi Rajasekaran分享了一项研究,探讨了如何随着模型能力的提升,调整用于构建复杂应用的Agent Harness框架。研究从使用Opus 4.5模型开始,逐步简化并优化,最终在Opus 4.6模型上测试其有效性。初始阶段,团队使用Opus 4.5模型构建了一个复杂的Agent Harness框架,包含多个组件,如sprint结构、planner和eval

科技2 阅读
AI专家卡帕西坦承:沉迷龙虾游戏引发“AI精神困扰”,不耗尽算力难求心安

AI专家卡帕西坦承:沉迷龙虾游戏引发“AI精神困扰”,不耗尽算力难求心安

智东西编译 陈骏达编辑 李水青智东西3月23日报道,在上周六发布的播客中,OpenAI联合创始人、AI大牛Andrej Karpathy(安德烈·卡帕西)系统梳理了自己在AI编程和OpenClaw浪潮中的一线体感与方法论,他笑称由于AI领域的飞速发展,自己仿佛出现某种“精神错乱”,在不同新事物之间疲于奔命。他还发现,当下AI编程智能体的瓶颈已不只是模型能力:“Agent做不好,多半是Ski

科技2 阅读
MIT博士突破创新:在Transformer架构中构建计算机,破解大模型核心瓶颈

MIT博士突破创新:在Transformer架构中构建计算机,破解大模型核心瓶颈

新智元报道刚刚,一项令人震撼的研究成果震惊了整个AI社区。一位来自麻省理工学院的博士,成功地在Transformer架构中构建了一个计算机模型。这一突破性进展,彻底打破了人们对大模型能力的原有认知。此前,LLM在执行基本计算任务上一直存在明显短板,例如无法准确比较9.11和9.9哪个更大。然而,这位博士巧妙地将WebAssembly解释器嵌入到了Transformer模型的权重中,实现了无损编码。

科技6 阅读
一家00后创办的世界模型公司,凭什么让华为哈勃重金押注?

一家00后创办的世界模型公司,凭什么让华为哈勃重金押注?

机器之心编辑部近日,世界模型与空间智能前沿公司魔芯科技已完成 Pre-A + 轮近亿元融资。本轮融资由华为哈勃领投,老股东跟投。成立于 2021 年的魔芯科技从 3D AI 物体建模和制造出发,正逐步走向让 AI 具备对三维物理世界的生成、理解与交互能力。公司正持续推进空间表示学习、动态场景三维建模和基于世界模型的物理、动作模型等关键技术研发,并面向下游行业输出模型能力、平台与解决方案。科研突破:

科技1 阅读
蚂蚁推出两大万亿参数开源模型,吞吐量提升三倍、访问内存减少到十分之一,架构创新成核心优势

蚂蚁推出两大万亿参数开源模型,吞吐量提升三倍、访问内存减少到十分之一,架构创新成核心优势

智东西作者 陈骏达编辑 漠影当大模型在推理、编程等领域不断刷新纪录时,一个新的问题也随之浮现:如何在提升模型能力的同时,控制算力和资源消耗?近期,蚂蚁集团inclusionAI团队发布了一项重要成果——百灵大模型家族的新一代开源万亿参数模型Ling-2.5-1T(即时模型)与Ring-2.5-1T(思考模型)。两款模型并非单纯通过增加参数量取胜,而是依靠共

科技6 阅读