
GLM-5.1开源版本领跑业界:自主编程能力突破八小时限制
据快科技4月10日的消息,在3月底智谱公司发布了GLM-5.1大模型,该模型在编程能力方面的评分达到了45.3分,并声称仅比全球领先的Opus 4.6低2.6分。不久前,GLM-5.1大模型正式向公众开放源代码,受到了开发者的广泛欢迎。最近,权威的人工智能评估平台LMArena(由百万用户参与盲测)更新了Code Arena的专项排名表,显示GLM-5.1在开源模型中位居第一,在全球所有模型中的排
共找到 400 篇相关文章

据快科技4月10日的消息,在3月底智谱公司发布了GLM-5.1大模型,该模型在编程能力方面的评分达到了45.3分,并声称仅比全球领先的Opus 4.6低2.6分。不久前,GLM-5.1大模型正式向公众开放源代码,受到了开发者的广泛欢迎。最近,权威的人工智能评估平台LMArena(由百万用户参与盲测)更新了Code Arena的专项排名表,显示GLM-5.1在开源模型中位居第一,在全球所有模型中的排

最近,《科创板日报》报道指出,在“养虾”热潮的影响下,大模型企业和云服务提供商的访问量和Token使用量持续上升。AI产品最新榜单显示,OpenClaw在3月份吸引了高达2948万次的浏览量,并且成为AI龙虾排行榜的第一名。与此同时,各个主要云服务商如百度智能云、火山引擎、腾讯云及阿里云等,由于“养虾”活动的影响,其访问量均显著增加。特别是百度智能云增长了105%,而火山引擎和腾讯云分别增加了81

近日,比亚迪腾势汽车宣布为旗下腾势 D9 车型进行全量升级推送天神之眼 5.0 版本,并引入了基于强化学习的端到端大模型技术,同时更新了智舱界面和辅助驾驶报告功能。此次 OTA 更新适用于 D9 至尊版、尊航版以及25款 D9。此次腾势 D9 的软件升级包括如下几项内容:升级至天神之眼 5.0,新增驾驶辅助系统的强化学习模型;行程结束后生成驾驶辅助报告,涵盖领航里程、变道次数及绕行记录等信息,并可

在大数据和人工智能蓬勃发展的背景下,如何准确有效地表达数据成为了一个重要的问题。当人们将一份Excel表格交给大模型时,往往只能得到一张配色奇怪、标注错误且不可编辑的图片。这种情况下,“把一切交给AI”的想法显然过于理想化了。大多数现有的AI图表工具本质上更像是“黑箱”,人类只能被动接受结果,没有修改的机会。究其原因,在于数据表达是一个门槛极高的专业领域。即便AIGC技术降低了某些方面的难度,但精
华龙证券指出,全流程人工智能影视创作工具现已对外开放,为实现AI短剧产业化的成本控制和效率提升提供了切实可行的技术路径;此外,全模态大模型的推出在音视频识别、多种语言交互及实时生成方面取得了显著进步,进一步加强了AIGC内容生产的底层技术支撑。国信证券分析认为,在当前娱乐需求依然旺盛的情况下,AI技术正促使影视内容供应模式发生转变。1)回顾过去一年的表现,《哪吒之魔童闹海》和《疯狂动物城2》等高质

以下是对一篇关于小米大模型负责人罗福莉分析文章的重新表述。在4月6日,Xiaomi MiMo的大模型项目负责人罗福莉于社交平台X上发表了一篇文章,对Anthropic近期采取的新措施进行了评论,并对其Token Plan策略进行了解释。她在文中详细探讨了算力分配和定价逻辑的问题。罗福莉在她的社交媒体帖子中分享了一些观点(图源:X)。4月4日,Anthropic宣布禁止使用包括OpenClaw在内的

小龙虾(OpenClaw)借鉴了人类清理大脑垃圾的方法。为了解决隔夜忘事的问题,小龙虾模仿人类的行为模式,在智能体闲置时进行数据整理,使其能够提炼出有价值的长期记忆。长期以来,大模型的记忆系统就像一个杂乱无章的文件柜。由于缺乏有效的长短期记忆筛选机制,长时间交互后容易陷入信息冗余和混乱的局面。它们能记住每个细节,却难以区分重点,并且在面对矛盾的信息时会感到困惑。2026年4月5日,OpenClaw
最近,“词元”这个AI领域的关键术语,随着国家数据局的正式命名而迅速走红网络。截至今年三月的数据表明,我国每日的词元调用量已超过一百四十万亿次,与年初相比增长了上千倍。实际上,“词元”一词早已深入我们的日常生活,并在新技术和新应用的发展中扮演着重要角色。我们既要积极接受并利用这些技术,同时也要重视潜在的风险,确保信息安全。“词元(Token)”具体是指什么呢?从本质上讲,词元是AI大模型处理信息的


零跑汽车官方今日发布消息,零跑 D19 在安兔兔评测中获得 2036050 的高分,成为业内首个突破 200 万分大关的车型。零跑 D19 搭载了双高通骁龙 8797 芯片,构建了一套舱驾融合体系,总计算能力高达 1280TOPS,并支持端侧 AI 大模型和五屏互动功能。IT之家了解到,零跑 D19 计划于4月16日正式推出市场。该车尺寸为长宽高5252×1995×1780毫米,轴距达到 3110

新智元报道最近,“会编写Tcl脚本”的大模型首次以Agent形态进入实际的EDA工具链,标志着设计优化流程迈出了重要一步。大模型已经在工程研发领域迅速普及。然而,在EDA(电子设计自动化)这一专业领域中,真正具有挑战性的并不是编写一段简单的脚本,而是让这些模型能够无缝集成到真实的开发环境中,并持续调用特定的功能进行分析和优化。行业迫切需要的并非只是一个可以生成脚本的聊天助手,而是一个能围绕目标不断

新智元报道大型AI模型的决策机制究竟是由谁掌控?OpenAI最新研究揭示了“指令层级”如何终结大模型中的权力纷争。每当我们与聊天机器人互动时,或许从未考虑过这样一个问题:它们在遵循什么样的指导原则?是否是平台设定的安全规则、开发者制定的产品要求、用户输入的命令词,还是从网页和数据库中获取的信息?当今的大模型已经超越了简单的对话功能。它们能够调用工具、阅读文件、浏览网页,并以“智能体”的身份完成实际

近日,一篇关于新稀疏注意力机制的研究论文引起广泛关注。论文提出了一种名为HISA(Hierarchical Indexing Sparse Attention)的新方法,成功解决了大模型中的索引瓶颈问题,并提高了计算效率。相较于现有的DeepSeek Sparse Attention (DSA) 方法,HISA不仅速度提升了2至4倍,而且无需额外的微调步骤便能实现即插即用的效果。研究团队在多种大模

ReCALL团队在量子位平台上发布了一篇文章,探讨了生成式模型的应用效果。当多模态大模型具备强大的视觉和逻辑推理能力时,人们期待它们能轻松解决图像检索任务,尤其是组合图像检索问题。然而实际应用中却发现,将这些大型生成式模型改造为判别式的检索工具后,其性能反而显著下降。这种从生成转向判断的转换过程中产生了严重的功能退化现象。最近,紫东太初团队与新加坡国立大学的研究人员合作解决了这一行业难题,并提出了

ReCALL框架破解生成式与判别式的冲突,助力大模型在多模态检索领域实现超越SOTA的性能 | CVPR’26 听雨 2026-04-06 23:30:59 量子位

新智元报道顶级分析师Benedict Evans认为,大模型如今更像是「大宗商品」,而非护城河壁垒,OpenAI可能会步Netscape后尘。别再指望OpenAI能成为下一个谷歌或微软了。在最近一期的The MAD Podcast节目中,Evans与Matt Turck就当前科技趋势进行了深入探讨。Evans指出,OpenAI正面临巨大的护城河危机。无论是Windows还是谷歌搜索引擎,它们之所以

大模型圈,变天了。2026年3月29日,一份名为FutureX的全球动态评测榜单刷新了成绩。北京中关村学院信息智能团队自主研发的智能体系统Milkyway,以60.9分的绝对优势霸榜!这个分数有多夸张?作为对比,由埃隆·马斯克(Elon Musk)旗下xAI打造、曾被寄予厚望的Grok-4,在这份榜单上仅拿到了25.9分。Milkyway的得分是它的一倍还多(Grok-4曾拿下该项目的首期冠军)。

新智元报道【新智元导读】OpenAI根本没有护城河!顶级分析师Benedict Evans判断:大模型本质上是「大宗商品」,OpenAI极有可能重演Netscape的悲剧。80%的用户一年交互不足千次、Meta掏出50%的收入去买芯片,AI行业的「财务重力」时刻已经到来。不要再幻想OpenAI会成为下一个谷歌或微软!在最新一期的The MAD Podcast中,顶级科技分析师Benedict Ev

2025年底,全球最大的AI模型聚合平台OpenRouter发布的年度使用报告显示,在其用户构成中,47%来自美国,中国开发者占6%。此外,平台调用内容中,英语占比83%,中文不足5%。但截至2026年4月3日当周,该平台调用量排名前十的模型中,有6个来自中国。按调用量从高到低依次为:小米MiMo-V2-Pro、阶跃星辰Step 3.5 Flash、MiniMax M2.7、DeepSeek V3

这家原本默默无闻的硅谷机器人 AI 公司,或许很快就会受到更多关注。今天,Generalist 正在尝试将大模型技术完全应用于机器人领域,并首次对外公布了其最新一代基础模型 GEN-1。效果相当惊人:来自官方账号比起前代产品 Gen-0 平均仅64%的成功率,GEN-1 在多项任务中已经达到了99%,包括折叠 T 恤和维护吸尘器等操作,能够连续运行数百次而无需人工干预。先看数据。现在的机器人不再是