搜索: "开源模型"

共找到 27 篇相关文章

腾讯混元开源全新翻译模型Hy-MT2 ，上线小程序「腾讯Hy翻译」

5月21日，腾讯混元宣布开源全新翻译模型Hy-MT2并上线翻译小程序「腾讯Hy翻译」。Hy-MT2 是支持 33 种语言互译的多语言模型，其中7B 和 30B-A3B模型在各类翻译任务上达到了开源模型最佳效果，超越了几十倍参数量的模型，轻量级的 1.8B 模型也超越了微软等主流商业 API，且得益于 AngelSlim 1.25-bit 极端量化，仅需 440MB 存储空间，可以轻松部署在主流手机

科技2026/5/222 阅读

谷歌Gemma 4详评：虽非完美，却是移动端的理想选择

最近，谷歌推出了新一代开源模型Gemma 4，该版本包含了E2B、E4B、26B和31B四种规格的模型。其中，有两个较小规模的模型——E2B和E4B可以被直接部署在智能手机或树莓派等设备上，并支持离线运行。自从这两款「小型」端侧模型发布以来，它们受到了许多人的赞誉，被认为是迄今为止最实用的端侧解决方案。雷科技之前也发表了两篇关于实测体验的文章，一篇着重于逻辑推理和多模态功能的表现，另一篇则介绍了在

科技2026/5/47 阅读

架构创新引领图像理解与生成一体化开源模型发展

近日，朋友圈被GPT-Image-2生成的图像所占据，占了近七成。 henry 2026-04-29 12:27:03 量子位全

AI2026/4/3011 阅读

斯坦福与国内顶尖高校联手，宽德Will利用开源模型攻克21项科学难题

本文探讨的并非使模型变得更聪明的方法，而是如何让试错过程本身更加高效。通过引入一套全新的框架，即使是普通的开源模型也能在科学发现上取得显著成果。假设你有有限的资金预算，想要尝试一次未知领域的科学研究。你会怎么选择？会把所有资金投入到一个顶级的模型中，让它长时间运行以寻求突破性的发现吗？或者反其道而行之，在资源允许的情况下同时进行几十甚至上百个实验假设，通过竞争和快速筛选来找到最有潜力的方向？前一种

科技2026/4/273 阅读

在DeepSeek-V4测试1000万token后，我发现三个惊喜与一个意外

近日，关于DeepSeek-V4的一项深度体验报告发布，该款新推出的开源模型迅速在Hugging Face平台上获得了极高关注，并被视为当前最佳推理和智能体编程性能的代表。在此次评估过程中，我们通过一系列多维度测试来验证这两款模型的实际效果。经过大量数据分析后发现，DeepSeek-V4系列及其Pro版本展示了卓越的技术优势，尤其是在自主规划与执行方面表现出色。测试数据显示，这款新模型已经登上了H

科技2026/4/253 阅读

揭秘：DeepSeek V4暗藏中国万亿级开源模型驚喜发现！DeepSeek V4内含重磅中国开源项目万亿规模开源模型悄然入驻DeepSeek V4

新智元报道DeepSeek V4 引人注目，其参数量达到惊人的1.6万亿，并且在Codeforces竞赛中排名人类选手第二十三位，KV缓存仅前代的十分之一。在同一周内，Kimi K2.6也宣布开源，支持数百万token的上下文和300个子Agent协同工作，模型参数量更是达到了2.6万亿。两家公司在中国AI领域中的地位显赫，它们的技术进步与发布时间高度契合，似乎有意为之。回顾过去一年半的时间线，D

科技2026/4/254 阅读

中国有望半年内研发Mythos级别AI！Anthropic创始人警告：全球网络安全面临严峻挑战

在短短6到12个月内，中国有望开发出与Claude Mythos相匹敌的开源模型。这一警告出自Anthropic首席执行官达里奥·阿莫代伊最近的一次公开访谈。他提到的Mythos是该公司新近向特定机构开放的一款测试型AI系统，在内部评估中展现了惊人的攻击能力。如果这种技术被开源并广泛复制，过去需要国家级资源和顶尖团队才能实施的高级网络攻击可能只需要一台笔记本电脑就能完成。阿莫代伊最担心的是这一趋势

科技2026/4/213 阅读

百度再推开源项目：消费级GPU也能运行的文本渲染技术挑战Nano Banana

百度近期正式向公众开放了其文心大模型团队开发的ERNIE-Image图形生成系统，该系统的参数规模仅为8B，在仅需24GB显存的消费级GPU上就能运行。在多个国际评估标准中，ERNIE-Image表现出色，在GenEval、OneIG等关键测试中的综合得分均列开源模型之首。尤其在文字渲染方面，其性能与Nano Banana等商业闭源系统处于同一水平线上。此外，团队还同时发布了ERNIE-Image

科技2026/4/166 阅读

美国企业转向中国开源模型：Claude引领硅谷AI新浪潮

近日，在旧金山举办的人类X大会明确地传达了生成式人工智能领域不再是OpenAI独领风骚的信息。此次会议吸引了超过6500名业内精英，讨论的话题集中在人工智能技术的革新方向上，而Anthropic公司则成为了当前的关注焦点。多位参会专家指出，虽然Cursor、谷歌和OpenAI都提供了有竞争力的产品，但近期在编程智能体领域声名鹊起的Claude Code无疑是全场瞩目的明星产品。这款由Anthro

科技2026/4/132 阅读

国产开源模型征服硅谷，性价比优势达十倍以上 —— LeCun盛赞

近日，国产开源模型在硅谷大放异彩，性价比远超同类产品。听雨 2026-04-10 16:22:55 量子位中国的时间已经到来，

AI2026/4/128 阅读

GLM-5.1开源版本领跑业界：自主编程能力突破八小时限制

据快科技4月10日的消息，在3月底智谱公司发布了GLM-5.1大模型，该模型在编程能力方面的评分达到了45.3分，并声称仅比全球领先的Opus 4.6低2.6分。不久前，GLM-5.1大模型正式向公众开放源代码，受到了开发者的广泛欢迎。最近，权威的人工智能评估平台LMArena（由百万用户参与盲测）更新了Code Arena的专项排名表，显示GLM-5.1在开源模型中位居第一，在全球所有模型中的排

科技2026/4/102 阅读

GLM-5.1开源突破Opus4.6纪录，CUDA专家热议仅14小时后即遭逆袭

开源模型首超Opus4.6！智谱GLM-5.1登场，14小时后CUDA专家被冲了十三 2026-04-08 14:29:23 量子位

AI2026/4/94 阅读

谷歌推出超强免费开源模型，手机端运行只需2B内存

近日，谷歌DeepMind宣布开源Gemma 4系列模型，并表示这是该公司迄今为止最智能的开放模型。据官方博客透露，这款新模型专为高级推理和智能体工作流设计，在单位参数下的智能水平达到了前所未有的高度。目前，该系列中的31B模型在Arena AI文本排行榜上位居全球开放模型第三位，并且在GPQA Diamond高难度科学推理基准测试中取得了85.7%的准确率，仅稍逊于Qwen 27B模型（85.8

科技2026/4/424 阅读

谷歌发布Gemman 4开源版本，310亿参数挑战顶级模型性能

Google DeepMind 最近公布了其最新的开源模型 Gemma 4：该模型拥有大约 300 亿个参数，在性能上与市面上的其他主流开源项目不相上下。Gemma 是一个由 Google 开发的开源系列，它和谷歌自家的闭源产品 Gemini 共享基础技术。Gemma 的所有权重都向公众开放，任何人都可以获取、修改或部署这些模型。该系列的上一版本 Gemma 3 发布于 2025 年三月，至今已过

科技2026/4/325 阅读

谷歌Gemmma发起反击，国产开源模型准备应战？

凤凰网科技出品作者｜姜凡谷歌最新发布的Gemma 4系列展示了其在人工智能领域的深厚技术积累。在社交平台X上，谷歌DeepMind首席执行官Demis Hassabis于凌晨发布了四颗钻石的emoji，随后揭晓了这一重磅消息：谷歌正式推出了全新的开源大模型家族Gemma 4。这是谷歌自进入开源AI领域以来，最具创新性和竞争力的作品之一。Gema 4不是一个单一的模型，而是一个涵盖从手机到工作站全

科技2026/4/315 阅读

美国开源AI最后的旗帜，也倒了

开源领域一大悲号传来——艾伦人工智能研究所（Ai2），宣布削减开源模型开发（包括OLMo）的资金，转向AI应用。就在同一时间，AI2核心团队几乎被“打包带走”，集体流向微软。人员包括前CEO阿里·法哈迪、前首席运营官索菲·莱布雷希特、汉娜·哈吉希尔齐和兰杰·克里希纳，都是Ai2的核心力量。其中有的人上周刚参加完GTC大会，还跟老黄畅谈开源模型的未来。他们的下一站，则是微软穆斯塔法·苏莱曼的超级智能

科技2026/3/314 阅读

美国开源AI最后的旗帜，也倒了

美国开源AI最后的旗帜，也倒了听雨 2026-03-30 16:47:29 量子位 Ai2削减开源模型资金，研发人员集体出走

AI2026/3/310 阅读

Kimi套壳Cursor曝光，最强「自研」模型遭质疑！创始人回应：忘记标注来源

最近，关于开源模型的争议再次引起广泛关注。这次，事件的焦点集中在一家国产开源模型与硅谷初创公司之间。值得注意的是，双方在这次事件中的立场似乎发生了转变。月之暗面的预训练模型负责人杜羽伦，直接点名Cursor的CEO Michael Truell，质问其为何没有遵守许可协议且未支付任何费用。月之暗面的另一位联合创始人周昕宇也对Cursor进行了严厉批评。周昕宇表示，他不记得Cursor曾经向他们申请

科技2026/3/226 阅读

英伟达推出超强开源代理推理模型，进军龙虾市场？

英伟达携其“最强开源龙虾模型”正式进入养殖业。近日，英伟达发布了拥有120B参数的MoE模型Nemotron 3 Super，并宣布将其代码完全开放给公众使用。在OpenClaw智能体控制能力测试PinchBench中，该模型表现优异，取得了85.6%的成绩，一举登上同类开源模型榜首的位置。此外，在Artificial Intelligence Index的评估中，Nemotron 3 S

AI2026/3/1321 阅读

阿里就林俊旸离职声明：组建基础模型团队，增强人工智能研发力度

林俊旸参加活动画面阿里巴巴首席执行官吴泳铭今日通过内部邮件对林俊旸离职一事作出回应。他强调公司将持续推行开源模型策略，并进一步强化在人工智能领域的研发投入以及吸引顶尖人才的举措。以下为邮件全文——各位通义实验室同学：公司已经同意了林俊旸提出的辞职请求，对其过去的工作表示感谢。今后通义实验室将继续由靖人负责推进相关项目。同时，公司计划成立一个基础模型支持小组，该小组将由吴泳铭、靖人和范禹共同领导，协

国内2026/3/63 阅读