据报道,当前中国科技公司正在引领全球开源AI大模型的发展趋势,而美国的大型科技企业则倾向于闭源策略。不过,为了防止完全失去市场竞争力,这些美国巨头也会偶尔推出一些开源项目作为象征性举措。谷歌即将发布的Gemma 4便是其中之一。
关于Gemma 4的消息已经流传了一段时间,近日,该模型背后的团队DeepMind创始人、首席执行官Demis Hassabis在推特上透露了相关信息。他提到的是四颗钻石的图案,这与Gemma这一名称源于拉丁语中的宝石不谋而合。

当前版本的Gemma 3大模型是在去年三月发布的基础上构建的,基于谷歌的Gemini 2.0技术。从发布时间来看,现在是推出新版本的最佳时机。值得注意的是,尽管已经过去了大约一年的时间,并且Gemini 3.1也已面世,这并不会影响到谷歌通过闭源大模型盈利的能力。
用户最为关心的问题无疑是Gemma 4的技术性能。目前的Gemma 3虽然算得上轻量级版本,但其参数规模仅27B,能够使用单卡GPU运行,并具备多模态能力,在开源社区内也获得了不错的评价。
关于即将发布的Gemma 4,有传言称除了现有的小规模模型外,还将推出一个高达120B参数的新版。这一版本的规模是前一代的四倍之大,但采用了MoE架构并以激活参数15B的形式降低资源需求,仍能在本地离线环境中运行。

谷歌自家的Gemini系统对Gemma 4的能力进行了预测分析,并给出了积极的结果。据称,这款新模型在深度思考和上下文理解能力方面都有显著提升,甚至可以执行复杂的逻辑任务。
尽管如此,用户也不应抱有过高期待。美国科技公司如谷歌和Meta对待开源大模型的优先级并不算太高,他们不会让这些项目的性能影响到自身产品的盈利状况。因此,如果Gemma 4能够在本地离线环境下运行的话,其技术上限可能并不会特别突出,并且在同等参数量下,也未必能超越国内其他开源的大模型产品。

