
新智元报道
Gemini 桌面客户端终于问世了!这款工具不仅能完成网页端的所有功能,更具备捕捉屏幕所有窗口的能力,打破了浏览器的限制。
在过去两年中,每当提到桌面AI助手时,人们首先想到的就是ChatGPT和Claude。
ChatGPT早早就将客户端部署到了Mac系统上,而Claude也早已在桌面上开辟了入口。
相比之下,谷歌的Gemini一直局限于网页界面,显得有些不协调。
尽管模型本身声量很大,但在桌面端的存在感却略显不足。
现在这项短板终于得到了弥补。
谷歌正式发布了专为macOS设计的原生客户端,并支持全局快捷键和直接共享当前窗口的功能。

Gemini的这一更新标志着它从网页端迈向了桌面环境,提供了更加无缝的工作体验。
这件事其实分量很重。
网页端虽强,但终究还是网页端。
使用时需要先打开浏览器,在众多标签中找到正确的页面,完成操作后再切换出来。
整个过程显得有些破碎,像是临时寻求帮助一般。
相比之下,客户端则会一直驻留在桌面上方,如同一个随时待命的助手。
这种常驻的入口使得Gemini有机会深入文档、表格和代码等场景中发挥作用。
一些用户可能会认为多了一个应用程序并没有那么重要。
还真有。
实际上,今天大家竞争的核心已经不再是聊天或写邮件的能力。
更关键的是谁能更贴近工作流程,并成为一个始终在线的助手。
现在Gemini终于也加入了这场桌面AI的竞争中。
此次更新的主要亮点有哪些
先看官方公告。
首先,Gemini Mac版是一款真正的原生客户端,而非简单的网页壳应用程序。
谷歌官方表示这是为macOS量身定制的用户体验。
产品经理Josh Woodward透露,一个小团队在不到一百天内完成了超过一百个功能开发,并且完全使用了Swift语言。

这次更新显示谷歌已经意识到用户对桌面端应用的需求并积极回应。
其次,Gemini现在可以从任何界面被快速启动。
使用快捷键Option+Space可以拉起迷你聊天窗口;而Option+Shift+Space则可切换到完整对话界面。
浅色主题设计美观,深色模式相比网页版更显惊艳,背景从灰色变为纯黑色。

Gemini的设计理念是让用户在任何工作场景下都能轻松获取帮助,无需离开当前任务区域太远。


这种低门槛的操作方式往往更能决定一个产品是否会被高频使用。

客户端

网页端
最重要的一点在于Gemini可以直接访问用户正在处理的文件或窗口内容。
官方提供了窗口共享功能,使AI能够基于当前屏幕内容给出反馈和建议。
用户可以分享复杂的图表、代码段落甚至视频给Gemini,询问其分析结果或是总结要点。
这种交互方式彻底改变了传统的信息传递模式。
从前需要用户手动提供上下文信息给AI,而现在则是AI主动获取并理解场景中的相关信息。

官方落地页还提到了一些细节。

支持所有Gemini支持的语言和国家地区;免费使用;要求macOS版本为15及以上;仅适用于Apple M系列芯片设备;同一账号下的聊天记录可以同步。

网页端的功能,现在在客户端中也都能实现。

这次更新不仅是简单的移植网页界面,更像是重新整合了Gemini的各项能力以适应Mac的工作流程。
对于普通用户来说,这意味着更加便捷的操作体验。
更少的页面切换、更少的内容复制粘贴等操作,这些细节上的改进往往决定了产品的留存率。
然而,Gemini距离成为真正的助手还有一定差距
不过必须承认,这次更新确实是好事,并且是迟早会发生的趋势。

但是将它放在当前的桌面AI竞争环境中来看,现在的Gemini更像是一个学会了常驻桌面的聊天工具。
虽然很重要但还没有达到像ChatGPT和Claude那样彻底改变用户工作方式的程度。
这个变化的影响很大。
还没有完全掌握计算机操作方面的技能。
目前,Gemini已经可以嵌入Chrome浏览器并默认开启读取上下文信息的功能。
它能够从任何界面快速启动、共享窗口,并根据上下文提供回答。
但是像ChatGPT和Claude这样的桌面版本已经向更深层次的电脑操作能力迈进了一步。
Gemini虽然已经开始脱离浏览器环境,但要真正做到帮助用户在电脑上连续工作还有一段距离。
桌面AI的最终目标不仅仅是悬浮窗的设计是否美观、快捷键是否顺手的问题。
更关键的是能否理解用户的屏幕操作意图,并主动跨多个应用程序执行任务。
看起来很美
当前版本的Gemini已经初步具备了这样的潜力。
而ChatGPT和Claude则在这方面走得更远一些,已经开始实践这种能力的应用场景。
Gemini未来很可能会补上这一块的能力短板。
谷歌官方博客也表示这只是开始阶段,接下来几个月会有更多更新消息发布。
窗口共享功能是第一步;全局快捷键则是第二步;而跨应用程序的理解与执行则属于第三步的挑战。
差在哪?
目前谷歌已经完成了前两步的任务。
最具吸引力的那个环节,或许还需要等待一段时间才能实现。

总而言之,Gemini现在终于入驻了Mac平台。
Gemini 已经从浏览器里走出来了,但离真正能帮你在电脑上连续干活,还差一段路。
这段路很关键。
因为桌面 AI 走到最后,拼的绝对不只是悬浮窗做得漂不漂亮,快捷键顺不顺手。
拼的是它能不能真的读懂你的屏幕,理解你在干嘛,然后跨多个 App 去主动接活,去执行,去把一连串动作串起来。
今天的 Gemini,已经摸到了门把手。
Claude 和 ChatGPT,已经把门推开了一点。
Gemini 后面大概率也会补上这一块的能力。
谷歌官方博客自己都说了,首发版只是开始,接下来几个月还会有更多消息。
窗口共享是第一层,全局快捷键是第二层,跨 App 理解和执行是第三层。
现在谷歌总算把前两层搭起来了。
剩下那层最香的,估计还得等等。
总之,Gemini,总算住进 Mac 了。
参考资料:
https://blog.google/innovation-and-ai/products/gemini-app/gemini-app-now-on-mac-os/
https://gemini.google/mac/
