谷歌Gemini入驻 Mac,直面ChatGPT与Claude

2026-03-20 17:58:25

本周,谷歌悄悄向部分Beta测试者推送了适用于macOS的Gemini原生应用程序。

根据目前流出的测试信息,这是一个拥有系统级权限、直接窥屏的原生应用。在ChatGPT和Claude早已将Mac桌面端化为主战场的今天,谷歌终于按捺不住,掏出了自己的底牌。

这场迟到的反击战正式开始!

苦等两年Gemini


过去对于Mac用户而言,想要使用谷歌的Gemini,体验一直算不上友好。

你需要切出当前的工作窗口,打开浏览器输入网址,等待网页加载并将内容复制粘贴进去,等待生成后再复制出来。这种在不同应用和网页之间反复横跳的体验,极其消耗耐心,反观ChatGPT和Claude,它们早就有了桌面应用。连iOS端也早就用上了免费且支持Gemini 的独立App,Mac端的缺失显得尤为刺眼。

但是这次最大的变化在于,Gemini终于进城了,而且原生的Mac App,不仅仅是多了个桌面图标那么简单。


千呼万唤始出来,谷歌这次搞了个大的。原生应用的底层重构、极速唤醒、极低延迟,更少的系统能耗,只需一个快捷键,Gemini就能在毫秒级的时间内出现在你的屏幕侧边栏或悬浮窗中。

桌面智能曝光


如果仅仅是把网页版打包成一个独立的软件,那谷歌完全没必要搞Beta测试。真正的杀手锏,隐藏在代码深处。

首先是系统级权限与拖拽交互的全面放开。过去在网页端处理长文档,你需要点击上传、选择文件、等待解析。而现在,原生应用带来了无缝交互。你可以直接从Mac的桌面上,将一份100页的PDF行业财报,或者一个包含数十个文件的Python代码文件夹,拖拽进Gemini的对话框里。不需要繁琐的上传按钮,直接拖拽,效率拉满。

这还只是基础功能,桌面智能才是更具颠覆性的技术了。

这到底是个什么黑科技?简单来说,它类似于Android版Gemini Live的屏幕共享模式,但针对桌面端进行了深度定制,让Gemini能理解用户桌面应用和屏幕内容上下文的能力。比如你正在用Mac浏览一篇全英文的深度行业报告,或者正在看一张复杂的架构图。过去,你需要截图,保存,再发给AI。现在,你无需截图,无需复制,只需直接唤醒Gemini并问一句:“帮我总结当前屏幕里第三段的核心数据,并对比上一季度的财报,翻译屏幕上的英文。”

Gemini能窥屏,理解上下文,并迅速给出回答。除此之外,还有全家桶联动与多模态模型接入。

一旦Gemini获得了Mac的系统级权限,它可以直接跨应用调取你的数据,读取Gmail邮件,查看Google日历行程,检索Google Drive里的文档。你可以对它说:“根据我今天下午三点的日历会议,帮我写一封跟进邮件并发送给参会者”,它能一气呵成地完成。

同时,参与测试的用户反馈,应用内有了使用Nano Banana、Veo和Lyria等高级模型创建多媒体内容的选项,Mac版Gemini不仅能处理文本,还能生成高质量的视频和音乐。

迟到的谷歌,能否反杀ChatGPT与Claude?


但在ChatGPT和Claude早已退出了MAC桌面应用,迟到的Gemini凭什么偷塔?

目前的Mac桌面端,早已不是一片蓝海,2024年5月,ChatGPT的Mac原生App已经推出。占据先发优势的ChatGPT,目前依然是保有量最大、用户习惯最深的桌面应用。其最大的亮点在于语音模式以及全局快捷唤醒,它几乎满足了普通用户对AI的所有基础想象。

Gemini的反击点在哪里? ChatGPT虽然强大,但其在处理实时信息时偶尔会出现幻觉,而Gemini背靠全球最大的搜索引擎,强在与Google Search的实时联网结合。在信息的时效性、事实核查的准确度上,Gemini有着天然的优势。

第二位是2024年10月上线的Claude Mac App。如果说ChatGPT是大众情人,那Claude绝对是程序员和研究员的心头好。Claude的计算机能力极强,代码分析、长文本逻辑推理能力在业界有口皆碑,很多Mac用户已经将Claude作为写代码和读论文的唯一指定工具。

Gemini的反击点又在哪里? Claude的能力虽然强大,但其生态相对封闭,没有自己的办公套件支撑。而Gemini借由原生应用,能更顺滑地处理日常办公文档。对于不写代码的普通白领、市场营销人员、行政人员来说,能直接帮你处理邮件和全家桶文档的Gemini,受众面显然更广。

ChatGPT是面面俱到的“通才”,Claude是深耕垂直领域的“专才”,而Gemini都不是,它是依靠服务生态和数据打通能力的“管家”。

三足鼎立的局面,已然成型。

苹果与谷歌的合谋


如果我们把视角再拉高一层,就会发现一个更加宏大的商业现象。

过去十几年里,谷歌在适配苹果新系统、新API时,往往会慢半拍。无论是iOS的新特性,还是macOS的底层接口,谷歌的跟进速度都不快,似乎在和苹果互相防备。为什么这次Gemini入驻Mac的动作如此迅猛,还直接切入了最核心的系统级权限?这就不得不提到今年年初的一场世纪大和解。

没有永远的敌人,只有永远的利益。2026年1月,苹果与谷歌达成了一项重磅协议,下一代的Apple Foundation Models将基于Gemini技术进行增强,以此来大幅提升Siri等苹果原生AI的智力水平。

两家巨头都清楚自己的短板与长板,苹果拥有全球最优质、最保值的硬件入口(Mac和iPhone),拥有极强的手机芯片,但受限于隐私政策和数据积累,在模型算力上急需强援。另一边,谷歌拥有全球最顶级大模型和算力集群,但用户入口少,他们想将触角延伸到Android和Chrome之外,触达更多愿意为生产力付费的用户。

这是一场双向奔赴,原本微妙的竞争关系,正向深度合作转变。谷歌提早以独立App的形态入驻Mac,全面调用桌面智能权限,当底层的利益达成一致,软件生态的打通自然势如破竹。(微信公众号:Tahou_2025)


关注塔猴公众号,回复“1”加入专属社群

扫码下载塔猴APP,查看更多干货

声明:该内容由作者自行发布,观点内容仅供参考,不代表平台立场;如有侵权,请联系平台删除。
标签:
生成式大模型
多模态大模型
跨模态融合增强
企业级大模型