近日,谷歌在iOS App Store悄然上线了一款名为Google AI Edge Eloquent的语音听写应用,该软件提供免费且不限制使用的功能,并采用了本地化的Gemma ASR模型进行语音识别和文本整理。
在保障隐私的同时,这款应用程序还支持切换至云端使用Gemini模型来改善文本质量。此外,Eloquent引入了个性化词汇机制,可以根据用户的常用表达建立专属词典以提高识别准确度。
据报道,尽管没有官方发布或预热,该应用还是直接与当前市场上的付费产品形成了竞争态势,并且未来可能会推出安卓版本,但目前尚未上线。

Eloquent的应用能力主要集中在语音转录、文本润色及结构化重写三个方面。其功能能够实现从语音输入到整理和输出的一站式服务,减少了手动编辑的步骤。
启动应用后,用户可以看见一个带有实时波形显示的听写区域,在说话过程中文字会即时生成并展示在屏幕上。
当用户暂停或结束录音时,系统将自动去除诸如“嗯”、“啊”等口头填充词,并对句子进行初步整理以接近书面文本的形式呈现出来。
处理完成的内容会被自动复制到剪贴板中,方便直接使用。除了核心转录功能之外,Eloquent还提供了四种不同的文本转换工具:“要点”用于提炼口述内容中的主要信息;“正式”则将转录的文本改写为更为专业的语体;“简短”对内容进行压缩处理;而“详细”则是扩展原有内容。
历史记录选项卡中保存了所有之前的转录内容,用户可以单独删除每一条记录。此外,统计功能可以帮助追踪累积字数和每分钟的输入速度,为那些希望量化自己实际口述产出效率导向型用户提供方便。
为了进一步提升识别准确率,Eloquent允许用户手动添加专有名词与行业术语以构建个人词汇字典。同时,在登录谷歌账号后,系统还可以从近期Gmail邮件中自动导入高频词汇来建立个性化词汇档案,这项功能是整个应用中唯一涉及谷歌账户数据的部分,并且完全可选。

该应用程序采用端侧优先加云端增强的技术路径,即尽可能地在设备本地完成处理任务。底层模型使用的是谷歌自主研发的Gemma ASR,确保语音数据和个人内容不会离开手机,从而保护了用户隐私。

在云端模式下,虽然语音识别仍然会在设备端启动,但文本润色则由云端的Gemini模型来执行。这样的可切换机制使得用户可以在隐私与效果之间做出选择,尤其适用于对数据流转敏感的应用场景。
Eloquent支持iPhone本地离线转写,并且完全免费、不设使用上限,这与其他工具的付费模式形成了鲜明对比,正在挑战现有的定价逻辑。
当前市场上的大多数语音转录工具有着订阅式的收费机制,例如Wispr Flow和Willow每月费用约为15美元。此外,还有一些产品需要将音频上传至云端服务器进行处理。尽管另一款名为SuperWhisper的应用支持本地运行且强调隐私保护,但同样需按年付费,并不能覆盖移动设备场景。

Eloquent并未被纳入谷歌的常规消费级产品体系中,而是以Google AI Edge的品牌发布。这一品牌主要面向开发者提供在Android和iOS设备上本地运行AI模型的相关工具及SDK支持。
在此背景下,Eloquent不仅是一款面向用户的语音工具,同时也承担着展示端侧模型能力的角色,并向开发人员及企业展示了Gemma在实际应用中的潜力。
据悉,在过去的一年里主流科技公司正在加速推动AI模型向终端设备迁移的趋势。一方面是为了满足隐私保护的需求,另一方面则是为了减少云端调用所带来的延迟与成本问题。在此背景下,Eloquent利用端侧语音识别和文本处理能力在日常输入场景中落地,成为了一个较为直接的案例。
通常情况下,谷歌会先在其自有生态系统中展示新的AI技术能力,例如通过Pixel设备上的端侧模型或AI Edge相关的SDK来体现。然而,此次Eloquent选择优先登陆iOS平台而非安卓,并不常见。
在没有同步推出Android版本的情况下先行上线iOS版,使这款应用更像是单独试水,而非成熟产品体系内的常规发布。
Eloquent通过将端侧语音识别、文本自动整理和基础内容处理整合到同一个流程中,同时提供免费的使用方式以及支持本地核心计算的功能组合,降低了用户的使用门槛。这种模式改变了过去语音转写工具的不同产品或付费版本中的常见做法,并首次出现在一个无需订阅的移动端应用程序中。
目前看来,Eloquent更像是Google AI Edge体系下的一次展示项目,其后续的发展方向仍有待观察,例如是否会持续更新、是否扩展到Android平台并融入系统级输入场景。至少在现阶段,这款应用已经明确了一种新的发展方向,即将语音输入从云端服务转向设备本地能力,并以更低的门槛进入日常使用场景中。
此外,对于以Android为核心阵地的谷歌来说,Eloquent选择优先登陆iOS并不常见。过去谷歌在AI能力的发布路径上,通常会先在自有生态中落地,例如通过Pixel设备上的端侧模型或AI Edge相关SDK展示新能力,再逐步扩展到其他平台。
而此次在没有同步推出Android版本的情况下先上线iOS,让Eloquent更像是一场单独试水,而非成熟产品体系内的常规正式上线。
结语:免费与本地处理,Eloquent指向更低门槛的语音转写
Eloquent把端侧语音识别、文本自动整理和基础内容处理放在同一个流程里,同时提供完全免费的使用方式,并允许在本地完成核心计算。这种组合此前多出现在不同产品或付费版本中,如今被整合进一个无需订阅的移动端应用中,改变了语音转写工具的使用门槛。
Eloquent目前更像是Google AI Edge体系下的一次展示,其后续形态仍有待观察,例如是否会持续更新、是否扩展到Android并接入系统级输入场景。至少在现阶段,这款应用已经展示出一种更具体的方向,即将语音输入从云端服务转向设备本地能力,并以更低门槛进入日常使用场景。

