搜索: "语音转录"

共找到 3 篇相关文章

AI语音模型全面开启：实时聆听与行动，智能化交互新时代来临

在美国当地时间周四，OpenAI向开发者发布了三款新的音频模型，以显著提升语音智能体的交互效果，并使其实现直接执行任务的功能。新版API的开放标志着OpenAI正从传统的“语音转录”和“文本聊天”阶段迈向构建具有实时监听、翻译及执行能力的先进智能体的新阶段。此次推出的三款核心模型包括GPT-Realtime-2、GPT-Realtime-Translate以及GPT-Realtime-Whisp

科技2026/5/84 阅读

近日，谷歌在iOS App Store悄然上线了一款名为Google AI Edge Eloquent的语音听写应用，该软件提供免费且不限制使用的功能，并采用了本地化的Gemma ASR模型进行语音识别和文本整理。在保障隐私的同时，这款应用程序还支持切换至云端使用Gemini模型来改善文本质量。此外，Eloquent引入了个性化词汇机制，可以根据用户的常用表达建立专属词典以提高识别准确度。据报道，

科技2026/4/810 阅读

微软推出自主研发AI工具包至2027年力图构建顶级智能模型

美国科技巨头微软于4月3日宣布，推出三款自主研发的AI模型供广泛商业使用，此举旨在减少对长期伙伴OpenAI的依赖。这些新推出的模型包括MAI-Transcribe-1、MAI-Voice-1和MAI-Image-2。它们分别专注于语音转录、语音生成以及图像创建这三个在企业级应用中具有高商业价值的功能领域。微软首席执行官纳德拉对外宣布了这一更新。公司强调，MAI-Transcribe-1是市面上最

科技2026/4/33 阅读

搜索: "语音转录"

AI语音模型全面开启：实时聆听与行动，智能化交互新时代来临

谷歌推出免费无限使用的AI语音转录工具

微软推出自主研发AI工具包 至2027年力图构建顶级智能模型

微软推出自主研发AI工具包至2027年力图构建顶级智能模型