搜索: "语音合成"

共找到 4 篇相关文章

TTS也要真人感！首个字级内容、毫秒级停顿控制的语音合成系统

新智元报道【新智元导读】语音合成这两年发展迅速：把一段话顺顺当当地念完，已经不算难事；难的是该慢的时候慢，该顿的时候顿，该强调的时候真能把重点托出来。语音合成这些年最明显的进展，是越来越会模拟真人输出语音。自然度更高了，声音更像真人了，零样本克隆也越来越成熟了。可一旦要求模型别再只是平着往下读，而是对一句话内部的节奏做有选择的安排，问题就暴露出来了。很多系统能做到整体变快、整体变慢，也能给整段话套

科技2026/5/133 阅读

小米发布OmniVoice跨语种语音合成技术，支持逾600种语言clone模型

小米技术公众号今日宣布，小米AI实验室新一代Kaldi团队推出OmniVoice系统，该系统在中英文场景中的性能已达到顶尖水平，并且在多种语言任务上超越了商用系统的现有表现，成为首个支持数百种语言的语音克隆TTS模型。据官方介绍，OmniVoice的一个显著特点是其简化的设计结构。它仅采用双向Transformer网络直接将文本转换成语音，无需额外处理步骤或复杂的混合架构和层级预测机制。这种设计使

科技2026/5/72 阅读

罗福莉悄然发起突袭

罗福莉在小米的第二个重要项目已经完成。在3月19日，小米推出了面向Agent时代的旗舰基座模型Xiaomi MiMo-V2-Pro，同时发布了全模态基座模型Xiaomi MiMo-V2-Omni和语音合成模型Xiaomi MiMo-V2-TTS。之前，罗福莉的第一个项目成果是去年12月发布的小米MiMo-V2-Flash，这款产品对标的是DeepSeek-V3.2。当时，罗福莉加入小米还不到一个月

科技2026/3/192 阅读

小米确认神秘大模型身份，或与此前DeepSeek V4传闻有关，更有机会免费体验“养龙虾”乐趣！

近日，小米公司发布了其MiMo大模型系列的三项重大更新：旗舰基座模型MiMo-V2-Pro、全模态代理模型MiMo-V2-Omni以及语音合成大模型MiMo-V2-TTS，旨在增强智能体的能力。最近，匿名模型Hunter Alpha和Healer Alpha在API聚合平台OpenRouter的日榜上多次登顶，引发热议。这两个模型实际上是MiMo-V2-Pro和MiMo-V2-Omni的早期测试版

科技2026/3/1925 阅读