搜索: "语音生成"

共找到 3 篇相关文章

StepAudio 2.5面世：全新TTS技术实现零样本音色克隆

近日，阶跃公司发布了其最新一代的语音生成技术——StepAudio 2.5 TTS。这款模型在全局语境调控、文中语境调整以及零样本复制和全音色控制方面取得了显著进展。全局语境调控功能允许用户设定整段音频的情感基调、角色状态及场景氛围，而文中语境调节则可以针对语气、节奏、停顿等细节进行更细致的操控。此外，该技术还能在保持目标声音特征的前提下，灵活改变情感表达和风格。阶跃强调，这款StepAudio

科技2026/4/164 阅读

微软推出自主研发AI工具包至2027年力图构建顶级智能模型

美国科技巨头微软于4月3日宣布，推出三款自主研发的AI模型供广泛商业使用，此举旨在减少对长期伙伴OpenAI的依赖。这些新推出的模型包括MAI-Transcribe-1、MAI-Voice-1和MAI-Image-2。它们分别专注于语音转录、语音生成以及图像创建这三个在企业级应用中具有高商业价值的功能领域。微软首席执行官纳德拉对外宣布了这一更新。公司强调，MAI-Transcribe-1是市面上最

科技2026/4/33 阅读

千问上线Qwen3.5-Omni 具备全模态感知与生成能力

凤凰网科技讯 3月30日，千问宣布上线Qwen3.5-Omni。Qwen3.5-Omni系列包含Plus、Flash、Light三种尺寸的Instruct版本，支持256k长上下文，模型支持超过10小时的音频输入及超过 400 秒的720P（1 FPS）音视频输入。Qwen3.5-Omni能够支持113种语种和方言的语音识别和36种语种和方言的语音生成，目前可通过Offline API和Real

科技2026/3/303 阅读

搜索: "语音生成"

StepAudio 2.5面世：全新TTS技术实现零样本音色克隆

微软推出自主研发AI工具包 至2027年力图构建顶级智能模型

千问上线Qwen3.5-Omni 具备全模态感知与生成能力

微软推出自主研发AI工具包至2027年力图构建顶级智能模型