
StepAudio 2.5面世:全新TTS技术实现零样本音色克隆
近日,阶跃公司发布了其最新一代的语音生成技术——StepAudio 2.5 TTS。这款模型在全局语境调控、文中语境调整以及零样本复制和全音色控制方面取得了显著进展。全局语境调控功能允许用户设定整段音频的情感基调、角色状态及场景氛围,而文中语境调节则可以针对语气、节奏、停顿等细节进行更细致的操控。此外,该技术还能在保持目标声音特征的前提下,灵活改变情感表达和风格。阶跃强调,这款StepAudio
科技1 阅读
共找到 1 篇相关文章

近日,阶跃公司发布了其最新一代的语音生成技术——StepAudio 2.5 TTS。这款模型在全局语境调控、文中语境调整以及零样本复制和全音色控制方面取得了显著进展。全局语境调控功能允许用户设定整段音频的情感基调、角色状态及场景氛围,而文中语境调节则可以针对语气、节奏、停顿等细节进行更细致的操控。此外,该技术还能在保持目标声音特征的前提下,灵活改变情感表达和风格。阶跃强调,这款StepAudio