近日,谷歌在其DeepMind团队的努力下,推出了一款名为Lyria 3 Pro的AI音乐生成模型,该模型在3月25日的发布会上正式亮相。
Lyria 3 Pro是继上个月发布的Lyria 3之后的升级版,最大的改进在于它能够生成长达3分钟的音乐,比之前的30秒有了显著的提升。此外,该模型还能够理解音乐结构,让用户通过提示词指定不同的音乐部分,如前奏、主歌、副歌等,实现对完整歌曲的精细控制。
除了模型本身的进步,谷歌还将其集成到了Vertex AI、Google AI Studio、Gemini API、Google Vids、Gemini应用和ProducerAI等多个平台中,涵盖了从企业级开发到个人创作的全链路场景。

谷歌已经宣布了这款新模型Lyria 3 Pro的上线。
智东西团队在谷歌的ProducerAI平台上测试了Lyria 3 Pro,生成了几首歌曲。
我们首先上传了一张前往海边旅行时拍摄的照片,让Lyria 3 Pro根据这张照片生成音乐。

从这张照片生成的音乐展现了模型对图像的理解能力,它迅速捕捉到了照片中的海鸥元素,并在不到一分钟内生成了一首完整的歌曲。整首歌曲采用电吉他作为主旋律,并加入了海鸥的叫声和浪花的背景噪音,同时用沙锤打节奏。整首音乐的音质清晰、流畅,具有很强的节奏感和层次感,让人感受到一种自由的感觉。
接着,我们让Lyria 3 Pro创作了一首古风歌曲,提示词是这样的:“请创作一首抒情的国风中文歌曲,采用中低音女声,伴奏可以包含笛子、古筝或琵琶,演唱要有情感。”
生成的音乐中,可以明显听到笛子的声音,歌曲的主歌和副歌部分也交代得非常清楚,显示出模型对提示词的理解能力。
就歌词而言,虽然它们的质量一般,不太押韵,但整体来说,音乐的品质还是相当不错的。Lyria 3 Pro在生成音乐时,能够清晰地理解歌曲的结构,并且能够根据提示词创作出带有情感的音乐。
实际上,Lyria 3 Pro已经开始具备生成成熟作品的能力。因此,谷歌这次发布的重点不仅在于“模型更强了”,还在于迅速将这项能力接入多个产品入口,使开发者、企业用户和普通创作者都能直接使用。
一、谷歌通过五个平台,覆盖了从开发者到普通用户的整个链条。
在谷歌云的Vertex AI平台上,Lyria 3 Pro已经开放了公开预览,面向那些需要大规模按需生成音频的用户。用户可以将其用于游戏配乐的批量生成、创意工具的集成、音乐和视频平台的嵌入等场景。
同时,面向开发者的Google AI Studio和Gemini API也同步上线了Lyria 3 Pro,与之前的Lyria RealTime并列提供,开发者可以将其集成到自己的应用中。

在消费者端,Google Vids和Gemini应用也已经向Google Workspace企业客户和Google AI Pro及Ultra付费订阅用户开放了Lyria 3和Lyria 3 Pro,用户可以为营销视频、创意项目等添加定制配乐。
此外,谷歌的协作式音乐创作工具ProducerAI也已经升级到了Lyria 3 Pro版本,该工具面向全球免费和付费用户开放。
二、音乐行业的共创:格莱美制作人率先使用Lyria 3系列
谷歌强调了Lyria 3开发过程中与音乐行业紧密合作的重要性。通过Music AI Sandbox项目,谷歌为音乐人、制作人和词曲作者提供了一套实验性工具,这些合作反馈对Lyria 3的研发产生了深远的影响。
在实际应用中,格莱美获奖制作人扬·斯皮尔伯格已经将Lyria 3用于谷歌DeepMind短片《Dear Upstairs Neighbors》的配乐创作过程。
著名DJ兼制作人弗朗索瓦·K也在使用Lyria 3进行迭代创作,其作品即将发布。弗朗索瓦·K表示:“在探索了许多音乐工具后,Lyria 3的进步令人震惊,其保真度和音乐性很强。我使用生成式AI工具的方式从来不是‘一键生成’,而是将其作为武器库中的多功能组件,帮助我以更高的真实感和精确度打磨创意。”

三、版权责任:避免模仿艺人风格,所有输出均嵌入隐形水印
在版权责任方面,谷歌为Lyria 3设置了多重防护。训练数据方面,Lyria 3使用的是YouTube和谷歌依据服务条款、合作协议及适用法律有权使用的素材。在艺人保护方面,Lyria 3和Gemini不会模仿特定艺术家的风格,当用户在提示词中输入某位创作者的名字时,模型只会将其作为宽泛的灵感方向,而不是进行风格复制。
此外,系统还会对生成内容进行比对过滤,以防止输出与已有作品高度相似的内容。所有Lyria 3和Lyria 3 Pro生成的音频都嵌入了SynthID隐形水印,以标识AI生成内容。

结语:从“生成”到“商用”,AI音乐的竞争才刚刚开始
Lyria 3 Pro将AI生成音乐的时长从30秒提升至3分钟,标志着AI音乐从Demo走向了完整作品。此前,Suno、Udio等AI音乐创企已经通过社区传播获得了可观的用户规模,但它们面临的共同问题是:生成质量的天花板受限于模型能力。
当AI能够批量生成游戏配乐、广告音乐和短视频BGM时,首先受到冲击的是版权音乐库市场。Epidemic Sound、Artlist等平台赖以生存的“海量标准化配乐”,正是AI最容易替代的品类。格莱美制作人率先采用AI,也释放了一个信号:专业音乐人不再把AI视作“竞争对手”,而是用作生产工具,音乐行业的创作流程正在被重塑。当然,版权归属、风格模仿的法律边界,以及AI生成内容对原创生态的挤压,仍是悬在整个赛道上方的达摩克里斯之剑。
然而,我们可以看到,AI音乐的竞争已经不再是“能不能生成”的问题,而是“谁能率先进入真实的商业场景”。从这个意义上说,这场比赛才刚刚开始。

▲谷歌DeepMind短片《Dear Upstairs Neighbors》海报(图源:谷歌)
知名DJ兼制作人弗朗索瓦·K(François K)也在使用Lyria进行迭代创作,其作品即将发布。弗朗索瓦·K在评价中表示:“在探索了大量音乐工具之后,Lyria 3的进步令人震惊,其保真度和音乐性强。我使用生成式AI工具的方式从来不是‘一键生成’,而是将它作为武器库中的多功能组件,让我以更高的真实感和精确度打磨创意。”
三、责任机制:不模仿艺人风格,全部输出嵌入隐形水印
在版权责任方面,谷歌为Lyria 3设置了多重防护。训练数据方面,Lyria 3使用的是YouTube和谷歌依据服务条款、合作协议及适用法律有权使用的素材。艺人保护上,Lyria 3和Gemini不会模仿特定艺术家的风格,当用户在提示词中输入某位创作者的名字时,模型只会将其作为宽泛的灵感方向,而非进行风格复制。
此外,系统还会对生成内容进行比对过滤,防止输出与已有作品高度相似。所有Lyria 3和Lyria 3 Pro生成的音频都嵌入了SynthID隐形水印,用于标识AI生成内容。
结语:从“能生成”到“能商用”,AI音乐的真正赛点才刚到来
Lyria 3 Pro将AI生成音乐的时长从30秒推至3分钟,AI音乐已经从Demo走向完整作品。此前,Suno、Udio等AI音乐创企已凭借社区传播跑出了可观的用户规模,但它们面临的共同问题是:生成质量的天花板受限于模型能力。
当AI能够批量生成游戏配乐、广告音乐和短视频BGM时,首先受到冲击的是版权音乐库市场。Epidemic Sound、Artlist等平台赖以生存的“海量标准化配乐”,正是AI最容易替代的品类。格莱美制作人率先采用AI,也释放了另一个信号:专业音乐人不再把AI视作“竞争对手”,而是用作生产工具,音乐行业的创作流程正在被重塑。当然,版权归属、风格模仿的法律边界、以及AI生成内容对原创生态的挤压,仍是悬在整个赛道上方的达摩克里斯之剑。
不过,我们可以发现,AI音乐的竞争已经不再是“能不能生成”的问题,而是“谁能率先进入真实的商业场景”。从这个意义上说,这场比赛才刚刚开始。
