周三 (2 月 18 日) 美股盘中,谷歌在官网博客中宣布,Gemini 应用已配备公司最先进的音乐生成模型 Lyria 3,用户可使用文本或图像制作 30 秒的音乐片段。
新闻稿称,「只需描述一个想法或上传一张照片,Gemini 就能在几秒钟内将其转化为一首高质量、朗朗上口的歌曲。为了进一步拓展创意空间,您甚至可以让 Gemini 从上传的内容中汲取灵感。」
根据谷歌的说法,Gemini 不仅可以 「文字转歌曲」,还可以通过 「上传照片或视频」 创作一首完美契合氛围的歌曲,歌曲长为 30 秒,并配有 Nano Banana 设计的自定义封面。
另外,创作者还可以通过 YouTube 的 Dream Track 功能探索 Lyria 3,以提升 Shorts 短视频配乐的品质。谷歌称,Lyria 3 已在美国推出,并正在逐步推广至其他地区的创作者。
谷歌提到,Lyria 的音频生成功能采用了公司最新的隐私和安全特性,所有生成的曲目都使用 SynthID 技术添加了不易察觉的水印,可以检测音乐是否由人工智能创作或编辑。
消息公布后,欧美主流流媒体音乐服务平台 Spotify(股票代码:SPOT) 股价回吐了日内近 5% 的涨幅,Sirius XM(股票代码:SIRI) 也一度转跌。

有分析表示,虽然谷歌的音乐生成模型预计不会成为 Spotify 的致命打击,但这些举措可能迫使后者尽快推出 AI 混音功能。
另外,把音频创作工具加入移动应用,有望增强谷歌的消费者产品竞争力。对于谷歌来说,公司需要持续向投资者证明其 AI 产品投入能够带来收入增长。
生成式 AI 工具在音乐行业一直受到谨慎甚至敌视的对待,许多从业者认为其可能威胁商业模式和知识产权。
谷歌在博客中强调,其系统设有保护措施,禁止 AI 直接挪用特定艺术家的作品。如果用户点名真实音乐人,Gemini 只会将其视为 「广泛的创作灵感来源」,生成风格或氛围与之相似的曲目。
(财联社)
文章转载自 东方财富






