Google Gemini集成Lyria 3:用文字、图片甚至视频生成AI音乐

Google Gemini集成Lyria 3:用文字、图片甚至视频生成AI音乐

在AI内容生成的赛道上,Google Gemini又迈出了新的一步。2026年2月18日,Google Gemini官方宣布推出由DeepMind开发的Lyria 3音乐生成模型,将AI的创造力延伸到了音频领域,让用户可以通过文字、图片甚至视频,轻松生成带有定制歌词的高保真音乐片段。

作为Google DeepMind的又一力作,Lyria 3的登场并不意外。毕竟DeepMind一直站在AI创新的前沿,此前就凭借Gemini 3 Deep Think实现了草图到3D打印文件的转换,还推出了给AI生成内容添加隐形水印的SynthID技术。这一次,Lyria 3将AI的触角伸向了充满争议却又充满乐趣的音乐生成领域。

Lyria 3的使用逻辑十分直观,就像Gemini的图像或视频生成功能一样,它能根据用户的输入内容,生成风格匹配的音乐。目前,用户可以通过三种方式调用这一功能:第一种是纯文本提示,你只需要描述自己想要的音乐风格、主题、情绪,比如“一首关于森林徒步的lo-fi节拍”,Lyria 3就能为你生成一段30秒的音乐片段;第二种是图像或视频驱动,上传一张照片或一段视频,AI会自动分析内容的氛围,创作贴合场景的音乐和歌词,比如上传宠物狗在林间徒步的照片,就能生成专属的主题音乐;第三种则是模板修改,如果你缺乏灵感,还可以选择现有模板,通过提示词对已有曲目进行调整,有点像在Gemini Gems基础上进行二次创作。

值得一提的是,目前Lyria 3生成的音乐时长固定为30秒,这个时长刚好契合社交媒体内容的需求——很多用户都需要为自己的照片、短视频配上合适的背景音。从搞笑的广告短曲到舒缓的lo-fi节拍,无论是日常记录还是创意创作,Lyria 3都能提供适配的音乐内容。

在使用渠道上,Lyria 3已经率先登陆网页版Gemini,用户通过浏览器就能直接体验;在接下来的几天里,这一功能还将逐步向全球范围内的Gemini移动端用户开放。而且和很多AI音乐工具不同,目前使用Lyria 3是完全免费的,这无疑降低了用户的尝试门槛。

不过,AI音乐生成领域并非一片蓝海,Google也不是第一个吃螃蟹的玩家。目前Suno是这一领域的头部玩家,但其也曾因版权问题陷入争议。AI生成音乐的版权归属、是否侵犯原创音乐人权益,一直是行业内的热门话题。Google此次推出Lyria 3,或许也需要在版权合规方面做好准备,毕竟其旗下的SynthID技术已经为AI生成内容的溯源提供了可能,或许未来会将这一技术应用到音乐生成领域,解决版权争议。

对于普通用户来说,Lyria 3的到来无疑是个好消息。它让音乐创作的门槛大幅降低,不再需要专业的乐理知识和昂贵的设备,只要有创意,就能轻松生成自己的专属音乐。对于内容创作者而言,这也为他们提供了一个高效的背景音乐制作工具,节省了寻找版权音乐的时间和成本。

从图像生成到视频创作,再到如今的音乐生成,Gemini正在不断完善自己的多模态能力。Lyria 3的加入,让Gemini的内容生成生态更加完整,也让我们看到了AI在创意领域的更多可能性。未来,或许AI还能在更多艺术领域带来惊喜,让普通人也能轻松实现自己的创意想法。

原创文章,作者:王 浩然,如若转载,请注明出处:https://www.dian8dian.com/google-gemini-ji-cheng-lyria-3-yong-wen-zi-tu-pian-shen-zhi

Like (0)
王 浩然的头像王 浩然作者
Previous 12小时前
Next 2025年11月10日

相关推荐

发表回复

Please Login to Comment