谷歌Gemini上線AI音樂創作,一夜革了Suno的命!

市場資訊
02/19

炒股就看金麒麟分析師研報,權威,專業,及時,全面,助您挖掘潛力主題機會!

(來源:新智元)

新智元報道

編輯:艾倫

【新智元導讀】谷歌在 7.5 億月活的 Gemini 中上線了 AI 音樂生成功能,輸入一句話或一張照片,幾秒就能得到一首帶人聲和歌詞的完整歌曲。背後是 DeepMind 最新的 Lyria 3 模型,訓練數據超 200 萬首曲目。對 Suno 等 AI 音樂創業公司而言,競爭從此不再只是比模型,更是要比入口。

昨天,谷歌在 Gemini App 中上線了 AI 音樂生成功能。

用戶輸入一段文字描述,或者上傳一張照片,幾秒鐘內就能得到一首 30 秒的完整歌曲,帶人聲、帶歌詞、帶 AI 生成的封面。純器樂當然也是支持的。

驅動這個功能的是 DeepMind 最新的音樂生成模型 Lyria 3。

谷歌對這項功能的定位,不是取代音樂人,而是讓普通人獲得一種全新的自我表達方式。

做 AI 音樂生成的公司不少,但把它直接塞進一個擁有超過 7.5 億月活用戶的超級應用裏,谷歌是頭一個。

「30 秒」背後的技術躍遷

從 2023 年發布初代 Lyria 算起,這已經是谷歌在音樂生成領域的第三代模型。

相比前代,Lyria 3 有幾個明顯的進步。

過去用戶需要自己寫歌詞輸入模型,現在 Lyria 3 可以根據提示詞自動生成歌詞。

用戶對風格、人聲類型、節拍速度等元素的控制也更精細了。

根據 DeepMind 官方推文,Lyria 3 輸出 48kHz 立體聲音頻,人聲表現更自然,歌詞的咬字清晰度也有了明顯提升。

據數字音樂媒體 Digital Music News 報道,Lyria 3 的訓練數據規模從 Lyria 2 的約 50 萬首曲目擴展到了超過 200 萬首,音頻位深從此前版本升級到了 24-bit。

這意味着它在音質維度上甚至超過了 YouTube Music 等主流流媒體平台的標準。

除了文本生成音樂,用戶還可以上傳照片或視頻,讓 Gemini 根據視覺內容的情緒來作曲配詞。

比如上傳一張徒步的照片,Gemini 就能創作一首與之匹配的歌曲。

封面則由谷歌的圖像生成模型 Nano Banana 自動完成。

功能目前以 Beta 形式向全球 18 歲以上用戶開放,支持英語、德語、西班牙語、法語、印地語、日語、韓語和葡萄牙語,桌面端已率先上線,移動端將在未來幾天內陸續推送。

谷歌 AI Plus、Pro 和 Ultra 訂閱用戶將享有更高的使用額度。

與此同時,Lyria 3 也被整合進了 YouTube 的 Dream Track 功能,幫助創作者為 Shorts 短視頻生成背景音樂。這項功能此前僅限美國地區,此次正式面向全球創作者開放。

版權這張牌

谷歌打得很小心

AI 音樂生成領域的版權糾紛從未停歇。

2024 年夏天,環球音樂、索尼音樂和華納音樂聯手對 AI 音樂初創公司 Suno 和 Udio 提起了總金額達 5 億美元的版權侵權訴訟。

到 2025 年底,Suno 與華納達成和解並獲得授權,Udio 也分別與環球和華納簽署了協議。

整個行業正在從對抗走向合作,但緊張關係遠未消散。

在這個背景下,谷歌的措辭格外謹慎。

官方公告強調 Lyria 3 的設計目標是「原創表達,而非模仿現有藝術家」。

如果用戶在提示詞中提到某位具體藝術家的名字,Gemini 只會將其作為寬泛的創作靈感,生成風格或情緒相似的作品,而非模仿該藝術家的聲音。

谷歌還表示在訓練過程中「非常注意版權和合作伙伴協議」,並設定了過濾器來比對輸出內容與已有作品。

在內容標識層面,所有通過 Gemini 生成的音樂都會嵌入 SynthID 水印。

更值得關注的是,Gemini 現在還新增了音頻鑑別功能——用戶可以上傳一段音頻文件,詢問它是否由谷歌AI 生成,Gemini 會檢測 SynthID 標記並結合自身推理給出判斷。

這是繼圖片和視頻鑑別之後,SynthID 覆蓋的第三種媒體類型。

當音樂生成變成一場平台戰爭

如果說 Suno 和 Udio 代表了 AI 音樂的創業浪潮,谷歌此舉則標誌着這場競賽正式升級為平台級別的角力。

Suno 在 2024 年 11 月完成了 2.5 億美元孖展,其付費版本已經提供了虛擬音頻工作站等專業編輯功能。

但 Suno 的月活用戶量級與 Gemini 的 7.5 億相比,根本不在同一個數量級。

Tom's Guide 的編輯在體驗後寫道,她把丈夫的待辦事項清單變成了一首朋克搖滾歌曲,然後通過短信發了出去。

這種場景可能正是谷歌想要的:音樂生成的殺手級應用也許並不在錄音棚裏,而是藏在日常生活的每一條消息、每一次分享中。

30 秒的長度限制、Beta 階段的粗糙感、版權爭議的暗湧——Lyria 3 顯然還遠談不上完美。

但谷歌選擇在這個時間點把它推向 7.5 億用戶面前,傳遞的信號已經足夠清晰:AI 音樂生成這件事,它不打算再等了。

當每個人的口袋裏都裝着一個作曲家的時候,改變的或許不是音樂本身,而是我們與音樂之間的關係。

參考資料:

https://blog.google/innovation-and-ai/products/gemini-app/lyria-3/

https://x.com/GoogleDeepMind/status/2024153067654902014

免責聲明:投資有風險,本文並非投資建議,以上內容不應被視為任何金融產品的購買或出售要約、建議或邀請,作者或其他用戶的任何相關討論、評論或帖子也不應被視為此類內容。本文僅供一般參考,不考慮您的個人投資目標、財務狀況或需求。TTM對信息的準確性和完整性不承擔任何責任或保證,投資者應自行研究並在投資前尋求專業建議。

熱議股票

  1. 1
     
     
     
     
  2. 2
     
     
     
     
  3. 3
     
     
     
     
  4. 4
     
     
     
     
  5. 5
     
     
     
     
  6. 6
     
     
     
     
  7. 7
     
     
     
     
  8. 8
     
     
     
     
  9. 9
     
     
     
     
  10. 10