用 AI 創作音樂:Suno、Stable Audio & 更多

我第一次用 Suno 產出一首歌的時候笑了。不是因為它不好 — 是因為它真的不錯。我打了「lo-fi 爵士 chill、深夜錄音室氛圍、柔和鋼琴和刷子鼓」,30 秒後我拿到一段兩分鐘的音軌,聽起來像是 Spotify 播放清單裡會出現的東西。

AI 音樂生成已經跨過「新奇」進入「真的有用」的門檻。不管你需要影片的背景音樂、專案的 jingle,或只是想在不用花好幾年訓練的情況下摸摸音樂,工具已經到位、而且能用。

Suno V5:完整套組

Suno 是 AI 音樂的大名字,原因很充分。V5 能從一段文字提示詞產出完整歌曲 — 人聲、樂器、編曲,全部都有。它懂曲風、情緒、節奏與編制,產出相當精緻。

怎麼寫音樂提示詞

從 Suno 拿到好結果的關鍵是曲風的具體度。模糊提示詞產出模糊音樂。具體的曲風標籤會做出聽起來有意圖的音軌。

有效的曲風標籤:

• 「lo-fi 爵士 chill、柔和鋼琴、刷子鼓、黑膠雜訊」
• 「90 年代垃圾搖滾、失真吉他、粗糙人聲、焦躁感」
• 「史詩電影管弦樂、銅管號角、定音鼓、磅礴弦樂」
• 「熱帶 house、鋼鼓、愉快、夏日氛圍、120 BPM」
• 「木吉他民謠敘事曲、指彈吉他、柔和女聲、憂傷」

會產出亂糟糟結果的提示詞:

• 「放鬆的音樂」(太模糊 — 怎麼個放鬆法?爵士?ambient?古典?)
• 「一首快樂的歌」(快樂涵蓋了從泡泡流行到雷鬼的一切)
• 「酷的東西」(對模型來說沒有意義)

The pattern: genre + instruments + mood + tempo. The more specific each element, the better the result. You don’t need to be a musician to write good prompts — you just need to describe what you want to hear in concrete terms.

歌詞:自己寫,或讓 AI 生成

Suno 提供兩種歌詞模式。你可以讓 AI 根據你的提示詞產出歌詞(它在這方面意外地不差),或者自己寫好再貼進去。

如果你要自己寫歌詞,記得這幾件事:

要:自然地寫。Suno 懂主歌/副歌結構、押韻、節奏與音節模式。就像你會怎麼唱那樣寫。

不要:在歌詞裡放場景指示。這是新手最常犯的錯。

警告:Suno 會把所有東西都唱出來。

如果你的歌詞裡寫「[Verse 1]」或「(輕柔地)」或「*吉他獨奏*」,Suno 真的會把那些字唱出來。它不會去解讀格式標示 — 它會把它們發聲。把歌詞保持乾淨:只放你想被唱出來的字,別的都不要。

純演奏模式

要沒有人聲的音樂時,開啟純演奏模式。這對背景配樂、影片配樂、Podcast 片頭、環境音樂都很適合。品質很好 — Suno 在純演奏上的表現,跟帶人聲的完整歌曲一樣好。

每次生成兩個版本

你每次生成,Suno 都會對同一個提示詞產出兩個版本。它們整體風格相同,但旋律、編曲、詮釋不一樣。一定要兩個都聽 — 有時候第二個版本會比第一個好很多。這是每次生成都內建、免費附上的多樣性。

延長音軌

Suno 是以段落方式產出音軌(通常 1-2 分鐘)。如果你要更長的音軌,可以從某段生成片段的結尾開始延長。延長會延續原本的樂思、調性與風格。你就是這樣把一首 3-4 分鐘的完整歌做起來:先產出第一段、延長、再延長。

結果通常沒接縫,不過偶爾延長會改變能量或引入一個風格變化。遇到這種情況,就重新產生那段延長 — 很快。

Stable Audio 2.5:演奏曲專家

Stability AI 的 Stable Audio 2.5 採取不同路線。它只做演奏 — 沒有人聲 — 但在高品質背景音樂與聲音設計上非常出色。

它擅長的地方:氛圍音軌、ambient 聲景、影片背景音樂、遊戲音效、Podcast 墊底音樂。當你需要音樂去襯托其他內容、而不喧賓奪主時,Stable Audio 非常出色。

Suno 勝出的地方:帶人聲的完整歌曲、歌詞詮釋、曲風多樣性。Suno 是通才;Stable Audio 是專才。

把 Stable Audio 想成當音樂要坐在別的東西後面時會選的工具 — 影片、簡報、遊戲。Suno 是當音樂本身就是主角時的工具。

版稅問題

這是大家都會問的問題:AI 產出的音樂能不能拿來商業使用?

答案,截至 2026 年 3 月:可以,但有但書。Suno 和 Stable Audio 在付費方案上都授予商業使用權。你可以把產出的音軌用在 YouTube 影片、Podcast、遊戲、廣告、產品上。你擁有那份產出。

但書是法律上的,不是技術上的。AI 產出內容的著作權法還在演進。沒有法院對 AI 產出音樂的著作權狀態做出決定性判決。實務上,每天都有數千位創作者把 AI 音樂商業使用而沒遇到問題,但如果你是在替大品牌或廣電節目做內容,你可能會想問一下律師。

個人專案、社群媒體、YouTube 影片、獨立遊戲、小商家使用?沒事。用就對了。

真的有幫助的訣竅

對曲風要具體。「lo-fi hip hop,帶有爵士鋼琴和弦、黑膠雜訊、慢速 boom-bap 鼓點」永遠會比「chill beats」產出更好的結果。

指名特定樂器。「木吉他、立式低音提琴、刷子小鼓」給模型清楚的目標。「好聽的樂器」什麼都沒給。

用形容詞設定情緒。「憂鬱」、「勝利」、「詭異」、「俏皮」、「帶侵略性」 — 這些字對模型如何塑造音軌有巨大影響。

有需要就放速度。「120 BPM」或「慢速」或「快節奏」能幫模型對齊你要的能量,對影片同步特別重要。

兩個版本都聽。永遠。版本 1 和版本 2 的差別,可能就是「還好啦」跟「完美」的差別。

沒人提的祕密: AI music generation is at its best when you know what you want but lack the technical ability to produce it. If you can hear the song in your head — the genre, the instruments, the mood — but you can’t play guitar or don’t own a studio, these tools bridge that gap. The people getting the best results aren’t musicians. They’re music listeners who know exactly what they like.

Suno 和 Stable Audio 都在 Zubnet 上按次計費 — 而不是讓你訂閱一個你只偶爾用的音樂平台。需要時產出、按使用付費。