ElevenLabs と Stability AI が、ライセンスされたデータを使った新しい AI 音楽モデルを発表

今週、ElevenLabs と Stability AI は新しい AI 音楽生成モデルをリリースし、業界で進行中の著作権訴訟を背景に、いずれもライセンスされた学習データを強調している。ElevenLabs はポーランド発の音声 AI 企業で、2 月の 500 million ドルの Series D の後、評価額が 110 億ドルとなった。Stability AI は Stable Audio 3.0 を公開した。3 つのバリアントに対してオープンウェイトを備えた4モデルのファミリーで、生成できるのは最大 6 分 20 秒までの楽曲だ。これらのリリースは、米国レコーディング産業協会(RIAA)が 2024 年に AI 音楽プラットフォーム Suno と Udio に対して起こした著作権訴訟に続くもので、新規参入企業にとってライセンスされた学習データが主要な関心となっている。ElevenLabs は Believe、Kobalt、Merlin とライセンス契約を結び、Stability AI は Warner Music Group と Universal Music Group と提携した。Suno は 2025 年 11 月時点で 24.5 億ドルの評価額で、年次経常収益は 3 億ドルを突破しており、約 1 億人に利用されていて、1 日あたり約 700 万曲を生成している。

ElevenLabs Music v2 の特徴

Music v2 は ElevenLabs の2つ目の音楽モデルで、最初のバージョンからおよそ 10 か月後に登場した。このモデルは、1 つのトラック内でジャンルを切り替え(オペラからヘヴィメタルへ、そして戻ることも可能)、そのまま作曲の一貫性を保つことができる。ElevenLabs によれば、このモデルは高速ラップを扱い、作曲が崩れない形で非音楽的な効果音を埋め込めるという。

このモデルにはインペインティング機能が含まれており、ユーザーは特定のセクションを選んで再生成しつつ、トラックの残りはそのままにできる。ユーザーは曲をセクションごとに組み立てられる――イントロ、ヴァース、コーラス――そしてモデルは各クリップを単体の生成物として扱うのではなく、全体を通して継続性を維持する。多言語サポートも改善されたが、ElevenLabs は具体的な詳細は公開していない。

Music v2 は3つのプラットフォームを動かす。クリエイター向けの ElevenMusic、開発者向けの ElevenAPI、そしてブランド向けの ElevenCreative。モデルは現在、ElevenMusic と ElevenCreative 上で稼働している。API アクセスは販売チームを通じた早期参入で利用可能だ。

価格の調整

ElevenLabs は ElevenAPI 向けおよび ElevenCreative のセルフサーブで、それぞれ Music v1 と v2 の価格を最大 50% と最大 40% 下げた。同社は 2026 年 4 月に年次経常収益で 5 億ドルに到達した。ElevenMusic は 4 月に消費者向けアプリとしてローンチされた。

Stability AI Stable Audio 3.0 の技術仕様

Stable Audio 3.0 は4つのモデルを搭載している。Small SFX(オンデバイスの効果音)、Small(オンデバイスでのフル音楽作曲)、Medium(最大 6:20、より強力なハードウェアが必要)、Large(API のみ)。4つのうち3つのモデルは Hugging Face でオープンウェイトとして提供されている。前バージョンの Stable Audio 2.0 は、生成できる楽曲が最大 3 分までだった。

Small モデルは各 459 million パラメータで、GPU を必要としない。Medium は 14 億パラメータで動作し、H200 GPU 上で約 1.31 秒で 6:20 の出力を生成する。Large は 27 億パラメータで、売上が 100 万ドルを超える組織向けに API のみ提供される。各秒単位の生成のきめ細かさに対応しており、指定された正確な長さでトラックを作成できる。

アーキテクチャは、Stability が SAME(semantic-acoustic autoencoder)と呼ぶセマンティック-音響オートエンコーダを使用しており、より長い出力にわたってメロディの一貫性を保つよう設計されている。LoRA によるファインチューニングに対応しており、アーティストが自身のカタログに合わせてモデルを適応させられる。インペインティング機能には、単一セグメント、多セグメント、そして因果(causal)継続が含まれており、元の終了点を超えてトラックを延長できる。モデルはローカル環境向けに ComfyUI でサポートされている。

市場の状況と法的和解

Suno は 2025 年 11 月に 24.5 億ドルの評価額に到達し、年次経常収益で 3 億ドルを突破した。Warner Music は 2025 年 11 月に Suno に対する訴訟を和解で解決した。Sony と Universal Music Group は Suno とともに連邦裁判所での手続が続いている。

Udio は3つの主要レーベルすべてと和解し、「囲い込み」の環境として運営している――つまり、プラットフォーム上で生成されたコンテンツはエクスポートできない。

提供状況

Stable Audio 3.0 の Small と Medium は Hugging Face で利用可能。Large は Stability AI API 経由で稼働している。Music v2 は ElevenMusic ユーザーには無料で、商用プランは ElevenCreative と ElevenAPI 経由で提供されている。

免責事項:本ページの情報には第三者提供の内容が含まれる場合があり、参考目的のみで提供されています。これらはGateの見解や意見を示すものではなく、金融、投資、または法律上の助言を構成するものでもありません。暗号資産取引には高いリスクが伴います。意思決定を行う際には、本ページの情報のみに依存しないでください。詳細については、免責事項をご確認ください。
コメント
0/400
コメントなし