A ElevenLabs e a Stability AI lançaram esta semana novos modelos de geração de música com IA, ambos destacando a formação com dados licenciados num contexto de processos de violação de direitos de autor em curso na indústria. A ElevenLabs, empresa polaca de IA de voz avaliada em 11 mil milhões de dólares após uma ronda Série D de 500 milhões de dólares em fevereiro, lançou o Music v2. A Stability AI lançou o Stable Audio 3.0, uma família de quatro modelos com pesos abertos para três variantes que gera faixas até 6 minutos e 20 segundos de duração. Os lançamentos surgem na sequência de processos de 2024 da Recording Industry Association of America contra plataformas de música com IA Suno e Udio, tornando os dados de treino licenciados uma prioridade central para os novos intervenientes no mercado. A ElevenLabs celebrou acordos de licenciamento com Believe, Kobalt e Merlin, enquanto a Stability AI fez parceria com a Warner Music Group e a Universal Music Group. A Suno, atualmente avaliada em 2,45 mil milhões de dólares em novembro de 2025, ultrapassou 300 milhões de dólares em receita anual recorrente e tem sido utilizada por aproximadamente 100 milhões de pessoas, gerando cerca de 7 milhões de músicas por dia.
ElevenLabs Music v2 Features
O Music v2 é o segundo modelo musical da ElevenLabs, chegando cerca de 10 meses após a primeira versão. O modelo consegue mudar de géneros dentro de uma única faixa—da ópera ao heavy metal e vice-versa—mantendo a coerência composicional. Segundo a ElevenLabs, o modelo lida com rap rápido e integra efeitos sonoros não musicais sem que a composição se desagregue.
O modelo inclui funcionalidade de inpainting, permitindo aos utilizadores selecionar e regenerar secções específicas enquanto deixam o resto da faixa intacto. Os utilizadores podem construir músicas secção a secção—introdução, verso, refrão—com o modelo a manter a continuidade ao longo de todo o processo, em vez de tratar cada excerto como uma geração independente. O suporte multilingue melhorou, embora a ElevenLabs não tenha publicado detalhes específicos.
O Music v2 alimenta três plataformas: ElevenMusic para criadores, ElevenAPI para programadores e ElevenCreative para marcas. O modelo está ativo no ElevenMusic e no ElevenCreative agora. O acesso via API está disponível através de entrada antecipada com o apoio da equipa de vendas.
Pricing Adjustments
A ElevenLabs reduziu os preços do Music v1 e v2 em até 50% para o ElevenAPI e em até 40% para o ElevenCreative self-serve. A empresa atingiu 500 milhões de dólares em receita anual recorrente em abril de 2026. O ElevenMusic foi lançado como aplicação para consumidores em abril.
Stability AI Stable Audio 3.0 Technical Specifications
O Stable Audio 3.0 inclui quatro modelos: Small SFX (efeitos sonoros no dispositivo), Small (composição musical completa no dispositivo), Medium (até 6:20, requer hardware mais robusto) e Large (apenas API). Três dos quatro modelos têm pesos abertos disponíveis no Hugging Face. A versão anterior, Stable Audio 2.0, gerava faixas até três minutos de duração.
Os modelos Small funcionam com 459 milhões de parâmetros cada, sem exigir GPU. O Medium opera com 1,4 mil milhões de parâmetros e gera a sua saída de 6:20 em aproximadamente 1,31 segundos numa GPU H200. O Large funciona com 2,7 mil milhões de parâmetros e é apenas API para organizações com mais de 1 milhão de dólares em receita. Os modelos suportam granularidade de geração por segundo, produzindo faixas exatamente com o comprimento solicitado.
A arquitetura usa um autoencoder semântico-acústico que a Stability designa SAME, concebido para manter a coerência melódica em saídas mais longas. O fine-tuning com LoRA é suportado, permitindo que artistas adaptem os modelos aos seus próprios catálogos. A funcionalidade de inpainting inclui continuação de segmento único, multi-segmento e causal para estender faixas para além do seu endpoint original. Os modelos têm suporte no ComfyUI para configurações locais.
Market Context and Legal Settlements
A Suno atingiu uma avaliação de 2,45 mil milhões de dólares em novembro de 2025 e ultrapassou 300 milhões de dólares em receita anual recorrente. A Warner Music resolveu o seu processo contra a Suno em novembro de 2025. A Sony e a Universal Music Group continuam em processos no tribunal federal com a Suno.
A Udio chegou a acordo com todas as três principais editoras e opera como um jardim vedado—o conteúdo gerado na plataforma não pode ser exportado.
Availability
Os modelos Stable Audio 3.0 Small e Medium estão disponíveis no Hugging Face. O Large está ativo via a API da Stability AI. O Music v2 é gratuito para utilizadores do ElevenMusic, com escalões comerciais disponíveis através do ElevenCreative e do ElevenAPI.