ElevenLabs y Stability AI lanzan nuevos modelos de música con IA con datos con licencia

ElevenLabs y Stability AI lanzaron esta semana nuevos modelos de generación de música con IA, ambos destacando datos de entrenamiento con licencia en medio de una demanda legal vigente por derechos de autor en la industria. ElevenLabs, la empresa de IA de voz fundada en Polonia, valorada en 11.000 millones de dólares tras una ronda Serie D de 500 millones de dólares en febrero, lanzó Music v2. Stability AI lanzó Stable Audio 3.0, una familia de cuatro modelos con pesos abiertos para tres variantes que genera pistas de hasta seis minutos y veinte segundos de duración. Los lanzamientos se producen después de demandas por derechos de autor de la Recording Industry Association of America en 2024 contra plataformas de música con IA Suno y Udio, convirtiendo los datos de entrenamiento con licencia en un foco central para los nuevos participantes del mercado. ElevenLabs estableció acuerdos de licenciamiento con Believe, Kobalt y Merlin, mientras que Stability AI se asoció con Warner Music Group y Universal Music Group. Suno, valorada actualmente en 2.450 millones de dólares a noviembre de 2025, superó los 300 millones de dólares en ingresos recurrentes anuales y se ha utilizado por aproximadamente 100 millones de personas, generando alrededor de 7 millones de canciones por día.

ElevenLabs Music v2 Features

Music v2 es el segundo modelo de música de ElevenLabs, llegando aproximadamente 10 meses después de la primera versión. El modelo puede cambiar géneros dentro de una sola pista—de ópera a heavy metal y de vuelta—manteniendo la coherencia compositiva. Según ElevenLabs, el modelo maneja rap rápido e incrusta efectos de sonido no musicales sin que la composición se descomponga.

El modelo incluye funcionalidad de inpainting, lo que permite a los usuarios seleccionar y regenerar secciones específicas mientras dejan el resto de la pista intacto. Los usuarios pueden construir canciones sección por sección—intro, verso, estribillo—con el modelo manteniendo la continuidad en todo momento en lugar de tratar cada clip como una generación independiente. El soporte multilingüe ha mejorado, aunque ElevenLabs no publicó detalles específicos.

Music v2 impulsa tres plataformas: ElevenMusic para creadores, ElevenAPI para desarrolladores y ElevenCreative para marcas. El modelo ya está en vivo en ElevenMusic y ElevenCreative. El acceso a la API está disponible mediante entrada temprana a través del equipo de ventas.

Pricing Adjustments

ElevenLabs redujo el precio de Music v1 y v2 hasta en un 50% para ElevenAPI y hasta en un 40% para ElevenCreative auto-serve. La empresa alcanzó 500 millones de dólares en ingresos recurrentes anuales en abril de 2026. ElevenMusic se lanzó como una app de consumo en abril.

Stability AI Stable Audio 3.0 Technical Specifications

Stable Audio 3.0 incluye cuatro modelos: Small SFX (efectos de sonido en el dispositivo), Small (composición musical completa en el dispositivo), Medium (hasta 6:20, se requiere hardware más fuerte) y Large (solo API). Tres de los cuatro modelos tienen pesos abiertos disponibles en Hugging Face. La versión anterior, Stable Audio 2.0, generaba pistas de hasta tres minutos de duración.

Los modelos Small se ejecutan con 459 millones de parámetros cada uno sin requerir una GPU. Medium opera con 1,4 billones de parámetros y genera su salida de 6:20 en aproximadamente 1,31 segundos en una GPU H200. Large se ejecuta con 2,7 billones de parámetros y es solo API para organizaciones con más de 1 millón de dólares en ingresos. Los modelos admiten granularidad de generación por segundo, produciendo pistas con la longitud exacta solicitada.

La arquitectura usa un autoencoder semántico-acústico que Stability llama SAME, diseñado para mantener la coherencia melódica en salidas más largas. Se admite fine-tuning con LoRA, permitiendo a los artistas adaptar los modelos a sus propios catálogos. La funcionalidad de inpainting incluye continuación causal de un solo segmento, multisegmento y causal para extender pistas más allá de su punto final original. Los modelos se soportan en ComfyUI para configuraciones locales.

Market Context and Legal Settlements

Suno alcanzó una valoración de 2.450 millones de dólares en noviembre de 2025 y superó los 300 millones de dólares en ingresos recurrentes anuales. Warner Music resolvió su demanda contra Suno en noviembre de 2025. Sony y Universal Music Group siguen en procedimientos en un tribunal federal con Suno.

Udio llegó a acuerdos con los tres tres grandes sellos discográficos y opera como un jardín amurallado—el contenido generado en la plataforma no puede exportarse.

Availability

Los modelos Small y Medium de Stable Audio 3.0 están disponibles en Hugging Face. Large está disponible a través de la API de Stability AI. Music v2 es gratis para usuarios de ElevenMusic, con planes comerciales disponibles a través de ElevenCreative y ElevenAPI.

Aviso legal: La información en esta página puede provenir de fuentes de terceros y es solo para referencia. No representa las opiniones ni puntos de vista de Gate y no constituye asesoramiento financiero, de inversión ni legal. El comercio de activos virtuales implica un alto riesgo. No te bases únicamente en la información presentada en esta página para tomar decisiones. Para más detalles, consulta el Aviso legal.
Comentar
0/400
Sin comentarios