¡El suministro de capacidad de cómputo es tan escaso que hasta da pena! WSJ: el alquiler de Blackwell sube 48% en dos meses; Anthropic va tan lento que las empresas se van saltando del barco.

《The Wall Street Journal》最新调查披露,AI 产业算力供给危机已全面引爆,Blackwell GPU 现货租金在两个月内从每小时 $2.75 美元狂飙至 $4.08 美元,涨幅 48%;Anthropic 的 Claude API 在 90 天内的正常执行率仅 98.95%,远低于企业级标准 99.99%,这已导致 Retool 等企业客户跳槽转向 OpenAI。
(前情提要:大卖空麦可贝瑞放话:Palantir只是低毛利 SaaS 外包公司!Anthropic 正在吃掉它)
(背景补充:Claude 用量翻倍送!Anthropic 推限时优惠,台湾用户几乎全天受惠)

本文目录

Toggle

  • Anthropic 是最惨的一家
  • OpenAI 到处找算力,只好关 Sora
  • CoreWeave 要找大客户签下天文数字,一边逼退中小客户

En todo el mundo, la capacidad de cómputo ya se ha agotado; incluyendo que el alquiler spot de Blackwell GPU subió 48% en dos meses, y también la gente que mira que la pantalla de Claude Code se queda en thinking…; todos están muy escasos.

El índice de precios de cómputo de Ornn(Ornn Compute Price Index,OCPI)se ha incorporado recientemente al Bloomberg Terminal(Terminal Bloomberg); ahora los inversores institucionales pueden, como si siguieran el precio del petróleo, ver directamente la evolución en tiempo real del alquiler spot de GPU.

El factor central que impulsa esta escalada de precios es la explosión de la demanda de Agentic AI(IA agente);la IA ya no es solo una función de preguntas y respuestas para la interfaz web delantera, sino que necesita tareas autónomas que duren mucho tiempo y operen de forma continua; el apetito por cómputo está en un nivel totalmente distinto. Mientras la oferta de cómputo aún no sube, la demanda explota primero.

El CEO de Vultr, J.J. Kardwell, lo dijo sin rodeos: «Esta es la escasez de cómputo más grave que he visto en más de cinco años gestionando esta empresa. Los ciclos de construcción de centros de datos son demasiado largos y toda la electricidad disponible para 2026 ya está reservada». Ojo: él habló de «electricidad», no de «chips».

El cuello de botella del cómputo en 2026 ya no está en las líneas de producción de GPU, sino en la red eléctrica; los centros de datos están esperando la electricidad.

Anthropic es la peor de todas

En los 90 días hasta el 8 de abril, la tasa de ejecución normal de Claude API es 98.95%; el estándar empresarial de referencia de la industria es 99.99%. Se queda corto en 1.04 puntos porcentuales; suena pequeño, pero en realidad equivale a casi 8 horas adicionales de tiempo de inactividad por mes.

Las empresas que conectan la IA al flujo de trabajo central no pueden aceptarlo(aunque lo que se dice es como si el usuario general tuviera que aceptarlo)。

El fundador y CEO de Retool, David Hsu, soltó una frase que, seguramente, haría sentir vergüenza a Anthropic: «Creo que Opus 4.6 es el mejor modelo para empresas, pero al final cambiamos a OpenAI, porque Anthropic siempre se cae».

Retool es una plataforma de desarrollo de software empresarial, el cliente que más necesita Anthropic, pero aun así los acuerdos volaron porque no había suficiente capacidad de cómputo.

A finales de marzo, Anthropic empezó a aplicar medidas de limitación de velocidad: de lunes a viernes, en la franja de 5:00 a 11:00 de la mañana, hora del Pacífico, limitando la cantidad de tokens consumidos por los usuarios. Y un poco antes, a mediados de marzo, Anthropic también lanzó la promoción de «duplicar el uso en horas valle», para animar a los usuarios de Taiwán a evitar las horas pico. Ahora al mirar hacia atrás, esa promoción no era para regalar beneficios, sino para mover el tráfico hacia las horas valle y dejar capacidad libre en las horas pico.

Vemos un crecimiento asombroso en los ingresos anuales recurrentes(ARR)de Anthropic: para fines de 2025 era $90 millones; este año, en febrero saltó a $140 millones, y en abril ya alcanzó $300 millones. Se gana cada vez más, pero se gana cada vez peor, porque detrás de los nuevos ingresos hay una mayor necesidad de cómputo, y la brecha de oferta es cada vez mayor.

OpenAI busca cómputo en todas partes, así que tuvo que cerrar Sora

En cuanto al volumen de procesamiento de tokens de la API de OpenAI: en octubre de 2025 era de 6,000 millones por minuto; para finales de marzo de este año ya es de 15,000 millones por minuto. En cinco meses aumentó 2.5 veces; no es que el modelo se haya vuelto más fuerte, es que el uso se disparó a una velocidad exagerada.

La CFO Sarah Friar dijo: «Paso mucho tiempo buscando el último pedacito de capacidad de cómputo disponible; estamos haciendo decisiones increíblemente dolorosas. Algunos proyectos se abandonaron por falta de cómputo».

Así que ya sabemos que Sora se cerró: OpenAI bajó de la plataforma esta aplicación de generación de videos. Una de las razones, en parte, es reasignar los recursos de chips liberados hacia herramientas de programación y productos empresariales.

CoreWeave quiere conseguir clientes grandes con acuerdos de cifras astronómicas, a la vez que empuja hacia fuera a clientes medianos y pequeños

CoreWeave aumentó el alquiler a finales del año pasado más de 20% y, al mismo tiempo, pidió a los clientes medianos y pequeños firmar contratos de al menos tres años; antes era de un año. Para startups nuevas y empresas medianas que necesitan flexibilidad, equivale a estar corriendo gente.

Pero para los grandes clientes, CoreWeave tiene otra estrategia: este 10 de abril, CoreWeave acaba de anunciar que firmó un contrato plurianual con Anthropic, permitiendo a Anthropic acceder a la capacidad de cómputo de Nvidia GPU en centros de datos en Estados Unidos. Anthropic se comprometió a aportar hasta 1 GW(1 gigawatt)de capacidad de cómputo y usará hardware Nvidia Grace Blackwell y la próxima generación Vera Rubin.

Aviso legal: La información de esta página puede proceder de terceros y no representa los puntos de vista ni las opiniones de Gate. El contenido que aparece en esta página es solo para fines informativos y no constituye ningún tipo de asesoramiento financiero, de inversión o legal. Gate no garantiza la exactitud ni la integridad de la información y no se hace responsable de ninguna pérdida derivada del uso de esta información. Las inversiones en activos virtuales conllevan riesgos elevados y están sujetas a una volatilidad significativa de los precios. Podrías perder todo el capital invertido. Asegúrate de entender completamente los riesgos asociados y toma decisiones prudentes de acuerdo con tu situación financiera y tu tolerancia al riesgo. Para obtener más información, consulta el Aviso legal.

Artículos relacionados

Apple acepta pagar 250 millones de dólares, acuerdo en una demanda colectiva por Apple Intelligence

Según el informe de la BBC del 6 de mayo, Apple (Apple) presentó el 5 de mayo en un tribunal federal de California un acuerdo de conciliación propuesto, con el que acepta pagar 250 millones de dólares (aprox. 184 millones de libras esterlinas) para resolver una demanda colectiva por presunta publicidad engañosa relacionada con sus funciones de Apple Intelligence y Siri con IA; Apple niega cualquier conducta indebida en el acuerdo, y el acuerdo aún debe ser aprobado por el juez.

MarketWhisperHace11m

La vista previa de Tencent Hunyuan Hy3 registra un crecimiento de tokens de 10x en dos semanas

Desde su lanzamiento hace dos semanas, la vista previa Hy3 de Hunyuan de Tencent ha experimentado un aumento de 10 veces en las llamadas de tokens en comparación con el modelo Hy2 anterior. El uso de tokens en escenarios de código y agentes ha crecido especialmente con fuerza; entre las aplicaciones se incluyen WorkBuddy, Codebuddy y Qclaw, que reportan crecimiento

GateNewsHace20m

Musk Consideró Integrar OpenAI en Tesla a Fines de 2017, Dice el Tribunal

De acuerdo con un testimonio en un juicio federal en Oakland, California, Elon Musk consideró integrar OpenAI en Tesla a finales de 2017 y principios de 2018, según Shivon Zilis, ejecutiva de Neuralink y exmiembro de la junta de OpenAI. Zilis declaró que Musk exploró ofrecer a Sam Altman un escaño en la junta directiva de Tesla

GateNewsHace40m

El crecimiento de usuarios de Gemini y Claude se acelera en abril, mientras que el de ChatGPT se desacelera a 30% interanual

Según el último informe de Bank of America, Gemini y Claude registraron un sólido crecimiento de usuarios en abril, mientras que la expansión de ChatGPT se desaceleró. En visitas web en EE. UU., ChatGPT creció un 30% interanual hasta 34 millones de visitas (equivalente al 6% del tráfico de Google), mientras que Claude se disparó un 715% interanual hasta 7,1 mil millones

GateNewsHace47m

OpenAI lanza el protocolo MRC con AMD, Broadcom, Intel, Microsoft y Nvidia

OpenAI anunció que ha colaborado con AMD, Broadcom, Intel, Microsoft y Nvidia para lanzar Multipath Reliable Connection (MRC), un protocolo de redes de código abierto. MRC está diseñado para acelerar clústeres de entrenamiento de IA a gran escala, mejorar la fiabilidad y reducir significativamente la inactividad de GPU

GateNewsHace50m

Los ingresos del centro de datos de IA de SK Telecom aumentan un 89% en el primer trimestre de 2026

Según SK Telecom, el negocio de centro de datos de inteligencia artificial de la empresa de telecomunicaciones surcoreana registró 131,4 mil millones de wones (89,4 millones de dólares) en ingresos durante el primer trimestre de 2026, un 89,3% más interanual. La compañía atribuyó el aumento a una mayor utilización de los centros de datos y

GateNewshace1h
Comentar
0/400
Sin comentarios