《The Wall Street Journal》最新调查披露,AI 产业算力供给危机已全面引爆,Blackwell GPU 现货租金在两个月内从每小时 $2.75 美元狂飙至 $4.08 美元,涨幅 48%;Anthropic 的 Claude API 在 90 天内的正常执行率仅 98.95%,远低于企业级标准 99.99%,这已导致 Retool 等企业客户跳槽转向 OpenAI。
(前情提要:大卖空麦可贝瑞放话:Palantir只是低毛利 SaaS 外包公司!Anthropic 正在吃掉它)
(背景补充:Claude 用量翻倍送!Anthropic 推限时优惠,台湾用户几乎全天受惠)
本文目录
Toggle
En todo el mundo, la capacidad de cómputo ya se ha agotado; incluyendo que el alquiler spot de Blackwell GPU subió 48% en dos meses, y también la gente que mira que la pantalla de Claude Code se queda en thinking…; todos están muy escasos.
El índice de precios de cómputo de Ornn(Ornn Compute Price Index,OCPI)se ha incorporado recientemente al Bloomberg Terminal(Terminal Bloomberg); ahora los inversores institucionales pueden, como si siguieran el precio del petróleo, ver directamente la evolución en tiempo real del alquiler spot de GPU.
El factor central que impulsa esta escalada de precios es la explosión de la demanda de Agentic AI(IA agente);la IA ya no es solo una función de preguntas y respuestas para la interfaz web delantera, sino que necesita tareas autónomas que duren mucho tiempo y operen de forma continua; el apetito por cómputo está en un nivel totalmente distinto. Mientras la oferta de cómputo aún no sube, la demanda explota primero.
El CEO de Vultr, J.J. Kardwell, lo dijo sin rodeos: «Esta es la escasez de cómputo más grave que he visto en más de cinco años gestionando esta empresa. Los ciclos de construcción de centros de datos son demasiado largos y toda la electricidad disponible para 2026 ya está reservada». Ojo: él habló de «electricidad», no de «chips».
El cuello de botella del cómputo en 2026 ya no está en las líneas de producción de GPU, sino en la red eléctrica; los centros de datos están esperando la electricidad.
En los 90 días hasta el 8 de abril, la tasa de ejecución normal de Claude API es 98.95%; el estándar empresarial de referencia de la industria es 99.99%. Se queda corto en 1.04 puntos porcentuales; suena pequeño, pero en realidad equivale a casi 8 horas adicionales de tiempo de inactividad por mes.
Las empresas que conectan la IA al flujo de trabajo central no pueden aceptarlo(aunque lo que se dice es como si el usuario general tuviera que aceptarlo)。
El fundador y CEO de Retool, David Hsu, soltó una frase que, seguramente, haría sentir vergüenza a Anthropic: «Creo que Opus 4.6 es el mejor modelo para empresas, pero al final cambiamos a OpenAI, porque Anthropic siempre se cae».
Retool es una plataforma de desarrollo de software empresarial, el cliente que más necesita Anthropic, pero aun así los acuerdos volaron porque no había suficiente capacidad de cómputo.
A finales de marzo, Anthropic empezó a aplicar medidas de limitación de velocidad: de lunes a viernes, en la franja de 5:00 a 11:00 de la mañana, hora del Pacífico, limitando la cantidad de tokens consumidos por los usuarios. Y un poco antes, a mediados de marzo, Anthropic también lanzó la promoción de «duplicar el uso en horas valle», para animar a los usuarios de Taiwán a evitar las horas pico. Ahora al mirar hacia atrás, esa promoción no era para regalar beneficios, sino para mover el tráfico hacia las horas valle y dejar capacidad libre en las horas pico.
Vemos un crecimiento asombroso en los ingresos anuales recurrentes(ARR)de Anthropic: para fines de 2025 era $90 millones; este año, en febrero saltó a $140 millones, y en abril ya alcanzó $300 millones. Se gana cada vez más, pero se gana cada vez peor, porque detrás de los nuevos ingresos hay una mayor necesidad de cómputo, y la brecha de oferta es cada vez mayor.
En cuanto al volumen de procesamiento de tokens de la API de OpenAI: en octubre de 2025 era de 6,000 millones por minuto; para finales de marzo de este año ya es de 15,000 millones por minuto. En cinco meses aumentó 2.5 veces; no es que el modelo se haya vuelto más fuerte, es que el uso se disparó a una velocidad exagerada.
La CFO Sarah Friar dijo: «Paso mucho tiempo buscando el último pedacito de capacidad de cómputo disponible; estamos haciendo decisiones increíblemente dolorosas. Algunos proyectos se abandonaron por falta de cómputo».
Así que ya sabemos que Sora se cerró: OpenAI bajó de la plataforma esta aplicación de generación de videos. Una de las razones, en parte, es reasignar los recursos de chips liberados hacia herramientas de programación y productos empresariales.
CoreWeave aumentó el alquiler a finales del año pasado más de 20% y, al mismo tiempo, pidió a los clientes medianos y pequeños firmar contratos de al menos tres años; antes era de un año. Para startups nuevas y empresas medianas que necesitan flexibilidad, equivale a estar corriendo gente.
Pero para los grandes clientes, CoreWeave tiene otra estrategia: este 10 de abril, CoreWeave acaba de anunciar que firmó un contrato plurianual con Anthropic, permitiendo a Anthropic acceder a la capacidad de cómputo de Nvidia GPU en centros de datos en Estados Unidos. Anthropic se comprometió a aportar hasta 1 GW(1 gigawatt)de capacidad de cómputo y usará hardware Nvidia Grace Blackwell y la próxima generación Vera Rubin.
Artículos relacionados
Apple acepta pagar 250 millones de dólares, acuerdo en una demanda colectiva por Apple Intelligence
La vista previa de Tencent Hunyuan Hy3 registra un crecimiento de tokens de 10x en dos semanas
Musk Consideró Integrar OpenAI en Tesla a Fines de 2017, Dice el Tribunal
El crecimiento de usuarios de Gemini y Claude se acelera en abril, mientras que el de ChatGPT se desacelera a 30% interanual
OpenAI lanza el protocolo MRC con AMD, Broadcom, Intel, Microsoft y Nvidia
Los ingresos del centro de datos de IA de SK Telecom aumentan un 89% en el primer trimestre de 2026