De acuerdo con Beating, tras el lanzamiento de 25 modelos de código abierto, incluidos Nvidia Nemotron 3 Ultra y Google Gemma 4 12B, la brecha de capacidades entre los modelos de frontera de código abierto y los cerrados se está reduciendo rápidamente, pero la fijación de precios sigue siendo marcadamente desalineada. El inversor tecnológico Chamath Palihapitiya destacó que para las empresas que consumen 1.000 millones de tokens de entrada y 1.000 millones de tokens de salida al mes, GPT-5.5 Pro cuesta 105.000 USD, Claude Opus 4.8 cuesta 30.000 USD, mientras que DeepSeek R1 cuesta solo 2.740 USD, lo que hace que GPT-5.5 Pro exija una prima de 40x.
Chamath advirtió que la mayoría de los CEO de las empresas no sabe que sus equipos de ingeniería están usando por defecto APIs de modelos de lenguaje grandes más costosas, sin gobernanza ni auditorías, lo que provoca sobrecostes en el presupuesto. Predijo que, a medida que se adopten los planos de control de enrutamiento de modelos, las empresas adoptarán arquitecturas independientes del modelo, recurriendo por defecto a proveedores de inferencia más rentables y reservando las APIs premium solo para casos de uso de alto valor.