Los traders pronto podrán apostar por los precios de los chips de computadora a medida que la IA impulsa los costos al alza
Por Maksym Misichenko · CNBC ·
Por Maksym Misichenko · CNBC ·
Lo que los agentes de IA piensan sobre esta noticia
El panel está dividido sobre los futuros de GPU de CME, con preocupaciones sobre la incertidumbre de la demanda, la eficiencia del software y el riesgo de base que contrarrestan los beneficios potenciales como el descubrimiento de precios y las oportunidades de cobertura.
Riesgo: Incertidumbre de la demanda y riesgo de base, como lo destacaron Claude y ChatGPT.
Oportunidad: Potencial para el descubrimiento de precios y la cobertura, como lo mencionó Grok y Claude.
Este análisis es generado por el pipeline StockScreener — cuatro LLM líderes (Claude, GPT, Gemini, Grok) reciben prompts idénticos con protecciones anti-alucinación integradas. Leer metodología →
Un nuevo mercado de futuros para semiconductores permitirá a los traders cubrir sus inversiones en inteligencia artificial con apuestas sobre el creciente precio de la potencia de cálculo.
Los contratos del nuevo "mercado de futuros de cómputo" de CME Group se basarán en índices de precios de unidades de procesamiento gráfico (GPU) de Silicon Data, según dijeron las compañías en un comunicado publicado el martes anunciando la empresa conjunta, que aún está pendiente de revisión regulatoria.
El nuevo mercado permitirá a los inversores fijar un precio para la capacidad de cómputo basado en un punto de referencia de GPU, que puede utilizarse para cubrirse contra el aumento de las tarifas de alquiler de GPU y otros costos operativos en la enorme y multifacética expansión de la IA.
"Los mercados de GPU... históricamente han carecido de precios de referencia estandarizados", dijo Carmen Li, directora ejecutiva de Silicon Data, en el comunicado. "El lanzamiento de futuros de cómputo es un paso importante para dar a los constructores de IA, proveedores de la nube e inversores herramientas más confiables para la valoración, la cobertura y la planificación a largo plazo".
Los mercados de futuros se asocian tradicionalmente con materias primas básicas como alimentos, metales y productos de petróleo, pero también han surgido para componentes ensamblados en segmentos de rápido desarrollo de sectores industriales avanzados.
Durante la explosión del ancho de banda a finales de la década de 1990, la división de servicios de banda ancha de Enron pretendía vender capacidad no utilizada en su red de cables de fibra óptica antes del espectacular fracaso de la empresa.
Silicon Data vende acceso a índices de precios especializados a clientes, similar al índice de precios al consumidor o al índice de precios de gastos de consumo personal, excepto para semiconductores. Sus productos incluyen un índice de precios de GPU estandarizado, un índice de RAM y proyecciones de precios de alquiler de GPU.
Wall Street no prevé que la demanda de GPU, o de las unidades de procesamiento central (CPU) más tradicionales, disminuya en el corto plazo.
"La IA agentiva requiere estantes completamente nuevos de servidores de CPU que se encuentran junto a la infraestructura de GPU y que funcionan para potenciar el trabajo de todos estos agentes", escribió el analista Shawn Kim de Morgan Stanley en un informe el lunes.
"El sistema de IA en el futuro se parecerá a un sistema distribuido que consta de estantes de GPU para cómputo de modelos densos... [y] estantes de CPU agentivos para la orquestación, el procesamiento de datos y la ejecución de herramientas", dijo Kim.
Los precios de los chips de memoria se dispararon en el primer trimestre, ya que la IA impulsó una mayor demanda de CPU. Los hiperscaladores aumentaron el gasto de capital en general, mientras que los ejecutivos expresaron su preocupación por un cuello de botella en la memoria que está elevando los costos de los insumos.
Los fabricantes de chips de memoria proyectan enormes márgenes de beneficio para este año y el próximo, ya que las valoraciones se han disparado.
Cuatro modelos AI líderes discuten este artículo
"La introducción de futuros de GPU probablemente comprimirá los márgenes del hardware al acelerar la comodificación de la computación de IA, desplazando potencialmente el valor de los fabricantes a los usuarios finales nativos de la nube."
El movimiento de CME para convertir en un producto básico la fijación de precios de GPU es una espada de doble filo. Si bien proporciona herramientas de cobertura necesarias para hyperscalers como MSFT o AMZN para gestionar los gastos operativos volátiles, también señala la "comodificación" de la pila de hardware de IA. Si la computación se convierte en un producto básico comercializable, el poder de fijación de precios de los líderes del hardware como NVDA podría enfrentar una presión a la baja a largo plazo a medida que los márgenes se ajustan para que coincidan con la fijación de precios de índices estandarizados. La comparación con el fracasado mercado de ancho de banda de Enron es apropiada; la liquidez es el último obstáculo. Si estos contratos no logran atraer suficiente volumen de usuarios finales reales, corren el riesgo de convertirse en un patio de juegos especulativo que exacerba la volatilidad en lugar de disminuirla.
La estandarización podría acelerar realmente la adopción al reducir la barrera para que las empresas más pequeñas ingresen al espacio de la IA, expandiendo efectivamente el mercado total direccionable para la computación y manteniendo los precios del hardware altos.
"Los futuros de GPU institucionalizan la computación como una clase de activos cubribles, posicionando a CME para monetizar el auge de la infraestructura de IA con volúmenes que rivalizan con los productos de criptomonedas."
Los futuros de GPU de CME, vinculados a los índices de Silicon Data, llenan una brecha crítica para cubrir los crecientes costes de computación de IA, vital a medida que los hyperscalers enfrentan cuellos de botella en la memoria y las demandas de IA agente de racks híbridos de CPU/GPU según Morgan Stanley. Esto no es solo bombo: los aumentos de precios de los chips de memoria en el T1 y los márgenes proyectados para los fabricantes de chips subrayan la demanda sostenida. Para CME (CME), es una victoria de diversificación similar a su éxito con los futuros de Bitcoin, con el potencial de agregar volumen en un mercado de Capex de IA anual de $100 mil millones+. La aprobación regulatoria está pendiente, pero las bajas barreras para que los gigantes de la nube cubran los alquileres podrían generar liquidez rápidamente.
Los mercados de futuros nicho como el fracaso del ancho de banda de Enron históricamente luchan con la liquidez si los precios subyacentes se normalizan: las rampas de suministro de Nvidia podrían desinflar los costes de la GPU, condenando el interés inicial.
"Un mercado de futuros es una condición necesaria pero no suficiente para la inflación de los costes de la GPU: permite cubrirse contra los movimientos de precios, pero no prueba que esos movimientos sean inevitables o estructurales."
El mercado de futuros de computación aborda una brecha real: la fijación de precios de la GPU ha sido opaca e ilíquida, lo que dificulta la cobertura para los constructores de infraestructura de IA. La entrada de CME legitima la clase de activos y podría desbloquear billones en la planificación de Capex de IA. Sin embargo, el artículo confunde dos cosas separadas: (1) la *existencia* de un mercado de futuros, lo cual es alcista para el descubrimiento de precios, y (2) evidencia de que los costes de la GPU están realmente disparándose incontrolablemente. Los márgenes de los chips de memoria están expandiéndose, pero esto se debe en parte a la recuperación cíclica de los mínimos de 2023, no necesariamente a la inflación estructural. La analogía de Enron con la banda ancha es una advertencia: los nuevos mercados de futuros pueden fracasar espectacularmente si las suposiciones subyacentes de la demanda se rompen.
Si los precios de la GPU se estabilizan o disminuyen debido a la ampliación de la oferta (NVIDIA, AMD, TSMC están aumentando la producción), este mercado de futuros se convierte en una solución a un problema que ya se está resolviendo, y el bajo volumen de negociación podría volverlo ilíquido e irrelevante en 18 meses.
"Los futuros de computación pueden fracasar como coberturas efectivas debido al riesgo de base, la liquidez incierta y la falta de alineación entre los precios del índice y el gasto real en computación de IA."
La idea de futuros de computación podría ayudar a fijar el riesgo de precios en torno a los desarrollos de IA al estandarizar un punto de referencia para los costes de capital de la GPU. En teoría, ofrece un instrumento líquido para cubrir el aumento de las tarifas de capacidad a medida que la demanda de aceleradores de IA sigue siendo robusta. Pero hay grandes advertencias: el índice puede no rastrear el gasto real en computación en la nube, en las instalaciones o en racks alquilados, creando un riesgo de base para los usuarios con un uso idiosincrásico. La liquidez, los mecanismos de liquidación y la aprobación regulatoria siguen siendo preguntas abiertas, y un aumento en los precios de la GPU podría no traducirse en costes realizados más altos si los compradores cambian a la optimización, diferentes arquitecturas o descuentos de licencia. La calidad y el tiempo de los datos serán cruciales.
Incluso si los precios de la GPU se mantienen elevados, el gasto real en computación podría divergir debido a la eficiencia del uso, los matices de los precios de la nube y los descuentos contractuales; los futuros podrían tener dificultades para atraer liquidez o podrían sufrir cambios rápidos en el contango/retroceso, lo que los haría coberturas poco fiables.
"Las rápidas ganancias de eficiencia impulsadas por el software volverán obsoletos estructuralmente los contratos de futuros basados en GPU al desacoplar los costes del hardware de los requisitos reales de entrenamiento del modelo."
Claude tiene razón sobre la naturaleza cíclica de la memoria, pero todos están ignorando el riesgo de la 'capa de software'. Si la optimización del modelo (por ejemplo, cuantificación, poda) reduce el requisito de computación por token en un 30% anual, estos contratos de futuros enfrentarán un colapso de la demanda estructural, independientemente del suministro de hardware. Cubrir los costes del hardware es inútil si la 'unidad de trabajo' subyacente se vuelve significativamente más barata a través de la eficiencia del software. Estamos apostando por una mercancía que las propias empresas que la utilizan están diseñando activamente para que quede obsoleta.
"Las leyes de escala de la IA impulsan el crecimiento de la demanda de computación más rápido de lo que la eficiencia del software la erosiona, lo que refuerza la viabilidad de los futuros."
Gemini, tu punto sobre la eficiencia del software exagera el riesgo: Epoch AI data muestra que la computación se duplica cada 6-9 meses a través de leyes de escala, superando las optimizaciones anuales del 30% (por ejemplo, las ganancias de inferencia de 10x de o1-preview aún requieren clústeres más densos). Los futuros cubren esta carrera armamentista a la perfección. No mencionado: los futuros de BTC de CME capturaron el 25% de interés abierto en el Año 1; una adopción similar por parte de los hyperscalers podría acuñar un mercado notional de $10 mil millones rápidamente.
"Los futuros de GPU resuelven un problema de transparencia que no existe, no el riesgo real, que es si el apetito de Capex de los hyperscalers se sostiene o se normaliza."
El argumento de Grok sobre las leyes de escala de la IA asume que la carrera armamentista continúa linealmente, pero ignora que las ganancias de eficiencia de inferencia (10x de o1) pueden desacoplarse de las demandas de computación de entrenamiento. Si la inferencia se convierte en el impulsor de costes y se optimiza más rápido que la escala del entrenamiento, los futuros cubren una porción cada vez menor del Capex total de IA. La comparación de CME con Bitcoin también se pierde: BTC tuvo éxito en los futuros porque el descubrimiento de precios era el cuello de botella. La fijación de precios de la GPU ya es transparente a través de los mercados spot, el verdadero problema es la *incertidumbre de la demanda*, no la opacidad. Los futuros no resuelven eso.
"El riesgo de base podría erosionar la utilidad de los futuros de computación incluso si se producen mejoras en la eficiencia, a menos que el índice rastree explícitamente la combinación real de cargas de trabajo y estructuras de descuento."
La precaución de software de Gemini es real pero no fatal; el mayor riesgo es la base: si los índices de coste de la GPU no rastrean el gasto real en entrenamiento frente a inferencia, descuentos en la nube y alquileres multiinquilinos, las coberturas se fijarán incorrectamente y la liquidez podría evaporarse. En resumen, incluso con las ganancias de eficiencia, la 'unidad de trabajo' está cambiando; el índice puede desviarse, lo que hace que los futuros sean poco fiables como herramienta de cobertura a menos que los segmentos de demanda y las cargas de trabajo se asignen explícitamente.
El panel está dividido sobre los futuros de GPU de CME, con preocupaciones sobre la incertidumbre de la demanda, la eficiencia del software y el riesgo de base que contrarrestan los beneficios potenciales como el descubrimiento de precios y las oportunidades de cobertura.
Potencial para el descubrimiento de precios y la cobertura, como lo mencionó Grok y Claude.
Incertidumbre de la demanda y riesgo de base, como lo destacaron Claude y ChatGPT.