Rompiendo el monopolio de CUDA: AMD ROCm…

«El objetivo era demostrar que AMD ROCm es una alternativa capaz y accesible al ecosistema de CUDA para el ajuste fino de LLM». Es una afirmación audaz, sobre todo porque «accesible» es una palabra que suele reservarse para cosas que no requieren un doctorado y tres días depurando kernels solo para que los controladores dejen de fallar. Durante demasiado tiempo, el mundo de la IA ha vivido en una burbuja exclusiva de CUDA, tratando la pila propietaria de Nvidia como si fuera una ley de la física en lugar de un foso defensivo empresarial muy exitoso. Básicamente, hemos aceptado un «impuesto de CUDA» en cada token generado, no porque el hardware sea mágicamente superior, sino porque la alternativa solía ser un ejercicio de masoquismo.

El informe de Hugging Face sobre el proyecto de ajuste fino de MedQA demuestra que la infraestructura finalmente está llegando a buen puerto. El proyecto se centró en la IA clínica —concretamente en el conjunto de datos MedQA— y mostró que ajustar un modelo en hardware de AMD no solo es posible, sino práctico. Pero seamos honestos con la fricción: cualquiera que haya intentado instalar ROCm sabe que a menudo se parece menos a «instalar un software» y más a intentar montar un mueble de IKEA a ciegas en medio de una ventisca. El hecho de que ahora se presente como una ruta viable para el ajuste de dominios especializados significa que la excusa de «es demasiado difícil» está perdiendo dientes. Si puedes ajustar un modelo médico sin que el sistema colapse en un montón de fallos de segmentación, la barrera de entrada ha cambiado.

¿Por qué importa esto? Porque la lotería del hardware está amañada actualmente. Hemos pasado los últimos tres años fingiendo que la única forma de obtener computación de alto rendimiento es suplicar a un proveedor de nube por un clúster de H100 o vender un riñón por un par de A100. Es como si te dijeran que solo puedes cocinar un plato de cinco estrellas si usas una marca específica de sartén de cobre francesa: la sartén es genial, claro, pero el calor sigue siendo solo calor. Cuando vinculamos todo el progreso de la IA clínica a la pila de software de un solo proveedor, no solo estamos arriesgando un monopolio de chips; estamos arriesgando un cuello de botella en la rapidez con la que podemos iterar en modelos especializados y de alto riesgo. Si podemos trasladar el ajuste fino clínico a AMD sin un golpe masivo al rendimiento o a la cordura de los desarrolladores, el coste de entrada para la IA especializada baja significativamente.

Aquí está la verdad incómoda: el foso de CUDA no tiene que ver con el silicio; tiene que ver con las bibliotecas. Nvidia no ganó porque sus chips fueran inherentemente mágicos, sino porque hicieron que la experiencia de software fuera sin fricciones. La industria ha estado secuestrada por una elección binaria: usar CUDA o gastar la mitad de tu presupuesto de ingeniería escribiendo kernels personalizados que quedarán obsoletos en seis meses. El proyecto MedQA es una señal de que la brecha se está cerrando. Si la experiencia del desarrollador en ROCm alcanza la paridad con CUDA (lo cual aún no ha logrado del todo, aún quedan algunos detalles por pulir), el poder de fijación de precios del equipo verde se evapora. No estamos hablando de un cambio total del mercado, pero sí del fin del monopolio en el desarrollo de IA «profesional».

¿Nos importa realmente si el modelo se entrenó en un Instinct MI300X o en un H100 si la curva de pérdida se ve igual? Probablemente no. El usuario final de una IA clínica no le importa la optimización del kernel; le importa si el modelo alucina una dosis de medicación. La IA médica es particularmente sensible a esto porque los datos están en silos y los requisitos de computación para el ajuste fino de alta precisión son elevados. Al desacoplar la «inteligencia» de la pila de software de un solo proveedor, avanzamos hacia un mundo donde la computación vuelve a ser una mercancía, en lugar de un bien de lujo controlado por un puñado de guardianes. Esto permite que el foco regrese a los pesos y sesgos reales, no a la marca específica de la GPU que se queda inactiva en el rack.

Ya hemos visto este patrón antes con la lenta migración de sistemas Unix propietarios a Linux. Tarda un tiempo, y hay mucha negación por parte de los incumbentes, pero el impulso es inevitable. El hardware finalmente está alcanzando las ambiciones del software. Sospecho que para el cuarto trimestre del próximo año, veremos al menos tres startups importantes de IA médica anunciar públicamente un cambio primario a hardware de AMD para sus pipelines de entrenamiento con el fin de recortar sus OpEx.

El foso está filtrándose.

Cobertura relacionada

Crisis de energía para la IA: ya ha comenzado la carrera por la infraestructura energética

AMD acaba de llevar a cabo su mejor contraataque de GPU

Amazon integra la generación de imágenes con IA para la impresión de mercancía personalizada

Audio Interaction: Un nuevo modelo de pesos abiertos para IA de voz continua