«ByteDance eleva su gasto planificado en IA para 2026 a más de 200.000 millones de yuanes (unos 30.000 millones de dólares), un aumento de al menos el 25 % respecto a los planes anteriores.»

Suena a una cifra enorme hasta que te das cuenta de que los hiperscalers estadounidenses gastan ese tipo de dinero un martes por la mañana solo para mantener el sistema en marcha. ByteDance no intenta superar a Microsoft en una guerra de desgaste; está intentando sobrevivir a un movimiento de pinza geopolítico que amenaza con dejarlos con un stack tecnológico obsoleto en un mundo de modelos de vanguardia.

Si miras las cifras que reporta The Decoder, los 30.000 millones de dólares parecen modestos frente a los 725.000 millones combinados de gigantes estadounidenses como Google, Amazon y Microsoft. Es esencialmente la diferencia entre construir una metrópoli global y edificar una urbanización cerrada bastante chula. Pero hay que recordar que ByteDance no lucha por la misma corona. No necesitan ganar la guerra de los LLM de propósito general para tener éxito; solo necesitan hacer TikTok ligeramente más adictivo y su segmentación de anuncios un poco más depredadora.

Este salto en el gasto es probablemente una reacción al coste brutal de entrenar modelos modernos. Si quieren mantener sus herramientas internas competitivas frente a GPT-4 o Claude, no pueden limitarse a unos pocos clústeres de H100 (de los que ya ni siquiera pueden comprar a granel). Tienen que gastar de más ahora para evitar un colapso total de capacidades más adelante. Es un caso clásico de gastar dinero para evitar perder la capacidad de ganar dinero.

Aquí es donde el plan se vuelve arriesgado. ByteDance está apostando cada vez más por el silicio chino nacional para llenar el vacío dejado por las sanciones estadounidenses. Para quien haya intentado desplegar un clúster a gran escala, la «alternativa nacional» suele significar pasar el doble de tiempo en la optimización del kernel solo para obtener la mitad del rendimiento de un chip de Nvidia.

¿Llegarán a igualar los TFLOPS necesarios para los modelos de vanguardia? (Dudo mucho de ello). La fricción aquí no es solo el hardware en bruto; es el stack de software. Alejarse de CUDA es como intentar cambiar el sistema de fontanería de toda una ciudad por otro de distinto calibre de la noche a la mañana. Es una pesadilla de compatibilidad y latencia que ninguna cantidad de capital puede borrar de un plumazo. Puedes comprar mil chips, pero no puedes comprar una década de librerías optimizadas en un solo ejercicio fiscal.

El giro hacia los chips chinos no es una elección estratégica; es una imposición. Con las sanciones estadounidenses cerrando el lazo sobre las GPU de gama alta, ByteDance está esencialmente obligada a construir su propio ecosistema desde cero. Es como llevar un cuchillo carísimo a un enfrentamiento nuclear. Están apostando a que, tirando 30.000 millones de dólares al problema, pueden abrirse paso a base de fuerza bruta para acceder a un stack de hardware viable.

Si esto funciona, crean una integración vertical que las empresas estadounidenses no necesitan preocuparse por ella porque ya tienen a Nvidia. Si falla, se quedan con una montaña de silicio propietario que no podrá ejecutar los últimos pesos. Predigo que ByteDance migrará el 60 % de sus cargas de entrenamiento a hardware no Nvidia para el tercer trimestre de 2026.

El objetivo real aquí no es un chatbot que escriba poesía; es el feed. Si ByteDance logra integrar IA de alta inferencia en el algoritmo de TikTok sin que la latencia se dispare, las métricas de engagement se dispararán. Buscan ese punto dulce específico donde la IA genera contenido y lo curatela en tiempo real.

Pero hay un pero. La integración de IA de gama alta requiere una potencia de inferencia masiva. Si los chips chinos en los que están apostando no pueden gestionar la carga de inferencia a escala, la experiencia de usuario se degradará. No puedes tener un feed impulsado por IA «impecable» si el backend está luchando por seguir el ritmo del volumen de peticiones. Si la latencia aumenta solo unos pocos cientos de milisegundos, el ciclo de dopamina se rompe.

La brecha de hardware es demasiado amplia.