¿Realmente necesita el mundo otro LLM de alto contexto? Sí, pero solo si deja de intentar parecer un manual de recursos humanos corporativo.

Anthropic acaba de lanzar Claude Fable 5 y Mythos 5, y la estrategia es tan extraña como la nomenclatura. En lugar de un único modelo «hazlo todo», han dividido la personalidad. Fable 5 es el ala creativa, diseñada para narrar, captar matices y redactar textos largos, mientras que Mythos 5 es el motor de razonamiento, pensado para el trabajo pesado de la lógica y la construcción de mundos complejos.

Es un movimiento extraño. Durante años, el objetivo de la industria ha sido el modelo «generalista». Nos vendían la idea de que el camino hacia la AGI era un único conjunto masivo de pesos capaz de escribir un soneto y depurar un kernel panic al mismo tiempo. De repente, volvemos a las herramientas especializadas. (Y todos sabemos lo que le gusta a Anthropic con sus guardrails de seguridad, así que uno se pregunta si Fable es solo una forma de aflojar la correa de la creatividad sin romper la lógica de Mythos).

La fricción en el mundo real ya se nota en los precios y las capas de rendimiento del anuncio. Mythos 5 es un devorador de recursos. Según las especificaciones técnicas, la latencia en consultas de razonamiento complejo es notablemente mayor que la que vimos con Claude 3.5, y el punto de precio sugiere que va dirigido a arquitectos empresariales más que al desarrollador solitario que programa un proyecto de fin de semana. Básicamente, estás pagando un sobreprecio para que el modelo «piense» más antes de soltar un token.

Es una apuesta arriesgada.

Aquí es donde tenemos que ser honestos: la división Fable/Mythos no es ninguna gran visión del futuro. Es una confesión.

Al dividir el modelo, Anthropic está admitiendo que el techo del generalista es real. No puedes maximizar la fluidez poética y la consistencia lógica rígida en el mismo conjunto de pesos sin que uno de los dos sufra. Es como intentar contratar a un chef que sea igual de hábil horneando un soufflé delicado y despieceando un cerdo entero. Puedes encontrar a alguien que haga ambas cosas, pero no será el mejor del mundo en ninguna. Al bifurcar la arquitectura, están intentando recuperar el primer puesto en dos categorías diferentes simultáneamente.

¿Realmente queremos volver a la era de «elegir el modelo correcto» para cada único prompt? Es un paso atrás para la experiencia de usuario. La belleza de los últimos dos años era la invisibilidad de la herramienta. Ahora, el desarrollador tiene que hacer de policía de tráfico, enrutando los prompts a Fable para la «vibra» y a Mythos para las «matemáticas». Es un flujo de trabajo engorroso que añade carga cognitiva a quien realmente está construyendo la aplicación. Si ya has pasado meses optimizando tu cadena de prompts, ahora tienes que reescribir la capa de orquestación solo para decidir qué modelo recibe cada solicitud.

O quizás me equivoque: quizás esto sea solo el primer paso hacia un sistema modular donde intercambiamos «cabezas» sobre un backbone congelado. Pero, dada la trayectoria actual, esto se siente más como un intento desesperado de superar los benchmarks falseando la definición de un modelo de propósito general. Me recuerda a los inicios de la fiebre de los «sistemas expertos», donde creíamos que podíamos simplemente apilar reglas específicas hasta que equivalieran a inteligencia. Hemos pasado una década alejándonos de los silos especializados y frágiles; ver que un laboratorio de primer nivel retroceda hacia ellos es desconcertante.

La sobrecarga logística de mantener dos pipelines de alto parámetro distintos es una pesadilla de DevOps. El coste de servir dos modelos masivos diferentes, cada uno con su propia caché y necesidades de optimización, es muy superior al de servir uno. Para el cuarto trimestre, veremos una versión «Omni» fusionada, porque el coste operativo de mantener la dualidad Fable/Mythos será insostenible para la cuenta de resultados.

Es un parche ingenioso para una arquitectura estancada.