La verticalización es la única forma en que estos laboratorios dejan de toparse con el muro. Hemos pasado dos años fingiendo que un modelo capaz de escribir un soneto al estilo de un detective de los años 20 también puede mapear el plegamiento de una proteína. No puede. El lanzamiento de Claude Science es un reconocimiento tácito de que el sueño del “único modelo para gobernarlos a todos” está muerto. Ahora estamos en la era del especialista.
La imagen del lanzamiento es reveladora. Anthropic no soltó esto en un blog aleatorio para las masas; lo llevó a un evento específicamente para ejecutivos farmacéuticos e investigadores. Este es un giro hacia el trabajo empresarial de alto margen y alto riesgo. El mercado general de chat para consumidores se ha convertido en una carrera hacia el fondo donde todos luchan por ver quién puede resumir un PDF más rápido y por el menor precio.
Pero en biotecnología, el valor no está en el resumen, sino en la precisión de la hipótesis. Si puedes acortar el ciclo de descubrimiento de fármacos incluso unas pocas semanas, el ROI se mide en miles de millones, no en tarifas de suscripción mensual. (Y probablemente una factura masiva por los tokens).
El problema es que los LLM generales son probabilísticos por naturaleza. Están diseñados para predecir el siguiente token más probable, lo cual es genial para la poesía pero letal para la química. Usar un modelo general para ciencias duras es como contratar a un músico de jazz para realizar una cirugía a corazón abierto; claro, ambos tienen sentido del ritmo, pero realmente quieres que el cirujano siga el manual al pie de la letra. ¿Quién está pagando realmente por esto si el modelo sigue alucinando un enlace químico porque se veía “plausible” en los datos de entrenamiento?
La gran pregunta es si Claude Science es realmente un nuevo modelo o solo un envoltorio de datos curados con un prompt de sistema diferente y una fuerte dosis de RAG sobre revistas propietarias. Si es solo una versión ajustada de los pesos existentes, entonces es una característica, no un producto.
Es una característica, no un producto.
Para que esto sea un “insignia” legítimo, Anthropic tiene que demostrar que ha resuelto el problema de fundamentación. Los datos científicos a menudo son escasos y están detrás de muros de pago. Si simplemente han raspado la web abierta y añadido un “modo ciencia”, solo están dando a los investigadores una forma más rápida de equivocarse. La verdadera fricción aquí no es la UI ni la ventana de contexto, son los datos de entrenamiento. La mayoría de los datos científicos de alta calidad son propietarios, lo que significa que Anthropic tuvo que cerrar acuerdos con gigantes farmacéuticos o encontrar una forma de sintetizar datos que no se degraden en ruido.
Sospecho que lo segundo es más probable. Hemos visto este patrón antes donde un laboratorio afirma tener una versión “especializada” de un modelo solo para resultar ser una capa delgada de ingeniería de prompts. O quizás no—ver más abajo. Si realmente han integrado un motor de razonamiento simbólico o un verificador formal en el bucle, entonces el juego cambia. Pero no han mencionado un verificador. Han mencionado un “producto”.
La industria está actualmente obsesionada con el premio al “fármaco descubierto por IA”. Todos quieren ser los primeros en afirmar que encontraron una cura para algo usando un clúster de GPU. Pero el cuello de botella no es la capacidad de la IA para sugerir una molécula; es la capacidad del laboratorio físico para verificarla. Hasta que el bucle entre el LLM y el laboratorio húmedo se automatice, Claude Science es solo una herramienta de lluvia de ideas muy costosa.
Para el cuarto trimestre, veremos el primer artículo revisado por pares que liste un modelo vertical específico como herramienta principal para la generación de hipótesis, y esto desencadenará una crisis masiva en la publicación académica sobre lo que constituye la “autoría”.
Hasta entonces, solo estamos viendo un juego muy costoso de “adivina la molécula” jugado por un modelo que, en su núcleo, sigue siendo un autocompletado muy sofisticado.