¿Le importa realmente a Google la salud de la web abierta? Sí, pero solo en la medida en que un parásito se preocupa porque el huésped no muera.
Durante los últimos años, el objetivo de AI Overviews ha sido matar el clic. ¿Para qué enviar a un usuario a un blog si el LLM puede simplemente sintetizar la respuesta en un párrafito bien pulido? Es eficiente para el usuario. Es fantástico para las métricas de Google. Y es un desastre absoluto para cualquiera que escriba realmente el contenido. Hemos pasado de un motor de búsqueda —que era esencialmente un mapa hacia donde vivía la información— a un motor de respuestas, que actúa como un filtro que elimina el contexto y el incentivo para que el creador original siga publicando. Ahora, de repente, Google está dando un giro hacia citar sus fuentes de forma más agresiva. (Y ya era hora).
Este cambio es un reconocimiento de que la trayectoria actual es insostenible. Si eliminas el tráfico, eliminas los ingresos. Si eliminas los ingresos, eliminas a los escritores. Si eliminas a los escritores, eventualmente te quedas sin datos frescos generados por humanos para entrenar la siguiente versión del modelo. Google está finalmente comprendiendo que no puede simplemente banquetearse con el corpus existente de internet sin contribuir algo de vuelta al ecosistema.
El nuevo enfoque tiene menos que ver con el altruismo y más con las frías matemáticas de la disponibilidad de datos. Si cada editor de alta calidad decide que el coste de ser raspado supera el valor del tráfico residual, simplemente activará el bloqueo en su robots.txt. Google sabe que entrenar un modelo en una web muerta es una receta para la estancación. Según ArsTechnica, la compañía planea integrar los enlaces de forma más prominente, facilitando que los usuarios salten del resumen a la fuente.
Esta es una táctica de supervivencia. Google ha pasado una década moviéndose desde un directorio de enlaces hasta un jardín amurallado de respuestas, pero finalmente ha dado con el techo. Cuando eliminas el incentivo para que la gente cree contenido original e investigado a fondo, detienes el flujo de nuevos datos de entrenamiento. No puedes simplemente mantener al LLM bucleando sobre su propia salida para siempre sin que todo se convierta en un desastre digital endogámico. Lo hemos visto en experimentos de colapso de modelos a menor escala; cuando un modelo aprende de datos sintéticos, la calidad se degrada rápidamente.
¿De verdad creen que unos cuantos enlaces azules más detendrán la hemorragia?
El problema es que un enlace no es una visita. Es como un restaurante que sirve un menú degustación de tus platos favoritos pero espera que pagues a los chefs originales mediante un bote de propinas al salir. La fricción sigue ahí. El usuario ya tiene la respuesta —la “degustación” fue el AI Overview—, así que no tiene motivo para hacer clic a menos que busque matices más profundos o una herramienta específica.
La latencia del clic también es un factor. En un mundo donde la respuesta aparece en 200 ms, pedirle a un usuario que espere tres segundos a que cargue un sitio WordPress pesado es una exigencia considerable. Google intenta mantener la fachada de un motor de búsqueda mientras opera como un motor de respuestas, esperando que si tiran unos cuantos enlaces más contra la pared, los editores dejen de tratar al crawler como a un ladrón. (Sospecho que esto es solo una jugada defensiva para evitar el escrutinio antimonopolio). Pero las citas son un consuelo. No pagan las facturas del servidor ni los salarios de los escritores.
Es un parche en una herida de bala.
Google no está arreglando el ecosistema de búsqueda; solo intenta ralentizar la tasa de deterioro. Quieren el prestigio y los datos de la web abierta sin la responsabilidad de entregar el tráfico que mantiene viva esa web. Para el cuarto trimestre, veremos un aumento significativo de sitios de alta autoridad bloqueando AI Overviews por completo a pesar de estos enlaces.
Se equivocan al pensar que esto es suficiente.