¿Recuerdan cuando internet estaba convencido de que las imágenes generadas por AI podían detectarse simplemente buscando manos con seis dedos? Fue un breve momento de triunfo para el ojo humano antes de que los modelos aprendieran a contar. Ahora estamos viendo una repetición de esa misma arrogancia en el ámbito del audio. Deezer intenta lograr algo similar con el sonido. Según TechCrunch, el servicio de streaming ha lanzado una herramienta que escanea listas de reproducción en plataformas competidoras como Spotify y Apple Music para marcar pistas generadas por AI. Es una jugada estratégica extraña. Por lo general, los actores más pequeños intentan robar usuarios ofreciendo algoritmos de descubrimiento mejores o precios más bajos, no actuando como la policía de la pureza digital para el resto de la industria (una afirmación audaz para una empresa que constantemente lucha por cuota de mercado contra los gigantes).

También está el problema inmediato de la fricción en el mundo real. Escanear listas externas no es tan simple como presionar un botón de “detectar”; requiere lidiar con APIs frágiles y restrictivas, y la amenaza constante de ser ralentizado por las mismas plataformas que Deezer intenta “limpiar.” Si Spotify decide que no le gusta que Deezer haga de detective en sus listas propietarias, simplemente puede cortar el flujo o cambiar la estructura de datos en la noche. La sobrecarga técnica de mantener la compatibilidad entre plataformas para una herramienta que básicamente te dice “esta canción podría ser falsa” parece un mal uso de las horas de ingeniería. ¿Quién va a usar esto realmente? El oyente promedio no pasa su tarde importando una lista de Spotify a Deezer solo para ver qué beats de lo-fi fueron hechos por una GPU.

Séamos realistas: la detección de audio es un juego perdido. La brecha entre el audio sintético y la grabación orgánica se cierra más rápido que la distancia entre un desarrollador junior y un senior que sabe usar un cursor. Si puedes entrenar un modelo para generar una voz convincente, puedes entrenar un segundo modelo para eliminar los mismos artefactos que el detector busca. Es un clásico juego del gato y el ratón, pero el ratón tiene una mochila cohete. Intentar construir un filtro definitivo de “AI o Humano” es como intentar detectar un Rolex falso mirándolo a través de una ventana desde la acera de enfrente: quizás atrapes los falsos evidentes, pero lo de gama alta es invisible al ojo desnudo. Básicamente, es intentar pelear contra una marea con un cubo de plástico.

¿Realmente nos importa si un beat de lo-fi “Rainy Night in Tokyo” fue creado por un humano en un dormitorio o por una GPU en un almacén? Para la mayoría de los oyentes, la utilidad es la misma. Los únicos que se preocupan son los abogados de derechos de autor y los puristas que creen que el arte requiere sufrimiento humano. Dado que ya aceptamos autotune, baterías cuantizadas y voces altamente procesadas, la línea entre “asistido” y “generado” es un borrón. Hemos pasado veinte años normalizando la perfección digital; ahora nos sorprendemos cuando una máquina puede imitarla perfectamente. (O tal vez solo estamos aterrorizados de que el “alma” que atribuimos a la música fuera en realidad solo un conjunto específico de frecuencias y errores de tiempo).

Este movimiento de Deezer también ignora la realidad económica del negocio del streaming. Las discográficas ya están experimentando con AI para llenar huecos en sus catálogos y reducir los pagos de regalías a humanos. Al posicionarse como la plataforma “anti-AI”, Deezer está buscando pelea con la misma industria que los alimenta. Es una apuesta que asume que los usuarios valoran la “humanidad” por encima del “ambiente.” Pero si el ambiente es correcto, el origen es irrelevante. Vemos esto en la industria alimentaria todo el tiempo: a la gente le encanta el sabor de una hamburguesa sin importar si fue volteada por una persona o una máquina, siempre y cuando sepa a hamburguesa.

Para Q4, estas herramientas de detección estarán completamente obsoletas. La próxima oleada de modelos de audio multimodal producirá formas de onda matemáticamente indistinguibles de las grabaciones orgánicas, convirtiendo todo este ejercicio en un desperdicio de potencia de cálculo. Las “huellas digitales” que busca Deezer ya se están evaporando. Una vez que la generación sea indistinguible a nivel de muestra, la única forma de demostrar que una canción es humana es filmar al artista en una habitación con una guitarra y un micrófono, y eso es un problema logístico, no de software. Nos estamos moviendo hacia un mundo donde la “prueba de humanidad” requiere evidencia física, no análisis digital.

Un ejercicio inútil de vanidad.