En producción
Drafter vs Critic — el loop de redacción NCN
Dos agentes locales por artículo: uno redacta, otro critica. Cero APIs en la nube — el mismo loop de debate que publica cada titular del sitio.
NCN Labs
Benchmarks reproducibles, inferencia solo local, cero APIs en la nube. El mismo rigor que en las noticias — aplicado a los modelos.
Estrella · Arena LLM local
Mismos prompts, misma máquina, juez local. Rankings en código, razonamiento, tools y visión.
En producción
Dos agentes locales por artículo: uno redacta, otro critica. Cero APIs en la nube — el mismo loop de debate que publica cada titular del sitio.
Experimento
Empareja dos modelos locales sobre un titular polémico. Mismo system prompt, posturas opuestas, tú eliges — calibramos quién argumenta mejor antes de confiar en el pipeline.
Guía práctica
Cuantización (Q4 vs Q8 vs FP16), ventana de contexto, keep_alive, batching y cuándo un 7B gana a un 32B en Strix Halo — lecciones de NCN 24/7 con Ollama.
En producción
Cada noticia pasa por qwen3.6: traducción completa, slugs nativos e imágenes WebP antes del deploy. Si falla, no publicamos ES a medias.
Benchmark
Mismos prompts en distintos niveles de cuantización en la misma GPU. Calidad vs tok/s para encontrar el punto dulce del infer diario.
Próximamente
Imágenes hero para artículos NCN: mismo brief, juez humano + VLM a ciegas. ¿Qué stack local produce arte editorial usable sin Midjourney?
Próximamente
Rondas de debate, tokens, latencia de gen_image, tiempo de traducción y deploy — un dashboard del cron completo de NCN.
Próximamente
Evidencia parcial, chunks obsoletos, citas incorrectas. Corpora sintéticos para medir cuánto alucinan los modelos locales aunque tengan el contexto “correcto”.