Google Gemma 4 12B: El equilibrio ideal para el despliegue de LLMs locales
El nuevo modelo de 12B de Google apunta al hueco entre los modelos de 8B y 70B, ofreciendo altas capacidades de razonamiento para dispositivos con 16 GB de RAM.
Modelos
Pesos, lanzamientos y la carrera por escalar
27 artículos en esta sección.
El nuevo modelo de 12B de Google apunta al hueco entre los modelos de 8B y 70B, ofreciendo altas capacidades de razonamiento para dispositivos con 16 GB de RAM.
Un análisis de las capacidades multimodales de Qwen3.7-Plus, las exigencias de VRAM de su motor de razonamiento y las implicaciones de su licencia para los desarrolladores.
Un análisis de las limitaciones de hardware y los desafíos de calidad de recuperación que enfrenta la ventana de contexto de un millón de tokens de MiniMax M3 para su despliegue local.
El nuevo modelo MoE de Liquid AI equilibra 8.3B de parámetros totales con 1.5B activos para optimizar la velocidad de inferencia local y el razonamiento.
Un análisis de la actualización de Claude Opus 4.8, que sostiene que los pequeños refinamientos en la controlabilidad y el precio no sustituyen a las ganancias reales de inteligencia.
Soro aprovecha Gemma 3 para ofrecer un LLM local y culturalmente matizado, especializado en tayiko, priorizando la eficiencia y la inferencia local frente a los modelos generalistas.
Un análisis de los costes de latencia y VRAM al utilizar el reranker Zerank-2 de 4B parámetros en pipelines RAG de producción.
Stability AI publica los pesos abiertos de las variantes Small y Medium de Stable Audio 3, permitiendo la generación de audio de alta calidad en GPUs de consumo.
Un análisis de las capacidades de codificación autónoma de Qwen3.7-Max y la creciente brecha entre las APIs propietarias y los modelos de IA de pesos abiertos.
La nueva familia de agentes de navegador Fara1.5 de Microsoft supera a la competencia en tareas de uso informático, ofreciendo un modelo de alto rendimiento de 27B para despliegue local.