Qwen3.7-Max de Alibaba: Analizando la ventana de contexto de 1M de tokens
Una mirada crítica al agente de razonamiento Qwen3.7-Max, explorando los compromisos entre su masiva ventana de contexto y la viabilidad de su implementación local.
Modelos
Pesos, lanzamientos y la carrera por escalar
27 artículos en esta sección.
Una mirada crítica al agente de razonamiento Qwen3.7-Max, explorando los compromisos entre su masiva ventana de contexto y la viabilidad de su implementación local.
El giro hacia los modelos del mundo marca una transición de la competencia lingüística a la competencia ambiental, con el objetivo de resolver las alucinaciones de la IA mediante una realidad fundamentada.
Apple se ha volcado por completo en la IA en el dispositivo con el iPhone 15, y es el enfoque más sensato que ha adoptado con esta tecnología — porque resulta que lo único que tiene sentido para la IA ahora mismo es no procesarla en la nube. Mientras todos los demás construían modelos más grandes y centros de datos más...
DeepSeek acaba de lanzar R1, y ha hecho añicos más que los benchmarks: ha hecho añicos los modelos de precios. Un modelo que iguala a GPT-4 Turbo en la mayoría de tareas, cuesta un 98,5 % menos entrenarlo y libera sus pesos bajo una licencia MIT permisiva. Para una industria que ha estado cobrando 30 dólares por cada m...
La disrupción de los modelos abiertos de DeepSeek rompe los precios de la IA
La semana pasada OpenAI lanzó GPT-5. Google lanzó Gemini 2.5 poco después. Internet decidió tomar partido. Hablemos de lo que realmente importa. En papel, GPT-5 se ve mejor. Los benchmarks están por las nubes. Las ventanas de contexto son más amplias. El rendimiento en programación es realmente impresionante. Pero los benchm
OpenAI ha puesto a disposición su último modelo de lenguaje grande, GPT-5, consolidando la última iteración en su constante cadena de lanzamientos de IA. El nuevo modelo es el fruto de años de investigación y desarrollo por parte de la compañía y su ecosistema de colaboradores, destacando mejoras sustanciales en la comprensión del lenguaje natural, capacidades de razonamiento y asistencia en programación respecto a sus predecesores.