Meta lanzó Llama 4 Scout y Maverick, los primeros modelos de la familia Llama en utilizar una arquitectura Mixture-of-Experts (MoE) que activa solo un subconjunto de parámetros por consulta.

Scout: diseñado para contexto largo

Llama 4 Scout tiene 17.000 millones de parámetros activos en 16 expertos (109.000 millones en total) y una ventana de contexto de 10 millones de tokens, permitiendo procesar bases de código completas en un solo paso.

Uso comercial

Ambos modelos están disponibles para uso comercial bajo la licencia Llama actualizada de Meta. La arquitectura MoE reduce los costes de inferencia aproximadamente un 60% en comparación con un modelo denso de calidad equivalente.