A Meta lançou Llama 4 Scout e Maverick — os primeiros modelos da família Llama a usar uma arquitetura Mixture-of-Experts (MoE) que ativa apenas um subconjunto de parâmetros por consulta.

Scout: construído para contexto longo

O Llama 4 Scout tem 17 bilhões de parâmetros ativos em 16 especialistas (109 bilhões no total) e uma janela de contexto de 10 milhões de tokens — a maior de qualquer modelo aberto.

Uso comercial

Ambos os modelos estão disponíveis para uso comercial sob a licença Llama atualizada da Meta. A arquitetura MoE reduz os custos de inferência em aproximadamente 60% em comparação com um modelo denso de qualidade equivalente.