Meta hat Llama 4 Scout und Maverick veröffentlicht — die ersten Modelle der Llama-Familie mit einer Mixture-of-Experts (MoE)-Architektur, die nur eine Teilmenge der Parameter pro Anfrage aktiviert.
Scout: für langen Kontext entwickelt
Llama 4 Scout hat 17 Milliarden aktive Parameter auf 16 Experten (109 Milliarden gesamt) und ein 10-Millionen-Token-Kontextfenster — das größte aller offenen Modelle.
Kommerzielle Nutzung
Beide Modelle sind zur kommerziellen Nutzung unter Metas aktualisierter Llama-Lizenz verfügbar. Die MoE-Architektur reduziert die Inferenzkosten um etwa 60 % im Vergleich zu einem dichten Modell vergleichbarer Qualität.