Meta Llama 4 Scout: 10M Token Kontext mit MoE-Architektur

Modelle Apr 12, 2026·Meta AI Blog

Meta hat Llama 4 Scout und Maverick veröffentlicht — die ersten Modelle der Llama-Familie mit einer Mixture-of-Experts (MoE)-Architektur, die nur eine Teilmenge der Parameter pro Anfrage aktiviert.

Scout: für langen Kontext entwickelt

Llama 4 Scout hat 17 Milliarden aktive Parameter auf 16 Experten (109 Milliarden gesamt) und ein 10-Millionen-Token-Kontextfenster — das größte aller offenen Modelle.

Kommerzielle Nutzung

Beide Modelle sind zur kommerziellen Nutzung unter Metas aktualisierter Llama-Lizenz verfügbar. Die MoE-Architektur reduziert die Inferenzkosten um etwa 60 % im Vergleich zu einem dichten Modell vergleichbarer Qualität.