Meta випустила Llama 4 Scout та Maverick — перші моделі сімейства Llama з архітектурою Mixture-of-Experts (MoE), яка активує лише підмножину параметрів для кожного запиту.
Scout: створений для довгого контексту
Llama 4 Scout має 17 мільярдів активних параметрів на 16 експертів (109 мільярдів загалом) та вікно контексту 10 мільйонів токенів — найбільше серед відкритих моделей.
Комерційне використання
Обидві моделі доступні для комерційного використання за оновленою ліцензією Llama від Meta. Архітектура MoE знижує витрати на інференс приблизно на 60%.