Китайская ИИ-лаборатория Zhipu AI выпустила GLM-5.1 под лицензией MIT — одной из наиболее разрешительных лицензий с открытым исходным кодом — что делает её свободной для любого использования, включая коммерческое развёртывание без ограничений.

Масштаб и архитектура

GLM-5.1 — это модель Mixture-of-Experts с 744 миллиардами параметров и 40 миллиардами активных параметров за один прямой проход. Такая архитектура обеспечивает производительность, сравнимую со значительно более крупными полносвязными моделями, при управляемых затратах на инференс. Модель поддерживает контекстное окно в 200 000 токенов.

Результаты тестов

По стандартным оценкам, включая MMLU, HumanEval и MATH, GLM-5.1 соответствует или превосходит производительность GPT-4 в большинстве категорий. Кодирование и математические рассуждения заявлены как особые сильные стороны: по тестам по соревновательному программированию модель набирает выше 85%.

Почему это важно

Полностью открытый выпуск под лицензией MIT значителен тем, что не накладывает никаких ограничений на использование, модификацию или распространение модели. Предыдущие крупные открытые модели, включая семейство Llama от Meta, имеют кастомные лицензии с различными ограничениями. Лицензия MIT для GLM-5.1 делает её наиболее свободно доступной фронтирной моделью на сегодняшний день.

Веса доступны для скачивания на Hugging Face. Zhipu AI также управляет коммерческим API для команд, предпочитающих управляемый инференс.