DeepSeek — китайская AI-лаборатория, которая произвела настоящий переворот в индустрии в начале 2025 года, выпустив модели, сопоставимые по качеству с GPT-4, но за долю стоимости — и сделав их открытыми. Модели DeepSeek R1 и V3 полностью бесплатно доступны через веб-интерфейс на chat.deepseek.com без ограничений по количеству запросов, а веса моделей можно скачать и запускать локально или в коммерческих целях.
Технические достижения впечатляют: по имеющимся данным, обучение DeepSeek V3 обошлось в 6 миллионов долларов — против сотен миллионов для сопоставимых моделей OpenAI — благодаря новаторской архитектуре mixture-of-experts, которая задействует лишь часть параметров на каждый запрос. На стандартных бенчмарках, включая MMLU, HumanEval и MATH, модели DeepSeek сравниваются с GPT-4o или превосходят его, особенно в математике, программировании и логическом мышлении.
Главная проблема — конфиденциальность данных. DeepSeek работает из Китая и подчиняется китайскому законодательству в области данных, а значит, переписка может быть доступна китайским властям. Для личного использования, общих исследований или разработки с открытым исходным кодом это, как правило, приемлемо. Для конфиденциальных бизнес-материалов, проприетарного кода или чувствительных данных настоятельно рекомендуются американские альтернативы — Claude, GPT-4 — или локально развёрнутая модель.
Оставить отзыв
Отзывы публикуются после модерации. Email не передаётся третьим лицам.