Google's Gemini 3.1 Pro закрепил позиции абсолютного лидера по бенчмаркам, возглавив 13 из 16 основных тестов.
Ключевые результаты
- SWE-bench (программирование): 80,6%
- GPQA Diamond (экспертная наука): 94,3% — лучший показатель среди всех моделей
- ARC-AGI-2: 77,1%
- LM Council reasoning: 94,1%
Мультимодальность и контекст
Gemini 3.1 Pro обладает контекстным окном в 2 миллиона токенов, нативно работающим с текстом, изображениями, аудио и видео в единой модели. Доступен подписчикам Google AI Pro в США и Gemini Ultra — по всему миру.