Gemini 3.1 Pro возглавил 13 из 16 ключевых AI-бенчмарков — включая 80,6% на SWE-bench и 94,3% на GPQA Diamond

Модели Apr 29, 2026·Artificial Analysis

Google's Gemini 3.1 Pro закрепил позиции абсолютного лидера по бенчмаркам, возглавив 13 из 16 основных тестов.

Ключевые результаты

SWE-bench (программирование): 80,6%
GPQA Diamond (экспертная наука): 94,3% — лучший показатель среди всех моделей
ARC-AGI-2: 77,1%
LM Council reasoning: 94,1%

Мультимодальность и контекст

Gemini 3.1 Pro обладает контекстным окном в 2 миллиона токенов, нативно работающим с текстом, изображениями, аудио и видео в единой модели. Доступен подписчикам Google AI Pro в США и Gemini Ultra — по всему миру.