Gemini 3.1 Pro Очолив 13 з 16 Основних AI-Бенчмарків — включаючи 80,6% на SWE-bench і 94,3% на GPQA Diamond

Моделі Apr 29, 2026·Artificial Analysis

Google's Gemini 3.1 Pro закріпив позиції абсолютного лідера за бенчмарками, очоливши 13 з 16 основних тестів.

Ключові показники

SWE-bench (програмування): 80,6%
GPQA Diamond (експертна наука): 94,3% — найвищий серед усіх моделей
ARC-AGI-2: 77,1%
LM Council reasoning: 94,1%

Мультимодальність і контекст

Gemini 3.1 Pro має контекстне вікно у 2 мільйони токенів, що нативно працює з текстом, зображеннями, аудіо та відео в єдиній моделі. Доступний підписникам Google AI Pro у США та Gemini Ultra — по всьому світу.