Google's Gemini 3.1 Pro закріпив позиції абсолютного лідера за бенчмарками, очоливши 13 з 16 основних тестів.
Ключові показники
- SWE-bench (програмування): 80,6%
- GPQA Diamond (експертна наука): 94,3% — найвищий серед усіх моделей
- ARC-AGI-2: 77,1%
- LM Council reasoning: 94,1%
Мультимодальність і контекст
Gemini 3.1 Pro має контекстне вікно у 2 мільйони токенів, що нативно працює з текстом, зображеннями, аудіо та відео в єдиній моделі. Доступний підписникам Google AI Pro у США та Gemini Ultra — по всьому світу.