Gemini 3.1 Pro Domine 13 des 16 Principaux Benchmarks d'IA — dont 80,6% sur SWE-bench et 94,3% sur GPQA Diamond

Modèles Apr 29, 2026·Artificial Analysis

Google's Gemini 3.1 Pro s'est imposé comme le leader global des benchmarks, dominant 13 des 16 principaux benchmarks.

Scores clés

SWE-bench (code): 80,6%
GPQA Diamond (science experte): 94,3% — le plus élevé de tout modèle
ARC-AGI-2: 77,1%
LM Council reasoning: 94,1%

Multimodal et contexte

Gemini 3.1 Pro dispose d'une fenêtre de contexte de 2 millions de tokens fonctionnant nativement sur le texte, l'image, l'audio et la vidéo dans un seul modèle. Disponible pour les abonnés Google AI Pro aux États-Unis et Gemini Ultra dans le monde entier.