Google's Gemini 3.1 Pro s'est imposé comme le leader global des benchmarks, dominant 13 des 16 principaux benchmarks.
Scores clés
- SWE-bench (code): 80,6%
- GPQA Diamond (science experte): 94,3% — le plus élevé de tout modèle
- ARC-AGI-2: 77,1%
- LM Council reasoning: 94,1%
Multimodal et contexte
Gemini 3.1 Pro dispose d'une fenêtre de contexte de 2 millions de tokens fonctionnant nativement sur le texte, l'image, l'audio et la vidéo dans un seul modèle. Disponible pour les abonnés Google AI Pro aux États-Unis et Gemini Ultra dans le monde entier.