Google's Gemini 3.1 Pro se ha establecido como el líder general en benchmarks, encabezando 13 de 16 benchmarks principales.
Puntuaciones clave
- SWE-bench (programación): 80,6%
- GPQA Diamond (ciencia experta): 94,3% — el más alto de cualquier modelo
- ARC-AGI-2: 77,1%
- LM Council reasoning: 94,1%
Multimodal y contexto
Gemini 3.1 Pro cuenta con una ventana de contexto de 2 millones de tokens funcionando de forma nativa en texto, imagen, audio y video en un solo modelo. Disponible para suscriptores de Google AI Pro en EE.UU. y Gemini Ultra globalmente.