Gemini 3.1 Pro Lidera 13 de 16 Principales Benchmarks de IA — Incluyendo 80,6% en SWE-bench y 94,3% en GPQA Diamond

Modelos Apr 29, 2026·Artificial Analysis

Google's Gemini 3.1 Pro se ha establecido como el líder general en benchmarks, encabezando 13 de 16 benchmarks principales.

Puntuaciones clave

SWE-bench (programación): 80,6%
GPQA Diamond (ciencia experta): 94,3% — el más alto de cualquier modelo
ARC-AGI-2: 77,1%
LM Council reasoning: 94,1%

Multimodal y contexto

Gemini 3.1 Pro cuenta con una ventana de contexto de 2 millones de tokens funcionando de forma nativa en texto, imagen, audio y video en un solo modelo. Disponible para suscriptores de Google AI Pro en EE.UU. y Gemini Ultra globalmente.