Gemini 3.1 Pro Lidera 13 dos 16 Principais Benchmarks de IA — Incluindo 80,6% no SWE-bench e 94,3% no GPQA Diamond

Modelos Apr 29, 2026·Artificial Analysis

O Gemini 3.1 Pro do Google se estabeleceu como o líder geral nos benchmarks, liderando 13 dos 16 principais benchmarks.

Pontuações principais

SWE-bench (codificação): 80,6%
GPQA Diamond (ciência especializada): 94,3% — o mais alto de qualquer modelo
ARC-AGI-2: 77,1%
LM Council reasoning: 94,1%

Multimodal e contexto

O Gemini 3.1 Pro conta com uma janela de contexto de 2 milhões de tokens funcionando nativamente em texto, imagem, áudio e vídeo em um único modelo. Disponível para assinantes do Google AI Pro nos EUA e Gemini Ultra globalmente.