O Gemini 3.1 Pro do Google se estabeleceu como o líder geral nos benchmarks, liderando 13 dos 16 principais benchmarks.
Pontuações principais
- SWE-bench (codificação): 80,6%
- GPQA Diamond (ciência especializada): 94,3% — o mais alto de qualquer modelo
- ARC-AGI-2: 77,1%
- LM Council reasoning: 94,1%
Multimodal e contexto
O Gemini 3.1 Pro conta com uma janela de contexto de 2 milhões de tokens funcionando nativamente em texto, imagem, áudio e vídeo em um único modelo. Disponível para assinantes do Google AI Pro nos EUA e Gemini Ultra globalmente.