Googles Gemini 3.1 Pro hat sich als Gesamtführer in Benchmarks etabliert, mit 13 von 16 wichtigen Benchmarks an der Spitze.
Schlüsselwerte
- SWE-bench (Programmierung): 80,6%
- GPQA Diamond (Expertenwissenschaft): 94,3% — höchster Wert aller Modelle
- ARC-AGI-2: 77,1%
- LM Council Reasoning: 94,1%
Multimodal und Kontext
Gemini 3.1 Pro verfügt über ein Kontextfenster von 2 Millionen Tokens, das nativ über Text, Bild, Audio und Video in einem einzigen Modell funktioniert. Verfügbar für Google AI Pro-Abonnenten in den USA und Gemini Ultra-Abonnenten weltweit.