Gemini 3.1 Pro Führt 13 von 16 Wichtigen KI-Benchmarks an — Einschließlich 80,6% auf SWE-bench und 94,3% auf GPQA Diamond

Modelle Apr 29, 2026·Artificial Analysis

Googles Gemini 3.1 Pro hat sich als Gesamtführer in Benchmarks etabliert, mit 13 von 16 wichtigen Benchmarks an der Spitze.

Schlüsselwerte

SWE-bench (Programmierung): 80,6%
GPQA Diamond (Expertenwissenschaft): 94,3% — höchster Wert aller Modelle
ARC-AGI-2: 77,1%
LM Council Reasoning: 94,1%

Multimodal und Kontext

Gemini 3.1 Pro verfügt über ein Kontextfenster von 2 Millionen Tokens, das nativ über Text, Bild, Audio und Video in einem einzigen Modell funktioniert. Verfügbar für Google AI Pro-Abonnenten in den USA und Gemini Ultra-Abonnenten weltweit.