Anthropic hat intern ein neues Modell mit dem Codenamen Mythos entwickelt — und sagt, es werde bewusst nicht öffentlich veröffentlicht aufgrund seiner außergewöhnlichen Fähigkeiten im Bereich Cybersicherheit.
Was Mythos kann
Anthropic beschreibt Mythos als «weit voraus» gegenüber anderen Frontier-Modellen speziell im Cybersicherheitsbereich. Das Modell birgt erhebliche Risiken bei unkontrollierter Bereitstellung — in der Lage, bei offensiven Cyberoperationen zu assistieren, auf eine Art, die aktuelle Modelle nicht können.
Regulatorische Folgewirkungen
Die Existenz von Mythos brachte Cybersicherheitsbedenken an einen Wendepunkt. Das Weiße Haus begann, einen formellen Überprüfungsprozess für KI-Modell-Releases zu erwägen. Innerhalb von Tagen stimmten Microsoft, Google und xAI zu, der US-Regierung frühen Zugang zu unveröffentlichten Modellen zur Sicherheitsbewertung durch NIST zu geben.
Warum es wichtig ist
Mythos ist der erste öffentlich anerkannte Fall, in dem ein großes KI-Labor absichtlich ein Modell aufgrund von Fähigkeitsbedenken zurückhält — kein Sicherheitstheater, sondern ein Modell, das Anthropic selbst nicht komfortabel veröffentlichen kann.