Новий флагманський модель Anthropic — Claude Opus 4.7 — встановив рекорд галузі на SWE-bench Verified з результатом 87,6%, перевершивши всі раніше опубліковані показники для публічно доступних моделей.
Що вимірює SWE-bench
SWE-bench Verified перевіряє, чи здатний ШІ вирішувати реальні задачі з GitHub у популярних open-source репозиторіях без участі людини.
Ціни та доступність
Claude Opus 4.7 коштує $5 за мільйон вхідних токенів і $25 за мільйон вихідних. Доступний через Anthropic API та Claude.ai Pro.