ElevenLabs — провідна AI-платформа синтезу голосу, що спеціалізується на TTS, клонуванні голосу, транскрипції в реальному часі та інфраструктурі голосових агентів. Обслуговує 5M+ користувачів. Оцінюється в $11 млрд і є еталоном природного AI-голосу в 2026 році.
SDK v2.46, випущений у травні 2026, розширює можливості голосових агентів і транскрипції. Conversation Tags дозволяють позначати розмови агентів структурованими метаданими на рівні SDK для аналітики та моніторингу якості без окремої інфраструктури логування.
Scribe Realtime отримує підтримку ключових слів: розробники передають список спеціалізованих термінів при ініціалізації сесії, і модель пріоритизує їх точне розпізнавання. Критично для медичних, юридичних і технічних контекстів.
GPT-5.5 та Qwen 3 тепер доступні як LLM-рушії для Voice Agents. GPT-5.5 додає найпотужнішу поточну модель OpenAI; Qwen 3 — економічну open-source альтернативу для розгортань з великим обсягом.
Batch Calling автоматизує вихідні голосові кампанії: розробник задає список дзвінків, конфігурацію агента та розклад — ElevenLabs виконує всі дзвінки автономно.
Безкоштовний рівень: 10 000 символів/місяць. Платні плани від $5/місяць (Starter) до $99/місяць (Scale) та корпоративні тарифи.
Залишити відгук
Відгуки публікуються після модерації. Email не передається третім особам.