Descript ist eine KI-gestützte Video- und Podcast-Bearbeitungsplattform, die Audio und Video wie ein Textdokument behandelt. Nutzer bearbeiten Medien durch Bearbeitung eines Transkripts – das Löschen von Wörtern löscht das entsprechende Filmmaterial – und Underlord, Descripts integrierter KI-Layer, verarbeitet komplexe Produktionsaufgaben automatisch. Es wird von Podcastern, Video-Erstellern, Vermarktern und Produktionsteams genutzt.
Underlord läuft jetzt auf Reasoning-Modellen, einschließlich des wählbaren Gemini 3, was es ermöglicht, mehrstufige Bearbeitungsanweisungen zu verarbeiten, die zuvor manuell ausgeführt werden mussten. Nutzer können komplexe Sequenzen beschreiben – alle Pausen über eine Sekunde kürzen, Füllwörter entfernen, einen Kapitelumbruch vor jedem Themenwechsel hinzufügen – und Underlord führt sie als koordinierte Kette statt als eine Reihe einzelner Aktionen aus.
Videogenerierung aus Textanweisungen ist jetzt über integriertes Veo 3.1 und Sora 2 verfügbar, was Creators ermöglicht, B-Roll oder Szenenfilmmaterial direkt in Descript zu generieren, ohne zu einem externen Tool zu wechseln. Lippensynchronisation für synchronisierte und übersetzte Videos wurde neben den Generierungsfunktionen hinzugefügt, was den Realismus für mehrsprachige Inhalte verbessert.
Untertitel-Übersetzung und Dubbing wurden erheblich erweitert: 39 weitere Sprachen werden jetzt für Untertitel unterstützt, und 6 neue Sprachen erhielten vollständige Dubbing-Unterstützung einschließlich Sprachsynthese. Descript hat auch 21 neue Stock-Stimmen für KI-Voiceover hinzugefügt und bringt die Gesamtbibliothek auf über 1.000.
MCP-Integration (Model Context Protocol) ermöglicht Claude und anderen KI-Agenten, die MCP unterstützen, Descript über natürlichsprachige Anweisungen zu steuern. Dies ermöglicht automatisierte Bearbeitungsworkflows, bei denen ein externer Agent Bearbeitungsbefehle ausgeben, Exporte ausführen oder Projekte programmatisch verwalten kann.
Descript eignet sich am besten für Video- und Podcast-Creators, die KI-gestützte Bearbeitung auf Transkript-Ebene wünschen, und für Teams, die mehrsprachige oder synchronisierte Inhalte produzieren und integrierte Lippensynchronisation und Sprachsynthese benötigen.
Bewertung abgeben
Bewertungen werden nach Moderation veröffentlicht. Wir teilen Ihre E-Mail nicht.