Descript é uma plataforma de edição de vídeo e podcast com IA que trata áudio e vídeo como um documento de texto. Os usuários editam a mídia editando uma transcrição — cortar palavras exclui a filmagem correspondente — e o Underlord, a camada de IA integrada do Descript, lida com tarefas complexas de produção automaticamente. É usado por podcasters, criadores de vídeo, profissionais de marketing e equipes de produção.
O Underlord agora roda em modelos de raciocínio, incluindo o Gemini 3 selecionável, permitindo que ele lide com instruções de edição em múltiplas etapas que anteriormente exigiam execução manual. Os usuários podem descrever sequências complexas — cortar todas as pausas acima de um segundo, remover palavras de preenchimento, adicionar uma quebra de capítulo antes de cada mudança de tema — e o Underlord as executa como uma cadeia coordenada em vez de uma série de ações individuais.
A geração de vídeo a partir de prompts de texto agora está disponível via Veo 3.1 e Sora 2 integrados, permitindo que os criadores gerem filmagens B-roll ou de cenas diretamente no Descript sem mudar para uma ferramenta externa. A sincronização labial para vídeo dublado e traduzido foi adicionada junto com os recursos de geração, melhorando o realismo para conteúdo multilíngue.
A tradução de legendas e dublagem expandiu significativamente: 39 idiomas adicionais agora são suportados para legendas, e 6 novos idiomas ganharam suporte completo de dublagem incluindo síntese de voz. O Descript também adicionou 21 novas vozes de estoque para narração com IA, trazendo a biblioteca total para mais de 1.000.
A integração com MCP (Model Context Protocol) permite que o Claude e outros agentes de IA que suportam MCP controlem o Descript via prompts em linguagem natural. Isso permite fluxos de trabalho de edição automatizados onde um agente externo pode emitir comandos de edição, executar exportações ou gerenciar projetos de forma programática.
O Descript é ideal para criadores de vídeo e podcast que desejam edição assistida por IA no nível da transcrição, e para equipes que produzem conteúdo multilíngue ou dublado que precisam de sincronização labial e síntese de voz integradas.
Deixar avaliação
As avaliações são publicadas após moderação. Não compartilhamos seu email.