Guia
Software de ditado para roteiristas
Falar uma fala em voz alta é a forma mais rápida de saber se ela funciona. O software de ditado deixa você performar o diálogo e capturá-lo, e um atalho global do sistema cola o texto no Final Draft, Fade In, WriterDuet ou Highland — os atalhos do próprio app continuam fazendo a formatação.
Última atualização: junho de 2026

O software de ditado para roteiristas captura diálogos e linhas de ação falados como texto e cola no cursor de qualquer aplicativo de roteiro. Um atalho global do sistema funciona da mesma forma no Final Draft, Fade In, WriterDuet e Highland. A voz produz as palavras; os atalhos do app produzem cabeçalhos de cena, indicações de personagem e formatação. O ditado nativo do sistema operacional resolve uma fala rápida.
Uma fala de diálogo é uma performance antes de virar texto. Você pode ficar olhando para "Eu nunca pedi nada disso" na página por dez minutos sem saber se funciona. Fale em voz alta uma vez e você sabe na hora — está monótono, está cortado, ou está exatamente certo. Essa distância entre a página e a boca é a razão pela qual um roteirista quereria ditar em primeiro lugar. Não para digitar mais rápido. Para ouvir a fala.
Aí as pessoas vão procurar software de ditado para roteiristas e batem numa parede confusa. O Final Draft tem um modo de ditado, mas só funciona no Mac e só em inglês. O hook de ditado antigo do Fade In para Mac parou de funcionar depois de uma atualização do macOS. O WriterDuet tem seu próprio recurso de ditado. O Highland praticamente não tem nenhum. Cada app é uma resposta separada, e metade delas depende do notebook que você comprou. Existe uma forma mais tranquila de pensar nisso, e leva uns dois minutos para configurar.
Aqui está a parte que os artigos de comparação pulam. Um aplicativo de roteiro, por baixo da formatação, é um editor de texto. O campo de diálogo é uma caixa de texto. O campo de ação é uma caixa de texto. O ditado que cola no cursor não se importa se a caixa é no Final Draft, assim como não se importa se a caixa é no Gmail.
Então a pergunta certa não é "qual app de roteiro tem o melhor ditado por voz integrado". A resposta honesta para isso é "todos são irregulares e alguns são presos a uma plataforma". A pergunta melhor é "qual ferramenta de ditado eu uso em cima do app em que já escrevo", para que o mesmo fluxo funcione esteja você no Final Draft hoje e no Fade In no ano que vem. Vou explicar o mecanismo, configurar um, mostrar como manter diálogos e ações separados, e dizer quando pular a ferramenta dedicada de vez.
Por que roteiristas recorrem ao ditado

O primeiro motivo é o que está acima: você não consegue ouvir uma fala que digitou. O diálogo existe para ser falado, e a forma mais rápida de testar se uma cena funciona é performar e capturar exatamente o que saiu da sua boca. Dite a fala, leia de volta, mantenha ou corte. Você termina com um diálogo que soa como uma pessoa falando, porque era uma pessoa falando — você.
O segundo motivo é o ritmo. Um primeiro rascunho é uma corrida contra a sua própria autocrítica. Linhas de ação são especialmente fáceis de sobreelaborar quando você as digita; faladas em voz alta elas saem mais enxutas, no presente, do jeito que a ação deve ser lida. Ditar num ritmo de conversa chega a cerca de 145 palavras por minuto contra aproximadamente 40 ao digitar. Num rascunho de 110 páginas, essa diferença é o que separa terminar no fim de semana de não terminar.
O terceiro motivo são as mãos, e não é pequeno. Roteiristas são digitadores por ofício — sessões longas, prazos, os mesmos pulsos fazendo a mesma coisa por anos. O ditado dá descanso ao teclado sem abrir mão do trabalho, como um auxílio simples de produtividade e conforto, não uma solução médica. Se a tensão nos pulsos é o seu principal motivo para procurar isso, a configuração de ditado para quem tem dor nas mãos vai mais fundo do que vou chegar aqui. Para a maioria dos roteiristas é uma combinação dos três: ouvir a fala, manter o ritmo, poupar as mãos.
Pressione um atalho, performe a fala, ela aparece no cursor
O mecanismo é simples, e esse é o ponto. Você pressiona um atalho, fala, solta, e a transcrição é colada no cursor — no campo que estiver em foco. Coloque o cursor num bloco de diálogo no Final Draft, segure a tecla, entregue a fala, solte, e as palavras aparecem naquele bloco. O Whisper mantém um pequeno delay depois que você solta, para que a última palavra de uma fala não seja cortada no meio da respiração. Como ele cola no cursor do sistema operacional, um campo de diálogo do Final Draft, uma linha de ação do Fade In e uma cena do WriterDuet são todos simplesmente "a caixa onde o cursor está".
Essa é a parte que os guias por app complicam demais. Não há plugin para instalar no seu app de roteiro, nenhuma configuração para encontrar nas preferências, nenhuma janela separada para ditar e depois copiar. O cursor já está no seu roteiro; você fala; a fala aparece no roteiro. Uma pequena cápsula surge enquanto você fala para que você saiba que está gravando:
O atalho é a única coisa que vale a pena acertar de cara. No Windows é Ctrl+Space; no Mac é Command+Option, um push-to-talk de modificador que você segura enquanto fala. Ambos são alteráveis nas Configurações se entrarem em conflito com um atalho que o seu app de roteiro já usa — e apps de roteiro têm muitos atalhos, então verifique. A mesma tecla que preenche um bloco de roteiro também preenche uma mensagem de commit ou qualquer outro campo de texto, que é a vantagem silenciosa de não prender sua voz a um único programa.
Configure em dois minutos (Windows ou Mac)
Você precisa de um Mac com Apple Silicon ou um PC com Windows 10 ou mais recente, um microfone funcionando e o seu app de roteiro aberto — Final Draft, Fade In, WriterDuet no navegador ou no desktop, Highland, qualquer um. Todo o pipeline local é gratuito para qualquer conta logada, sem pedir forma de pagamento no cadastro. Aqui está a sequência.
Passo 1 — Instale o Whisper e entre na conta.
Baixe na página de download, instale e crie uma conta gratuita. Sem cartão. O pipeline de transcrição local abre na hora.
Você saberá que funcionou quando o ícone do app aparecer na bandeja do sistema e o assistente de configuração oferecer a escolha de um modelo.
Passo 2 — Escolha o modo de transcrição.
O app não escolhe por você. Você tem três opções: Cloud (OpenAI, use sua própria chave), Local Parakeet ou Local Whisper. Para um roteiro inédito que você prefere manter no seu próprio disco, comece com o local — mais sobre isso duas seções adiante.
Você saberá que funcionou quando um modelo terminar de baixar e aparecer como pronto.
Passo 3 — Confirme o atalho.
O padrão no Windows é Ctrl+Space; no Mac é Command+Option mantido como push-to-talk. No Mac, conceda a permissão de Acessibilidade quando solicitado; sem ela, o colar-no-cursor não consegue alcançar o Final Draft nem nenhum outro app.
Você saberá que funcionou quando uma gravação de teste for colada em qualquer campo de texto.
Passo 4 — Coloque o cursor num bloco do roteiro e performe uma fala.
Abra o seu roteiro, clique num campo de diálogo ou ação, segure o atalho, diga a fala, solte. A transcrição aparece onde o cursor está, dentro do bloco.
Você saberá que funcionou quando a sua fala estiver no bloco do roteiro como texto.
A parte lenta é o download do modelo, não a configuração. Todo o resto são os quatro passos acima. Uma vez rodando, escrever uma cena deixa de ser uma tarefa de digitação e vira uma tarefa de fala — o que, para diálogo, é exatamente o formato certo.
Mantendo diálogos e linhas de ação organizados por voz
O ponto honesto ao ditar um roteiro é este: o ditado te dá palavras, não a formatação automática do Final Draft. Fale uma linha e você recebe o texto no campo onde o cursor está. Você não recebe uma indicação de personagem automática, um cabeçalho de cena centralizado, ou a ciclagem de elementos que os apps de roteiro fazem quando você aperta Tab e Enter. Quem promete "diga INT. COZINHA e veja formatar sozinho" está te mostrando uma demo, não o dia a dia. Então o fluxo é de duas mãos, e assim que você aceita isso, é rápido.
O padrão que funciona: deixe o app cuidar da estrutura, deixe a voz cuidar das palavras. Use os próprios atalhos do seu app de roteiro para definir o elemento — Tab e Enter no Final Draft para alternar entre Cabeçalho de Cena, Ação, Personagem ou Diálogo, os atalhos equivalentes no Fade In e no WriterDuet — depois dite o conteúdo daquele elemento. Cursor no campo de diálogo, segure o atalho, entregue a fala. Cursor no campo de ação, segure o atalho, descreva a cena. O app mantém o roteiro com cara de roteiro; você mantém as mãos fora do teclado para a escrita em si.
Alguns apps têm seus próprios truques de voz que vale conhecer, e prefiro que você os conheça a fingir que não existem. O recurso Dictate do WriterDuet entende comandos de formatação falados como "pressionar enter" para ir a uma nova linha. O ditado do Final Draft 13, onde funciona, aceita comandos em linguagem natural como "novo cabeçalho de cena". Esses são genuinamente úteis dentro daquele app específico — o trade-off é que só funcionam naquele app, e a versão do Final Draft é exclusiva para Mac e inglês. Um atalho global abre mão dos comandos de formatação falados em troca de funcionar de forma idêntica em todo lugar, para que a fala que você performe no Final Draft hoje seja colada da mesma forma no Fade In no ano que vem. Escolha com base em se você vive em um app para sempre ou migra entre eles.
Local ou cloud: qual modo para um roteiro inédito
Para um roteiro, tente o modo local primeiro. Um script ainda não produzido é o tipo de coisa que você não quer nos logs de um fornecedor — é a sua ideia antes de alguém comprá-la. A transcrição local nunca sai da sua máquina, que é o padrão certo para páginas inéditas. Se o seu Mac é Apple Silicon ou o seu PC é dos últimos anos, o local aguenta uma sessão completa de escrita sem reclamar, e o cloud vira a saída de emergência em vez do ponto de partida.
Veja como os três caminhos diferem, porque o app faz você escolher e prefiro que você escolha bem:
- Local Parakeet — Motor TDT da NVIDIA, cerca de 600 MB, e a opção local mais rápida — de 5 a 10 vezes mais rápido que o Whisper na CPU. Cobre inglês mais 24 outros idiomas europeus, 25 no total. Sem tradução para inglês. Se você escreve em inglês ou em outro idioma europeu, esta é a escolha rápida e totalmente offline para longas sessões de escrita.
- Local Whisper — mais lento que o Parakeet na mesma máquina, mas as versões multilíngues cobrem 99 idiomas e podem traduzir para o inglês. As versões apenas em inglês são só inglês, não 99. Escolha este para um roteiro com diálogos em idiomas não europeus, para trabalho de tradução, ou quando quiser controle mais fino como vocabulário personalizado para nomes de personagens. O modelo padrão em inglês tem cerca de 480 MB.
- Cloud (OpenAI, BYOK) — melhor precisão em áudios difíceis e acesso à web, usando a sua própria chave OpenAI cobrada diretamente pela OpenAI. A transcrição usa gpt-4o-mini-transcribe por padrão. Precisa de internet, então é o único caminho que sai da sua máquina. O Cloud faz parte do Whisper Pro.
A verdade simples é que para diálogos e linhas de ação, o local é mais que suficiente. Ambos os motores locais rodam completamente na sua máquina sem enviar nada a um servidor, que é o que você quer para um roteiro ainda não finalizado. Onde o local ganha pontos extras para roteiristas: o Local Whisper permite adicionar nomes de personagens e lugares inventados como vocabulário personalizado, para que "Kaelin" e "Veth" não voltem como "Caitlin" e "Beth". O cloud ganha seu lugar quando o áudio é ruim ou você precisa buscar uma informação da internet no meio de uma cena. Comece com o local e recorra ao cloud apenas quando o local deixar a desejar.
Limpando um rascunho falado para texto de roteiro
O ditado bruto sai como um texto corrido. Você performa uma fala e um pedaço de ação numa respiração só, e o que aparece é "ela para na porta não se vira apenas diz você nunca ia ficar mesmo ia", que é a parede sem pontuação que qualquer motor de fala te entrega. Limpar isso é onde os modos divergem.
O Voice Typing do Windows adiciona pontuação enquanto você fala, e o Dictation do macOS lida com pontuação básica quando você diz "vírgula" ou "ponto". Para uma limpeza mais pesada — tirar os excessos, corrigir os textos corridos, dividir uma respiração em uma fala limpa — o Whisper pode rodar um passe de IA. Diga a frase de ativação "Hey whisper" e o texto é aprimorado antes de aparecer. Num modelo local isso passa pelo Ollama; no modo cloud é gpt-5-mini por padrão. Uma nota de gosto: o aprimoramento é ótimo para linhas de ação e suas próprias notas, mas deve ser mais leve no diálogo, porque o ponto todo de ditar uma fala era preservar como ela realmente soou.
ela para na porta não se vira apenas diz você nunca ia ficar mesmo ia
Ela para na porta. Não se vira. "Você nunca ia ficar, ia?"
Esse texto limpo ainda não está formatado como roteiro, e não deve fingir que está. A voz te dá as palavras; as ferramentas do seu app de roteiro te dão os cabeçalhos de cena, as indicações de personagem, o diálogo centralizado, as quebras de página. Jogue a fala limpa no campo de diálogo para o qual você já navegou com Tab e Enter, e deixe o Final Draft, Fade In ou WriterDuet fazer o que faz bem. Nenhuma ferramenta de ditado conjura formatação correta de roteiro por comando — os apps que tentam só fazem isso dentro deles mesmos, numa plataforma. Coloque as palavras por voz, molde a página com as teclas que você já conhece.
O mesmo fluxo de falar-e-limpar compensa muito além de um roteiro — você pode ditar texto limpo no Google Docs da mesma forma, para a sinopse, o logline ou o e-mail para o seu agente que você fica adiando.
Quando pular uma ferramenta de ditado dedicada

Às vezes a ferramenta certa é a que já está na sua máquina ou já está no seu app de roteiro, e fingir o contrário seria desonesto. Se você só precisa soltar uma fala numa cena para testar como soa, não precisa instalar nada.
Para uma fala rápida, o sistema operacional já resolve. No Windows, pressione a tecla Windows + H e a barra de Voice Typing integrada abre onde quer que o cursor esteja, incluindo um campo do Final Draft ou WriterDuet. Ela pontua sozinha e serve bem para pausas curtas — o problema é que passa pelos servidores da Microsoft e precisa de internet, então não é uma opção offline, o que importa quando as páginas são inéditas. No Mac, o Dictation deixa você falar em qualquer campo de texto, configurado em Ajustes do Sistema em Teclado, e no Apple Silicon textos gerais podem ser processados no próprio dispositivo. E se você vive inteiramente dentro de um app, use o próprio recurso de voz desse app: o Dictate do WriterDuet e o ditado do Final Draft 13 no Mac entendem comandos de formatação falados que uma ferramenta global não consegue, o que é uma vantagem real enquanto você nunca sair daquele app.
Recorra a uma ferramenta global dedicada quando as opções integradas começarem a limitar: sessões longas de escrita, vocabulário personalizado para nomes de personagens, privacidade offline no Windows, ou querer um único atalho que se comporta da mesma forma no Final Draft, Fade In, Highland, no e-mail e nas notas. Mais uma fronteira honesta — nada disso serve para transcrever uma mesa redonda gravada ou uma entrevista para um roteiro. Isso é transcrição de arquivo, um trabalho diferente; envie uma gravação finalizada para um serviço de transcrição. Ditado é para as palavras que você está dizendo ao vivo, enquanto escreve.
A mecânica de plataforma é a mesma fora do mundo dos roteiros também — a forma como o ditado por voz funciona no Windows é idêntica esteja o cursor num app de roteiro ou numa planilha, porque o cursor, não o app, é a integração.
Nenhum app de roteiro lançou uma forma limpa e multiplataforma de falar o seu script para a página, e depois de escrever isso não acho que algum vai, porque o cursor é a integração. Performe a fala, capture as palavras, deixe o app cuidar da página. Ditei a maior parte deste guia numa caixa de texto que não era um app de roteiro, com uma ferramenta que não se importa com qual caixa é — que é exatamente como eu gostaria de escrever um roteiro se eu algum dia terminar o que está na minha pasta de rascunhos.
Experimente na sua próxima cena
Coloque o cursor num bloco de diálogo, segure o atalho, performe a fala, solte. As palavras aparecem no roteiro — e em todos os outros apps em que você escreve.
Modo local gratuito para qualquer conta logada. Sem cartão para começar.



