Por Denys Medvediev

Guia

Software de ditado para escritores

Você fala um rascunho mais rápido do que consegue digitar. A solução é uma ferramenta que funciona em todo o sistema: pressione um atalho, fale, e as palavras aparecem onde o cursor está no Scrivener, Word, Google Docs ou em qualquer editor. Depois, dê um retoque com uma passagem de IA.

Última atualização: junho de 2026

Caderno aberto, caneta e café sobre uma mesa de madeira ao lado de um laptop, evocando a escrita de textos longos

O software de ditado para escritores transforma um primeiro rascunho falado em texto dentro de qualquer editor. Uma ferramenta de sistema como o Whisper cola no cursor no Scrivener, Word ou Google Docs com um único atalho, roda de graça e offline no Windows ou Mac, e uma passagem opcional de IA transforma o fluxo de fala em prosa legível.

Digitar é a parte mais lenta da escrita. As palavras já estão na sua cabeça, formadas em frases, e então você as filtra por dez dedos a uns quarenta palavras por minuto. Eu falo em torno de três vezes mais rápido — e você também. O gargalo nunca foram as ideias. Foi o teclado.

Escritores pesquisam "software de ditado" e topam com a lembrança do Dragon NaturallySpeaking, uma licença de $699 e uma sessão de treinamento de quarenta e cinco minutos. Esse mundo acabou. O ditado que um romancista ou blogueiro precisa em 2026 é um atalho que joga o texto falado em qualquer editor que ele já usa, seguido de uma passagem de IA para arrumar o resultado. Sem licença. Sem plugin por aplicativo. Roda no notebook que você já tem.

Aqui está o detalhe que a maioria das páginas sobre ditado para escritores omite. Seu editor não precisa de um recurso de ditado. Um documento no Scrivener, uma página no Word, uma janela no Google Docs — são todos apenas caixas de texto com um cursor. Uma ferramenta que cola no cursor não se importa qual deles está aberto.

Então a pergunta certa não é "qual aplicativo de escrita tem o melhor reconhecimento de voz". Nenhum deles foi construído para ditado de textos longos, e você também não quer ficar preso a um só. A pergunta é "qual ferramenta de ditado funciona em cima de todos eles", e a resposta honesta é um atalho offline que se comporta da mesma forma em todos os programas. Vou mostrar o fluxo de trabalho, configurar em dois minutos e dizer quando pular o ditado de vez.

Por que escritores recorrem ao ditado

Mãos de um escritor pousadas perto de um caderno e teclado, pausando entre frases

O primeiro rascunho é a tarefa para a qual o ditado foi feito. Um primeiro rascunho deve ser rápido e imperfeito — pegue a forma, corrija depois. Digitar atrapalha isso, porque digitar é cuidadoso por natureza; você vê as palavras aparecerem e vai mexendo nelas. Falar não deixa mexer. Você diz a frase, ela fica ali, você segue em frente. Para um romancista avançando por um capítulo ou um blogueiro tentando limpar um post de 1.500 palavras antes de as crianças acordarem, esse impulso para frente é o ponto central.

A diferença de velocidade é real e não é sutil. A digitação sustentada para a maioria das pessoas fica em torno de quarenta palavras por minuto. Falar chega perto de cento e quarenta e cinco. Você não vai escrever um capítulo acabado e polido nessa velocidade — ninguém consegue — mas vai jogar a matéria-prima em um terço do tempo, e editar algo existente é mais rápido do que encarar uma página em branco. A parte cara da escrita é começar. O ditado torna o começo barato.

Há também um motivo mais silencioso, e vou ser honesto: o ditado descansa as mãos. Se você escreve para viver, o teclado vai acumulando carga, e poder rascunhar uma seção longa recostado na cadeira alivia os pulsos. É um aparte de produtividade, não conselho médico — mas é uma razão real pela qual escritores que conheço adotaram o ditado, e é a mesma lógica por trás de migrar para a voz para aliviar o esforço no teclado. Menos teclas para a mesma contagem de palavras é simplesmente um bom negócio.

Pressione um atalho, fale, e o rascunho aparece no editor

O mecanismo é simples, o que é exatamente por isso que funciona em qualquer lugar. Você pressiona um atalho, fala o parágrafo, solta a tecla, e a transcrição é colada no cursor — em qualquer campo de texto que estiver em foco. O Whisper mantém uma pequena janela depois que você solta a tecla, para que a última palavra de uma frase não seja cortada. Como ele cola no cursor, seu editor no Scrivener, uma página no Word e uma janela no Google Docs são todos apenas "qualquer caixa de texto". Mesmo atalho, mesmo comportamento, sempre.

Esse é o ponto que as ferramentas de ditado mais antigas nunca acertaram. Não há plugin para instalar no Scrivener, nenhum modo de ditado separado para configurar no Word, nenhuma extensão para autorizar no Docs. Seu cursor está no capítulo, você fala, as palavras aparecem no capítulo. Uma pequena cápsula aparece enquanto você fala para indicar que está sendo ouvido:

Cancel
O indicador de gravação: uma pequena cápsula que aparece enquanto você fala, mostrando que o Whisper está ouvindo.

O atalho é a única coisa que vale acertar logo de início. No Windows é Ctrl+Space; no Mac é Command+Option, um push-to-talk que você segura enquanto fala. Ambos podem ser alterados em Configurações se conflitarem com algo que você já usa — um aplicativo de escrita com atalhos próprios, por exemplo. (A primeira versão tinha o atalho fixo no código, o que durou até exatamente um usuário descobrir que colidia com o software de música dele às duas da manhã. Agora tudo é personalizável.) Se você já configurou reconhecimento de voz no Windows ou no Mac antes, é a mesma memória muscular apontada para o seu manuscrito.

Configure em dois minutos (Windows ou Mac)

Você precisa de um Mac com Apple Silicon ou um PC com Windows 10 ou mais recente, um microfone funcionando e o editor de sua preferência aberto. Todo o pipeline local é gratuito para qualquer conta logada, sem exigência de forma de pagamento no cadastro. Veja a sequência.

Passo 1 — Instale o Whisper e faça login.

Baixe pela página de download, instale e crie uma conta gratuita. Sem cartão. Todo o pipeline de transcrição local fica disponível imediatamente.

Você saberá que funcionou quando o ícone do app aparecer na bandeja do sistema e o assistente de configuração oferecer a escolha de um modelo.

Passo 2 — Escolha o modo de transcrição.

O app não escolhe por você. Você tem três opções: Cloud (OpenAI, chave própria), Parakeet Local ou Whisper Local. Para manuscritos que você prefere manter fora de qualquer servidor, comece local — mais sobre isso duas seções abaixo.

Você saberá que funcionou quando um modelo terminar de baixar e aparecer como pronto.

Passo 3 — Confirme seu atalho.

O padrão no Windows é Ctrl+Space; no Mac é Command+Option, mantido como push-to-talk. No Mac, conceda a permissão de Acessibilidade quando solicitado; sem ela, a colagem no cursor não consegue alcançar outros apps.

Você saberá que funcionou quando uma gravação de teste for colada em qualquer campo de texto.

Passo 4 — Posicione o cursor no rascunho e fale.

Abra o Scrivener, Word ou seu documento no navegador, clique na página, segure o atalho, diga uma frase, solte. A transcrição aparece onde o cursor estava.

Você saberá que funcionou quando a frase que você disse estiver no manuscrito como texto.

Whisper
O app de desktop Whisper real na tela de configurações, com os painéis de Transcrição e IA abertos.

A parte demorada é o download do modelo, não a configuração. Todo o resto são os quatro passos acima. Uma vez que estiver rodando, o ato de colocar um parágrafo na página deixa de ser uma tarefa de digitação e vira uma tarefa de fala — que é a única mudança que você realmente queria.

reconhecimento de voz no Windows · no Mac

Um fluxo de trabalho de rascunho que sobrevive a um capítulo de verdade

Ditar um capítulo inteiro não é a mesma coisa que ditar um e-mail, e fingir que é a receita para desistir na primeira semana. O truque é separar os dois trabalhos que os escritores costumam fazer ao mesmo tempo. Rascunhar é um trabalho: tirar as palavras de dentro, em ordem, rápido, sem julgá-las. Editar é outro trabalho: pontuação, quebras de parágrafo, a frase que você disse duas vezes. O ditado é brilhante no primeiro e desajeitado no segundo. Então separe-os. Fale o rascunho de cima a baixo, depois volte e molde com o teclado que você nunca vai aposentar completamente.

Alguns hábitos ajudam a manter o ritmo. Fale em frases completas, não fragmentos — a transcrição fica mais precisa quando tem um pensamento completo para trabalhar. Diga "novo parágrafo" em voz alta como marcador que você vai encontrar na edição, mesmo que a ferramenta não aja sobre isso, porque um muro de texto ditado é difícil de retomar. Mantenha um glossário dos seus próprios substantivos próprios por perto; nomes de personagens, lugares inventados e jargões técnicos são onde qualquer motor de reconhecimento chuta, e o Whisper local permite que você direcione o vocabulário para que "Aeryn" pare de virar "Erin". Nada disso é complicado. É só tratar o rascunho como um rascunho.

A expectativa honesta: uma seção de 2.000 palavras ditada sai como prosa legível, corrida, ligeiramente informal demais, mas com a estrutura no lugar. Isso é uma vitória. Você passou quinze minutos falando em vez de uma hora digitando, e agora tem algo para editar em vez de um cursor piscando para você. Eu rascunho coisas longas assim e depois faço as edições precisas à mão no teclado — voz para volume, teclas para polimento. Os dois não são rivais.

Local ou cloud: qual modo usar para um manuscrito

Para sua própria escrita, experimente o modo local primeiro. Um manuscrito é algo privado até você decidir que não é, e não há motivo para rotear um capítulo inédito pelo servidor de alguém só para transformar sua voz em texto. Se o seu Mac é Apple Silicon ou o seu PC é dos últimos anos, o local resolve o rascunho do dia a dia sem reclamar, e o cloud vira a saída de emergência, não o padrão.

Veja como os três caminhos diferem, porque o app faz você escolher e prefiro que você escolha bem:

  • Parakeet LocalMotor TDT da NVIDIA, cerca de 600 MB, e a opção local mais rápida — de 5 a 10 vezes mais rápido que o Whisper em CPU. Cobre inglês mais 24 outros idiomas europeus, 25 no total. Sem tradução para inglês, sem vocabulário personalizado. Se você escreve em inglês e quer velocidade, esta é a escolha rápida e totalmente offline.
  • Whisper Localmais lento que o Parakeet na mesma máquina, mas as versões multilíngues cobrem 99 idiomas e podem traduzir para o inglês, além de oferecer suporte a vocabulário personalizado — o recurso que mantém os nomes dos seus personagens intactos. As versões exclusivas em inglês só cobrem inglês, não os 99. Escolha este para glossários de personagens, trabalho multilíngue ou tradução. O modelo padrão em inglês tem cerca de 480 MB.
  • Cloud (OpenAI, chave própria)melhor precisão e acesso à web, usando sua própria chave OpenAI cobrada diretamente pela OpenAI. A transcrição usa gpt-4o-mini-transcribe por padrão. Precisa de internet, então é o único caminho que sai da sua máquina. A superfície Cloud faz parte do Whisper Pro.

A verdade simples é que para um rascunho funcional, o local é mais do que suficiente. Ambos os motores locais rodam completamente na sua máquina sem enviar nada para um servidor, o que importa quando o arquivo é um livro que ninguém leu ainda. O cloud ganha seu lugar quando você quer precisão máxima em uma gravação difícil ou precisa que o modelo busque um fato na web no meio de uma frase. Para o trabalho diário de capítulo, comece local e só recorra ao cloud quando o local deixar a desejar.

Transformando um rascunho falado em prosa limpa

O ditado bruto sai corrido, e isso é normal. Você diz "ok então a detetive entra ela não fala nada ainda hm ela só olha pro corpo e aí as luzes apagam", e esse é o fluxo sem pontuação que qualquer motor de reconhecimento entrega. O rascunho está todo lá; as vírgulas não estão. Limpá-lo é onde os modos divergem.

O Windows Voice Typing adiciona pontuação enquanto você fala, e o macOS Dictation cuida da pontuação básica quando você diz "vírgula" ou "ponto". Para uma limpeza mais pesada — tirar os "ehs", corrigir as frases corridas, quebrar um monólogo falado em frases que você realmente guardaria — o Whisper pode rodar uma passagem de IA. Diga a frase de ativação "Hey whisper" e o texto é aprimorado antes de chegar. Em um modelo local isso roda via Ollama; no modo cloud é gpt-5-mini por padrão.

Thinking...
Bruto

ok então a detetive entra ela não fala nada ainda hm ela só olha pro corpo e aí as luzes apagam

Limpo

A detetive entra. Ela não fala nada ainda — só olha para o corpo. Então as luzes apagam.

Uma ressalva que os escritores precisam ouvir claramente: a passagem de IA é para mecânica, não para voz. Ela corrige pontuação e palavras de preenchimento; não deve reescrever suas frases deixando-as mais apagadas do que o que você disse. Use-a para tornar o rascunho legível, depois faça a edição de verdade você mesmo, porque o ritmo de uma linha é a parte que nenhum modelo tem direito de possuir. A divisão honesta de trabalho é: a voz coloca as palavras, a passagem de IA as torna legíveis, e você as torna suas.

Esse mesmo fluxo de falar e limpar vai muito além de um manuscrito — você também pode manter um diário de voz ditando em qualquer app para que as anotações do dia virem algumas frases faladas em vez de uma página que você digita à meia-noite.

Quando pular o ditado e buscar outra coisa

Duas setas pintadas no asfalto apontando em direções diferentes, ilustrando uma escolha

O ditado é a ferramenta certa para rascunhar suas próprias palavras. É a ferramenta errada para dois trabalhos que os escritores frequentemente confundem com ele, e dizer isso em voz alta poupa uma tarde frustrante.

Se o seu trabalho é transformar uma entrevista gravada, um podcast ou um arquivo de reunião em transcrição, isso é transcrição, não ditado — uma categoria diferente. Você quer um serviço de transcrição que ingira um arquivo de áudio e devolva um documento com marcação de tempo e identificação de falantes. Um atalho de push-to-talk foi feito para fala ao vivo no seu próprio cursor, não para processar um arquivo gravado antes. E se você só precisa anotar uma frase no celular — uma linha de diálogo que chegou na fila do mercado — o microfone integrado do teclado no seu telefone já faz isso, e o Whisper é desktop exclusivo no Windows e macOS. Não instale um app de desktop para capturar uma linha só.

Há também um nível gratuito já na sua máquina para uso rápido. No Windows, pressione a tecla Windows + H e a barra de digitação por voz integrada abre no cursor; pontua sozinha e funciona bem para uma frase ou duas, embora passe pelo servidor da Microsoft e precise de internet, então não é uma opção offline. No Mac, o Dictation deixa você falar em qualquer campo de texto, configurado em Preferências do Sistema em Teclado, e no Apple Silicon o texto geral pode ser processado no dispositivo. Recorra a uma ferramenta dedicada para todo o sistema quando essas opções começarem a limitar: rascunhos longos, privacidade offline para um manuscrito, vocabulário personalizado para os nomes dos seus personagens, ou querer um atalho que se comporte da mesma forma no Scrivener, no e-mail e no editor do blog. Abaixo desse nível, use o que é gratuito. Não vou mandar você instalar um app para capturar uma linha de diálogo solta.

E se o motivo pelo qual você está olhando para a voz em primeiro lugar é o esforço de longas horas no teclado, a troca está explicada em migrar para o ditado para aliviar as mãos — mesma lógica de produtividade, menos teclas para a mesma contagem de páginas.

Cresci perto de um familiar que tinha o Dragon NaturallySpeaking em um computador com Windows 98 e 64 megabytes de RAM. O treinamento levava quarenta e cinco minutos — você lia uma lista de palavras para calibrá-lo — e então o ditado funcionava com uns setenta por cento de precisão e quatro segundos de atraso por frase. Levava quinze minutos para ditar um parágrafo de uma carta de fim de ano, e o headset acabou sendo atirado pela sala. Vinte e cinco anos depois, um capítulo rascunhado aparece no cursor em cerca de um segundo e meio, offline, de graça. O headset sobreviveu, aliás. Ditei a maior parte deste guia em uma caixa de texto e depois editei com o teclado — que é exatamente o fluxo de trabalho que estou recomendando. Experimente na próxima coisa que você tiver que escrever.

Fale o próximo capítulo direto na página

Segure o atalho, rascunhe um parágrafo em voz alta, solte. O texto aparece no seu editor — e em todos os outros apps onde você escreve também.

Modo local gratuito para qualquer conta logada. Sem cartão para começar.

Foto de Denys Medvediev

Denys Medvediev

Sou o responsável por ler o e-mail de suporte, provavelmente ditando as respostas.

Leitura complementar