Guia
Voz em texto no editor do Substack
O editor de posts do Substack não tem ditado embutido. Seus recursos de áudio narram um post pronto; eles não ajudam você a escrevê-lo. A solução é uma ferramenta que funciona em todo o sistema: pressione um atalho, fale, e suas palavras chegam ao cursor dentro do editor.
Última atualização: junho de 2026

A voz em texto no editor do Substack funciona por meio de uma ferramenta que atua em todo o sistema, não pelo próprio Substack. O editor de posts do Substack não tem recurso de ditado; suas opções de áudio só narram textos prontos. Uma ferramenta como o Whisper resolve isso: pressione um atalho, fale, e a transcrição é colada no cursor dentro do editor; depois, um passe de IA limpa a fala solta.
Eu escrevo uma pequena newsletter, e a maioria dos meus melhores parágrafos surge enquanto passeio com o cachorro, não enquanto estou sentado ao teclado. Então fui atrás de um jeito de falar um rascunho direto no editor do Substack. Encontrei um monte de páginas sobre o recurso de narração do Substack. Nenhuma delas era sobre o que eu realmente queria, que é o caminho inverso.
Aqui está a confusão em que quase todo resultado de busca tropeça. O Substack transforma de bom grado o seu post pronto em áudio. Ele não vai transformar o seu áudio em post. São direções opostas, e a segunda — ditar o rascunho — não tem botão nenhum em lugar algum do editor. A solução vive fora do Substack, leva cerca de dois minutos para configurar e funciona em todos os outros aplicativos em que você escreve também.
Eis o que os artigos sobre narração escondem. O editor de posts do Substack é uma caixa de texto rich-text no navegador, do mesmo tipo de uma janela de redação do Gmail ou de um Google Doc. O ditado que cola no seu cursor não liga para qual caixa está recebendo o texto.
Então a pergunta certa não é "como eu ativo o ditado no Substack". Não existe interruptor, e o menu de áudio que você fica encontrando faz o trabalho oposto. A pergunta é "qual ferramenta de ditado eu uso por cima do editor do Substack", e a resposta depende de você querer algo gratuito e já embutido, ou um atalho offline que se comporta igual em todo lugar. Vou mostrar tudo, configurar uma em dois minutos e te dizer quando pular o caminho da ferramenta dedicada.
O editor do Substack tem ditado?

Não. O editor de posts do Substack não tem nenhum recurso embutido de voz em texto, ditado ou digitação por voz para escrever o seu rascunho falando. Não há botão de microfone que digita por você, nenhum comando de voz, nenhuma preferência escondida. Se você anda procurando isso na barra de ferramentas do editor, pode parar. Não está lá.
O que existe — e o que todo resultado de busca insiste em te entregar no lugar — é o menu de áudio atrás do ícone de fones de ouvido. Isso é narração e texto em fala. A narração permite que você grave a si mesmo lendo um post que já escreveu, ou que envie um arquivo de áudio, para que os assinantes possam ouvir. O texto em fala, disponível em algumas publicações, faz uma voz sintética ler em voz alta o seu post pronto. Os dois pegam texto e produzem áudio. O ditado faz exatamente o contrário: pega a sua voz e produz texto. As pessoas confundem os dois porque ambos envolvem um microfone e a palavra "voz", e essa confusão custa uma tarde de buscas. Prefiro que você pule essa tarde.
A distinção importa porque ela te diz onde procurar. Você não vai encontrar ditado dentro do Substack, por mais que fique encarando o painel de áudio, porque ele nunca foi construído ali. O editor é uma caixa de texto que espera digitação. Para colocar a sua voz nele, você precisa de uma ferramenta que fica por cima do navegador e envia o texto para onde quer que o cursor esteja. Há dois caminhos honestos, e o resto deste guia cobre os dois.
Pressione um atalho, fale, e as palavras aparecem no editor
Essa é a mecânica inteira, e é entediante no melhor sentido. Você pressiona um atalho, fala, solta, e a transcrição é colada no seu cursor, em qualquer campo de texto que estiver em foco. O Whisper mantém uma pequena sobra de tempo depois que você solta a tecla, para que a sua última palavra não seja cortada. Como ele cola no cursor do sistema, o editor do Substack é só "mais uma caixa de texto". Um editor web sem API para integrar, sem espaço para plugin — e isso não importa, porque o ditado nunca toca no código do Substack. Ele digita onde você já está digitando.
É essa a parte que as landing pages complicam à toa. Não há nada para instalar dentro do Substack, nenhum token para colar nas configurações da sua publicação, nenhuma integração para aprovar. O seu cursor está no editor, você fala, as palavras aparecem no editor. Uma pequena cápsula surge enquanto você fala, para que você saiba que ele está ouvindo:
O atalho é a única coisa que vale a pena acertar logo de cara. No Windows é Ctrl+Space; no Mac é Command+Option, um push-to-talk só com modificadores que você segura enquanto fala. Ambos podem ser alterados nas Configurações se entrarem em conflito com algo que você já usa. (Minha filha mais nova uma vez me disse que um atalho "não funcionava" no aplicativo de desenho dela. Era um conflito, não um bug, e foi assim que aprendi que a pessoa comum não faz a menor ideia do que seja um conflito de atalho. Então agora todo atalho é personalizável.) Se você já configurou o ditado no Windows ou no Mac, essa é a mesma memória muscular apontada para a sua newsletter.
Configure em dois minutos (Windows ou Mac)
Você precisa de um Mac com Apple Silicon ou um PC com Windows 10 ou mais recente, um microfone funcionando e o Substack aberto no navegador com um rascunho de post na tela. Todo o pipeline local é gratuito para qualquer conta com login, sem método de pagamento solicitado no cadastro. Aqui está a sequência.
Passo 1 — Instale o Whisper e faça login.
Baixe na página de download, instale e crie uma conta gratuita. Sem cartão. Todo o pipeline local de transcrição fica disponível na hora.
Você vai saber que deu certo quando o ícone do app aparecer na bandeja do sistema e o assistente de configuração oferecer para escolher um modelo.
Passo 2 — Escolha um caminho de transcrição.
O app não escolhe por você. São três: Nuvem (OpenAI, com a sua própria chave), Parakeet Local ou Whisper Local. Para redigir posts na sua própria máquina, comece pelo local — mais sobre isso duas seções abaixo.
Você vai saber que deu certo quando um modelo terminar de baixar e aparecer como pronto.
Passo 3 — Confirme o seu atalho.
O Windows usa Ctrl+Space por padrão; o Mac usa Command+Option segurado como push-to-talk. No Mac, conceda a permissão de Acessibilidade quando for solicitada; sem ela, a colagem no cursor não consegue alcançar o seu navegador.
Você vai saber que deu certo quando uma gravação de teste for colada em qualquer campo de texto.
Passo 4 — Coloque o cursor no editor do Substack e fale.
Abra um rascunho, clique no corpo do texto, segure o atalho, diga uma frase e solte. A transcrição aparece onde o cursor está, dentro do editor.
Você vai saber que deu certo quando a sua frase falada estiver no rascunho do Substack como texto.
A parte lenta é o download do modelo, não a configuração. Todo o resto são os quatro passos acima. Quando está rodando, o ato de colocar um rascunho na página deixa de ser uma tarefa de digitar e passa a ser uma tarefa de falar — o que, para uma newsletter, é a maior parte do trabalho.
Por que um editor de navegador precisa de uma ferramenta que funcione em todo o sistema
O editor do Substack roda no seu navegador, e isso determina o que é sequer possível. A maioria dos aplicativos nos quais você gostaria de ditar tem uma versão desktop com ganchos profundos; um editor rich-text web não tem nada disso. Não há loja de plugins, nenhum ponto de extensão que o Substack exponha para escrever dentro de um post. Então a integração não pode vir de dentro do Substack. Ela tem que vir de uma camada acima do navegador.
Um atalho que funciona em todo o sistema é exatamente essa camada. Ele cola no cursor do sistema operacional, não importa qual janela seja a dona dele, então a mesma tecla que preenche o seu rascunho do Substack também preenche a sua caixa de redação do Gmail, uma mensagem no Slack e uma mensagem de commit. Uma ferramenta, todos os campos de texto, no Windows e no Mac. Você não reaprende nada quando passa de redigir um post a responder o e-mail de um leitor — é o mesmo pressionar-falar-soltar em todo lugar.
É também por isso que uma extensão de navegador que só funcionasse no Substack seria a forma errada de resolver o problema. Escritores não vivem em uma única aba. Você redige no Substack, pesquisa em outra janela, responde comentários no app, anota a próxima ideia onde quer que ela apareça. Uma ferramenta limitada a um único site resolve uma fatia; uma ferramenta ligada ao cursor resolve o problema inteiro. Eu troco de aplicativo umas quarenta vezes por hora e não quero ter que lembrar de quarenta botões de ditado diferentes.
Local ou nuvem: qual modo usar para redigir posts
Para o rascunho de uma newsletter, comece pelo modo local. Um post pela metade é o seu próprio pensamento bruto — opiniões que você ainda não formou por completo, um parágrafo que talvez você corte, aquela coisa que você não tem certeza se quer publicar ainda. Seria uma escolha estranha mandar cada frase não polida para a nuvem de alguém só para colocá-la na sua própria tela. Se o seu Mac tem Apple Silicon ou o seu PC é dos últimos anos, o local dá conta do ditado do dia a dia sem reclamar, e a nuvem vira a saída de emergência, não o padrão.
Veja como os três caminhos diferem, já que o app faz você escolher e eu prefiro que você escolha bem:
- Parakeet Local — O motor TDT da NVIDIA, cerca de 600 MB, e a opção local mais rápida — de 5 a 10 vezes mais rápida que o Whisper na CPU. Cobre inglês mais 24 outros idiomas europeus, 25 no total. Não traduz para o inglês. Se você escreve a sua newsletter em inglês ou em outro idioma europeu, essa é a escolha rápida e totalmente offline.
- Whisper Local — mais lento que o Parakeet na mesma máquina, mas as versões multilíngues cobrem 99 idiomas e podem traduzir para o inglês. As versões somente em inglês são só inglês, não 99. Escolha esta para chinês, japonês, coreano ou qualquer trabalho de tradução, que o Parakeet não faz. O modelo padrão em inglês tem cerca de 480 MB.
- Nuvem (OpenAI, BYOK) — a melhor precisão e acesso à web, usando a sua própria chave da OpenAI cobrada direto pela OpenAI. A transcrição roda por padrão no gpt-4o-mini-transcribe. Precisa de internet, então é o único caminho que sai da sua máquina. A camada de Nuvem faz parte do Whisper Pro.
A verdade entediante é que, para o tipo de prosa que a maioria dos autores de newsletter coloca na página, o local é mais do que suficiente. Os dois motores locais rodam inteiramente na sua máquina, sem nada enviado a um servidor. A nuvem ganha o seu lugar quando você quer precisão de primeira linha em uma gravação confusa, ou quer que o modelo busque um dado na web enquanto você redige. Para um hábito de escrita regular, comece pelo local e só recorra à nuvem quando o local te deixar querendo mais.
Transforme uma fala solta em um parágrafo limpo
O ditado bruto sai como um amontoado sem pontuação. Você fala do jeito que pensa, num único fôlego longo e sem pausas, e é essa parede de texto que qualquer motor de fala te entrega. Para um e-mail pronto, é irritante. Para um post que você vai publicar com o seu próprio nome, é um problema — ninguém quer publicar um parágrafo que parece uma transcrição. Arrumar isso é onde o valor de verdade de redigir por voz aparece.
A Digitação por Voz do Windows adiciona pontuação enquanto você fala, e o Ditado do macOS cuida da pontuação básica quando você diz "vírgula" ou "ponto". Para uma limpeza mais pesada — tirar os "ãhs", consertar os amontoados, transformar uma fala solta em um parágrafo que você realmente publicaria — o Whisper pode rodar um passe de IA. Diga a frase de ativação "Hey whisper" e o texto é aprimorado antes de chegar. Num modelo local isso roda pelo Ollama; no modo nuvem é o gpt-5-mini por padrão. O antes e depois é a coisa toda:
tá então a coisa que eu queria dizer essa semana é que a maioria dos conselhos de produtividade é só conselho de digitação disfarçado ãh tipo você não precisa de um app melhor você precisa parar de digitar tanto
A coisa que eu queria dizer esta semana é que a maioria dos conselhos de produtividade é só conselho de digitação disfarçado. Você não precisa de um app melhor. Você precisa parar de digitar tanto.
Vale dizer o limite honesto, porque as demonstrações não vão dizer. A voz te dá as palavras; ela não te dá a formatação. Os cabeçalhos, o negrito, as citações em bloco, os links e aquela linha divisória do Substack vêm todos da própria barra de ferramentas e dos atalhos do editor. Dite a frase e, depois, vá até a barra de ferramentas para criar o H2 ou inserir o link do jeito que você sempre faz. Nenhuma ferramenta de ditado faz surgir uma citação em destaque do Substack por comando de voz. Coloque a prosa no papel rápido pela voz, depois dê forma ao post com o editor que você já conhece.
Esse mesmo fluxo de falar e depois limpar compensa muito além da sua newsletter — você também pode ditar prosa limpa em qualquer aplicativo com o mesmo atalho, então um bloco longo vira algumas frases faladas em vez de um parágrafo que você martela à mão.
Quando dispensar uma ferramenta de ditado para o Substack

Às vezes a ferramenta certa é a gratuita que já está na sua máquina, e fingir o contrário seria desonesto. Se você só coloca uma linha curta no editor de vez em quando — uma nota de uma frase, uma resposta rápida nos comentários — o seu sistema operacional resolve isso de graça.
No Windows, pressione tecla Windows + H e a barra embutida de Digitação por Voz abre onde quer que o seu cursor esteja, incluindo o editor do Substack. Ela pontua sozinha e funciona bem para usos curtos. O porém: ela passa pelos servidores da Microsoft e precisa de conexão com a internet, então não é uma opção offline. No Mac, o Ditado permite que você fale para inserir texto em qualquer lugar onde você possa digitar, configurado em Ajustes do Sistema, em Teclado, e no Apple Silicon o texto em geral pode ser processado no próprio dispositivo. Para uma frase rápida num rascunho, qualquer um dos dois é genuinamente bom, e eu não vou tentar te convencer a abrir mão do que é de graça.
Recorra a uma ferramenta dedicada, que funcione em todo o sistema, quando os recursos embutidos começarem a doer: posts longos, o passe de limpeza por IA que transforma uma fala solta em prosa publicável, escrita multilíngue, redigir offline, ou querer um único atalho que se comporta igual no Substack, no seu e-mail e no seu app de notas. Uma newsletter é o caso de texto longo, então a maioria dos escritores cruza essa linha rápido — mas abaixo dela, use o que é de graça. Eu não vou te dizer para instalar um app só para responder um comentário de uma linha.
O mesmo dilema aparece onde quer que você escreva — a lógica de ditar no Gmail é idêntica, porque ambos são caixas de texto no navegador onde o cursor, não um plugin, é a verdadeira integração.
Leituras complementares
O Substack vai ler o seu post pronto em voz alta, e faz isso bem. Ele só não vai te ajudar a escrever a coisa em primeiro lugar e, depois de escrever isto, tenho quase certeza de que nunca foi a intenção dele. Tudo bem, porque o cursor é a integração. Fale dentro do editor, obtenha texto, limpe com um passe de IA, dê forma ao post com a barra de ferramentas que você já conhece. Eu redigi a maior parte deste guia por voz, numa caixa que não era o Substack, com uma ferramenta que não liga para qual caixa é, e depois colei tudo num rascunho. Esse é o truque inteiro.
Experimente no seu próximo rascunho do Substack
Segure o atalho, fale, solte. A transcrição chega no editor, onde o seu cursor está — depois um passe de IA transforma a fala solta em um parágrafo que você publicaria.
Modo local gratuito para qualquer conta com login. Nenhum cartão necessário para começar.



