Por Denys Medvediev

Comparativo

Uma alternativa ao SpeechTexter que funciona fora do navegador

O SpeechTexter vive dentro de uma aba do Chrome e precisa da nuvem para ouvir. A alternativa mais poderosa para a maioria das pessoas é um app de ditado desktop que aciona um atalho, transcreve offline e cola o texto em qualquer app que você já esteja usando.

Última atualização: junho de 2026

Notebook sobre uma mesa exibindo uma página de busca na web, ilustrando ferramentas de ditado baseadas em navegador

A melhor alternativa ao SpeechTexter para a maioria das pessoas é um app de ditado desktop com um atalho global, porque o SpeechTexter vive dentro de uma aba do Chrome e para na borda dessa aba. O Whisper aciona um atalho, transcreve offline no próprio computador e cola o texto onde quer que o cursor esteja — Word, Slack, e-mail, em qualquer lugar — em vez de apenas em uma janela do navegador.

Testei o SpeechTexter numa terça-feira à noite para resolver uma discussão comigo mesmo. Clicar no microfone, falar, as palavras aparecem. Sem download, sem conta, gratuito. É uma ferramenta genuinamente bacana. Aí tentei jogar uma frase numa mensagem do Slack e lembrei do problema: ele só digita na própria página. A própria página inicial do SpeechTexter diz que o app web precisa do Chrome mais recente e nada mais. O atrito não é o ditado. O atrito são as paredes ao redor dele.

Essa limitação é exatamente o motivo pelo qual as pessoas buscam uma alternativa. O ditado por voz transformou minha pilha de e-mails de sábado em algo que eu conseguia fazer enquanto dobrava roupa — a qualidade da dobra não melhorou, mas a da digitação sim. O problema com uma ferramenta presa ao navegador é que o seu dia não está preso ao navegador. Você escreve num cliente de e-mail desktop, num app de chat, num bloco de notas, num editor de código. Uma ferramenta que só preenche uma caixa de texto na web te obriga a copiar e colar para sair dela toda vez. A solução não é uma página web melhor. A solução é um ditado que segue o cursor.

Abra uma aba, fale, veja digitar. É o SpeechTexter.

Notebook aberto mostrando uma página de buscas sobre uma mesa, representando uma ferramenta gratuita dentro do navegador

Crédito onde é devido: o SpeechTexter faz um trabalho bem-feito. É um app web gratuito e multilíngue de fala para texto, ideal para transformar notas, documentos, relatórios ou posts de blog em texto usando a voz — "escreva com sua voz", como o site define. Você abre a página, clica no microfone e ele transcreve em tempo real usando o reconhecimento de voz do Google no navegador, a Web Speech API que roda no servidor do Google. Mais de 70 idiomas estão disponíveis.

O único recurso que o SpeechTexter tem e a maioria das ferramentas de ditado no navegador não tem é uma lista de comandos de voz personalizáveis. Você pode falar #newparagraph, #newline, #undo ou #redo, além de criar seus próprios comandos para inserir pontuação, adicionar uma frase ou acionar uma ação — tudo por voz. Ele também coloca maiúsculas automaticamente, tem uma caixa de prévia da transcrição que pode ser ativada ou desativada e exporta para um arquivo .doc ou .txt. A própria afirmação de precisão do SpeechTexter é "acima de 90% deve ser esperado." É o número deles, não algo que eu medi.

Se você só dita naquele editor e depois copia o resultado, está tudo bem. O problema começa no momento em que a escrita acontece em outro lugar.

Onde o SpeechTexter para: uma aba do Chrome, sem offline, sem outros apps

Mouse de computador em foco sobre uma mesa de escritório com fundo desfocado, sugerindo atrito no fluxo de trabalho

Três paredes, e as pessoas batem nas três.

A primeira é o navegador. No desktop, o SpeechTexter exige o Google Chrome mais recente — outros navegadores não são suportados — no Windows, Mac ou Linux. Se você usa Firefox ou Safari, precisa trocar de navegador para ditar. A segunda parede é a própria aba: o texto fica na página do SpeechTexter, não no app onde você está escrevendo. Não há como colar em todo o sistema — Word, Slack, Teams, seu cliente de e-mail ou um editor de código. A terceira parede é a rede. Ele roda no mecanismo de fala em nuvem do Google, então precisa de conexão com a internet — a própria página de solução de problemas aponta para um "erro de rede" quando a conexão está ruim, e não há modo offline para o produto web. O app para Android que antes tinha suporte offline não é mais suportado.

Nada disso é um bug. É exatamente o que uma ferramenta de ditado no navegador é. Uma página web não consegue, por definição, acessar seus apps desktop, e uma ferramenta Web Speech não consegue transcrever sem se conectar a um servidor. Se essas três paredes nunca te atrapalham, você não precisa de uma alternativa. Se você já se pegou ditando no SpeechTexter e depois copiando e colando no lugar onde queria escrever, esse passo de copiar e colar é o sinal de que existe uma alternativa melhor. Se o problema é que o ditado não inicia no Chrome de jeito nenhum, é outro caminho — escrevi sobre as correções mais comuns para quando o ditado por voz não funciona no Chrome para quando a permissão do microfone ou o próprio mecanismo é o problema.

Pressione um atalho e dite em qualquer app

É aqui que fica clara a diferença de categoria. O Whisper é um app desktop, não uma página web. Você pressiona um atalho, fala, solta, e o texto aparece no cursor — em qualquer app que estiver aberto: um documento Word, uma conversa no Slack, uma mensagem no Discord, um chat no Teams, o VS Code, Notion, Obsidian, um rascunho de e-mail, um campo no navegador, em qualquer lugar onde você possa digitar. O atalho padrão é Ctrl+Space no Windows e Command+Option no Mac.

Não há aba para ficar dentro. O app em que você já está continua sendo o app em que você está. Sem copiar, sem colar, sem trocar para o Chrome primeiro. Passei um número embaraçoso de noites na parte de colar no cursor — o tipo de coisa que funciona em cinco segundos numa demonstração e leva um mês para funcionar de forma confiável em todos os apps. Tenho mestrado.

Whisper
O app Whisper de verdade — clique pelas Configurações e pelo painel de transcrição. Esta é a interface ao vivo, não uma captura de tela.

Esta é a parte que as pessoas subestimam até sentirem na prática. Com o SpeechTexter, ditar é um lugar para onde você vai. Com um atalho global, ditar é algo que você faz onde já está. Minha filha mais nova, de sete anos, testou isso melhor do que qualquer especificação técnica poderia. Mostrei uma vez — pressionar, falar, soltar, colar — e ela escreveu um e-mail de 90 palavras para a avó na Ucrânia sobre um dente que ela havia perdido e a taxa de câmbio da fadinha dos dentes. Ela não fez nenhuma pergunta sobre a ferramenta. Dois dias depois voltou com a única reclamação que importa: "não funciona no meu app de desenho." Ela não sabia o que era um conflito de atalho. Ela só sabia que as palavras deveriam aparecer onde ela estava olhando. Naquela noite lançamos atalhos personalizáveis. Essa é a régua: o texto vai para onde você está.

Funciona em mais de 90 idiomas nos modos local e na nuvem, e a linha de modelos multilíngues chega especificamente a 99+ idiomas com detecção automática — as variantes apenas em inglês continuam apenas em inglês, então não as confunda. Os modelos multilíngues também conseguem traduzir a fala para o inglês em tempo real, o que um mecanismo Web Speech do navegador não faz.

Offline e na sua máquina, não nos servidores do Google

Smartphone envolto por uma corrente com cadeado, simbolizando dados privados e protegidos

Aqui vai minha única opinião forte: ditado sem opção offline — onde a nuvem é o único caminho, não uma escolha — é um desastre de privacidade esperando para ser transcrito. A planilha de salários do seu chefe, o e-mail para a escola do seu filho, a nota jurídica que você está redigindo no trem — nada disso precisa passar pelos servidores de um fornecedor só porque você quer digitar com a voz. Transcrição na nuvem que você pode ativar quando quiser é ótima. Transcrição na nuvem que você não pode desligar é o problema. O SpeechTexter é honesto sobre ser baseado em nuvem; ele usa o reconhecimento de voz do Google e precisa de conexão para funcionar. Isso é ótimo para uma lista de compras. É mais difícil de justificar para qualquer coisa que você ficaria desconfortável em ler em voz alta em um escritório aberto.

O modo local do Whisper funciona completamente offline — sem internet durante a transcrição. A única vez que ele precisa de conexão é no download único do modelo, algo entre cerca de 140 MB e 3 GB dependendo do modelo escolhido. O mecanismo local subjacente é a mesma família de modelos OpenAI Whisper de código aberto que alimenta boa parte dessa categoria. Depois disso, cada palavra fica na sua máquina. Em um voo, em um notebook do trabalho bloqueado sem rede, em uma sala onde o Wi-Fi é apenas uma promessa — ele continua digitando.

Acompanhei uma equipe acumular uma conta na nuvem de cinco dígitos em um único trimestre transcrevendo gravações de stand-up, em grande parte porque um loop de "retry inteligente" transcreveu o mesmo áudio quatro vezes. O CFO abriu o painel na revisão trimestral e a sala ficou em silêncio. Nuvem tem seu lugar. Deve ser uma escolha que você faz, não o único caminho disponível.

Gratuito sem conta, mas o "grátis" significa coisas diferentes aqui

As duas ferramentas são gratuitas para começar, mas essa palavra faz trabalhos diferentes em cada caso. O SpeechTexter é gratuito no sentido mais puro: sem download, sem instalação, sem cadastro — você clica no microfone e está ditando. Nada para configurar, nada para fazer login. Essa é uma vantagem real e não vou fingir que não é.

O pipeline local do Whisper também é gratuito, mas aqui gratuito significa que você baixa um app desktop e cria uma conta no Whisper, depois baixa um modelo na primeira vez. Alguns minutos no início em vez de zero. O que você ganha por esses minutos é o atalho global, a transcrição offline e o comportamento de seguir o cursor. A camada Cloud — recursos OpenAI, traga sua própria chave — é o plano Pro pago separado; não confunda o app local gratuito com isso. O detalhamento completo está na página de preços. Versão curta: o ditado local não custa nada e nunca expira.

Então a comparação honesta é uma troca. O SpeechTexter cobra zero de configuração e zero de conta, e em troca te mantém em uma aba na nuvem. O Whisper cobra um download e um cadastro, e em troca te dá acesso a todos os apps e ao modo offline. Escolha o custo que prefere pagar.

Quando o SpeechTexter ainda é a melhor escolha

Espaço de trabalho minimalista elegante com mesa de madeira e vaso de vidro, uma cena leve e simples

Em algumas situações reais, eu mesmo pularia o app desktop, e o SpeechTexter vence essas situações sem discussão.

Se você está em uma máquina bloqueada onde não pode instalar software — um computador de biblioteca, um laboratório escolar, um notebook do trabalho com restrições de administrador — o SpeechTexter roda em uma aba do navegador sem pedir permissão de ninguém. Se você dita apenas ocasionalmente, um parágrafo aqui e ali, o modelo sem instalação e sem conta é genuinamente menos trabalhoso do que baixar qualquer coisa. Se você realmente usa aquela lista de comandos de voz personalizáveis — falando #newparagraph e #undo para formatar enquanto avança — esse é um fluxo de trabalho específico para o qual o SpeechTexter foi criado e que uma ferramenta de atalho desktop não replica da mesma forma. E se você escreve principalmente dentro de um editor web mesmo e raramente copia para outro lugar, a aba não é uma parede, é só onde você trabalha. Em todos esses casos, abra speechtexter.com, clique no microfone e não complique. Indicar a ferramenta certa quando ela é a mais adequada é o objetivo.

Outras ferramentas de ditado que vale conhecer

SpeechTexter e Whisper não são as únicas opções. Um mapa rápido e honesto do mercado:

  • Speechnotesoutro bloco de notas gratuito baseado em navegador, com o mesmo formato preso à aba que o SpeechTexter. Se você também está avaliando ele, veja o comparativo entre alternativas ao Speechnotes.
  • Dictation.io / Dictanoteferramentas gratuitas de digitação por voz baseadas no Chrome; mesmo limite de aba do navegador, sem colagem global.
  • Speechifyum produto de leitura com IA e voz que também faz digitação por voz; se posiciona como alternativa ao SpeechTexter.
  • LilySpeechuma ferramenta de ditado para Windows que usa um mecanismo baseado no Chrome para digitar em apps; prático no Windows, mas amarrado a essa configuração.
  • Apple Dictationintegrado ao macOS e iOS, gratuito, bom para textos curtos, exclusivo da plataforma Apple.
  • Windows Voice Typing (Win+H)integrado ao Windows, dita globalmente na maioria dos campos de texto, gratuito, sem instalação. Se estiver com problemas, o guia de alternativas ao Win+H cobre o que usar no lugar.

A divisão é simples. Ferramentas de navegador (SpeechTexter, Speechnotes, Dictation.io) são gratuitas e sem instalação, mas presas à aba e dependentes da nuvem. Ditado do sistema operacional (Win+H, Apple) é global e gratuito, mas exclusivo de uma plataforma e com qualidade variável. Apps desktop como o Whisper são globais, funcionam offline e são multiplataforma, ao custo de um download.

Então, o que eu escolheria de verdade

Se você quer o ditado mais rápido possível em uma máquina onde não pode instalar nada, fique com o SpeechTexter — é gratuito, instantâneo, e a lista de comandos de voz é um toque bacana. Para todo o resto — escrever nos seus apps de verdade, trabalhar offline, manter textos sensíveis na sua própria máquina — eu escolheria uma ferramenta desktop com atalho global. O ditado roda em torno de 145 palavras por minuto contra aproximadamente 40 na digitação, então o gargalo nunca foram seus dedos; foram as paredes ao redor das palavras. Escolha a ferramenta com menos paredes para o que você faz. Se quiser sentir a diferença, veja como a digitação por voz em qualquer app funciona na prática.

O SpeechTexter é uma boa ferramenta gratuita que faz exatamente o que diz dentro de uma aba do Chrome. O dia em que sua escrita sai dessa aba — para o e-mail, o chat, o editor, as anotações — é o dia em que você começa a querer que o ditado venha junto. Essa é a única diferença real, e é grande. Minha filha de sete anos descobriu isso em dois dias e um relatório de bug. O resto de nós provavelmente também consegue.

Experimente a diferença você mesmo

O SpeechTexter é uma ferramenta gratuita e limpa que vive em uma aba do Chrome. O dia em que sua escrita migra para o e-mail, o chat, o editor, as anotações é o dia em que você quer que o ditado venha junto. Baixe o Whisper, segure o atalho e veja a transcrição aparecer no app em que você está agora.

Transcrição local gratuita para sempre. Sem método de pagamento no cadastro. O período de teste Cloud de 7 dias pede um cartão apenas na hora do upgrade.

Foto de Denys Medvediev

Denys Medvediev

Sou eu quem lê nosso e-mail de suporte, muito provavelmente ditando as respostas.

Leitura adicional