Comparativo
Alternativa ao digitação por voz do Google: dite em qualquer lugar
A digitação por voz do Google fica presa dentro do Google Docs. Aqui está o comparativo honesto, lado a lado, com um app de ditado para desktop que escreve onde quer que esteja o seu cursor — e uma resposta direta sobre quando a ferramenta nativa e gratuita ainda é a escolha certa.
Última atualização: junho de 2026

A melhor alternativa à digitação por voz do Google é um app de ditado para desktop que escreve em todos os campos de texto, não só no Google Docs. O Whisper by Remskill roda no Windows e no Mac, transcreve offline com modelos de IA locais e gratuitos, pontua automaticamente e cola o texto onde quer que o cursor esteja — e-mail, Slack, Word ou qualquer navegador.
Terça de manhã, um e-mail de 80 palavras para a professora que precisava sair antes da corrida pra escola. Eu estava com a digitação por voz aberta no Google Docs, ditei três parágrafos caprichados, pulei pro Gmail pra escrever a resposta de verdade e me peguei falando com uma janela de redação que nunca esteve ouvindo. A digitação por voz do Google tem uma regra só: fique dentro do documento. O microfone mora no menu Ferramentas do Docs, e ele não te acompanha pra fora.
Então você dita numa aba, copia, troca, cola, conserta a pontuação que esqueceu de falar em voz alta e envia. Essa corrida de revezamento é o caso inteiro a favor de uma alternativa. A decisão desta página é simples: ficar com a ferramenta gratuita que vive dentro de um único app, ou migrar para um ditado que segue o seu cursor por toda parte.
Aqui está a lacuna: a digitação por voz do Google escreve em documentos do Google Docs e nas anotações do apresentador do Slides — e o seu dia de escrita não fica só nesses lugares. Enquanto isso, o ditado para desktop amadureceu: modelos de IA locais agora rodam num notebook comum, ajeitam o que você fala enquanto você fala e nunca enviam áudio para lugar nenhum.
Este comparativo coloca a digitação por voz do Google ao lado do Whisper by Remskill, o app de ditado para desktop que eu desenvolvo, em cinco eixos: onde eles escrevem, pontuação, idiomas, privacidade e comportamento offline. Ao final, você vai saber qual se encaixa no seu jeito de escrever. Se a resposta honesta for "continue com o Google", a seção lá perto do fim diz isso com todas as letras. Eu dito a maior parte da minha própria escrita, incluindo as respostas de suporte, então isso vem do uso diário, não de uma página de recursos.
O que a digitação por voz do Google faz bem, e onde ela para
Crédito primeiro. A digitação por voz do Google é gratuita com uma conta Google, não exige nenhuma instalação e funciona nas versões mais recentes do Chrome, Edge e Safari. Dentro de um documento do Docs, ou nas anotações do apresentador e legendas do Slides, o reconhecimento é decente e a lista de idiomas é longa. Se você rascunha tudo no Docs, ela vale a pena, e o nosso passo a passo da digitação por voz do Google Docs cobre a configuração em detalhes.
As limitações são igualmente concretas. A pontuação é manual: você diz "ponto", "vírgula", "ponto de interrogação", "novo parágrafo". E a pontuação não está disponível em todos os idiomas. Os comandos de edição e formatação só funcionam em inglês, e só quando tanto o idioma da sua conta quanto o do documento estão em inglês. (As anotações do apresentador do Slides ganham digitação por voz, mas nenhum comando de voz. Eu também não sei por quê.)
E o limite que deu início a este artigo: o recurso existe dentro de duas superfícies do Google e em nenhum outro lugar. Gmail, Slack, o seu CRM, o seu editor de código, um formulário web — silêncio. Nada disso é um bug. É um recurso gratuito fazendo exatamente o que a própria página de ajuda dele diz que faz, nada além. A pergunta é se a sua escrita cabe dentro dessa caixa. E quando ele para de ouvir no meio da frase, geralmente é o microfone, não você — as nossas correções para a digitação por voz do Google Docs explicam as causas mais comuns.
Uma alternativa de digitação por voz que funciona em todos os apps
O Whisper faz a aposta oposta: o ditado pertence ao sistema operacional, não a um único site. Você aperta um atalho: Ctrl+Space no Windows, ou Command+Option pressionado no Mac, como push-to-talk. Você fala. Você solta. O texto aparece onde quer que esteja o seu cursor: um e-mail, uma janela de chat, uma célula de planilha, uma mensagem de commit. Não há etapa de copiar, porque não existe um "documento de origem" de onde copiar.
O argumento da velocidade é aritmética simples. O ditado roda a cerca de 145 palavras por minuto, contra algo em torno de 40 da digitação — chame de uma diferença de 3,6x. Num MacBook Air M1 com o modelo small em inglês, o intervalo entre soltar a tecla e ver o texto é de 1,4 segundo.
Por baixo dos panos você escolhe um de três caminhos, e o app não escolhe por você. O modo nuvem se conecta à OpenAI com a sua própria chave de API e usa o gpt-4o-mini-transcribe ou o gpt-4o-transcribe. O Parakeet, o motor local da NVIDIA, roda de 5 a 10x mais rápido que os modelos Whisper na CPU e cobre o inglês mais 24 idiomas europeus. E os modelos Whisper de código aberto locais vão de um modelo de 140 MB em inglês até o Large v3 de 3 GB. O app está disponível para Windows e para Macs com Apple Silicon.
Digitação por voz do Google vs Whisper, lado a lado
Os critérios, escolhidos antes da tabela: onde a ferramenta escreve, em que ela roda, pontuação, comandos de voz, cobertura de idiomas, comportamento offline e formato de preço. Essas são as sete coisas que decidiram a questão para mim quando eu ainda usava o microfone do Docs. A coluna do Google vem da própria página de ajuda do Google; a coluna do Whisper vem do código-fonte do app, que eu enxergo daqui.
| Digitação por voz do Google | Whisper | |
|---|---|---|
| Onde escreve | Documentos do Docs, anotações do apresentador e legendas do Slides | Qualquer campo de texto no seu computador |
| Roda em | Chrome, Edge e Safari mais recentes | App de desktop, Windows + macOS (Apple Silicon) |
| Pontuação | Falada em voz alta; não disponível em todos os idiomas | Adicionada pela limpeza com IA |
| Comandos de voz | Só em inglês, idioma da conta + do documento ambos em inglês | Palavra-chave "Hey whisper" mais presets personalizados |
| Idiomas | Lista longa, com limites de pontuação por idioma | 90+ nos modelos Whisper multilíngues, 25 no Parakeet, builds .en só em inglês |
| Offline | Recurso de navegador; uso offline não é documentado | O modo local funciona sem nenhuma internet |
| Formato de preço | Gratuito com uma conta Google | Modo local gratuito; recursos na nuvem pagos — ver preços |
O veredito bate com o primeiro parágrafo: o Whisper é a escolha no instante em que a sua escrita sai do Google Docs. A digitação por voz do Google continua sendo a resposta certa para quem nunca sai dele. Esse caso ganha a sua própria seção mais abaixo, e eu falo sério.
Digitação por voz online vs. digitação por voz no desktop

"Digitação por voz online" quase sempre significa um site que você abre numa aba: uma página gratuita com um botão de microfone que transcreve para uma caixa de texto. Essas ferramentas se apoiam no motor de reconhecimento de fala do navegador, e a documentação da Web Speech API da MDN é direta sobre como isso funciona: "Seu áudio é enviado a um serviço web para processamento do reconhecimento, então não vai funcionar offline." A mesma página aponta os dois custos: privacidade, porque a sua fala sai da máquina, e confiabilidade, porque sem conexão não há transcrição.
Para uma anotação pontual, uma página de digitação por voz online dá conta. O preço aparece com a repetição: todo ditado termina com selecionar, copiar, trocar, colar. Uma vez ditei uma lista de compras na aba errada e colei numa planilha de orçamento. Por uns dez segundos, as projeções do terceiro trimestre incluíam "iogurte os pequenos, não os grandes". Uma ferramenta de desktop elimina essa classe inteira de acidente, porque o texto começa onde termina — no seu cursor. E quando o microfone do navegador apronta, a correção mora nas configurações do navegador, o que rende a sua própria tarde. Escrevemos as correções de ditado no Chrome depois que gente suficiente pediu.
Pontuação e limpeza: o imposto de edição que ninguém conta
A verdade chata é que a transcrição nunca foi a parte lenta. A limpeza é. Com a digitação por voz do Google você fala a sua pontuação ("ponto", "novo parágrafo"), o que funciona, mas te transforma numa pessoa que narra vírgulas. Eu testei os comandos para este artigo, e o meu documento de teste acabou com a palavra "vírgula" onze vezes. O hábito te segue pra casa, também: desde então eu já encerrei uma frase falada, numa conversa de verdade, com "ponto final".
O Whisper, em vez disso, passa a transcrição bruta por uma etapa de limpeza com IA: gramática corrigida, palavras de preenchimento removidas, pontuação colocada onde ela pertence. No modo local isso roda pelo Ollama; no modo nuvem usa modelos da OpenAI, com o gpt-5-mini como aprimorador padrão. Comece uma frase com "Hey whisper" e a IA trata o que vem depois como uma instrução, não como texto a ser digitado: "Hey whisper, deixa essa resposta educada mas firme" é um fluxo de trabalho real, não uma demonstração. A diferença na sensação é difícil de exagerar. Uma ferramenta pede que você atue a formatação. A outra deixa você falar como gente e devolve algo que você enviaria do jeito que está.
Privacidade: para onde vai a sua voz
Aqui está a opinião que eu vou defender: um ditado que manda a sua voz para um servidor que você não controla é um problema de privacidade, e para certos trabalhos é um impeditivo. A digitação por voz baseada em navegador funciona enviando o áudio para fora para processamento. Tudo bem para uma lista de compras. É uma conversa diferente para um rascunho de contrato, uma anotação de paciente ou o e-mail sobre a situação do seu filho na escola.
Eu vi o lado do custo dessa lição de pertinho. Uma equipe com quem trabalhei contratou alguém para construir um protótipo interno de ditado com IA que chamava uma API na nuvem a cada fala. Fim do trimestre, o gerente abriu o painel de custos: uma conta de cinco dígitos, a maior parte de uma equipe transcrevendo gravações de standup quatro vezes porque a lógica de retentativa era ansiosa demais. O contratado sugeriu otimizar o prompt. O CFO sugeriu não pagar um servidor para escutar reuniões que já tinham anotações. Os dois tinham razão sobre alguma coisa.
O modo local do Whisper encerra a questão em vez de discuti-la: o modelo roda na sua máquina, nada sai do dispositivo e nenhuma internet é necessária. Mesmo atalho, mesmo fluxo, zero áudio em trânsito.
Quando pular o Whisper e ficar com o Google
Se cada palavra que você dita aterrissa num Google Doc, fique com a digitação por voz do Google. Não custa nada, já está no menu Ferramentas e, dentro do Docs, faz o trabalho — é uma combinação difícil de contestar, e eu não vou fingir o contrário. O mesmo vale se você dita duas vezes por mês: instalar um app de desktop para economizar dois copia-e-cola é exagero de engenharia, e digo isso profissionalmente. O Whisper conquista o seu lugar quando a sua escrita sai do documento com frequência (e-mail, chat, formulários, anotações), ou quando pontuação por IA, uso offline ou manter o áudio na sua máquina importam. Até lá, a ferramenta nativa e gratuita é a ferramenta certa.
Fontes que valem a leitura
Aquele e-mail para a professora lá do começo da página acabou sendo enviado — ditado dentro do próprio Gmail, sem revezamento por um Doc, com pontuação incluída sem eu falar uma palavra disso. A aba com o Google Docs ficou fechada. Esse é o comparativo inteiro num só momento: a ferramenta gratuita pede que a sua escrita vá até ela, e a alternativa vai aonde a escrita já está. Escolha a direção que combina com o seu dia.
Teste o atalho no seu próximo e-mail
Baixe o Whisper para Windows ou Mac, aperte uma vez, fale e veja o texto aterrissar onde o seu cursor já está.
O modo local é gratuito, funciona offline e nunca envia áudio para lugar nenhum.



