Por Denys Medvediev

Comparativo

Alternativa ao digitação por voz do Google: dite em qualquer lugar

A digitação por voz do Google fica presa dentro do Google Docs. Aqui está o comparativo honesto, lado a lado, com um app de ditado para desktop que escreve onde quer que esteja o seu cursor — e uma resposta direta sobre quando a ferramenta nativa e gratuita ainda é a escolha certa.

Última atualização: junho de 2026

Microfone e notebook sobre uma mesa de madeira sob luz quente, um setup de ditado que funciona em qualquer app

A melhor alternativa à digitação por voz do Google é um app de ditado para desktop que escreve em todos os campos de texto, não só no Google Docs. O Whisper by Remskill roda no Windows e no Mac, transcreve offline com modelos de IA locais e gratuitos, pontua automaticamente e cola o texto onde quer que o cursor esteja — e-mail, Slack, Word ou qualquer navegador.

Terça de manhã, um e-mail de 80 palavras para a professora que precisava sair antes da corrida pra escola. Eu estava com a digitação por voz aberta no Google Docs, ditei três parágrafos caprichados, pulei pro Gmail pra escrever a resposta de verdade e me peguei falando com uma janela de redação que nunca esteve ouvindo. A digitação por voz do Google tem uma regra só: fique dentro do documento. O microfone mora no menu Ferramentas do Docs, e ele não te acompanha pra fora.

Então você dita numa aba, copia, troca, cola, conserta a pontuação que esqueceu de falar em voz alta e envia. Essa corrida de revezamento é o caso inteiro a favor de uma alternativa. A decisão desta página é simples: ficar com a ferramenta gratuita que vive dentro de um único app, ou migrar para um ditado que segue o seu cursor por toda parte.

Aqui está a lacuna: a digitação por voz do Google escreve em documentos do Google Docs e nas anotações do apresentador do Slides — e o seu dia de escrita não fica só nesses lugares. Enquanto isso, o ditado para desktop amadureceu: modelos de IA locais agora rodam num notebook comum, ajeitam o que você fala enquanto você fala e nunca enviam áudio para lugar nenhum.

Este comparativo coloca a digitação por voz do Google ao lado do Whisper by Remskill, o app de ditado para desktop que eu desenvolvo, em cinco eixos: onde eles escrevem, pontuação, idiomas, privacidade e comportamento offline. Ao final, você vai saber qual se encaixa no seu jeito de escrever. Se a resposta honesta for "continue com o Google", a seção lá perto do fim diz isso com todas as letras. Eu dito a maior parte da minha própria escrita, incluindo as respostas de suporte, então isso vem do uso diário, não de uma página de recursos.

O que a digitação por voz do Google faz bem, e onde ela para

Crédito primeiro. A digitação por voz do Google é gratuita com uma conta Google, não exige nenhuma instalação e funciona nas versões mais recentes do Chrome, Edge e Safari. Dentro de um documento do Docs, ou nas anotações do apresentador e legendas do Slides, o reconhecimento é decente e a lista de idiomas é longa. Se você rascunha tudo no Docs, ela vale a pena, e o nosso passo a passo da digitação por voz do Google Docs cobre a configuração em detalhes.

O painel de digitação por voz do Google, recriado para ilustração — uma caixinha de microfone que só existe dentro do Docs e do Slides.

As limitações são igualmente concretas. A pontuação é manual: você diz "ponto", "vírgula", "ponto de interrogação", "novo parágrafo". E a pontuação não está disponível em todos os idiomas. Os comandos de edição e formatação só funcionam em inglês, e só quando tanto o idioma da sua conta quanto o do documento estão em inglês. (As anotações do apresentador do Slides ganham digitação por voz, mas nenhum comando de voz. Eu também não sei por quê.)

E o limite que deu início a este artigo: o recurso existe dentro de duas superfícies do Google e em nenhum outro lugar. Gmail, Slack, o seu CRM, o seu editor de código, um formulário web — silêncio. Nada disso é um bug. É um recurso gratuito fazendo exatamente o que a própria página de ajuda dele diz que faz, nada além. A pergunta é se a sua escrita cabe dentro dessa caixa. E quando ele para de ouvir no meio da frase, geralmente é o microfone, não você — as nossas correções para a digitação por voz do Google Docs explicam as causas mais comuns.

Uma alternativa de digitação por voz que funciona em todos os apps

O Whisper faz a aposta oposta: o ditado pertence ao sistema operacional, não a um único site. Você aperta um atalho: Ctrl+Space no Windows, ou Command+Option pressionado no Mac, como push-to-talk. Você fala. Você solta. O texto aparece onde quer que esteja o seu cursor: um e-mail, uma janela de chat, uma célula de planilha, uma mensagem de commit. Não há etapa de copiar, porque não existe um "documento de origem" de onde copiar.

Whisper
O app Whisper de verdade, embutido ao vivo nesta página — clique pelas Configurações; é o frontend real do desktop, não uma captura de tela.

O argumento da velocidade é aritmética simples. O ditado roda a cerca de 145 palavras por minuto, contra algo em torno de 40 da digitação — chame de uma diferença de 3,6x. Num MacBook Air M1 com o modelo small em inglês, o intervalo entre soltar a tecla e ver o texto é de 1,4 segundo.

Por baixo dos panos você escolhe um de três caminhos, e o app não escolhe por você. O modo nuvem se conecta à OpenAI com a sua própria chave de API e usa o gpt-4o-mini-transcribe ou o gpt-4o-transcribe. O Parakeet, o motor local da NVIDIA, roda de 5 a 10x mais rápido que os modelos Whisper na CPU e cobre o inglês mais 24 idiomas europeus. E os modelos Whisper de código aberto locais vão de um modelo de 140 MB em inglês até o Large v3 de 3 GB. O app está disponível para Windows e para Macs com Apple Silicon.

Digitação por voz do Google vs Whisper, lado a lado

Os critérios, escolhidos antes da tabela: onde a ferramenta escreve, em que ela roda, pontuação, comandos de voz, cobertura de idiomas, comportamento offline e formato de preço. Essas são as sete coisas que decidiram a questão para mim quando eu ainda usava o microfone do Docs. A coluna do Google vem da própria página de ajuda do Google; a coluna do Whisper vem do código-fonte do app, que eu enxergo daqui.

Digitação por voz do GoogleWhisper
Onde escreveDocumentos do Docs, anotações do apresentador e legendas do SlidesQualquer campo de texto no seu computador
Roda emChrome, Edge e Safari mais recentesApp de desktop, Windows + macOS (Apple Silicon)
PontuaçãoFalada em voz alta; não disponível em todos os idiomasAdicionada pela limpeza com IA
Comandos de vozSó em inglês, idioma da conta + do documento ambos em inglêsPalavra-chave "Hey whisper" mais presets personalizados
IdiomasLista longa, com limites de pontuação por idioma90+ nos modelos Whisper multilíngues, 25 no Parakeet, builds .en só em inglês
OfflineRecurso de navegador; uso offline não é documentadoO modo local funciona sem nenhuma internet
Formato de preçoGratuito com uma conta GoogleModo local gratuito; recursos na nuvem pagos — ver preços

O veredito bate com o primeiro parágrafo: o Whisper é a escolha no instante em que a sua escrita sai do Google Docs. A digitação por voz do Google continua sendo a resposta certa para quem nunca sai dele. Esse caso ganha a sua própria seção mais abaixo, e eu falo sério.

Digitação por voz online vs. digitação por voz no desktop

Mãos digitando num notebook sobre uma mesa branca e limpa, o fluxo no navegador que a digitação por voz online substitui

"Digitação por voz online" quase sempre significa um site que você abre numa aba: uma página gratuita com um botão de microfone que transcreve para uma caixa de texto. Essas ferramentas se apoiam no motor de reconhecimento de fala do navegador, e a documentação da Web Speech API da MDN é direta sobre como isso funciona: "Seu áudio é enviado a um serviço web para processamento do reconhecimento, então não vai funcionar offline." A mesma página aponta os dois custos: privacidade, porque a sua fala sai da máquina, e confiabilidade, porque sem conexão não há transcrição.

Para uma anotação pontual, uma página de digitação por voz online dá conta. O preço aparece com a repetição: todo ditado termina com selecionar, copiar, trocar, colar. Uma vez ditei uma lista de compras na aba errada e colei numa planilha de orçamento. Por uns dez segundos, as projeções do terceiro trimestre incluíam "iogurte os pequenos, não os grandes". Uma ferramenta de desktop elimina essa classe inteira de acidente, porque o texto começa onde termina — no seu cursor. E quando o microfone do navegador apronta, a correção mora nas configurações do navegador, o que rende a sua própria tarde. Escrevemos as correções de ditado no Chrome depois que gente suficiente pediu.

Pontuação e limpeza: o imposto de edição que ninguém conta

A verdade chata é que a transcrição nunca foi a parte lenta. A limpeza é. Com a digitação por voz do Google você fala a sua pontuação ("ponto", "novo parágrafo"), o que funciona, mas te transforma numa pessoa que narra vírgulas. Eu testei os comandos para este artigo, e o meu documento de teste acabou com a palavra "vírgula" onze vezes. O hábito te segue pra casa, também: desde então eu já encerrei uma frase falada, numa conversa de verdade, com "ponto final".

Thinking...
A sobreposição do Whisper no estado de aprimoramento — a passagem de limpeza com IA que roda depois que você solta o atalho.

O Whisper, em vez disso, passa a transcrição bruta por uma etapa de limpeza com IA: gramática corrigida, palavras de preenchimento removidas, pontuação colocada onde ela pertence. No modo local isso roda pelo Ollama; no modo nuvem usa modelos da OpenAI, com o gpt-5-mini como aprimorador padrão. Comece uma frase com "Hey whisper" e a IA trata o que vem depois como uma instrução, não como texto a ser digitado: "Hey whisper, deixa essa resposta educada mas firme" é um fluxo de trabalho real, não uma demonstração. A diferença na sensação é difícil de exagerar. Uma ferramenta pede que você atue a formatação. A outra deixa você falar como gente e devolve algo que você enviaria do jeito que está.

Privacidade: para onde vai a sua voz

Aqui está a opinião que eu vou defender: um ditado que manda a sua voz para um servidor que você não controla é um problema de privacidade, e para certos trabalhos é um impeditivo. A digitação por voz baseada em navegador funciona enviando o áudio para fora para processamento. Tudo bem para uma lista de compras. É uma conversa diferente para um rascunho de contrato, uma anotação de paciente ou o e-mail sobre a situação do seu filho na escola.

Eu vi o lado do custo dessa lição de pertinho. Uma equipe com quem trabalhei contratou alguém para construir um protótipo interno de ditado com IA que chamava uma API na nuvem a cada fala. Fim do trimestre, o gerente abriu o painel de custos: uma conta de cinco dígitos, a maior parte de uma equipe transcrevendo gravações de standup quatro vezes porque a lógica de retentativa era ansiosa demais. O contratado sugeriu otimizar o prompt. O CFO sugeriu não pagar um servidor para escutar reuniões que já tinham anotações. Os dois tinham razão sobre alguma coisa.

O modo local do Whisper encerra a questão em vez de discuti-la: o modelo roda na sua máquina, nada sai do dispositivo e nenhuma internet é necessária. Mesmo atalho, mesmo fluxo, zero áudio em trânsito.

Quando pular o Whisper e ficar com o Google

Se cada palavra que você dita aterrissa num Google Doc, fique com a digitação por voz do Google. Não custa nada, já está no menu Ferramentas e, dentro do Docs, faz o trabalho — é uma combinação difícil de contestar, e eu não vou fingir o contrário. O mesmo vale se você dita duas vezes por mês: instalar um app de desktop para economizar dois copia-e-cola é exagero de engenharia, e digo isso profissionalmente. O Whisper conquista o seu lugar quando a sua escrita sai do documento com frequência (e-mail, chat, formulários, anotações), ou quando pontuação por IA, uso offline ou manter o áudio na sua máquina importam. Até lá, a ferramenta nativa e gratuita é a ferramenta certa.

Fontes que valem a leitura

Aquele e-mail para a professora lá do começo da página acabou sendo enviado — ditado dentro do próprio Gmail, sem revezamento por um Doc, com pontuação incluída sem eu falar uma palavra disso. A aba com o Google Docs ficou fechada. Esse é o comparativo inteiro num só momento: a ferramenta gratuita pede que a sua escrita vá até ela, e a alternativa vai aonde a escrita já está. Escolha a direção que combina com o seu dia.

Teste o atalho no seu próximo e-mail

Baixe o Whisper para Windows ou Mac, aperte uma vez, fale e veja o texto aterrissar onde o seu cursor já está.

O modo local é gratuito, funciona offline e nunca envia áudio para lugar nenhum.

Foto de Denys Medvediev

Denys Medvediev

Sou eu quem lê o nosso e-mail de suporte, muito provavelmente ditando as respostas.