Por Denys Medvediev

Digitação por voz · Guia

App de digitação por voz: o que instalar em cada aparelho

No Android e no iPhone, use o ditado embutido no teclado. É grátis e funciona bem. No Windows e no Mac, as ferramentas nativas servem para frases curtas, mas se esgotam rápido quando você precisa escrever de verdade. Um app de digitação por voz para desktop como o Whisper adiciona um atalho global, modelos locais que funcionam offline e texto que aparece em qualquer aplicativo.

Última atualização: junho de 2026

Notebook e smartphone lado a lado sobre uma mesa de madeira, os dois lugares onde um app de digitação por voz pode morar

Um app de digitação por voz transforma fala em texto onde quer que o cursor esteja. No celular, o próprio teclado já faz isso: o Gboard no Android e a tecla do microfone no teclado do iPhone. Nos desktops com Windows e Mac, as ferramentas nativas têm mais limitações, e é aí que um app dedicado para desktop como o Whisper by Remskill conquista seu espaço.

Procure "app de digitação por voz" em qualquer loja de aplicativos e você verá páginas e mais páginas de teclados, cada um deles um botão de microfone com uma nova fachada. Enquanto isso, os números por trás disso não mudaram: a maioria das pessoas digita cerca de 40 palavras por minuto e fala cerca de 145. Essa diferença é a razão de existir dessa categoria inteira.

Eu construí um desses apps e mesmo assim me peguei digitando com os polegares um e-mail de 400 palavras na semana passada. Os hábitos sobrevivem aos seus motivos. O detalhe é que a resposta certa depende de qual aparelho você tem na mão, e para um deles a resposta certa não custa nada e já vinha instalada.

"App de digitação por voz" descreve duas situações diferentes vestindo o mesmo nome, e a maioria das listas nunca diz isso. No celular, o ditado é um problema resolvido que as lojas insistem em revender; no desktop, onde a escrita longa acontece, as ferramentas nativas vêm com pegadinhas. O jeito sensato de escolher é por aparelho.

Até o fim desta página você vai saber o que manter no celular, onde as ferramentas nativas do desktop param e o que instalar quando você as superar. Construo um app de digitação por voz para desktop para viver, e a primeira coisa que digo às pessoas é para não instalarem nada no celular.

O celular já vem com um app de digitação por voz

Mãos segurando um smartphone, onde o próprio teclado já faz o ditado

A verdade sem graça é que o melhor app de digitação por voz para o seu celular é o teclado que já veio nele. No Android, o Gboard faz o serviço: toque num campo de texto, toque no microfone no topo do teclado e fale quando ele disser "Fale agora". Você pode dizer a pontuação em voz alta, como "ponto final", "vírgula" e "novo parágrafo", embora o Google ressalte que a pontuação e o ditado por voz não estão disponíveis em todos os idiomas. No iPhone, o teclado tem uma tecla de microfone que faz a mesma coisa.

Isso cobre mensagens, e-mails, caixas de busca e anotações, que é a maior parte do que qualquer um escreve no celular. Um ditado típico no celular é uma resposta de e-mail de 50 a 150 palavras, cerca de 30 segundos falando; o microfone embutido dá conta disso sem reclamar. Os teclados de terceiros que lotam os resultados da loja embrulham esse mesmo microfone em outra marca, às vezes com uma assinatura por cima. Antes de instalar um, experimente o botão que você já tem. Esta é a rara categoria de produto em que a opção gratuita, já instalada, também é a mais sensata.

Uma confissão honesta, já que é aqui que um fornecedor mudaria de assunto para falar do app mobile dele: nós não temos um. O Whisper by Remskill é um app de desktop para Windows e macOS, ponto final. Se a sua vida de ditado acontece no celular, o teclado embutido é a minha recomendação, e você pode fechar esta aba com a minha bênção.

O desktop é onde as ferramentas nativas se esgotam

Os dois sistemas operacionais de desktop incluem digitação por voz, e vale conhecer os dois antes de instalar qualquer coisa. No Windows 11, pressione a tecla Windows + H e um pequeno widget de digitação por voz aparece. Ele precisa de três coisas: conexão com a internet, um microfone funcionando e o cursor parado em uma caixa de texto. Suporta mais de 40 idiomas e pode inserir a pontuação para você, se você ligar essa opção. A exigência de internet é o detalhe a lembrar. O Win+H é ótimo até a hora em que o Wi-Fi do hotel não está.

Digitação por voz

Ouvindo…

Win + H
Um esboço simplificado do widget de digitação por voz do Windows — a ferramenta nativa por trás do Win + H.

No Mac, o Ditado começa pela tecla de microfone na fileira de funções, por um atalho de teclado ou em Editar > Iniciar Ditado. Não há limite de duração, mas ele para sozinho após 30 segundos de silêncio, o que na prática significa que ele desiste enquanto você fita o teto escolhendo uma palavra. Ele pontua os idiomas suportados sem que você peça, e a Apple afirma que o Ditado não está disponível em todos os idiomas ou regiões.

Nenhuma das duas ferramentas é ruim, e as duas servem bem para uma frase ou três. Os limites aparecem quando a escrita fica séria. Vocabulário personalizado para os nomes dos seus produtos e clientes não está na lista de recursos de nenhuma delas, e nem a limpeza por IA da camada de "é, então" que a sua fala carrega. No Mac você consegue verificar se o ditado roda no próprio aparelho; no Windows, a ferramenta apaga no instante em que você fica offline. Esses limites são a razão pela qual os apps de digitação por voz para desktop existem como categoria.

O que um app de digitação por voz para desktop deveria de fato fazer

Teclado mecânico com uma tecla de destaque laranja sobre uma mesa de madeira

O mecanismo é simples de descrever. Um app de digitação por voz para desktop fica em segundo plano, observa um atalho global, grava enquanto você o segura, passa o áudio por um modelo de reconhecimento de fala e cola o resultado onde o seu cursor estiver. Cada parte dessa frase é algo a conferir antes de instalar.

O atalho importa porque transforma o ditado em um reflexo, e não num recurso que você vai visitar. A parte do "onde o seu cursor estiver" importa porque a escrita acontece no e-mail, no Slack, num CRM, num editor de código e num formulário do navegador; uma ferramenta que digita só na própria janela é um bloco de notas com microfone. O modelo importa por dois motivos: pela precisão e por onde o seu áudio vai parar. Modelos locais rodam na sua máquina e funcionam offline. Modelos em nuvem enviam o áudio para um servidor e muitas vezes transcrevem melhor. Um bom app de desktop deixa você escolher conforme a situação, em vez de decidir por você.

A velocidade também merece estar na lista, em números claros. Num MacBook Air M1 rodando um modelo local pequeno em inglês, o Whisper vai do soltar a tecla ao texto colado em cerca de 1,4 segundo; no modo nuvem com uma conexão decente, cerca de 1,1 segundo. Uma resposta nessa faixa mantém o ditado na categoria "reflexo". Se uma ferramenta faz você esperar, abrir uma janela ou copiar texto de um painel, o atrito devora a vantagem de velocidade que você veio buscar.

Eis a minha única opinião para esta página: o melhor truque de produtividade são menos passos, não passos mais rápidos. A maioria das ferramentas tenta acelerar a digitação. A digitação por voz simplesmente a elimina. O fluxo vai de "pare, sente, digite" para "fale, pronto", que é como a fala a 145 palavras por minuto vence a digitação a 40 sem ninguém precisar aprender uma habilidade nova. Um app que devolve passos perdeu o sentido da própria categoria.

Para um passeio mais detalhado pela categoria em si — motores, precisão, o dilema local-versus-nuvem — mantemos um texto separado sobre software de digitação por voz. Esta página fica na pergunta mais estreita: o que instalar, por aparelho.

Como o Whisper lida com digitação por voz no Windows e no Mac

O Whisper by Remskill é a nossa resposta para a metade da pergunta que é o desktop. Você segura um atalho (Ctrl+Space no Windows, Command+Option no Mac), fala, solta, e o texto aparece onde o seu cursor estiver, em qualquer aplicativo. Enquanto você fala, um pequeno overlay flutua na tela para você ver que ele está ouvindo.

Cancel
O overlay de gravação do Whisper, ao vivo — esta é a interface que foi lançada, animada, não uma captura de tela.

Por baixo dos panos você escolhe entre três caminhos, e o app não escolhe por você.

  • Whisper localFamílias de modelos otimizadas para inglês e multilíngues, de um modelo Base de ~140 MB até o Large v3 de ~3 GB. A família multilíngue cobre mais de 90 idiomas, incluindo detecção automática. Os modelos só em inglês são exatamente isso, só inglês, então escolha a família multilíngue se você troca de idioma ao longo do dia.
  • Parakeet localRoda de 5 a 10× mais rápido que o Whisper na CPU e cobre inglês mais 24 idiomas europeus. A faixa rápida para ditado majoritariamente em inglês.
  • Nuvem (sua própria chave da OpenAI)Conecta à OpenAI com a sua própria chave de API, usando gpt-4o-mini-transcribe ou gpt-4o-transcribe para a fala em si e gpt-5-mini para a limpeza opcional por IA.

Tudo o que é local é grátis: os modelos rodam no seu aparelho, funcionam offline, não enviam nada para lugar nenhum e não é preciso cartão para se cadastrar.

Tem mais um truque que vale conhecer: uma palavra-chave de IA. Comece uma gravação com "Hey whisper" e o app aciona o processamento por IA do texto transcrito em vez de colá-lo como está. Ditado para as frases do dia a dia, um assistente para os momentos em que você quer o texto reformulado. O mesmo atalho nos dois casos.

O teste em que mais confio não foi um benchmark. Dei o Whisper para a minha filha mais nova, mostrei uma vez (aperta, fala, solta, cola), e ela ditou um e-mail de 90 palavras para a avó sobre um dente que caiu e a cotação de câmbio da fada do dente, sem nenhuma pergunta de acompanhamento. Dois dias depois ela me avisou que "o atalho não funciona no meu app de desenho", que foi como aprendi que usuários comuns não sabem o que é um conflito de atalho. Eles só sabem que não funciona. As opções de atalho personalizável foram lançadas naquela noite. Se uma criança de sete anos consegue rodar o ciclo, o ciclo é simples o bastante.

Whisper
O app de desktop Whisper de verdade, montado ao vivo — clique pelas Configurações e pelo seletor de modelos.

O app embutido acima é o frontend de desktop de verdade, não uma captura de tela; clique por ele. E para repetir a confissão, porque a intenção de instalar merece uma resposta direta: o Whisper roda no Windows e em Macs com Apple Silicon, e em nenhum outro lugar.

Uma checklist curta antes de instalar qualquer coisa

Instalar um software é um compromisso, mesmo quando o software é grátis. Cinco perguntas resolvem isso mais rápido do que qualquer lista de avaliações:

  • Em qual aparelho você escreve, sinceramente? Quase tudo no celular: fique com o ditado embutido do teclado e não gaste nada.
  • Ele digita em todos os aplicativos? Procure um atalho global que cola no cursor, não uma janela separada da qual você copia.
  • Funciona offline? A digitação por voz do Windows não funciona. Modelos locais funcionam. Se a sua escrita inclui coisas que não deveriam visitar um servidor, esta pergunta vem em primeiro lugar.
  • Quais idiomas, contados por motor? Mais de 40 na digitação por voz do Windows, mais de 90 nos modelos multilíngues do Whisper, 25 no Parakeet, só inglês nos modelos .en.
  • Você resolveu o microfone primeiro? Um microfone USB de $20 faz mais pela precisão do que qualquer upgrade de modelo. Eu construo o software e mesmo assim o microfone ganha. Ninguém nessa indústria gosta de dizer isso em voz alta.

Se você chegou aqui pelo ângulo da pesquisa — números de precisão, como os motores se comparam — o texto sobre app de fala para texto cobre esse lado. Os planos e o que vem em cada um ficam na página de preços; a versão curta é que tudo o que é local não custa nada.

Quando deixar o Whisper de lado

Se o seu ditado acontece no celular, deixe a gente de lado. Não temos app mobile, e o ditado do Gboard ou do teclado do iPhone é grátis e mais do que suficiente. Se você escreve uma frase ou duas por dia no Mac, o Apple Dictation já vem instalado, começa pela tecla de microfone e pontua para você.

Se você precisa de transcrição de reuniões com vários participantes e resumos, isso é uma categoria de produto diferente de escrever por voz, e você deveria procurar nessa outra categoria. E se você usa Linux ou um Mac com Intel, o Whisper não roda aí, então as ferramentas nativas e do navegador são as suas opções honestas.

Fontes

Vinte anos atrás, digitação por voz significava ler scripts de calibração para o computador e torcer. Hoje o resumo honesto cabe em duas linhas: o seu celular já faz isso, e o seu desktop consegue fazer direito com uma única instalação. O microfone é o dispositivo de entrada mais rápido na sua mesa há um bom tempo. A maioria de nós só ainda não apertou a tecla.

Coloque um app de digitação por voz no seu desktop

Baixe o Whisper, segure um atalho e veja o texto aparecer onde quer que o seu cursor esteja.

Roda no Windows e em Macs com Apple Silicon. Tudo o que é local é grátis. O seu teclado vai continuar ali quando você precisar.

Foto de Denys Medvediev

Denys Medvediev

Sou eu quem lê o nosso e-mail de suporte, muito provavelmente ditando as respostas.