Comparativo
A melhor conversão de voz em texto no Windows, ranqueada
O melhor aplicativo de voz para texto no Windows depende de onde você digita. O Win+H é gratuito e já vem instalado, mas precisa de internet e só funciona dentro de uma caixa de texto. O Whisper funciona offline, em qualquer aplicativo, e cola o texto no cursor.
Última atualização: junho de 2026

O melhor aplicativo de voz para texto no Windows depende de onde você digita. O Windows Voice Typing (Win+H) é gratuito e já vem instalado, mas precisa de internet e só funciona dentro de uma caixa de texto. O Whisper by Remskill funciona offline, em qualquer aplicativo, e cola o texto no cursor. É a escolha mais forte para escrever de verdade.
No fim de semana passado, minha filha mais nova ditou um e-mail de 90 palavras para a avó dela na Ucrânia em cerca de 90 segundos. Sem teclado. Ela tem sete anos. Vinte e cinco anos atrás, a mesma máquina na mesma família levava quinze minutos para ditar um único parágrafo de uma carta de fim de ano, e mal feito. A conversão de voz em texto no Windows deixou de ser um experimento de laboratório, sem alarde. A resposta honesta é que você tem mais boas opções do que imagina, e um ou dois nomes famosos que pode deixar de lado.
A maioria das listas de "melhor voz para texto no Windows" ranqueia doze ferramentas e recomenda aquela que pagou pelo link. Esta não é assim. O Windows em 2026 traz um recurso de ditado gratuito que quase ninguém descobre, e o mercado pago se dividiu entre ferramentas que gravam reuniões e ferramentas que ajudam a escrever. Este guia ranqueia os aplicativos de voz para texto que valem a pena instalar no Windows 10 ou superior, por quatro coisas que importam: precisão, suporte offline, onde funciona e preço. Depois, ele explica, em termos simples, quando a opção gratuita já embutida é tudo de que você precisa. No fim, você vai saber qual instalar hoje e qual nome famoso deixar na prateleira. Eu leio os e-mails de suporte do aplicativo que desenvolvo, então a maior parte do que sei sobre onde essas ferramentas falham vem de pessoas escrevendo para me contar que elas falharam.
Uma palavra rápida sobre como ler o que vem a seguir. Eu desenvolvo uma das ferramentas desta lista, então não vou fingir que sou um juiz neutro, mas vou apontar os casos em que uma opção gratuita ou uma concorrente é a escolha certa, porque essa é a única forma honesta de escrever isto. O ranking é por caso de uso, não por um único vencedor, porque não existe um único vencedor. A pessoa que dispara três mensagens no Slack por dia e a pessoa que rascunha um relatório de 3.000 palavras por voz querem ferramentas diferentes, e uma lista que finge o contrário está te vendendo alguma coisa.
A resposta curta: o Win+H é gratuito, mas é aqui que ele para
Windows · Win + H
Pressione a tecla com o logotipo do Windows e o H em qualquer caixa de texto, e uma pequena barra de ferramentas aparece no topo da tela. Comece a falar. Isso é o Windows Voice Typing, gratuito e embutido no Windows 11. Para uma mensagem rápida numa janela de bate-papo, é difícil bater algo que é grátis e já vem instalado.
Duas coisas o limitam. Primeiro, ele precisa de internet. O Voice Typing usa reconhecimento de fala online, com a tecnologia dos serviços Azure Speech da Microsoft, então sem conexão não há ditado. Segundo, o seu cursor precisa estar numa caixa de texto para ele funcionar. Isso descarta muitos dos lugares onde você quer falar: renomear um arquivo, uma célula de planilha que resiste, um aplicativo de desktop que o Windows não considera uma "caixa de texto".
Uma terceira coisa, menor, só aparece depois de algumas semanas. O Win+H é um recurso, não um fluxo de trabalho. Ele não guarda histórico do que você ditou, não dá um lugar para corrigir uma palavra que sempre sai errada e não oferece jeito de moldar a pontuação ao seu jeito de falar. Você ganha um microfone e uma transcrição, e o pacote é só isso. Para uma resposta de uma linha, é exatamente certo. Para o quarto e-mail da manhã, você começa a querer mais.
Então a pergunta de verdade não é "existe uma opção gratuita". Existe, e você deveria experimentá-la primeiro. A pergunta é o que usar quando o gratuito acaba: num trem sem sinal, num aplicativo em que o Win+H se recusa a entrar, ou quando a mesma tarefa aparece pela quadragésima vez e você quer que ela seja lembrada.
Como escolhi: precisão, offline, funciona-em-tudo, preço

Ranqueei estes por quatro coisas, nesta ordem, porque é nesta ordem que elas te incomodam.
Precisão. Todo o resto é ruído se a transcrição estiver errada. O detalhe é que ninguém publica um número justo de comparação direta. A Nuance anuncia até 99% de precisão de reconhecimento para o Dragon desde o primeiro uso. No modo local, a nossa faixa publicada para o Whisper é de 95% a 99%, com os modelos maiores pontuando mais alto. Ambos são autodeclarados, então trate-os como afirmações, não como um placar. Nenhuma fonte primária publica uma porcentagem de precisão verificável e direta para o Win+H, o Google Docs Voice Typing ou o Otter, então qualquer lista que te entregue um número para cada ferramenta está inventando. A verdade chata é que um microfone USB de US$20 melhora a sua precisão mais do que qualquer troca de modelo. Se você quer gastar dinheiro com transcrição melhor, gaste primeiro no microfone e depois no software.
Offline. Funciona com o Wi-Fi desligado? O Win+H não. O Google Docs Voice Typing não. Uma ferramenta que roda na sua própria máquina, sim, e isso importa para uma planilha de salários, um rascunho jurídico ou um e-mail para a escola do seu filho que não tem nada que ficar nos logs de um fornecedor. Também importa do jeito bobo e cotidiano: trens, aviões, porões, o banco de trás de um carro. O ditado na nuvem é tão confiável quanto a pior barrinha de sinal que você vai pegar hoje.
Funciona em qualquer lugar. Ele digita em todos os aplicativos, ou só em um? Essa é a linha que divide o jogo. Um atalho de teclado válido em todo o sistema cola onde quer que esteja o cursor; um recurso de navegador só funciona naquela aba do navegador. O teste que eu uso é banal de propósito. Ele consegue renomear um arquivo, preencher uma caixa de busca num aplicativo de desktop ou escrever uma mensagem de commit? A maioria das opções "gratuitas" falha nesse teste no momento em que você sai do navegador, e você sai do navegador mais do que imagina.
Preço. Números cravados, nada de "a partir de". Gratuito onde o gratuito é real. Não vou encher um ranking com uma ferramenta que custa mais que uma licença do Windows só para parecer completo, e vou te dizer quando a opção gratuita embutida é tudo de que você precisa, o que, para muita gente, é o caso.
Os aplicativos de voz para texto no Windows que valem o seu tempo
Whisper by Remskill — melhor para escrever em qualquer aplicativo
Aviso completo: eu desenvolvo este, então pondere isso. O que ele faz e a opção embutida não faz: ele usa um atalho de teclado global, válido em todo o sistema, que funciona em qualquer aplicativo onde você consegue digitar, e cola o texto transcrito onde quer que esteja o cursor. O atalho padrão no Windows é Ctrl+Space: segure, fale, solte, e o texto cai ali.
Ele funciona offline. Toda a transcrição local é em Rust puro e fica no seu dispositivo; nada sai da máquina depois que o modelo é baixado. Você escolhe como ele roda. Não há um único modelo "recomendado" que o aplicativo empurre para você, porque a escolha certa depende da sua máquina e dos seus idiomas.
O Whisper local traz oito modelos: quatro só em inglês, do Base com cerca de 140 MB até o Medium com aproximadamente 1,5 GB, e quatro multilíngues que vão até o Large v3 com cerca de 3 GB. Os multilíngues cobrem 99 idiomas; as versões .en só em inglês fazem inglês e só inglês. Os modelos menores carregam rápido e rodam em hardware modesto; os maiores pedem mais RAM e te recompensam com transcrições mais limpas. Um segundo motor, o Parakeet da NVIDIA com cerca de 600 MB, roda de 5 a 10 vezes mais rápido que o Whisper numa CPU e lida com inglês mais 24 idiomas europeus, sem idiomas asiáticos e sem tradução para o inglês. Se você fala principalmente inglês e quer velocidade, o Parakeet é a faixa rápida. Se você precisa de 99 idiomas, tradução ou controle mais fino, o Whisper é o que carregar.
Se você quer a qualidade mais recente da OpenAI e respostas da web na mesma ferramenta, o modo Cloud usa a sua própria chave da OpenAI, então você paga diretamente à OpenAI e nós não ficamos com nada. Você pode até pedir para ele pesquisar algo em voz alta. Diga a frase de ativação "Hey whisper" e ele vai fazer uma busca na web e colar a resposta (batizei a frase de ativação com o nome do produto, o que, como minha esposa apontou, é o tipo de coisa que só quem desenvolve software acharia esperto). A coisa toda é leve: o próprio aplicativo tem cerca de 25 MB, sem necessidade de GPU dedicada, porque a transcrição local roda na CPU. Ele instala no Windows 10 ou superior. Detalhamos a configuração de primeira execução no nosso guia de voz para texto no Windows.
Melhor para: qualquer pessoa que escreve por voz em mais de um aplicativo e quer que funcione num voo.
Windows Voice Typing (Win+H) — melhor opção gratuita e embutida
Já está no seu PC, sem instalação, sem conta. Pressione Win+H, fale dentro de uma caixa de texto. A troca é a exigência de internet e o limite de só funcionar em caixa de texto. Para mensagens curtas onde você já está online mesmo, é a primeira escolha certa justamente porque não custa nada. A Microsoft adicionou pontuação automática ao Win+H, e ele está bem ali em toda instalação nova do Windows 11. A maioria das pessoas que "não têm voz para texto" já têm e nunca apertaram a combinação de teclas. Comece por aqui. Se cobrir o seu dia, você terminou e não gastou nada.
Melhor para: ditado rápido num navegador ou caixa de bate-papo, online, sem configuração.
Dragon Professional — melhor para vocabulário especializado
O velho rei do ditado no Windows. A Nuance ainda anuncia até 99% de precisão desde o primeiro uso, otimizado para o Windows 11 e retrocompatível com o Windows 10. Se você dita termos médicos ou jurídicos densos o dia inteiro, a profundidade do vocabulário personalizado do Dragon é a razão de ele existir, com décadas de trabalho por trás do tratamento de jargões que tropeçam os modelos de uso geral. Uma ressalva honesta: até o fechamento deste texto, a loja da Nuance estava em meio a uma migração e eu não consegui confirmar um preço atual, nem se a versão atual é uma compra única ou uma assinatura, a partir de uma fonte primária. Historicamente, o Dragon era uma licença única, mas não vou imprimir um número que não consigo sustentar, então verifique antes de comprar. A outra ressalva é a que eu tenho uma opinião sobre, e chego nela mais adiante: a era de treinar o seu software de ditado acabou para quase todo mundo, exceto neste caso profissional bem específico.
Melhor para: profissionais com muito jargão de domínio e orçamento.
Wispr Flow — melhor opção polida na nuvem
Uma concorrente direta e bem elegante. A Wispr Flow anuncia mais de 100 idiomas com detecção automática e roda nativamente no Windows, Mac, iOS e Android. A detecção automática é o recurso de destaque. Diz que se move entre os seus idiomas no meio da frase do jeito que você faz. Não consegui confirmar pela página inicial deles se a transcrição roda no dispositivo ou na nuvem, então, se o offline importa para você, pergunte a eles diretamente antes de se comprometer. Polida, multiplataforma, vale uma olhada se a nuvem te serve e você quer a mesma ferramenta no celular e no notebook. Fizemos a comparação direta no nosso texto sobre alternativa ao Wispr Flow caso você esteja decidindo entre os dois.
Melhor para: pessoas que querem uma experiência refinada entre dispositivos e não precisam de offline.
Otter.ai — melhor para reuniões, não para ditado
O Otter é excelente naquilo que faz, que não é isto. É um transcritor de reuniões que entra no Zoom, no Microsoft Teams e no Google Meet, com um plano Basic gratuito limitado a 300 minutos de transcrição por mês. Ele não digita nos seus aplicativos; grava e transcreve conversas, e depois as resume. Outra categoria, totalmente. Se o seu problema é "resumir minhas reuniões", o Otter é uma resposta forte; se é "escrever mais rápido", é a ferramenta errada por melhor que ela seja. Ele também roda como o próprio aplicativo e serviço web, em vez de um atalho de teclado válido em todo o sistema, então não é algo que você usa para preencher um campo de formulário. Aprofundamos essa distinção no nosso texto sobre alternativa ao Otter.ai.
Melhor para: capturar e resumir reuniões, não escrever por voz.
Comparação rápida: onde cada ferramenta funciona
Deixei a precisão de fora desta tabela de propósito. Só o Dragon e o Whisper publicam um número, e ambos são autodeclarados. O Win+H, o Google Docs Voice Typing e o Otter não publicam nenhuma cifra verificável. Qualquer placar do tipo "a Ferramenta X tem 96,3% de precisão" entre todas as cinco é um chute formatado como fato. Então as colunas abaixo são as que você pode verificar: onde roda, se funciona offline, se alcança todos os aplicativos e para que foi feita.
| Ferramenta | Modelo de preço | Local/Nuvem | Funciona offline | Funciona em todos os aplicativos | Idiomas | Melhor para |
|---|---|---|---|---|---|---|
| Whisper by Remskill | Local gratuito, nuvem paga (ver /pricing) | Local ou nuvem | Sim, no modo local | Sim, atalho válido em todo o sistema | 99 nos modelos multilíngues | Escrever por voz em qualquer aplicativo |
| Win+H Voice Typing | Gratuito, embutido | Nuvem (Azure) | Não, precisa de internet | Não, só em caixa de texto | Vários, definidos nas Configurações | Ditado rápido online |
| Dragon Professional | Pago, verifique a loja da Nuance | Verifique o fornecedor | Verifique o fornecedor | Dentro dos aplicativos compatíveis | Verifique o fornecedor | Vocabulário especializado |
| Wispr Flow | Pago, ver fornecedor | Não confirmado | Não confirmado | Válido em todo o sistema no Win/Mac | Mais de 100 anunciados | Ditado polido na nuvem |
| Otter.ai | Plano gratuito, pago acima dele (ver fornecedor) | Nuvem | Não | Não, é o próprio aplicativo | Verifique o fornecedor | Transcrição de reuniões |
Leia a tabela da esquerda para a direita e o campo se organiza sozinho. Se "funciona em todos os aplicativos" e "offline" precisam ambos ser sim, a lista é curta. Se você está feliz online e dentro de um único aplicativo, as opções gratuitas embutidas dão conta e você pode parar de ler aqui. A decisão raramente é sobre qual ferramenta é a "melhor" no abstrato. É sobre qual linha combina com o jeito que você trabalha.
Outras ferramentas que vale conhecer
O campo no Windows é mais amplo que cinco nomes. Algumas você vai ver em outras listas, com uma linha honesta para cada uma, para você descartar as que não servem:
- Microsoft Word Dictate — embutido no Word do Microsoft 365, gratuito se você já paga pelo Office, e bom dentro do Word. Preso dentro do Word. Se a maior parte da sua escrita já acontece ali, é uma boa opção sem custo extra. Cobrimos suas peculiaridades em voz para texto no Word.
- Google Docs Voice Typing — gratuito, mas só dentro do Google Docs e do Slides num navegador compatível, onde o navegador controla o serviço de fala. Não é válido em todo o sistema, e no momento em que você muda de aba para fora do Docs ele para.
- API de voz para texto da OpenAI — whisper-1, gpt-4o-transcribe e gpt-4o-mini-transcribe, com um limite de upload de 25 MB por arquivo. Isso é um bloco de construção para desenvolvedores, não um aplicativo que você instala. É o que ferramentas como o modo Cloud do Whisper chamam por baixo dos panos, não algo que você aponta e começa a falar.
- Speechnotes — um bloco de ditado gratuito no navegador. Bom para anotar coisas, vive numa aba, não sai da aba.
- Windows Voice Access — o controle do sistema operacional sem as mãos, da Microsoft, feito para acessibilidade e operação completa sem teclado, e não para escrever rápido. Vale saber que existe se você precisa comandar o Windows inteiramente por voz.
- OpenAI Whisper — o próprio modelo de código aberto, que você pode rodar localmente sem a linha de comando. Se você quer especificamente o modelo Whisper num PC, veja o nosso passo a passo de OpenAI Whisper para Windows para o jeito sem terminal de instalar e usar.
Se você quer o panorama mais longo de toda a categoria, incluindo as ferramentas de reunião e os serviços de transcrição na nuvem, escrevemos um guia completo de software de transcrição. A versão curta para esta página: a maioria delas é presa ao navegador ou está na categoria errada para a tarefa de escrever em qualquer aplicativo do Windows.
Quando dispensar um aplicativo pago (e simplesmente usar o Win+H)
Windows · Win + H
Aqui está a parte que a maioria dessas listas deixa de fora, porque te mandar para uma concorrente gratuita não paga o blog de ninguém. Se você está online e só dita a mensagem curta ocasional num navegador ou caixa de bate-papo, não pague por nada, inclusive por nós. Pressione Win+H e siga em frente. É gratuito, embutido no Windows 11, e lida bem com rajadas curtas. Se você vive no Google Docs, o Voice Typing dele é gratuito e está bem ali dentro do documento. Se a sua necessidade real é gravar e resumir reuniões em vez de escrever, o plano gratuito do Otter te dá 300 minutos por mês. Um aplicativo de ditado pago começa a ganhar o seu lugar numa linha específica: quando você escreve textos mais longos, trabalha em algum lugar sem sinal ou precisa falar em aplicativos onde o Win+H não consegue entrar. Abaixo dessa linha, a opção embutida é a resposta certa, e eu prefiro que você guarde o seu dinheiro e volte quando ela ficar pequena para você.
Aqui está a única opinião forte que vou plantar neste artigo: se a sua ferramenta de ditado precisa que você a treine, ela está em 1999. O reconhecimento de fala moderno funciona logo de cara na maioria dos sotaques e idiomas. O ritual de calibração de 45 minutos que definiu a velha era do Windows era uma gambiarra para o poder de processamento escasso, não um recurso. No fim dos anos 1990, um parente meu rodava o Dragon NaturallySpeaking num desktop com Windows 98 e 64 MB de RAM. O processo de treinamento levava 45 minutos. Você lia uma lista de palavras para calibrá-lo. Aí o ditado funcionava, mal e mal, talvez com 70% de precisão e um atraso de quatro segundos por frase. Um parágrafo de uma carta de fim de ano levava quinze minutos. O headset foi arremessado pela sala. O headset sobreviveu; o experimento, não. Vinte e cinco anos depois, uma criança de sete anos na mesma família ditou um e-mail completo em 90 segundos, sem treinamento, sem calibração. Se uma ferramenta de 2026 ainda pede que você a treine antes de ouvir, é uma ideia de 1999 vestindo um ícone novo.
Preço sem enrolação
Toda a pipeline local do Whisper é gratuita para quem tem conta: Whisper local, Parakeet, melhoria por IA no dispositivo, histórico de ditados, atalhos personalizados, tudo, sem precisar de meio de pagamento para se cadastrar. Essa é a parte que vale parar para pensar: o ditado offline, que funciona em todos os aplicativos e que é o tema deste artigo inteiro, não custa nada, e você não entrega um cartão para tê-lo. O Whisper Pro adiciona a superfície Cloud para transcrição com tecnologia da OpenAI, melhoria por IA na nuvem e busca na web por voz, para quem quer os modelos mais recentes e respostas da web na mesma ferramenta. O Win+H e o Google Docs Voice Typing também são gratuitos. O Otter tem um plano gratuito de 300 minutos por mês e planos pagos acima dele. O Dragon é um produto pago cujo preço atual não consegui confirmar diretamente com a Nuance, então verifique a loja deles. Os números exatos do Whisper Pro ficam na página de preços, cravados, por escrito, sem "a partir de", e mandamos um e-mail antes de qualquer renovação, então a data e o valor nunca são surpresa.
Abra uma caixa de texto agora mesmo e pressione Win+H. Se aquela barra rápida cobre tudo o que você faz, está pronto, e você economizou um download. No momento em que você se vir num trem sem sinal, ou falando com um aplicativo que se recusa a ouvir, ou escrevendo algo mais longo que uma mensagem de texto, é aí que uma ferramenta que você instala começa a importar. Minha filha de sete anos cruzou essa linha no dia em que quis escrever para a avó do banco de trás do carro, onde a lua sumia o tempo todo e o Wi-Fi nunca apareceu.
Quer ver isso no seu PC com Windows?
Baixe o Whisper, segure Ctrl+Space e veja a transcrição cair em qualquer aplicativo. A pipeline local é gratuita, sem cartão no cadastro.
Ditado local gratuito para todo usuário cadastrado. O Pro adiciona os recursos de nuvem num teste separado.



