Por Denys Medvediev

Comparativo

A melhor conversão de voz em texto no Windows, ranqueada

O melhor aplicativo de voz para texto no Windows depende de onde você digita. O Win+H é gratuito e já vem instalado, mas precisa de internet e só funciona dentro de uma caixa de texto. O Whisper funciona offline, em qualquer aplicativo, e cola o texto no cursor.

Última atualização: junho de 2026

Notebook prata aberto sobre uma mesa de escritório limpa, ao lado de uma janela bem iluminada, um ambiente típico de ditado no Windows

O melhor aplicativo de voz para texto no Windows depende de onde você digita. O Windows Voice Typing (Win+H) é gratuito e já vem instalado, mas precisa de internet e só funciona dentro de uma caixa de texto. O Whisper by Remskill funciona offline, em qualquer aplicativo, e cola o texto no cursor. É a escolha mais forte para escrever de verdade.

No fim de semana passado, minha filha mais nova ditou um e-mail de 90 palavras para a avó dela na Ucrânia em cerca de 90 segundos. Sem teclado. Ela tem sete anos. Vinte e cinco anos atrás, a mesma máquina na mesma família levava quinze minutos para ditar um único parágrafo de uma carta de fim de ano, e mal feito. A conversão de voz em texto no Windows deixou de ser um experimento de laboratório, sem alarde. A resposta honesta é que você tem mais boas opções do que imagina, e um ou dois nomes famosos que pode deixar de lado.

A maioria das listas de "melhor voz para texto no Windows" ranqueia doze ferramentas e recomenda aquela que pagou pelo link. Esta não é assim. O Windows em 2026 traz um recurso de ditado gratuito que quase ninguém descobre, e o mercado pago se dividiu entre ferramentas que gravam reuniões e ferramentas que ajudam a escrever. Este guia ranqueia os aplicativos de voz para texto que valem a pena instalar no Windows 10 ou superior, por quatro coisas que importam: precisão, suporte offline, onde funciona e preço. Depois, ele explica, em termos simples, quando a opção gratuita já embutida é tudo de que você precisa. No fim, você vai saber qual instalar hoje e qual nome famoso deixar na prateleira. Eu leio os e-mails de suporte do aplicativo que desenvolvo, então a maior parte do que sei sobre onde essas ferramentas falham vem de pessoas escrevendo para me contar que elas falharam.

Uma palavra rápida sobre como ler o que vem a seguir. Eu desenvolvo uma das ferramentas desta lista, então não vou fingir que sou um juiz neutro, mas vou apontar os casos em que uma opção gratuita ou uma concorrente é a escolha certa, porque essa é a única forma honesta de escrever isto. O ranking é por caso de uso, não por um único vencedor, porque não existe um único vencedor. A pessoa que dispara três mensagens no Slack por dia e a pessoa que rascunha um relatório de 3.000 palavras por voz querem ferramentas diferentes, e uma lista que finge o contrário está te vendendo alguma coisa.

A resposta curta: o Win+H é gratuito, mas é aqui que ele para

Windows · Win + H

Listening…
Windows Voice Typing (Win+H), recriado — uma pequena barra flutuante no topo da tela. Gratuito e já instalado, mas precisa de internet e só funciona dentro de uma caixa de texto.

Pressione a tecla com o logotipo do Windows e o H em qualquer caixa de texto, e uma pequena barra de ferramentas aparece no topo da tela. Comece a falar. Isso é o Windows Voice Typing, gratuito e embutido no Windows 11. Para uma mensagem rápida numa janela de bate-papo, é difícil bater algo que é grátis e já vem instalado.

Duas coisas o limitam. Primeiro, ele precisa de internet. O Voice Typing usa reconhecimento de fala online, com a tecnologia dos serviços Azure Speech da Microsoft, então sem conexão não há ditado. Segundo, o seu cursor precisa estar numa caixa de texto para ele funcionar. Isso descarta muitos dos lugares onde você quer falar: renomear um arquivo, uma célula de planilha que resiste, um aplicativo de desktop que o Windows não considera uma "caixa de texto".

Uma terceira coisa, menor, só aparece depois de algumas semanas. O Win+H é um recurso, não um fluxo de trabalho. Ele não guarda histórico do que você ditou, não dá um lugar para corrigir uma palavra que sempre sai errada e não oferece jeito de moldar a pontuação ao seu jeito de falar. Você ganha um microfone e uma transcrição, e o pacote é só isso. Para uma resposta de uma linha, é exatamente certo. Para o quarto e-mail da manhã, você começa a querer mais.

Então a pergunta de verdade não é "existe uma opção gratuita". Existe, e você deveria experimentá-la primeiro. A pergunta é o que usar quando o gratuito acaba: num trem sem sinal, num aplicativo em que o Win+H se recusa a entrar, ou quando a mesma tarefa aparece pela quadragésima vez e você quer que ela seja lembrada.

Como escolhi: precisão, offline, funciona-em-tudo, preço

Mesa com um notebook, cadernos e listas de verificação, ilustrando os critérios usados para ranquear os aplicativos de ditado

Ranqueei estes por quatro coisas, nesta ordem, porque é nesta ordem que elas te incomodam.

Precisão. Todo o resto é ruído se a transcrição estiver errada. O detalhe é que ninguém publica um número justo de comparação direta. A Nuance anuncia até 99% de precisão de reconhecimento para o Dragon desde o primeiro uso. No modo local, a nossa faixa publicada para o Whisper é de 95% a 99%, com os modelos maiores pontuando mais alto. Ambos são autodeclarados, então trate-os como afirmações, não como um placar. Nenhuma fonte primária publica uma porcentagem de precisão verificável e direta para o Win+H, o Google Docs Voice Typing ou o Otter, então qualquer lista que te entregue um número para cada ferramenta está inventando. A verdade chata é que um microfone USB de US$20 melhora a sua precisão mais do que qualquer troca de modelo. Se você quer gastar dinheiro com transcrição melhor, gaste primeiro no microfone e depois no software.

Offline. Funciona com o Wi-Fi desligado? O Win+H não. O Google Docs Voice Typing não. Uma ferramenta que roda na sua própria máquina, sim, e isso importa para uma planilha de salários, um rascunho jurídico ou um e-mail para a escola do seu filho que não tem nada que ficar nos logs de um fornecedor. Também importa do jeito bobo e cotidiano: trens, aviões, porões, o banco de trás de um carro. O ditado na nuvem é tão confiável quanto a pior barrinha de sinal que você vai pegar hoje.

Funciona em qualquer lugar. Ele digita em todos os aplicativos, ou só em um? Essa é a linha que divide o jogo. Um atalho de teclado válido em todo o sistema cola onde quer que esteja o cursor; um recurso de navegador só funciona naquela aba do navegador. O teste que eu uso é banal de propósito. Ele consegue renomear um arquivo, preencher uma caixa de busca num aplicativo de desktop ou escrever uma mensagem de commit? A maioria das opções "gratuitas" falha nesse teste no momento em que você sai do navegador, e você sai do navegador mais do que imagina.

Preço. Números cravados, nada de "a partir de". Gratuito onde o gratuito é real. Não vou encher um ranking com uma ferramenta que custa mais que uma licença do Windows só para parecer completo, e vou te dizer quando a opção gratuita embutida é tudo de que você precisa, o que, para muita gente, é o caso.

Os aplicativos de voz para texto no Windows que valem o seu tempo

Whisper
O aplicativo Whisper de verdade, rodando ao vivo — entre em Configurações e escolha um motor de transcrição. No modo local, nada disso sai da sua máquina.

Whisper by Remskill — melhor para escrever em qualquer aplicativo

Aviso completo: eu desenvolvo este, então pondere isso. O que ele faz e a opção embutida não faz: ele usa um atalho de teclado global, válido em todo o sistema, que funciona em qualquer aplicativo onde você consegue digitar, e cola o texto transcrito onde quer que esteja o cursor. O atalho padrão no Windows é Ctrl+Space: segure, fale, solte, e o texto cai ali.

Ele funciona offline. Toda a transcrição local é em Rust puro e fica no seu dispositivo; nada sai da máquina depois que o modelo é baixado. Você escolhe como ele roda. Não há um único modelo "recomendado" que o aplicativo empurre para você, porque a escolha certa depende da sua máquina e dos seus idiomas.

O Whisper local traz oito modelos: quatro só em inglês, do Base com cerca de 140 MB até o Medium com aproximadamente 1,5 GB, e quatro multilíngues que vão até o Large v3 com cerca de 3 GB. Os multilíngues cobrem 99 idiomas; as versões .en só em inglês fazem inglês e só inglês. Os modelos menores carregam rápido e rodam em hardware modesto; os maiores pedem mais RAM e te recompensam com transcrições mais limpas. Um segundo motor, o Parakeet da NVIDIA com cerca de 600 MB, roda de 5 a 10 vezes mais rápido que o Whisper numa CPU e lida com inglês mais 24 idiomas europeus, sem idiomas asiáticos e sem tradução para o inglês. Se você fala principalmente inglês e quer velocidade, o Parakeet é a faixa rápida. Se você precisa de 99 idiomas, tradução ou controle mais fino, o Whisper é o que carregar.

Se você quer a qualidade mais recente da OpenAI e respostas da web na mesma ferramenta, o modo Cloud usa a sua própria chave da OpenAI, então você paga diretamente à OpenAI e nós não ficamos com nada. Você pode até pedir para ele pesquisar algo em voz alta. Diga a frase de ativação "Hey whisper" e ele vai fazer uma busca na web e colar a resposta (batizei a frase de ativação com o nome do produto, o que, como minha esposa apontou, é o tipo de coisa que só quem desenvolve software acharia esperto). A coisa toda é leve: o próprio aplicativo tem cerca de 25 MB, sem necessidade de GPU dedicada, porque a transcrição local roda na CPU. Ele instala no Windows 10 ou superior. Detalhamos a configuração de primeira execução no nosso guia de voz para texto no Windows.

Melhor para: qualquer pessoa que escreve por voz em mais de um aplicativo e quer que funcione num voo.

Windows Voice Typing (Win+H) — melhor opção gratuita e embutida

Já está no seu PC, sem instalação, sem conta. Pressione Win+H, fale dentro de uma caixa de texto. A troca é a exigência de internet e o limite de só funcionar em caixa de texto. Para mensagens curtas onde você já está online mesmo, é a primeira escolha certa justamente porque não custa nada. A Microsoft adicionou pontuação automática ao Win+H, e ele está bem ali em toda instalação nova do Windows 11. A maioria das pessoas que "não têm voz para texto" já têm e nunca apertaram a combinação de teclas. Comece por aqui. Se cobrir o seu dia, você terminou e não gastou nada.

Melhor para: ditado rápido num navegador ou caixa de bate-papo, online, sem configuração.

Dragon Professional — melhor para vocabulário especializado

O velho rei do ditado no Windows. A Nuance ainda anuncia até 99% de precisão desde o primeiro uso, otimizado para o Windows 11 e retrocompatível com o Windows 10. Se você dita termos médicos ou jurídicos densos o dia inteiro, a profundidade do vocabulário personalizado do Dragon é a razão de ele existir, com décadas de trabalho por trás do tratamento de jargões que tropeçam os modelos de uso geral. Uma ressalva honesta: até o fechamento deste texto, a loja da Nuance estava em meio a uma migração e eu não consegui confirmar um preço atual, nem se a versão atual é uma compra única ou uma assinatura, a partir de uma fonte primária. Historicamente, o Dragon era uma licença única, mas não vou imprimir um número que não consigo sustentar, então verifique antes de comprar. A outra ressalva é a que eu tenho uma opinião sobre, e chego nela mais adiante: a era de treinar o seu software de ditado acabou para quase todo mundo, exceto neste caso profissional bem específico.

Melhor para: profissionais com muito jargão de domínio e orçamento.

Wispr Flow — melhor opção polida na nuvem

Uma concorrente direta e bem elegante. A Wispr Flow anuncia mais de 100 idiomas com detecção automática e roda nativamente no Windows, Mac, iOS e Android. A detecção automática é o recurso de destaque. Diz que se move entre os seus idiomas no meio da frase do jeito que você faz. Não consegui confirmar pela página inicial deles se a transcrição roda no dispositivo ou na nuvem, então, se o offline importa para você, pergunte a eles diretamente antes de se comprometer. Polida, multiplataforma, vale uma olhada se a nuvem te serve e você quer a mesma ferramenta no celular e no notebook. Fizemos a comparação direta no nosso texto sobre alternativa ao Wispr Flow caso você esteja decidindo entre os dois.

Melhor para: pessoas que querem uma experiência refinada entre dispositivos e não precisam de offline.

Otter.ai — melhor para reuniões, não para ditado

O Otter é excelente naquilo que faz, que não é isto. É um transcritor de reuniões que entra no Zoom, no Microsoft Teams e no Google Meet, com um plano Basic gratuito limitado a 300 minutos de transcrição por mês. Ele não digita nos seus aplicativos; grava e transcreve conversas, e depois as resume. Outra categoria, totalmente. Se o seu problema é "resumir minhas reuniões", o Otter é uma resposta forte; se é "escrever mais rápido", é a ferramenta errada por melhor que ela seja. Ele também roda como o próprio aplicativo e serviço web, em vez de um atalho de teclado válido em todo o sistema, então não é algo que você usa para preencher um campo de formulário. Aprofundamos essa distinção no nosso texto sobre alternativa ao Otter.ai.

Melhor para: capturar e resumir reuniões, não escrever por voz.

Comparação rápida: onde cada ferramenta funciona

Deixei a precisão de fora desta tabela de propósito. Só o Dragon e o Whisper publicam um número, e ambos são autodeclarados. O Win+H, o Google Docs Voice Typing e o Otter não publicam nenhuma cifra verificável. Qualquer placar do tipo "a Ferramenta X tem 96,3% de precisão" entre todas as cinco é um chute formatado como fato. Então as colunas abaixo são as que você pode verificar: onde roda, se funciona offline, se alcança todos os aplicativos e para que foi feita.

FerramentaModelo de preçoLocal/NuvemFunciona offlineFunciona em todos os aplicativosIdiomasMelhor para
Whisper by RemskillLocal gratuito, nuvem paga (ver /pricing)Local ou nuvemSim, no modo localSim, atalho válido em todo o sistema99 nos modelos multilínguesEscrever por voz em qualquer aplicativo
Win+H Voice TypingGratuito, embutidoNuvem (Azure)Não, precisa de internetNão, só em caixa de textoVários, definidos nas ConfiguraçõesDitado rápido online
Dragon ProfessionalPago, verifique a loja da NuanceVerifique o fornecedorVerifique o fornecedorDentro dos aplicativos compatíveisVerifique o fornecedorVocabulário especializado
Wispr FlowPago, ver fornecedorNão confirmadoNão confirmadoVálido em todo o sistema no Win/MacMais de 100 anunciadosDitado polido na nuvem
Otter.aiPlano gratuito, pago acima dele (ver fornecedor)NuvemNãoNão, é o próprio aplicativoVerifique o fornecedorTranscrição de reuniões

Leia a tabela da esquerda para a direita e o campo se organiza sozinho. Se "funciona em todos os aplicativos" e "offline" precisam ambos ser sim, a lista é curta. Se você está feliz online e dentro de um único aplicativo, as opções gratuitas embutidas dão conta e você pode parar de ler aqui. A decisão raramente é sobre qual ferramenta é a "melhor" no abstrato. É sobre qual linha combina com o jeito que você trabalha.

Outras ferramentas que vale conhecer

O campo no Windows é mais amplo que cinco nomes. Algumas você vai ver em outras listas, com uma linha honesta para cada uma, para você descartar as que não servem:

  • Microsoft Word Dictate — embutido no Word do Microsoft 365, gratuito se você já paga pelo Office, e bom dentro do Word. Preso dentro do Word. Se a maior parte da sua escrita já acontece ali, é uma boa opção sem custo extra. Cobrimos suas peculiaridades em voz para texto no Word.
  • Google Docs Voice Typing — gratuito, mas só dentro do Google Docs e do Slides num navegador compatível, onde o navegador controla o serviço de fala. Não é válido em todo o sistema, e no momento em que você muda de aba para fora do Docs ele para.
  • API de voz para texto da OpenAI — whisper-1, gpt-4o-transcribe e gpt-4o-mini-transcribe, com um limite de upload de 25 MB por arquivo. Isso é um bloco de construção para desenvolvedores, não um aplicativo que você instala. É o que ferramentas como o modo Cloud do Whisper chamam por baixo dos panos, não algo que você aponta e começa a falar.
  • Speechnotes — um bloco de ditado gratuito no navegador. Bom para anotar coisas, vive numa aba, não sai da aba.
  • Windows Voice Access — o controle do sistema operacional sem as mãos, da Microsoft, feito para acessibilidade e operação completa sem teclado, e não para escrever rápido. Vale saber que existe se você precisa comandar o Windows inteiramente por voz.
  • OpenAI Whisper — o próprio modelo de código aberto, que você pode rodar localmente sem a linha de comando. Se você quer especificamente o modelo Whisper num PC, veja o nosso passo a passo de OpenAI Whisper para Windows para o jeito sem terminal de instalar e usar.

Se você quer o panorama mais longo de toda a categoria, incluindo as ferramentas de reunião e os serviços de transcrição na nuvem, escrevemos um guia completo de software de transcrição. A versão curta para esta página: a maioria delas é presa ao navegador ou está na categoria errada para a tarefa de escrever em qualquer aplicativo do Windows.

Quando dispensar um aplicativo pago (e simplesmente usar o Win+H)

Windows · Win + H

Listening…
O Win+H de novo — para ditado curto e online num navegador ou caixa de bate-papo, a barra gratuita embutida é genuinamente a resposta certa. Não pague pelo que o Windows já te dá.

Aqui está a parte que a maioria dessas listas deixa de fora, porque te mandar para uma concorrente gratuita não paga o blog de ninguém. Se você está online e só dita a mensagem curta ocasional num navegador ou caixa de bate-papo, não pague por nada, inclusive por nós. Pressione Win+H e siga em frente. É gratuito, embutido no Windows 11, e lida bem com rajadas curtas. Se você vive no Google Docs, o Voice Typing dele é gratuito e está bem ali dentro do documento. Se a sua necessidade real é gravar e resumir reuniões em vez de escrever, o plano gratuito do Otter te dá 300 minutos por mês. Um aplicativo de ditado pago começa a ganhar o seu lugar numa linha específica: quando você escreve textos mais longos, trabalha em algum lugar sem sinal ou precisa falar em aplicativos onde o Win+H não consegue entrar. Abaixo dessa linha, a opção embutida é a resposta certa, e eu prefiro que você guarde o seu dinheiro e volte quando ela ficar pequena para você.

Aqui está a única opinião forte que vou plantar neste artigo: se a sua ferramenta de ditado precisa que você a treine, ela está em 1999. O reconhecimento de fala moderno funciona logo de cara na maioria dos sotaques e idiomas. O ritual de calibração de 45 minutos que definiu a velha era do Windows era uma gambiarra para o poder de processamento escasso, não um recurso. No fim dos anos 1990, um parente meu rodava o Dragon NaturallySpeaking num desktop com Windows 98 e 64 MB de RAM. O processo de treinamento levava 45 minutos. Você lia uma lista de palavras para calibrá-lo. Aí o ditado funcionava, mal e mal, talvez com 70% de precisão e um atraso de quatro segundos por frase. Um parágrafo de uma carta de fim de ano levava quinze minutos. O headset foi arremessado pela sala. O headset sobreviveu; o experimento, não. Vinte e cinco anos depois, uma criança de sete anos na mesma família ditou um e-mail completo em 90 segundos, sem treinamento, sem calibração. Se uma ferramenta de 2026 ainda pede que você a treine antes de ouvir, é uma ideia de 1999 vestindo um ícone novo.

Preço sem enrolação

Toda a pipeline local do Whisper é gratuita para quem tem conta: Whisper local, Parakeet, melhoria por IA no dispositivo, histórico de ditados, atalhos personalizados, tudo, sem precisar de meio de pagamento para se cadastrar. Essa é a parte que vale parar para pensar: o ditado offline, que funciona em todos os aplicativos e que é o tema deste artigo inteiro, não custa nada, e você não entrega um cartão para tê-lo. O Whisper Pro adiciona a superfície Cloud para transcrição com tecnologia da OpenAI, melhoria por IA na nuvem e busca na web por voz, para quem quer os modelos mais recentes e respostas da web na mesma ferramenta. O Win+H e o Google Docs Voice Typing também são gratuitos. O Otter tem um plano gratuito de 300 minutos por mês e planos pagos acima dele. O Dragon é um produto pago cujo preço atual não consegui confirmar diretamente com a Nuance, então verifique a loja deles. Os números exatos do Whisper Pro ficam na página de preços, cravados, por escrito, sem "a partir de", e mandamos um e-mail antes de qualquer renovação, então a data e o valor nunca são surpresa.

Abra uma caixa de texto agora mesmo e pressione Win+H. Se aquela barra rápida cobre tudo o que você faz, está pronto, e você economizou um download. No momento em que você se vir num trem sem sinal, ou falando com um aplicativo que se recusa a ouvir, ou escrevendo algo mais longo que uma mensagem de texto, é aí que uma ferramenta que você instala começa a importar. Minha filha de sete anos cruzou essa linha no dia em que quis escrever para a avó do banco de trás do carro, onde a lua sumia o tempo todo e o Wi-Fi nunca apareceu.

Quer ver isso no seu PC com Windows?

Baixe o Whisper, segure Ctrl+Space e veja a transcrição cair em qualquer aplicativo. A pipeline local é gratuita, sem cartão no cadastro.

Ditado local gratuito para todo usuário cadastrado. O Pro adiciona os recursos de nuvem num teste separado.

Foto de Denys Medvediev

Denys Medvediev

Sou eu que leio os e-mails de suporte, muito provavelmente ditando as respostas.

Leitura adicional