Por Denys Medvediev

Comparativo

Win+H alternativa

Win+H é a Digitação por Voz do Windows — gratuita, embutida e boa para ditados rápidos. Mas roda na nuvem da Microsoft, precisa de internet e não tem vocabulário personalizado. A alternativa que a maioria das pessoas quer funciona offline, com uma tecla de segurar-e-falar e uma passada de limpeza por IA.

Última atualização: junho de 2026

Um teclado do Windows sobre uma mesa escura com a tecla Windows em foco, evocando o atalho de digitação por voz Win+H

A melhor alternativa ao Win+H é uma ferramenta de ditado para todo o sistema que roda offline, como o Whisper by Remskill. O Win+H (Digitação por Voz do Windows) é gratuito e embutido, mas usa o serviço de fala online da Microsoft e precisa de internet. Uma ferramenta local transcreve no próprio dispositivo, adiciona vocabulário personalizado e usa uma tecla de segurar-e-falar que não para sozinha.

O Win+H é o ditado gratuito que já vem no seu PC e, para muita gente, ele é genuinamente suficiente. Você aperta a tecla Windows + H, uma barrinha aparece onde estiver o cursor, você fala e o texto surge. Sem instalação, sem conta, sem custo. Quero dizer isso com todas as letras logo de cara, porque a internet está cheia de páginas fingindo que a opção embutida é uma porcaria só para te vender alguma coisa. Não é uma porcaria. Ela é boa.

O problema começa quando "boa para ditados rápidos" esbarra em "eu faço isso o dia inteiro". A Digitação por Voz envia sua fala para a nuvem da Microsoft, então precisa de uma conexão estável. Não tem vocabulário personalizado, então nunca aprende os nomes dos seus produtos nem o sobrenome dos seus colegas. E o próprio atalho dá conflito — muitos aplicativos já se apropriaram do Win+H ou das teclas ao redor. Se você bateu em qualquer uma dessas paredes, não está procurando um conserto. Está procurando uma alternativa.

Aqui vai a verdade sem graça que a maioria dessas páginas pula. O Win+H é uma boa ferramenta gratuita com três limites específicos: ele depende da nuvem, então sem internet não tem ditado; não tem como ensinar o seu jargão a ele; e é uma barra de toque-para-ligar que fica escutando até algo parar, em vez de uma tecla que você segura enquanto fala. Nada disso é bug. São decisões de projeto, e são as decisões certas para o usuário casual para quem a Microsoft a criou.

Então a pergunta real não é "como faço para deixar o Win+H melhor". Você praticamente não consegue — os limites são de fábrica. A pergunta é "o que eu rodo no lugar quando esses limites começam a doer", e a resposta honesta depende de você querer privacidade offline, o seu próprio vocabulário, um atalho que não atrapalha ou uma passada de IA que limpa o texto corrido antes de ele chegar. Vou passar por tudo isso, configurar um em dois minutos e te dizer com clareza quando o Win+H ainda é a escolha certa.

O que o Win+H realmente é, e para quem ele serve

Uma pessoa usando um notebook Windows sobre uma mesa, ilustrando a digitação por voz embutida

O Win+H é o atalho de teclado para a Digitação por Voz do Windows. Aperte a tecla do logo do Windows e o H juntos em qualquer PC com Windows 11, uma barra de microfone aparece e tudo o que você falar é digitado na caixa de texto onde o cursor está. A própria página de suporte da Microsoft é clara sobre o que a alimenta: "A digitação por voz usa o reconhecimento de fala online, que é fornecido pelos serviços de fala do Azure." Ela funciona em cerca de 40 idiomas, pode inserir pontuação automaticamente se você ativar essa configuração e não custa nada porque vem junto com o Windows.

É justo dar o crédito, porque ser honesto aqui importa. Para um ditado curto e casual, o Win+H é genuinamente bom. A precisão em inglês claro é sólida. A configuração é zero — não tem conta, nem download, nem modelo para esperar baixar. Se você quer disparar uma mensagem de duas linhas no Teams ou uma busca rápida por voz, aperta um atalho e pronto. Para essa tarefa, pagar por qualquer outra coisa seria bobagem, e vou repetir isso de forma ainda mais clara lá na frente.

Ele foi feito para quem dita de vez em quando, não para quem dita para viver. Esse recorte explica todas as limitações que vêm a seguir. A Microsoft criou um recurso gratuito, simples e apoiado na nuvem para o usuário comum que quer falar em vez de digitar de vez em quando. Ela não criou uma ferramenta de alto desempenho, e nunca fingiu que criou. O descompasso só aparece quando você tenta usar uma ferramenta casual para um trabalho pesado.

O Win+H é também só um entre vários atalhos — o atalho de digitação por voz de cada sistema operacional está reunido em uma única tabela.

Por que as pessoas vão atrás de uma alternativa ao Win+H

Três coisas mandam as pessoas procurar. Primeiro, a exigência de internet. A documentação de suporte da Microsoft diz com todas as letras: "Para usar a digitação por voz, você precisa estar conectado à internet." A Digitação por Voz processa sua fala na nuvem, não na sua máquina, então num trem, num avião, numa área sem sinal ou numa rede corporativa restrita, ela simplesmente não funciona. Para quem dita qualquer coisa que prefere não mandar para um servidor — um e-mail de cliente, uma anotação médica, uma ideia ainda crua sobre o negócio — o ida e volta na nuvem é o fator decisivo, não a velocidade.

Segundo, não há vocabulário personalizado. O Win+H não vai aprender que o seu produto se escreve "Remskill" e não "rem skill", nem que a sua colega é "Siân" e não "Shawn". Toda sessão começa do zero. Terceiro, o atalho dá conflito. O Win+H é um atalho global, e outros aplicativos pegam ele ou as teclas ao redor, então o que deveria ser um aperto rápido vira uma briga por quem é dono da combinação. Uma alternativa resolve os três de uma vez: roda no dispositivo, aceita uma lista de palavras personalizada e deixa você escolher um atalho que nada mais usa.

Esse último ponto vale mais ver do que ler. A alternativa em que a maioria das pessoas acaba caindo é uma tecla de segurar-e-falar: você aperta e segura uma tecla, fala e solta, e o texto é colado no cursor. Ela fica ligada exatamente pelo tempo que você segura — sem parada automática depois de uma pausa, sem barra para fechar. Uma capsulazinha aparece enquanto você fala para você saber que está escutando:

Cancel
O overlay de gravação: uma cápsula pequena que aparece enquanto você segura o atalho, para você saber que está escutando.

Configure a alternativa em dois minutos

A alternativa que vou usar aqui é o Whisper by Remskill, porque é a que fecha as três lacunas do Win+H — offline, vocabulário personalizado, o seu próprio atalho. Você precisa de um PC com Windows 10 ou mais novo (ele roda no Mac também), um microfone funcionando e cerca de dois minutos. Todo o pipeline local é gratuito para qualquer conta logada, sem pedir forma de pagamento no cadastro. Aqui vai a sequência.

Passo 1 — Instale o Whisper e faça login.

Baixe na página de download, instale e crie uma conta gratuita. Sem cartão. Todo o pipeline de transcrição local fica disponível na hora.

Você vai saber que deu certo quando o ícone do app aparecer na bandeja e o assistente de configuração oferecer a escolha de um modelo.

Passo 2 — Escolha um caminho de transcrição.

O app não escolhe por você. Você tem três: Nuvem (OpenAI, com a sua própria chave), Parakeet Local ou Whisper Local. Para vencer o limite de nuvem que o Win+H tem, escolha um local — mais sobre qual deles duas seções abaixo.

Você vai saber que deu certo quando um modelo terminar de baixar e aparecer como pronto.

Passo 3 — Defina um atalho que nada mais use.

No Windows, o padrão é Ctrl+Space, segurado como push-to-talk. Se isso colidir com algo que você usa, mude nas Configurações — o motivo todo de largar o Win+H é justamente poder ser dono dessa tecla, e não brigar por ela.

Você vai saber que deu certo quando uma gravação de teste for colada em qualquer campo de texto.

Passo 4 — Adicione suas palavras personalizadas e fale.

Coloque os nomes dos seus produtos, sobrenomes e siglas na lista de hotwords para que saiam escritos certo. Depois ponha o cursor em qualquer lugar, segure o atalho, diga uma frase e solte.

Você vai saber que deu certo quando "Remskill" sair como Remskill e a sua frase estiver lá na caixa de texto.

Whisper
O app de desktop do Whisper de verdade na tela de configurações, com os painéis de Transcrição e IA abertos.

A parte lenta é o download do modelo, não a configuração. Todo o resto são os quatro passos acima. Uma vez rodando, o ditado deixa de ser um recurso que você invoca e vira uma tecla que você segura, em qualquer app, com ou sem internet.

voz para texto no Windows · no Mac

Win+H contra uma ferramenta dedicada, com honestidade

Comece por onde o Win+H ganha, porque ele ganha em duas coisas e fingir o contrário seria desonesto. Ele é gratuito, ponto final — nada para comprar, nunca. E já vem instalado, então não tem download nem conta. Se essas duas coisas são o que mais importa para você, a comparação pode acabar aqui e o Win+H leva. Uma ferramenta dedicada pede que você instale algo e faça login; o Win+H não pede nada.

Agora o resto da tabela. Em privacidade, o Win+H é só nuvem — a própria documentação da Microsoft traça a linha: o reconhecimento de fala online "usa serviços baseados na nuvem da Microsoft" e "os dados de voz são enviados para a Microsoft", enquanto o reconhecimento no dispositivo "processa sua voz localmente no seu dispositivo" e "nenhum dado de voz é enviado para a Microsoft". A Digitação por Voz usa o caminho online. Uma alternativa local mantém tudo na máquina. Em vocabulário personalizado, o Win+H não tem nenhum; uma ferramenta dedicada aceita uma lista de palavras. No atalho, o Win+H é um atalho global fixo que escuta até ser interrompido; uma ferramenta de segurar-e-falar te dá uma tecla que você escolhe e segura. Na limpeza, o Win+H faz pontuação automática ao vivo; uma ferramenta dedicada pode rodar uma passada completa de IA que corrige palavras de preenchimento e frases corridas, não só as vírgulas.

E a parada automática. O Win+H foi feito para ler uma pausa como "você terminou" e se desligar depois de alguns segundos de silêncio — um comportamento que eu investiguei à parte em por que o ditado do Windows fica parando. Para mensagens curtas, tudo bem. Para pensar em voz alta, quando você pausa para achar a palavra, é de enlouquecer. Uma tecla de segurar-e-falar contorna isso por completo: fica ligada enquanto você segura e desliga quando você solta, e o silêncio no meio não muda nada. Então o placar honesto: o Win+H ganha em gratuito e pré-instalado; a alternativa ganha em offline, vocabulário, controle do atalho, limpeza e não parar em cima de você. Escolha a linha que combina com o seu dia.

Local ou nuvem: qual modo substitui o Win+H

Se o motivo de você estar largando o Win+H é a exigência de internet ou a privacidade, a resposta é o modo local. Todo o apelo de uma alternativa é que a transcrição acontece na sua máquina, sem nada enviado a um servidor — o oposto do ida e volta na nuvem que para a Digitação por Voz no instante em que sua conexão oscila. Se o seu PC é dos últimos anos, o local dá conta do ditado do dia a dia sem reclamar, e a nuvem vira uma opção a que você recorre, e não uma dependência da qual você fica refém.

Aqui vai como os três caminhos diferem, porque o app faz você escolher e eu prefiro que você escolha bem:

  • Parakeet LocalO motor TDT da NVIDIA, cerca de 600 MB, e a opção local mais rápida — de 5 a 10 vezes mais rápida que o Whisper em CPU. Cobre o inglês mais 24 outros idiomas europeus, 25 no total. Sem tradução para o inglês. Se você dita em inglês ou em outro idioma europeu, esta é a escolha rápida e totalmente offline que faz o que o Win+H faz sem a nuvem.
  • Whisper Localmais lento que o Parakeet na mesma máquina, mas as versões multilíngues cobrem 99 idiomas e podem traduzir para o inglês. As versões só de inglês são só de inglês, não 99. Escolha esta para chinês, japonês, coreano ou qualquer trabalho de tradução, que o Parakeet não faz. O modelo padrão de inglês tem cerca de 480 MB.
  • Nuvem (OpenAI, BYOK)melhor precisão e acesso à web, usando sua própria chave OpenAI cobrada diretamente pela OpenAI. A transcrição roda no gpt-4o-mini-transcribe por padrão. Ela precisa de internet, como o Win+H, então é o único caminho que sai da sua máquina. A superfície de Nuvem faz parte do Whisper Pro.

A verdade sem graça é que, para o tipo de texto que o Win+H lida hoje — e-mails, mensagens, anotações — qualquer um dos dois motores locais é mais que suficiente, e os dois rodam totalmente offline. Essa é a maior diferença prática em relação à opção embutida: sem conexão, ainda funciona. A nuvem merece o seu lugar quando você quer precisão de primeira numa gravação difícil ou precisa que o modelo puxe um fato da web no meio da frase. Se você veio aqui para escapar da dependência de internet, comece no local e trate a nuvem como saída de emergência, não como padrão.

A passada de limpeza por IA que o Win+H não faz

O ditado cru sai como um texto corrido. Você diz "ok então mandar e-mail pro cliente sobre o lançamento da remskill empurra pra quinta e pergunta sobre o orçamento", e é essa parede sem pontuação que qualquer motor de fala te entrega. O Win+H vai pulverizar algumas vírgulas e pontos enquanto você fala, o que é real e útil. O que ele não vai fazer é reescrever a bagunça — tirar os "ãs", consertar a gramática quebrada, transformar uma fala desconexa em algo que você realmente mandaria.

É essa a lacuna que uma passada de IA preenche. Diga a frase de ativação "Hey whisper" e o texto é aprimorado antes de chegar: preenchimento removido, frases corridas separadas, suas palavras personalizadas escritas certo porque você as ensinou à ferramenta. Num modelo local, isso roda pelo Ollama, então a limpeza acontece na sua máquina também; no modo nuvem, é o gpt-5-mini por padrão. O Win+H te dá pontuação. Isso te dá uma frase pronta.

Thinking...
Cru

ok então mandar e-mail pro cliente sobre o lançamento da remskill empurra pra quinta e pergunta sobre o orçamento ã antes da call

Limpo

Ok, então mande um e-mail para o cliente sobre o lançamento da Remskill, empurre para quinta-feira e pergunte sobre o orçamento antes da call.

A parte do vocabulário personalizado é a que o Win+H estruturalmente não consegue acompanhar. Como a alternativa transcreve na sua máquina com a sua própria lista de palavras, ela sabe que "Remskill" é um produto e "Siân" é um nome, e acerta toda vez em vez de uma vez sim, outra não. Para quem dita os mesmos nomes próprios o dia inteiro — um vendedor com um CRM cheio de sobrenomes, um desenvolvedor nomeando os mesmos serviços — essa é a diferença entre texto que você mantém e texto que você corrige. O Win+H começa cada sessão como um estranho; uma ferramenta com hotwords lembra.

Esse mesmo fluxo de falar-e-limpar é o motivo todo de a voz vencer o teclado em volume — você consegue digitar mais rápido com a sua voz em todos os aplicativos, então uma mensagem longa vira algumas frases faladas em vez de um parágrafo que você martela à mão.

Quando o Win+H é tudo de que você precisa

Uma pessoa relaxada no notebook enviando uma mensagem rápida, ilustrando o ditado casual embutido

Eu estaria mentindo se dissesse a todo mundo para instalar alguma coisa. Para uma fatia real de pessoas, o Win+H é a resposta certa e uma ferramenta dedicada é exagero. Se você dita de vez em quando — uma mensagem rápida, uma caixa de busca, uma anotação curta — e está quase sempre online, o recurso embutido não custa nada e funciona bem. Não baixe um app para fazer o que o atalho tecla Windows + H já faz de graça.

Em concreto, fique com o Win+H se você está sempre conectado à internet e não liga que sua fala passe pela nuvem da Microsoft; se você dita em ditados curtos em vez de passagens longas, de modo que a parada automática por silêncio nunca te incomoda; se você nunca precisa que ele escreva nomes ou jargões personalizados; e se o atalho Win+H não colide com nada que você usa. Esse é um perfil de verdade, não um espantalho — ele descreve muitos usuários casuais, e para eles a alternativa adiciona atrito sem adicionar valor. Gratuito e pré-instalado é uma combinação forte quando os limites não te atingem.

A linha a cruzar é quando os limites começam a te custar tempo. Recorra a uma ferramenta offline e para todo o sistema quando você dita onde não há sinal, quando quer que suas palavras fiquem na sua máquina, quando está cansado de os mesmos nomes saírem errados, ou quando quer um atalho que você segura e que nunca para no meio do pensamento. Abaixo dessa linha, o Win+H ganha em preço e zero configuração, e eu vou te dizer, de bom grado, para ficar com ele.

E se a sua reclamação real com o Win+H é o corte constante e não a nuvem, o passo a passo de consertar-primeiro em por que o ditado do Windows fica parando cobre o que você de fato pode estabilizar antes de decidir trocar.

Leitura adicional

O Win+H é aquela rara ferramenta gratuita que é de fato boa, e é por isso que passei este texto inteiro me recusando a detoná-lo. Ele faz um trabalho bem: ditado curto, online e casual, de graça. A alternativa é para o outro trabalho — o trabalho de o dia inteiro, offline, com as minhas próprias palavras, de segurar-a-tecla-e-pensar. Ditei a maior parte deste comparativo com um atalho que escolhi eu mesmo, num avião com o wi-fi desligado, enquanto o Win+H ficava ali esperando uma conexão que não ia chegar. Escolha a ferramenta que combina com o voo em que você está.

Experimente a alternativa offline ao Win+H

Segure um atalho que você escolheu, fale, solte. O texto cai onde o seu cursor estiver — online ou off, em todos os apps.

Modo local gratuito para qualquer conta logada. Sem cartão para começar.

Foto de Denys Medvediev

Denys Medvediev

Sou eu quem lê o nosso e-mail de suporte, muito provavelmente ditando as respostas.