Por Denys Medvediev

Tutorial

Ditado por voz no Windows 11

Pressione a tecla Windows + H em um teclado físico, coloque o cursor em qualquer campo de texto e comece a falar — o ditado integrado funciona online via Azure. Para ditado offline em qualquer aplicativo, instale uma ferramenta dedicada. Este guia configura os dois, do início ao fim.

Última atualização: junho de 2026

Mãos digitando em um teclado de notebook em ambiente fechado, ilustrando o ditado como alternativa mais rápida à digitação

Pressione a tecla Windows + H em um teclado físico, coloque o cursor em qualquer campo de texto e comece a falar. As palavras aparecem na posição do cursor. O ditado integrado usa o reconhecimento de voz online do Azure e precisa de conexão com a internet. Para ditado offline em qualquer aplicativo, instale uma ferramenta dedicada. Este guia configura os dois, do início ao fim.

Minha filha mais velha um dia me perguntou por que meus e-mails demoram tanto para sair. A resposta honesta é que digito cerca de 40 palavras por minuto e sou interrompido a cada noventa segundos. O ditado por voz resolveu metade disso. O segredo no Windows 11 é um atalho que a maioria das pessoas nunca descobre: segure a tecla Windows + H e uma pequena barra de microfone aparece sobre o campo onde você está digitando.

A partir daí você fala, e as palavras aparecem na posição do cursor. A opinião que vou defender aqui: para qualquer coisa além de uma anotação rápida, a ferramenta integrada não é a que eu escolheria.

Dois caminhos de configuração chegam ao ditado por voz funcionando no Windows 11, e a diferença entre eles está em onde o processamento acontece. O Caminho 1 é o ditado integrado, que envia seu áudio para os servidores Azure da Microsoft, transcreve lá e devolve o texto. Isso funciona bem para uma mensagem no Teams e é um problema para uma planilha de salários num voo sem Wi-Fi.

O Caminho 2 é um aplicativo de mesa que faz a transcrição na sua própria máquina, offline, em qualquer janela. Ao final deste guia você terá os dois funcionando e saberá qual manter. A maior parte dos e-mails de suporte que recebo é de alguém que escolheu o caminho errado no primeiro dia. Eu sou quem lê esses e-mails.

Caminho 1: pressione Win+H e comece a falar

Windows 11 · Win + H

Listening…
A barra de ditado integrada do Windows 11: um botão de microfone, um ícone de configurações e o rótulo Ouvindo.

Pré-requisitos: Windows 11, conexão com a internet, microfone funcionando e cursor em um campo de texto. Sem download ou conta. Tempo: menos de um minuto.

1

Abra qualquer campo de texto. Um documento do Word, um e-mail, a barra de pesquisa do navegador — qualquer lugar onde você possa digitar.

2

Pressione a tecla Windows + H em um teclado físico. Uma pequena barra flutuante aparece com um botão de microfone.

3

Aguarde o rótulo Ouvindo e comece a falar. Suas palavras aparecem na posição do cursor.

4

Diga parar de ouvir ou clique no microfone para parar. A barra fecha e seu ditado fica onde o cursor estava.

Resultado esperado: a barra exibe Ouvindo e as palavras que você diz aparecem na posição do cursor enquanto você fala. Ativar a pontuação automática (o ícone de engrenagem na barra) permite que ela adicione vírgulas e pontos com base no que você diz.

Se não acontecer nada: o ditado por voz usa reconhecimento de voz online com o Azure, então precisa de conexão com a internet, microfone funcionando e cursor dentro de um campo de texto. Sem conexão, sem transcrição. A lista completa de soluções está duas seções abaixo.

Veio de um tutorial antigo que fala sobre o Reconhecimento de Fala do Windows? Esse recurso foi substituído pelo Voice Access para o Windows 11 22H2 e versões posteriores em setembro de 2024. O painel de controle do antigo WSR só existe agora em versões mais antigas do Windows. Então, se um guia mandar você abrir um assistente de Reconhecimento de Fala e você não encontrar, o guia é que está desatualizado, não o seu PC.

Quando o ditado integrado é suficiente

Notebook e bloco de notas sobre uma mesa de madeira, um ambiente de baixo risco onde o ditado integrado funciona bem

Não vou mandar você instalar um software que não precisa. Para muitas tarefas, Win+H é a resposta certa e não custa nada.

Use a ferramenta integrada quando o ditado for curto, você tiver conexão e o conteúdo não for sigiloso. Uma resposta a um colega no Teams. Uma anotação rápida no OneNote. Uma pesquisa que prefere falar a digitar no celular. Ela lida com pontuação automática e funciona em qualquer campo de texto padrão no Windows 11. Para fragmentos de 30 palavras quando você já está online, abrir um segundo aplicativo seria mais lento do que simplesmente falar.

Um segundo recurso integrado confunde muita gente, então vale esclarecer. O Voice Access não é a mesma coisa que o ditado por voz. O Voice Access permite controlar o PC inteiro e criar texto por voz e, ao contrário do Win+H, funciona offline usando reconhecimento de voz no próprio dispositivo após um download único de idioma. Requer o Windows 11 versão 22H2 ou posterior. Portanto, se você precisa de controle total do PC sem usar as mãos (clicar, rolar, abrir aplicativos por voz), o Voice Access é a ferramenta integrada para isso, não o ditado por voz. São funções diferentes.

Onde o Win+H deixa a desejar (offline, precisão, idiomas)

A ferramenta integrada tem três limites reais. Nenhum deles é um impedimento para uma anotação rápida. Os três começam a incomodar no momento em que você faz trabalhos mais longos ou mais sérios.

Offline

O ditado por voz precisa de internet porque a transcrição acontece nos servidores do Azure, não no seu notebook. Em um avião, em um trem passando por um túnel ou em um prédio que engole o Wi-Fi, ele para de funcionar.

Precisão

A Microsoft não divulga nenhuma taxa de precisão para o ditado por voz, e não existe um benchmark neutro em que eu apostaria. O que posso dizer é que um modelo na nuvem com conexão instável, um microfone embutido de notebook e um sotaque forte são três maneiras diferentes de obter uma transcrição que você terá de corrigir manualmente.

Idiomas

O ditado por voz suporta uma lista fixa, mantida pela Microsoft, de cerca de quarenta idiomas, e você precisa instalar cada um antes de conseguir mudar para ele. É mais do que suficiente para a maioria das pessoas e um obstáculo para quem trabalha com um idioma que a Microsoft ainda não adicionou.

Os três limites reais do ditado integrado: offline, precisão e cobertura de idiomas.

O aspecto de privacidade é o que mais me preocupa. Seu ditado — o e-mail para a escola do seu filho, o rascunho de um contrato, aquela ideia ainda não formada que você nunca diria em voz alta numa reunião — sai da sua máquina e vai para um servidor. Para uma mensagem de Teams com cinco minutos de atraso, isso não importa. Para o que realmente importa pra você, vale saber para onde o áudio vai.

Win+H não funciona? Os três culpados habituais

Quando o Win+H não faz nada, quase sempre é uma dessas três coisas. Verifique nessa ordem, porque é assim que costuma ser a frequência de cada causa.

1. Sem internet ou microfone que não funciona.

O ditado por voz precisa de conexão e de um microfone que o Windows consiga ouvir. Abra Configurações, Sistema, Som e confirme que seu dispositivo de entrada mostra movimento quando você fala.

Teste a correção: a barra deve alcançar Ouvindo em vez de travar.

2. O cursor não está em um campo de texto.

O Win+H só funciona quando o cursor está dentro de um campo onde você pode digitar. Clique em um documento do Word ou no corpo de um e-mail primeiro e depois pressione o atalho.

Teste a correção: a barra de microfone aparece no momento em que você pressiona as teclas.

3. Uma camada de teclas de função do notebook está interceptando o H.

Em alguns notebooks, as teclas da linha superior ou de mídia remapeiam funções, e um utilitário de teclado pode interceptar o atalho.

Teste a correção: use o botão de microfone do teclado virtual. Se o ditado funcionar assim, o atalho de hardware é o problema, e você remapeia a tecla no utilitário de teclado do fabricante.

Verifique os três culpados habituais nessa ordem — é assim que costuma ser a frequência de cada causa.

Se nenhuma dessas opções resolver, o problema mais profundo costuma ser um pacote de idioma que não terminou de instalar ou uma atualização do Windows em andamento. Esse também é o ponto em que paro de brigar com a ferramenta integrada e configuro algo que controlo de ponta a ponta, que é o Caminho 2 abaixo. Se continuar falhando depois disso, nós escrevemos um guia separado para quando o ditado por voz não funciona no Windows com a lista de verificação mais completa.

Caminho 2: configure um aplicativo de ditado dedicado

Whisper é o aplicativo de mesa que eu desenvolvo, e ele faz as três coisas que o Win+H não consegue: transcreve offline na sua própria CPU, funciona com um atalho global em qualquer aplicativo e deixa você escolher o motor para o seu hardware e idiomas em vez de um modelo fixo na nuvem. Aqui está a configuração completa, do início ao fim.

Whisper
O aplicativo Whisper para desktop — clique pelas abas de Configurações, Transcrição e IA.

Pré-requisitos: Windows 11, cerca de 1 GB de espaço livre em disco para um modelo de tamanho médio, um microfone e uma conta gratuita (sem método de pagamento para começar). Você precisa de conexão apenas para o download inicial; a transcrição depois é offline. Tempo: 5 a 10 minutos, a maior parte no download do modelo.

1

Baixe e instale o Whisper. Pegue o instalador na página de download e execute-o. Resultado esperado: o aplicativo abre na janela principal.

2

Faça login. Crie a conta gratuita quando solicitado; não é necessário cartão para começar. Resultado esperado: você chega à tela principal com as Configurações disponíveis.

3

Escolha um motor local e baixe o modelo. Escolha um modelo Whisper dimensionado para o seu PC, ou Parakeet para a opção local mais rápida. Resultado esperado: uma barra de progresso conclui e o modelo aparece como pronto.

4

Confirme o atalho. O atalho padrão no Windows é Ctrl+Space: pressione e segure, fale, solte. Mude nas Configurações se entrar em conflito com outra coisa.

5

Teste em qualquer aplicativo. Clique em qualquer campo de texto (um navegador, seu editor de código, uma caixa de chat), segure Ctrl+Space, diga uma frase, solte. O texto aparece na posição do cursor.

Resultado esperado: com o modelo baixado, você segura Ctrl+Space em qualquer aplicativo, fala, solta e suas palavras são coladas na posição do cursor sem internet no processo após o download. Dizer Hey whisper aciona uma revisão por IA no texto antes de ele aparecer, se você ativar essa opção.

Se o atalho disparar errado: redefina-o nas Configurações. Aprendi isso da pior forma. A primeira versão do manipulador de atalho disparava o callback de parada de gravação seis vezes por pressionamento real de tecla no Windows, porque o framework de entrada do Windows gera eventos fantasmas de liberação do Ctrl+Space em intervalos imprevisíveis. Funcionava em uma máquina limpa e quebrava em qualquer notebook com um segundo idioma de entrada ativado. Foram necessários telemetria, um guard de 50ms que não foi suficiente e, finalmente, um debounce de 300ms. O veredito da minha filha continua válido: é por isso que os e-mails do papai demoram para sair.

Em termos de cobertura de idiomas, o motor Whisper local lida com 99 idiomas nos modelos multilíngues, enquanto as versões .en são somente em inglês e um pouco mais rápidas para esse trabalho específico. O motor Parakeet é de 5 a 10 vezes mais rápido que o Whisper na CPU e cobre inglês mais 24 idiomas europeus (25 no total), mas não inclui idiomas asiáticos nem tradução para o inglês. Se o modo offline for o que mais importa pra você, nosso guia aprofundado sobre ditado por voz offline cobre os motores com mais detalhes.

Win+H vs Voice Access vs um aplicativo dedicado

Três formas de converter fala em texto no Windows 11, lado a lado. A tabela cobre apenas o que cada ferramenta documenta. Sem taxas de precisão ou velocidade inventadas.

FerramentaTipoFunciona offlineModelo de preçoIdiomasMelhor para
Ditado por voz Win+HIntegrado ao Windows 11Não (Azure online)Gratuito com o Windows~40, lista fixaNotas curtas online em qualquer campo de texto
Voice AccessIntegrado ao Windows 11 (22H2+)Sim (no dispositivo)Gratuito com o WindowsConjunto limitadoControle total do PC por voz sem as mãos
Whisper (aplicativo dedicado)Instalar no Windows + macOSSim (CPU local)Nível local gratuito; complemento Cloud pago99 nos modelos multilíngues do WhisperDitado offline em qualquer aplicativo

Se sua única necessidade é responder rapidamente no Teams enquanto está online, o Caminho 1 ganha em simplicidade. Já está no seu PC. No momento em que offline, cobertura em qualquer aplicativo ou um idioma não suportado entram em cena, o Caminho 2 justifica a instalação.

Local vs nuvem: qual modo do Whisper é ideal para o seu PC

O Whisper funciona em dois modos, e a escolha depende do seu hardware e de se você quer acesso à web.

O modo local faz tudo na sua máquina. Escolha um modelo Whisper dimensionado para o seu PC: o Base tem cerca de 140 MB e roda em quase qualquer coisa, o Small tem cerca de 480 MB, o Medium cerca de 1,5 GB, e o multilíngue Large v3 tem cerca de 3 GB para a melhor precisão se você tiver RAM suficiente. Ou escolha o Parakeet com cerca de 600 MB para a opção local mais rápida se você trabalha principalmente em inglês ou em idiomas europeus. Nada disso toca a internet após o download.

Thinking...
A revisão por IA que os modos local e nuvem compartilham, executada antes de o texto aparecer.

O modo nuvem é a saída de emergência. Ele usa sua própria chave OpenAI: transcrição via gpt-4o-mini-transcribe ou gpt-4o-transcribe, e pesquisa na web quando você quer uma resposta ao vivo colada na posição do cursor. Você traz a chave; não ficamos com nenhuma parte.

Aqui está a opinião que vou defender: experimente o modo local primeiro. Se o seu PC com Windows é dos últimos quatro anos, você não precisa da nuvem para ditado do dia a dia, e o modo local mantém seu áudio na sua máquina, onde ele deve ficar. A nuvem é o plano B quando você bater em um limite, não o padrão. O Whisper é gratuito para todo o pipeline local depois de fazer login, sem método de pagamento necessário para começar. A funcionalidade Cloud é o nível Pro pago. Os detalhes estão na página de preços. Para o passo a passo completo do modo local, o guia de voz para texto no Windows detalha cada etapa.

Quando pular o aplicativo dedicado

Prefiro que você mantenha o Win+H do que instale algo que não vai usar. Pule o aplicativo dedicado e fique no ditado integrado quando tudo isso for verdade:

  • Você dita fragmentos curtos, não documentos longos.
  • Você está online sempre que dita.
  • Você trabalha apenas em um idioma que o ditado por voz da Microsoft já suporta.
  • Seu áudio não é sigiloso e você não se importa se ele sair da máquina.

O Win+H é gratuito, já está instalado e é muito bom exatamente nesse trabalho. O aplicativo dedicado se justifica no momento em que você cruza uma dessas linhas — um avião, um rascunho de contrato, um idioma que a Microsoft não incluiu ou qualquer aplicativo que não seja um campo de texto padrão.

Preços sem rodeios

O modo local do Whisper é gratuito para todos que fazem login: transcrição com Whisper e Parakeet, aprimoramento por IA, histórico, presets, palavras-chave personalizadas, aceleração de hardware, downloads de modelos e o atalho global — tudo isso, sem cartão necessário para começar. O Whisper Pro adiciona os recursos Cloud por cima: transcrição em nuvem OpenAI, aprimoramento por IA na nuvem e pesquisa web por voz. O ditado por voz integrado do Windows também é gratuito, porque faz parte do Windows. O detalhamento completo dos planos está na página de preços. Prefiro que você leia os números exatos lá do que confiar em um valor num post de blog que pode ficar desatualizado.

Dois caminhos, uma decisão. Se você está online, a anotação é curta e o conteúdo não é sigiloso, pressione a tecla Windows + H e fale — é gratuito e já está no seu PC. No momento em que você precisar disso em um avião, em qualquer aplicativo, em um idioma que a Microsoft não incluiu ou com seu áudio ficando na sua própria máquina, configure o aplicativo dedicado. Eu cruzei essa linha em algum momento da terceira nota de reunião que ditei com uma mão só enquanto preparava as lancheiras, e não digitei um e-mail longo desde então.

Experimente offline no seu próprio PC

Baixe o Whisper, segure Ctrl+Space, fale, solte — suas palavras aparecem na posição do cursor em qualquer aplicativo, sem internet no processo.

Modo local gratuito para qualquer conta com login. Sem cartão necessário para começar. Se o Win+H já faz tudo o que você precisa, fique com o atalho — ele é muito bom.

Foto de Denys Medvediev

Denys Medvediev

Sou quem lê os e-mails de suporte, provavelmente ditando as respostas.

Leitura complementar