Por Denys Medvediev

Tutorial

Digitação por voz no Word: Win+H, Ditar ou algo melhor

Duas formas nativas de ditar no Word e um upgrade para o sistema inteiro. Onde cada uma fica, como ativá-la e onde elas param.

Última atualização: junho de 2026

Mãos digitando um documento num notebook cercado de papéis, o fluxo de trabalho que a digitação por voz no Word substitui

A digitação por voz no Word funciona de duas maneiras prontas para uso: pressione Win+H para abrir a digitação por voz do Windows em qualquer campo de texto, ou clique no botão Ditar na guia Página Inicial do Word. As duas precisam de conexão com a internet para transcrever. Uma ferramenta local como o Whisper acrescenta o ditado offline, que funciona no Word e em todos os outros aplicativos.

No mês passado, um relatório de status de 700 palavras levou 19 minutos para eu digitar e pouco menos de 5 para ditar a 145 palavras por minuto. Mesmo documento, mesma janela do Word, mesmo autor. A única coisa que mudou foi qual entrada o aplicativo mais famoso da Microsoft estava ouvindo. O Word tem ouvidos há anos; a maioria das pessoas só nunca encontrou os dois botões que os ligam. (Eu encontrei do jeito constrangedor, pressionando Win+H para silenciar uma chamada.)

O problema é este: o usuário do Word encontra uma das duas ferramentas de ditado nativas, supõe que ela é a única e julga a digitação por voz por aquela em que esbarra primeiro. Hoje o Windows 11 vem com a digitação por voz no Win+H e o Microsoft 365 vem com o Ditar dentro do próprio Word, e são ferramentas diferentes com requisitos diferentes. Este guia mostra como ligar as duas dentro do Word, onde cada uma para e como uma ferramenta para o sistema inteiro cobre o que elas deixam de fora.

Ao final, você terá a digitação por voz funcionando no Word em menos de um minuto, além de uma configuração offline caso precise. A maioria das dúvidas sobre ditado que chegam à nossa caixa de suporte se resume a "qual delas eu estou usando". Eu leio esses e-mails, então posso dizer isso com toda a seriedade.

O Word tem dois caminhos de digitação por voz, não um

A Microsoft construiu os dois, e é por isso que ninguém consegue diferenciá-los. A digitação por voz do Windows faz parte do sistema operacional. Ela abre com Win+H, flutua sobre qualquer aplicativo em foco e digita onde o cursor estiver. Funciona no Word do mesmo jeito que funciona no Bloco de Notas ou num formulário do navegador. O Ditar faz parte do Microsoft 365. Ele fica na guia Página Inicial do Word, só existe dentro dos aplicativos do Office e exige uma assinatura ativa do Microsoft 365.

A verdade sem graça: para ditar parágrafos comuns no Word, os dois produzem resultados quase idênticos, porque ambos enviam seu áudio pelos serviços de fala online da Microsoft. As diferenças que importam são o alcance e os requisitos. O Win+H vem com o Windows e te acompanha por todos os aplicativos. O Ditar está ligado ao seu plano do Microsoft 365 e conhece truques específicos do Word, como comandos de formatação. Se você tem uma assinatura do Microsoft 365 e vive dentro do Word o dia inteiro, comece pelo Ditar. Se você escreve no Word, no Outlook, no Slack e no navegador, comece pelo Win+H. Nenhum dos dois custa nada além do que você já tem.

Win+H: a digitação por voz que mora no Windows, não no Word

Ouvindo…
A pílula de digitação por voz do Windows 11 — uma recriação simplificada da interface da Microsoft, não o aplicativo Whisper.

O que você precisa antes do passo 1: um PC com Windows 11 (o Windows 10 tem a barra de ditado mais antiga no mesmo atalho), um microfone funcionando e uma conexão com a internet, porque a digitação por voz do Windows transcreve pelo reconhecimento de fala online da Microsoft. Sem conexão, não digita. O tempo total de configuração é de menos de um minuto.

1. Abra o documento e clique onde o texto deve entrar

A digitação por voz precisa do cursor numa caixa de texto; sem nada em foco, a pílula abre, mas nada é digitado.

Verifique: o cursor está piscando dentro da página do Word.

2. Pressione Win+H

A pílula de digitação por voz aparece perto do topo ou da base da tela.

Verifique: ela mostra "Ouvindo…" antes de você começar a falar.

3. Fale em frases, não em palavras soltas

Frases completas saem mais limpas do que o ditado palavra por palavra.

4. Ative a pontuação automática

Clique na engrenagem da pílula e ative a pontuação automática, ou fale você mesmo: "ponto", "vírgula", "ponto de interrogação".

Verifique: terminar uma frase e pausar produz um ponto final sem você dizê-lo.

5. Pare com a voz ou com o mesmo atalho

Diga "parar de ouvir", ou pressione Win+H de novo.

O Win+H também aceita comandos de edição: "excluir isso", "selecionar isso", "pressionar Enter". Eles funcionam, com a paciência de quem negocia a lição de casa: ganhos claros em pedidos simples, surpresas ocasionais nos compostos. Para correções mais longas, teclado e mouse seguem invictos. Se a pílula abre mas nada acontece, nosso guia de soluções para o Win+H que não funciona cobre os suspeitos de sempre, e a documentação de digitação por voz da Microsoft lista todos os comandos e os mais de 40 idiomas suportados.

Mais um detalhe: nos PCs Copilot+, um recurso chamado ditado fluido corrige a gramática e a ortografia enquanto você fala, e se desliga sozinho em campos de senha.

O botão Ditar, em poucas palavras

Página Inicial
Ditar
O botão Ditar do Word na guia Página Inicial — uma recriação simplificada da interface da Microsoft.

O Ditar é o botão de microfone na guia Página Inicial do Word. Clique nele, espere ele mostrar que está ouvindo, fale. Ele precisa de uma assinatura do Microsoft 365, de um microfone e de uma conexão com a internet confiável, e funciona no Word para Windows, Mac, web e celular. No Mac, Option+F1 liga e desliga. Se você escreve no Word num Mac o dia inteiro, o Ditar mais esse atalho podem ser toda a digitação por voz de que você precisa.

A vantagem dele sobre o Win+H é conhecer o Word. A pontuação automática está disponível na maioria dos idiomas suportados (uma opção nas configurações) e ele entende comandos de formatação: "colocar em negrito", "criar lista com marcadores", "excluir última palavra". O ponto fraco dele é o alcance. No instante em que você sai do Office, o Ditar fica para trás. Mantenho esta seção curta de propósito. Temos um guia completo do recurso Ditar nativo do Word que cobre todos os comandos, idiomas e configurações, e a documentação do Ditar da Microsoft é a referência oficial. Se o Ditar estiver acinzentado ou sumido, o guia de solução de problemas do ditado do Word mostra as correções passo a passo.

Onde as duas ferramentas nativas batem na parede

Três limites aparecem na prática, em ordem da frequência com que incomodam.

Primeiro, nenhuma funciona offline. O Win+H transcreve pelos serviços online da Microsoft; o Ditar exige uma conexão com a internet confiável. Num trem, num avião, no Wi-Fi de hotel que cai a cada 40 segundos, os dois ficam mudos. Cá entre nós: ditado que não funciona offline também é uma decisão de privacidade que outra pessoa tomou por você. O e-mail para a escola do seu filho, a avaliação de salário, a minuta jurídica — tudo passa pelos servidores de um fornecedor só porque você quis escrever com a voz. A transcrição local não envia nada para lugar nenhum, e para alguns documentos isso não é uma preferência, é o requisito.

Segundo, os tetos de idioma são diferentes. O Win+H suporta mais de 40 idiomas. O Ditar suporta cerca de 15 idiomas e variantes regionais por completo, com mais uns 25 em prévia, com menos precisão. Ditar em ucraniano ou misturar idiomas no meio do documento fica irregular rápido.

Terceiro, o alcance. O Ditar termina nas fronteiras do Office. O Win+H vai a todo lugar, mas continua sendo um recurso do Windows; não há equivalente para Mac. E eu nunca encontrei um lugar para ensinar a qualquer uma das ferramentas os nomes de projetos, de clientes ou o jargão de produto que uso todo dia — "Remskill" chega como "rem skill" por mais vezes que eu corrija.

Um atalho que digita no Word e em todo o resto

No fim dos anos 1990, um parente meu rodava o Dragon NaturallySpeaking num desktop com Windows 98 e 64 MB de RAM. Treiná-lo levava 45 minutos lendo um texto de calibração, o ditado se arrastava com 4 segundos de atraso por frase, e um parágrafo de uma carta de fim de ano levava 15 minutos. O headset foi arremessado pela sala. O headset sobreviveu; o experimento não. Arquivei a digitação por voz na pasta "ideias cuja hora ainda não chegou" e não toquei no arquivo por vinte anos. Esta seção é o arquivo reaberto.

O Whisper é um aplicativo de desktop que coloca um único atalho por cima do sistema inteiro. Pressione Ctrl+Space no Word (ou em qualquer outro lugar em que você possa digitar), fale, solte, e o texto aparece no cursor. A mesma tecla funciona no Outlook, no Slack, num navegador, num editor de código. Não há barra de ferramentas para encontrar nem recurso a ativar por aplicativo, e essa é a diferença estrutural em relação às duas ferramentas nativas.

Whisper
O aplicativo Whisper de verdade, renderizado ao vivo — clique pelas Configurações; é isto que se instala.

A configuração leva uns dez minutos, a maior parte é o download:

1. Instale o aplicativo

Ele roda no Windows 10 ou posterior e no macOS 11 ou posterior, e pesa cerca de 25 MB.

Verifique: a janela do Whisper abre nas Configurações.

2. Entre na sua conta

O pipeline local — modelos, histórico, predefinições, o atalho — precisa só de uma conta.

3. Escolha um modelo local e baixe-o

O padrão é o Small multilíngue, com ~480 MB. O Parakeet v3, com ~600 MB, roda de 5 a 10× mais rápido na CPU e cobre o inglês mais 24 idiomas europeus; os detalhes dele estão no model card do NVIDIA Parakeet. A família de modelos Whisper vai até o Large v3, com ~3 GB, e cobre mais de 90 idiomas nas variantes multilíngues (as versões só em inglês são exatamente isso).

Verifique: o modelo aparece como baixado nas Configurações.

4. Ponha o cursor no Word, segure Ctrl+Space, fale, solte

A transcrição é colada onde o cursor estiver.

Verifique: suas palavras estão no documento, com pontuação inclusa.

Cancel
A sobreposição flutuante durante a gravação — ela te acompanha em qualquer aplicativo.

Depois do download do modelo, a transcrição acontece na sua máquina, com zero atividade de rede; o mesmo ditado funciona a 11.000 metros com o Wi-Fi desligado. A precisão no modo local costuma ficar entre 95% e 99% dependendo do tamanho do modelo, e um vocabulário personalizado ensina a ele os nomes que as ferramentas nativas insistem em estropiar. Há também um modo na nuvem, em que você usa sua própria chave da OpenAI para os modelos de transcrição mais recentes, mas, para ditar no Word, o local é a metade que eu uso. Ditei esta seção direto no rascunho enquanto uma chaleira negociava com um saquinho de chá; a seção precisou de duas correções, o chá não precisou de nenhuma.

Quando as ferramentas nativas bastam

Home office com microfone de mesa, teclado e tela — uma configuração simples em que o ditado nativo dá conta do recado

Se você dita um parágrafo por semana, numa mesa com boa internet, só no Word, e em um dos ~15 idiomas que o Ditar suporta por completo, pule o Whisper. O Ditar já está no seu plano do Microsoft 365 e faz esse trabalho bem. O mesmo vale para o Win+H se o seu ditado nunca sai do Windows e os mais de 40 idiomas suportados cobrem o seu: ele está a um atalho de distância e não custa nada a mais. A digitação por voz de terceiros conquista seu lugar quando você dita todo dia, trabalha offline, precisa de vocabulário personalizado ou quer uma só ferramenta em todos os aplicativos — não antes disso.

Vinte e cinco anos separam o headset Dragon arremessado de um documento do Word que se digita sozinho enquanto você faz um chá. As ferramentas alcançaram a ideia. O trabalho que resta é escolher qual ouvinte combina com a sua semana. Pressione Win+H hoje e dite um parágrafo de verdade — uma atualização de status, uma resposta que você vem adiando. Se ele se sustentar, você tem um novo padrão. Se bater na parede do offline ou no teto do vocabulário, você já sabe onde mora o upgrade.

Experimente o mesmo parágrafo com um único atalho

Baixe o Whisper, segure Ctrl+Space no Word e veja a transcrição aparecer no seu cursor.

Funciona no Windows 10 ou posterior e no macOS 11 ou posterior. O modo local roda offline.

Foto de Denys Medvediev

Denys Medvediev

Sou eu quem lê nosso e-mail de suporte, muito provavelmente ditando as respostas.