Guia
Como adicionar palavras personalizadas à ditação
A ditação erra nomes, jargões e marcas porque eles não estão no vocabulário dela. A solução é ensiná-la: no Windows, há um Dicionário de Fala onde você adiciona palavras, e uma lista de hotwords no Whisper direciona um modelo local para os seus termos, fazendo com que sejam transcritos corretamente.
Última atualização: junho de 2026

Para adicionar palavras personalizadas à ditação, ensine a ferramenta o seu vocabulário. No Windows, o Dicionário de Fala do Reconhecimento de Voz tem um assistente de "Adicionar nova palavra". No Whisper by Remskill, uma lista de hotwords direciona um modelo local do Whisper para nomes, jargões e marcas. O macOS Dictation em si não tem configuração de palavras personalizadas; isso fica no Controle de Voz.
Toda ferramenta de ditação que já usei acerta bem o português comum e depois mutila a única palavra que realmente importa. Ela transcreve "agendar a revisão para quinta" sem problemas, mas transforma o nome do meu colega em algo irreconhecível, converte o nome do produto num palavrão aleatório, e faz "Kubernetes" virar outra coisa completamente. As palavras com que um transcritor tem dificuldade são exatamente aquelas que você não resolve falando mais devagar — são nomes próprios, jargões e marcas que ele nunca foi treinado para esperar.
Por isso as pessoas procuram como adicionar palavras personalizadas à ditação, esperando encontrar uma página de configurações bem organizada. A resposta honesta é: depende da ferramenta. O Windows tem um dicionário real e editável onde você digita as palavras. O macOS mantém essa função num lugar que a maioria das pessoas nunca encontra. E um modelo local do Whisper pode ser direcionado para os seus termos com uma lista de hotwords. Vou explicar as três opções, configurar a do Whisper e dizer quando o recurso nativo já é suficiente.
Aqui está a parte que a maioria das páginas pula. Um transcritor não "soletra" uma palavra como você faz — ele adivinha as palavras mais prováveis para os sons que ouviu. Um nome incomum perde para uma palavra comum porque o modelo ouviu aquela palavra comum milhões de vezes e o nome do seu colega quase nunca. Adicionar uma palavra personalizada não ensina novas letras ao modelo. Ele inclina a adivinhação.
Essa inclinação é construída de forma diferente em cada ferramenta. O Windows a armazena num Dicionário de Fala que você edita manualmente. Os modelos locais do Whisper recebem uma lista de hotwords e pesam a favor delas durante a transcrição. E — o detalhe que pega muita gente — esse viés de hotword é uma funcionalidade exclusiva do Whisper local. O Parakeet não aceita hotwords, e o caminho na nuvem também não. Vou ser específico sobre qual é qual, porque confundir isso pode fazer você perder uma tarde inteira.
Por que a ditação erra nomes e jargões

A ditação é uma máquina de apostas. Ela ouve um trecho de som e escolhe as palavras mais prováveis de terem produzido aquele som, com base nos milhões de horas em que foi treinada. A fala cotidiana vence essas apostas com facilidade. O problema começa com qualquer coisa rara: um colega com nome incomum, um projeto interno chamado Helios, um nome de medicamento, o nome de um escritório de advocacia, seu próprio sobrenome se não for comum.
O modelo mal ouviu essas palavras, então recorre a uma palavra comum que soa parecida. "Helios" vira "hélio esse". "Remskill" vira "rem skill" ou "rim skill". Você acaba corrigindo as mesmas cinco palavras toda hora — exatamente o desgaste que faz as pessoas desistirem da ditação e voltarem ao teclado. A solução não é um microfone melhor ou falar mais devagar. É avisar a ferramenta, com antecedência, que essas palavras específicas estão na jogada.
É isso que uma palavra personalizada faz. Na maioria das ferramentas, você não está ensinando pronúncia — está adicionando a palavra à lista de coisas que o transcritor pode esperar, de modo que, quando os sons são ambíguos, o seu termo vença a aposta em vez da palavra comum que vinha ganhando. A verdade prosaica é que uma lista curta de dez ou quinze termos resolve a maior parte da dor para a maioria das pessoas. Você não precisa alimentar um dicionário completo. Precisa alimentar as poucas palavras que ele continua errando.
A forma nativa, no Windows e no Mac
Comece pelo que já está na sua máquina, porque para algumas pessoas essa já é a resposta completa. No Windows há dois recursos nativos separados, e eles lidam com palavras personalizadas de formas muito diferentes. O Reconhecimento de Fala do Windows — o recurso de área de trabalho mais antigo — tem um Dicionário de Fala real e editável. Você abre o Reconhecimento de Fala, diz ou clica em "abrir o Dicionário de Fala", escolhe "Adicionar uma nova palavra" e segue o assistente. Essa palavra passa a ser reconhecida pela ditação. O mais novo Acesso por Voz do Windows 11 tem sua própria versão: um comando "Adicionar ao Vocabulário" (e uma opção no menu Ajuda) que direciona o reconhecimento para as palavras adicionadas.
A barra de digitação por voz Win+H que a maioria das pessoas usa no dia a dia é o caso intermediário. Ela não oferece um dicionário para você editar diretamente; aprende com as correções que você faz ao longo do tempo e com o texto digitado, em vez de uma lista que você edita. Portanto, se você quiser uma lista de palavras personalizadas editada manualmente no Windows hoje, o lugar onde ela vive é o Dicionário de Fala do Reconhecimento de Fala ou o vocabulário do Acesso por Voz — não a barra Win+H.
O macOS é onde você precisa ter cuidado, porque o recurso óbvio não tem isso. O macOS Dictation padrão — aquele que você aciona para falar em qualquer campo de texto — não tem configuração de palavras ou vocabulário personalizado. Nenhuma. O que existe é um recurso de acessibilidade separado, o Controle de Voz, que tem um painel de Vocabulário em Configurações do Sistema, Acessibilidade, Controle de Voz, onde você pode adicionar até 1000 termos e até gravar como cada um é pronunciado. É real e funciona bem, mas é uma ferramenta diferente do Dictation que a maioria dos usuários de Mac tem em mente. Se uma página diz "basta adicionar palavras personalizadas no macOS Dictation", ela está confundindo as duas coisas silenciosamente.
Configure palavras personalizadas no Whisper (Windows ou Mac)
Se você quer uma forma consistente de adicionar palavras personalizadas que funcione igual no Windows e no Mac, é aí que uma ferramenta dedicada cumpre seu papel. Você precisa de um Mac com Apple Silicon ou um PC com Windows 10 ou superior, um microfone funcionando e um modelo local do Whisper — hotwords são uma funcionalidade do Whisper local, então esse caminho precisa desse modelo, não do Parakeet nem da nuvem. Todo o pipeline local é gratuito para qualquer conta autenticada, sem pedir meio de pagamento no cadastro. Aqui está a sequência.
Passo 1 — Instale o Whisper e entre na conta.
Baixe da página de download, instale e crie uma conta gratuita. Sem cartão. O pipeline de transcrição local abre imediatamente.
Você saberá que funcionou quando o ícone do app na bandeja aparecer e o assistente de configuração oferecer a escolha de um modelo.
Passo 2 — Escolha um modelo local do Whisper.
O app apresenta três caminhos — Nuvem, Parakeet Local, Whisper Local. Para palavras personalizadas, escolha Whisper Local, porque a lista de hotwords funciona com modelos do Whisper. O Parakeet é mais rápido, mas não aceita hotwords; a nuvem também não.
Você saberá que funcionou quando um modelo do Whisper terminar de baixar e aparecer como pronto.
Passo 3 — Adicione seus termos à lista de hotwords.
Nas configurações do modelo do Whisper, adicione os nomes, jargões e marcas que ele continua errando — um termo por entrada. Mantenha a lista curta e específica: as palavras que ele realmente tropeça, não o seu glossário inteiro.
Você saberá que funcionou quando seus termos salvos aparecerem na lista e permanecerem lá entre as gravações.
Passo 4 — Dite e verifique as palavras difíceis.
Posicione o cursor em qualquer campo de texto, segure o atalho, diga uma frase que inclua um dos seus termos e solte. A transcrição é colada no cursor com a palavra escrita do jeito que você salvou.
Você saberá que funcionou quando o termo que antes saía errado agora sair certo.
Eu manteria a primeira lista deliberadamente pequena. Adicione as cinco ou seis palavras que mais te irritaram essa semana, dite por um dia e adicione mais somente quando outra coisa tropeçar. Uma lista de hotwords inchada com duzentos termos pode começar a empurrar o modelo para palavras que você não quis dizer. Curta e específica bate longa e esperançosa.
O que uma lista de hotwords realmente faz
Uma lista de hotwords é um conjunto de termos que você entrega ao modelo antes que ele transcreva, para que ele saiba esperá-los. Por baixo dos panos, é a mesma ideia que o Dicionário de Fala do Windows, só que conectada de forma diferente: em vez de uma entrada num dicionário armazenado, as palavras acompanham cada gravação como um viés. Quando o áudio é ambíguo entre o seu termo e um similar comum, o viés inclina a decisão para o seu termo. Um nome incomum para de perder para a versão comum porque você disse ao modelo que ele é uma palavra que pertence aqui.
Dois limites honestos merecem ser ditos claramente. Primeiro, hotwords empurram, não forçam — um termo que não soa nada com o que você disse ainda não vai aparecer, e uma palavra muito curta ou muito incomum ainda pode escapar. Segundo, e esse é o que as pessoas erram: hotwords são uma funcionalidade exclusiva do Whisper local. O Parakeet, o motor local rápido, não aceita lista de hotwords. O caminho na nuvem também não expõe uma. Portanto, se palavras personalizadas são o motivo pelo qual você está aqui, o modelo local do Whisper é o caminho que as tem.
Os modelos locais do Whisper também oferecem controle mais fino do que a maioria dos recursos nativos — coisas como tamanho de feixe e vocabulário personalizado que a caixa de ditação comum não expõe. Você não precisa de nada disso para adicionar alguns nomes. Mas está lá se você avançar de "corrigir cinco palavras" para "transcrever a terminologia de uma clínica médica o dia inteiro" — e esse é um motivo real pelo qual algumas pessoas escolhem o Whisper em vez do motor Parakeet mais rápido. Se você estiver pesando os modelos locais entre si, qual modelo do Whisper usar analisa as compensações.
Local ou nuvem quando palavras personalizadas são o objetivo
O app pede que você escolha um caminho, e para palavras personalizadas a escolha importa mais do que de costume, porque apenas um dos três aceita uma lista de hotwords. Aqui está a análise honesta, para você escolher com os olhos abertos em vez de descobrir o limite depois de instalar o motor errado.
Os três caminhos, e o que cada um faz com o seu vocabulário:
- Parakeet Local — O motor TDT da NVIDIA, cerca de 600 MB, a opção local mais rápida — 5 a 10 vezes mais rápido que o Whisper na CPU. Inglês mais 24 outros idiomas europeus, 25 no total. Sem tradução para o inglês, e o que importa aqui: sem hotwords. Ótimo para ditação cotidiana rápida em inglês, escolha errada se palavras personalizadas são o motivo pelo qual você veio.
- Whisper Local — mais lento que o Parakeet na mesma máquina, mas este é o caminho com a lista de hotwords e controle de vocabulário personalizado. As versões multilíngues cobrem 99 idiomas e podem traduzir para o inglês; as versões só em inglês ficam restritas ao inglês. O modelo padrão em inglês tem cerca de 480 MB. Se você precisa que nomes e jargões sejam transcritos corretamente, este é o certo.
- Nuvem (OpenAI, BYOK) — melhor precisão geral e acesso à web, usando sua própria chave OpenAI cobrada diretamente pela OpenAI. A transcrição roda em gpt-4o-mini-transcribe por padrão. Frequentemente acerta palavras raras pelo puro poder do modelo, mas não expõe uma lista de hotwords. Precisa de internet. A superfície de Nuvem faz parte do Whisper Pro.
Então a regra de ouro é simples. Se palavras personalizadas são o seu principal problema e você quer uma lista que controla, use um modelo local do Whisper. Se você fala principalmente inglês comum e quer velocidade pura, o Parakeet é o melhor motorista diário — apenas não espere uma caixa de hotwords. A Nuvem é a saída de emergência quando você quer máxima precisão numa gravação difícil e não se importa que ela saia da sua máquina. Se você estiver decidindo sobre a configuração local no geral, como rodar o Whisper localmente e o modelo Parakeet cobrem ambos os motores em profundidade.
Corrigindo o que escapa, depois do fato
Nenhuma configuração de palavras personalizadas captura tudo, e a ditação bruta sempre chega como um bloco de texto corrido. Você diz "reunir com csaba sobre o lançamento do helios hum marcar como projeto alfa", e mesmo com hotwords ativadas, a pontuação e as hesitações ainda são suas para limpar. É aqui que as duas metades do trabalho se separam: hotwords corrigem a grafia das palavras difíceis, e uma passagem de limpeza corrige a forma da frase.
A Digitação por Voz do Windows adiciona pontuação enquanto você fala, e o macOS Dictation lida com pontuação básica quando você diz "vírgula" ou "ponto". Para uma limpeza mais pesada — remover os "ums", corrigir frases corridas, transformar um parágrafo falado em algo que você enviaria de fato — o Whisper pode rodar uma passagem de IA. Diga a frase de ativação "Hey whisper" e o texto é aprimorado antes de chegar. Em um modelo local, isso roda pelo Ollama; no modo nuvem, é gpt-5-mini por padrão. A passagem de limpeza mantém a grafia das suas palavras personalizadas intacta enquanto corrige tudo ao redor.
reunir com csaba sobre o lançamento do helios hum marcar como projeto alfa antes do standup quinta
Reunir com Csaba sobre o lançamento do Helios, marcar como Projeto Alfa, antes do standup de quinta.
Para as palavras que ainda escapam tanto da lista de hotwords quanto da passagem de limpeza, o método antigo funciona: corrija uma vez, e no Windows adicione-a ao Dicionário de Fala para que não seja problema da próxima vez. Não há vergonha numa correção manual de vez em quando. O objetivo não é uma ferramenta que nunca erra; é uma ferramenta que erra nas mesmas cinco palavras uma vez em vez de quarenta. As palavras personalizadas resolvem a maior parte; uma edição rápida cobre o restante.
Esse mesmo ritmo de falar-e-limpar vale a pena dominar em qualquer lugar, porque quando ele encaixa você consegue ditar com clareza no Windows em qualquer app que abrir, não só naquele que você veio corrigir.
Quando o recurso nativo já é suficiente

Às vezes você não precisa de uma ferramenta dedicada, e fingir o contrário seria desonesto. Se o seu problema de palavras personalizadas é pequeno — alguns nomes, no Windows, que você pode adicionar uma vez e esquecer — o Dicionário de Fala do Reconhecimento de Fala do Windows já faz exatamente isso de graça. Adicione as palavras e siga em frente. Instalar qualquer coisa a mais para isso é exagero.
No Mac a situação é honestamente mais misturada, e vale ser direto. O macOS Dictation padrão não tem lista de palavras personalizadas, então se é só isso que você usa, suas opções nativas para adicionar termos são genuinamente limitadas. O painel de Vocabulário do Controle de Voz faz o trabalho e comporta até 1000 termos, mas é um recurso de acessibilidade que você estaria ativando especificamente para isso — tudo bem se você estiver confortável com ele, um desvio se não estiver. Então no Mac a troca é real: conviver com os erros do Dictation, aprender o Controle de Voz ou rodar uma ferramenta com sua própria lista de hotwords.
Recorra a uma ferramenta dedicada para o sistema inteiro quando os recursos nativos começarem a doer: uma lista longa de nomes e jargões, as mesmas palavras personalizadas necessárias tanto no Windows quanto no Mac, privacidade offline, ou querer um atalho e um vocabulário que se comportem igual em todos os apps. Abaixo desse limite, use o que é gratuito. Não vou sugerir que você instale um software para ensinar ao computador um único sobrenome.
O mesmo dilema aparece se a sua ditação vive principalmente no Mac — os limites do recurso nativo e as alternativas honestas em voz para texto no Mac são a versão mais completa desta seção.
Adicionar palavras personalizadas é a funcionalidade de ditação menos glamourosa e a que decide se você vai continuar usando. Coloque as cinco palavras que ele continua errando numa lista — o Dicionário de Fala no Windows, uma lista de hotwords no Whisper — e o atrito diário some silenciosamente. Adicionei meu próprio sobrenome a uma lista de hotwords há dois anos e desde então nunca mais assisti a um transcritor estragá-lo, o que é um critério baixo e exatamente o tipo de critério que quero superar antes do café da manhã.
Ensine as palavras que ele continua errando
Adicione seus nomes, jargões e marcas à lista de hotwords de um modelo local do Whisper e dite. Os termos que antes saíam errados chegam escritos do jeito que você salvou — em qualquer app que você abrir.
Modo local gratuito para qualquer conta autenticada. Sem cartão para começar.



