Por Denys Medvediev

Solução de problemas

O ditado do Windows não para de se desligar

O Digitação por Voz do Windows (Win+H) para sozinho após alguns segundos de silêncio, quando você clica em outra janela ou quando a conexão cai — e a própria Microsoft confirma que a pausa automática no silêncio é proposital. Continue falando e estabilize sua internet para contornar o problema, ou use uma ferramenta que grava enquanto a tecla é pressionada e nunca para sozinha.

Última atualização: junho de 2026

Um cronômetro sobre uma mesa ao lado de um notebook, sugerindo um recurso que expira no meio da tarefa, sem rostos na imagem

O ditado do Windows não para de se desligar porque a Digitação por Voz (Win+H) faz uma pausa automática após alguns segundos de silêncio, quando o foco da janela muda ou quando a conexão com a nuvem cai — e a Microsoft confirma que a pausa no silêncio é proposital. As soluções: continue falando, estabilize a internet, verifique o microfone. Uma ferramenta offline que grava enquanto a tecla é pressionada continua ligada enquanto você a segura e nunca para sozinha.

Você aperta Win+H, a barra aparece, você começa a falar e funciona. Aí você faz uma pausa para pensar por um instante. Talvez dê uma olhada em uma referência ou clique em outra janela para conferir um nome. Você volta, continua falando — e nada aparece, porque o ditado se desligou silenciosamente enquanto você não estava olhando. Já vi isso acontecer no meio de uma frase mais vezes do que consigo contar, e nas primeiras dezenas de vezes achei que meu microfone tinha morrido.

Não tinha. Aqui vai a versão curta antes da longa: o Digitação por Voz do Windows foi feito para parar sozinho. Ele para quando você fica em silêncio, para quando você digita no teclado e se apoia em um serviço na nuvem, então uma conexão instável ou uma mudança de foco de janela também podem interrompê-lo. Parte disso dá para contornar. A parte em que ele faz uma pausa após o silêncio é, nas próprias palavras da Microsoft, proposital — e essa você não consegue desligar por completo.

O que o primeiro resultado de busca costuma omitir: a maior parte disso é comportamento intencional, não um bug que você possa corrigir. O Win+H foi projetado para interpretar uma pausa como "você terminou", então ele se pausa sozinho. Ele também faz uma pausa no instante em que você começa a digitar manualmente. Além disso, a Digitação por Voz converte fala em texto por meio do serviço de fala online da Microsoft, o que significa que precisa de uma conexão de internet estável — e qualquer falha ali, ou uma mudança de qual janela está em foco, pode interrompê-lo de repente.

Então as perguntas honestas são: como mantenho o ditado funcionando em uma única sequência longa, como descarto as partes que realmente têm conserto e existe uma forma de ditar que simplesmente não pare. Vou cobrir as três, com os passos exatos da Microsoft, e serei direto sobre quando o recurso embutido é genuinamente tudo o que você precisa.

Por que o ditado do Windows não para de se desligar sozinho

Um cronômetro ao lado de um teclado sobre uma mesa escura, ilustrando um recurso que expira

Existem quatro causas, e só algumas delas estão ao seu alcance corrigir. A primeira é a que a maioria das pessoas enfrenta: a Digitação por Voz se pausa sozinha após alguns segundos de silêncio. A própria equipe de suporte da Microsoft confirmou que isso é intencional. Como disse um especialista de suporte da comunidade Microsoft no fórum oficial de perguntas e respostas: "a ferramenta de ditado atual realmente foi projetada dessa forma. Não há nenhum meio adicional de impedir que a ferramenta de ditado se pause sozinha após um período de inatividade." O mesmo tópico observa que ela "também faz uma pausa automática quando você digita manualmente usando o teclado." Então uma pausa para pensar, ou uma única tecla, encerra a sessão.

A segunda causa é o foco. O Windows não oferece um microfone permanente na tela como um celular faz. Conforme a mesma orientação oficial, "cada sessão exige que você a reative com Win+H." Quando você clica em outra janela, o ditado vinculado ao campo anterior pode cair, e você fica reapertando o atalho. A terceira causa é a rede. A página oficial da Microsoft afirma claramente que "a digitação por voz usa reconhecimento de fala online, com tecnologia dos serviços de Fala do Azure" — é baseado na nuvem, então uma conexão fraca ou que cai pode interrompê-lo no meio da frase. A quarta é o próprio microfone: um microfone USB mal conectado, uma falha ao despertar do modo de suspensão ou um nível que cai baixo demais é interpretado como silêncio, o que aciona justamente a pausa automática da primeira causa.

Vale dizer em voz alta, porque poupa uma tarde inteira: se o seu microfone funciona bem numa chamada, isso quase nunca é hardware com defeito. A parada acontece antes, na forma como a Digitação por Voz decide que uma sessão terminou. É também por isso que as soluções abaixo se dividem em dois grupos — as que genuinamente ajudam (conexão estável, bom microfone, continuar falando) e a única limitação que você simplesmente não tem como remover (a pausa proposital no silêncio).

A solução rápida que funciona para a maioria das pessoas

Você não consegue eliminar o tempo limite do silêncio, mas consegue parar de acioná-lo. Para uma passagem longa, o objetivo é simples: não fique em silêncio, não troque de janela e garanta que nada mais esteja te interrompendo. Os passos, baseados na orientação de suporte da Microsoft e no comportamento descrito nos tópicos deles:

Mantenha um fluxo constante de fala — se precisar de um instante para pensar, faça um som ou diga uma palavra de preenchimento em vez de ficar totalmente em silêncio, porque alguns segundos de silêncio são o que dispara a pausa. Não toque no teclado durante o ditado, já que digitar manualmente para a sessão por design. Permaneça em uma única janela durante toda a sequência e reaperte Win+H se tiver clicado em outro lugar. Verifique sua conexão, porque o reconhecimento de fala online precisa de internet estável; se o seu Wi-Fi estiver caindo, o ditado vai cair também. E confirme seu microfone em Configurações, Sistema, Som, Entrada e, em seguida, certifique-se de que o acesso ao microfone esteja ativado em Configurações, Privacidade e segurança, Microfone — um microfone que falha é interpretado como silêncio e encerra a sessão. Quando tudo isso se alinha, uma única sequência ininterrupta costuma se manter.

Cancel
Uma sobreposição que grava enquanto a tecla é pressionada permanece ligada todo o tempo em que a tecla está segurada — sem cronômetro de silêncio, sem parada automática enquanto você organiza a próxima frase.

Essa é a solução que te leva até o fim da tarefa imediata. A sobreposição acima é de uma ferramenta diferente — um app de ditado para todo o sistema — e está aqui para deixar um contraste claro. Um gravador que funciona enquanto a tecla é pressionada fica ligado exatamente pelo tempo em que você segura a tecla, com silêncio ou não. Não há contagem regressiva diminuindo a cada vez que você pausa para pensar, porque ele nunca decidiu sozinho que você tinha terminado. Se você briga com o ciclo de parar e recomeçar todos os dias, a resposta duradoura da próxima seção é usar uma ferramenta que simplesmente não para sozinha.

A solução definitiva: ditado que não para sozinho

Se você dita passagens longas e está cansado de a barra desistir a cada poucos segundos, a solução duradoura é uma ferramenta com um modelo de ligar/desligar diferente. Um atalho que grava enquanto pressionado continua gravando pelo tempo que você o segurar — através das pausas, do pensar, do estender a mão para pegar o café — e um motor local transcreve na sua própria máquina, então não há conexão de nuvem para cair nem cronômetro de silêncio para acionar. Você precisa de um PC com Windows 10 ou mais recente e um microfone funcionando. Aqui está a configuração em quatro passos com o Whisper.

Passo 1 — Instale o Whisper e faça login.

Baixe na página de download, instale e crie uma conta gratuita. Sem cartão. Todo o fluxo de transcrição local abre na hora.

Você saberá que deu certo quando o ícone do app aparecer na bandeja do sistema e o assistente de configuração oferecer a escolha de um modelo.

Passo 2 — Escolha um caminho de transcrição local.

O app não escolhe por você. Para escapar de vez das quedas de conexão, escolha o Local Parakeet (o mais rápido para inglês) ou o Local Whisper (multilíngue, com tradução). Ambos rodam totalmente na sua máquina. A nuvem também é oferecida, mas é o único caminho que usa rede.

Você saberá que deu certo quando um modelo terminar de baixar e aparecer como pronto.

Passo 3 — Defina seu atalho para gravar enquanto pressionado.

O padrão no Windows é Ctrl+Space, segurado como pressionar para falar — ele grava enquanto você segura a tecla e para quando você solta, não quando você pausa. Escolha outra combinação em Configurações se Ctrl+Space conflitar com outro app.

Você saberá que deu certo quando conseguir segurar a tecla, pausar por vários segundos no meio da frase, continuar falando e ainda assim capturar tudo.

Passo 4 — Posicione o cursor em qualquer lugar e fale.

Clique em qualquer caixa de texto — e-mail, documento, barra de busca — segure o atalho, diga algumas frases com pausas no meio e solte. A transcrição é colada onde está o seu cursor, transcrita localmente, sem nenhum tempo limite de silêncio te interrompendo.

Você saberá que deu certo quando uma passagem longa, cheia de pausas, aparecer como um único bloco de texto, sem precisar reapertar nada.

Whisper
O app de desktop real do Whisper na tela de configurações, com os painéis de Transcrição e IA abertos.

A única parte demorada é o download único do modelo. Depois disso, a gravação continua ligada enquanto você segura a tecla, e a transcrição acontece na sua CPU, então as duas coisas que viviam parando o Win+H — um cronômetro de silêncio e um handshake com a nuvem — simplesmente não existem no design. Segure, fale, pause, continue falando, solte. É todo o ciclo.

Se você prefere consertar o recurso embutido

Muita gente só quer que o Win+H se comporte e não quer outro app. Justo. Aqui está a solução de problemas mais a fundo do lado do Windows, na ordem em que eu tentaria, tudo dos próprios documentos e tópicos de suporte da Microsoft. Nada disso mexe no registro, então não há nada aqui que possa quebrar a sua máquina — e vou destacar a única coisa que você genuinamente não tem como consertar.

Primeiro, a conexão, porque a dependência da nuvem é a causa mais subestimada. A Digitação por Voz roteia o áudio pelo serviço de fala online da Microsoft, então confirme se o Reconhecimento de fala online está ativado em Configurações, Privacidade e segurança, Fala, e se a sua internet está estável. Em uma conexão instável, ele para no meio da frase e parece um bug local. Segundo, o microfone. Escolha a entrada certa em Configurações, Sistema, Som, Entrada, aumente o nível de entrada se estiver baixo e confirme se o acesso ao microfone está ativado em Configurações, Privacidade e segurança, Microfone. A própria solução de problemas da Microsoft também sugere trocar para um headset ou microfone externo se o embutido estiver falhando — um microfone que falha é interpretado como o silêncio que aciona a pausa automática.

Terceiro, o idioma. Em Configurações, Hora e idioma, Fala, certifique-se de que o idioma da fala corresponda ao que você está ditando e que o pacote de reconhecimento dele esteja instalado; uma incompatibilidade causa comportamento errático. A Microsoft também sugere ditar em um ambiente mais silencioso, já que o ruído de fundo prejudica o áudio. Agora a parte honesta: nenhuma dessas medidas remove a pausa automática no silêncio. Essa é intencional. A equipe de suporte da Microsoft confirmou isso diretamente e indicou aos usuários a opção Fornecer feedback dentro da ferramenta de ditado para votar por uma mudança. Até que esse voto surta efeito, o máximo que você pode fazer é evitar ficar em silêncio — a pausa em si não pode ser desligada. Se isso é um impedimento para você, uma ferramenta com uma tecla que grava enquanto pressionada é a única saída de verdade, que é justamente o ponto da seção acima.

Local ou nuvem: qual modo realmente evita isso

Se o motivo de você estar aqui é um recurso que desiste no instante em que a sua conexão vacila, a resposta pende para o local. Os dois motores locais rodam inteiramente na sua máquina, sem nada sendo enviado para lugar nenhum, então uma falha de rede não consegue interrompê-los no meio da frase como interrompe o Win+H. Veja como os três caminhos entre os quais o app te faz escolher diferem para esse problema específico.

O app te obriga a escolher, então aqui está como eu pensaria a respeito quando a queixa é "ele não para de se desligar":

  • Local Parakeeto motor TDT da NVIDIA, cerca de 600 MB, e a opção local mais rápida — de 5 a 10 vezes mais rápido que o Whisper na CPU. Cobre inglês mais outros 24 idiomas europeus, 25 no total. Sem tradução para o inglês. Totalmente offline, então não há conexão para cair. Se você fala inglês ou um idioma europeu, este é o jeito mais rápido de sair da esteira do handshake com a nuvem.
  • Local Whispermais lento que o Parakeet na mesma máquina, mas as versões multilíngues cobrem 99 idiomas e podem traduzir para o inglês. As versões só em inglês são apenas inglês, não 99. Escolha esta para chinês, japonês, coreano ou qualquer trabalho de tradução, que o Parakeet não consegue fazer. O modelo padrão em inglês tem cerca de 480 MB. Também totalmente offline.
  • Nuvem (OpenAI, BYOK)a melhor precisão e acesso à web, usando sua própria chave da OpenAI cobrada diretamente pela OpenAI. A transcrição roda no gpt-4o-mini-transcribe por padrão. Ela precisa de internet — então, assim como o Win+H, depende de uma rede e uma queda pode interrompê-la. A superfície da Nuvem faz parte do Whisper Pro.

A verdade sem graça é que, para a frustração específica que te trouxe aqui, o local é a cura de verdade. Uma queda de conexão não consegue parar uma transcrição que nunca toca a rede, e uma tecla que grava enquanto pressionada não se importa com o tamanho da sua pausa. A nuvem tem o seu lugar quando você quer precisão de primeira linha em uma gravação difícil ou um dado puxado da web no meio da frase. Mas se a sua queixa é "ele para quando o meu Wi-Fi pisca", escolher outro caminho dependente de rede seria perder o ponto. Comece pelo local.

Texto mais limpo depois que o ditado para de cair

Quando o ditado de fato funciona de ponta a ponta — embutido ou não — você esbarra na próxima realidade: a fala bruta sai como um amontoado sem pontuação. Você diz "beleza então termina o slide manda pra maria e reserva uma hora amanhã pra ensaiar", e essa é a parede sem pontuação que qualquer motor de fala te entrega. É na limpeza que as ferramentas se diferenciam.

A Digitação por Voz do Windows consegue adicionar pontuação enquanto você fala, quando está em funcionamento. Para uma limpeza mais pesada — tirar os "ãs", arrumar os amontoados, transformar um parágrafo falado em algo que você realmente enviaria — o Whisper pode rodar um ajuste de IA antes de o texto aparecer. Diga a frase de ativação "Hey whisper" e o texto é aprimorado primeiro. Em um modelo local, isso roda pelo Ollama; no modo nuvem, é o gpt-5-mini por padrão.

Thinking...
Bruto

beleza então termina o slide manda pra maria e reserva uma hora amanhã pra ensaiar ã antes da reunião com o cliente

Limpo

Beleza, então termina o slide, manda pra Maria e reserva uma hora amanhã pra ensaiar antes da reunião com o cliente.

A etapa de limpeza é parte do motivo pelo qual uma ferramenta dedicada se justifica para além de simplesmente não parar sozinha. Você não está apenas ganhando uma captura que continua ligada durante as suas pausas; está ganhando um texto que está mais perto de pronto. Se você quiser a versão mais ampla disso, é esse mesmo fluxo de falar e depois limpar que permite digitar mais rápido com a voz em todos os apps que você abrir, não apenas na única janela em que o Win+H por acaso aterrissou antes de desistir.

E porque ela cola no cursor em qualquer campo e nunca para sozinha quando o foco muda, o mesmo fluxo se mantém numa aba do navegador também — ditar no Google Docs se comporta igual a ditar em um editor de desktop, mesmo quando você clica entre eles, que é exatamente onde o Win+H costuma derrubar a sessão.

Quando o recurso embutido é suficiente

Uma mesa calma e arrumada com um notebook, sugerindo um problema resolvido

Aqui está a parte em que eu te convenço a não instalar nada. Se você dita em sequências curtas e a parada automática nunca atrapalha, você não precisa de outro app. Uma frase ou duas antes de o cronômetro de silêncio entrar em ação é exatamente para o que o Win+H foi feito. É gratuito, embutido no Windows e, para respostas rápidas, é genuinamente bom. Não vou te dizer para instalar um software para ditar uma mensagem de duas linhas.

O caminho embutido é a escolha certa quando algumas coisas são verdade: você dita principalmente textos curtos, está sempre online de qualquer forma, não se importa de reapertar Win+H entre os campos e se sente confortável com a sua voz indo para a nuvem da Microsoft para ser reconhecida. Esse último ponto é a verdadeira bifurcação. A Digitação por Voz roteia o seu áudio pelo serviço de fala online da Microsoft por design — tudo bem para uma lista de compras, mas vale pensar duas vezes para um e-mail de cliente ou qualquer coisa que você prefira manter na sua própria máquina.

Recorra a uma ferramenta offline que grava enquanto pressionada quando as paradas começarem a doer repetidamente: você dita passagens longas e fica esbarrando na pausa do silêncio, troca de janela o tempo todo e fica perdendo a sessão, trabalha em uma conexão instável ou prefere que a sua voz nunca saia da sua máquina. Abaixo dessa linha, use o que é gratuito — os contornos anteriores neste guia estão aí justamente para que você possa.

Se o problema for maior do que parar — o Win+H não fazer nada, nenhum texto aparecer ou o idioma estar errado — a lista mais ampla em voz para texto não funcionando no Windows cobre o restante dos modos de falha que não são estritamente uma parada automática.

Leitura adicional

A Microsoft construiu um recurso de ditado que decide que você terminou no instante em que você para para pensar e depois confirmou no próprio fórum de suporte que isso é proposital e não pode ser desligado. Então a gente segue falando através de cada pausa como se estivesse numa ligação telefônica que tem medo de cair, e reaperta as mesmas duas teclas toda vez que dá uma olhada em outra janela. Funciona na maior parte do tempo, para sequências curtas. Mas na primeira vez que um recurso desiste no meio da sua frase porque você respirou, você começa a querer um que espere por você. Ditei a maior parte deste guia segurando uma única tecla, pausando sempre que tive vontade. Ele nunca desistiu de mim, nem uma vez.

Dite sem a parada automática

Segure um atalho, fale, pause sempre que precisar e solte. A transcrição aparece no seu cursor em qualquer app — transcrita localmente, sem cronômetro de silêncio e sem conexão de nuvem para cair.

Modo local gratuito para qualquer conta logada. Sem cartão para começar.

Foto de Denys Medvediev

Denys Medvediev

Sou eu que leio o nosso e-mail de suporte, muito provavelmente ditando as respostas.