Di Denys Medvediev

Risoluzione dei problemi

La dettatura di Windows continua a fermarsi

La digitazione vocale di Windows (Win+H) si interrompe da sola dopo qualche secondo di silenzio, quando passi a un'altra finestra o quando salta la connessione — e Microsoft conferma che la pausa automatica per il silenzio è voluta. Continua a parlare e stabilizza la connessione per superarla, oppure usa uno strumento push-to-talk che non si ferma mai da solo.

Ultimo aggiornamento: giugno 2026

Un cronometro su una scrivania accanto a un portatile, a suggerire una funzione che scade a metà del lavoro, nessun volto inquadrato

La dettatura di Windows continua a fermarsi perché la digitazione vocale (Win+H) va in pausa automatica dopo qualche secondo di silenzio, quando cambia la finestra attiva o quando salta la connessione cloud — e Microsoft conferma che la pausa per il silenzio è voluta. Le soluzioni: continua a parlare, stabilizza la connessione, controlla il microfono. Uno strumento push-to-talk offline resta attivo finché tieni premuto e non si ferma mai da solo.

Premi Win+H, compare la barra, inizi a parlare e funziona. Poi ti fermi un attimo per pensare. Magari dai un'occhiata a un appunto, o passi a un'altra finestra per controllare un nome. Torni indietro, riprendi a parlare — e non compare nulla, perché la dettatura si è spenta in silenzio mentre non guardavi. Ho visto succedere a metà frase più volte di quante ne possa contare, e le prime dieci volte ho pensato che il microfono fosse morto.

Non lo era. Ecco la versione breve prima di quella lunga: la digitazione vocale di Windows è fatta apposta per fermarsi da sola. Si ferma quando stai in silenzio, si ferma quando scrivi con la tastiera, e si appoggia a un servizio cloud, quindi una connessione instabile o un cambio di finestra attiva possono interromperla. Su qualcosa puoi intervenire. La parte in cui va in pausa dopo il silenzio è, a detta di Microsoft stessa, voluta — e quella non puoi disattivarla del tutto.

La cosa che il primo risultato di ricerca tende a saltare: gran parte di questo è un comportamento voluto, non un bug che puoi correggere. Win+H è progettato per interpretare una pausa come "hai finito", quindi si mette in pausa da solo. Si ferma anche nel momento in cui inizi a scrivere a mano. In più, la digitazione vocale converte il parlato in testo tramite il servizio vocale online di Microsoft, il che significa che ha bisogno di una connessione internet stabile — e qualsiasi intoppo, o un cambio di finestra attiva, può interromperla di colpo.

Quindi le domande oneste sono: come faccio a tenerla attiva per una lunga sequenza, come escludo le parti che sono davvero risolvibili, ed esiste un modo di dettare che non si fermi affatto. Risponderò a tutte e tre, con i passaggi esatti di Microsoft, e sarò sincero su quando la funzione integrata è davvero tutto ciò che ti serve.

Perché la dettatura di Windows continua a fermarsi da sola

Un cronometro accanto a una tastiera su una scrivania scura, a illustrare una funzione che scade

Le cause sono quattro, e solo alcune dipendono da te. La prima è quella che colpisce la maggior parte delle persone: la digitazione vocale si mette in pausa da sola dopo qualche secondo di silenzio. Il team di supporto di Microsoft ha confermato che è intenzionale. Come ha spiegato uno specialista del supporto della community Microsoft sulle Q&A ufficiali, "l'attuale strumento di dettatura è effettivamente progettato in questo modo. Non esiste alcun mezzo aggiuntivo per impedire allo strumento di dettatura di mettersi in pausa da solo dopo un periodo di inattività." Lo stesso thread nota che "va inoltre automaticamente in pausa quando scrivi a mano con la tastiera." Quindi una pausa per pensare, o un solo tasto premuto, chiude la sessione.

La seconda causa è il focus. Windows non ti offre un microfono permanente sullo schermo come fa un telefono. Secondo la stessa guida ufficiale, "ogni sessione richiede di riattivarla con Win+H." Quando passi a una finestra diversa, la dettatura legata al campo precedente può cadere, e ti ritrovi a premere di nuovo la scorciatoia. La terza causa è la rete. La pagina ufficiale di Microsoft afferma chiaramente che "la digitazione vocale usa il riconoscimento vocale online, basato sui servizi vocali di Azure" — è basata sul cloud, quindi una connessione internet debole o che cade può interromperla a metà frase. La quarta è il microfono stesso: un microfono USB allentato, un problema dopo la sospensione, o un livello che scende troppo viene letto come silenzio, e fa scattare proprio la pausa automatica della prima causa.

Vale la pena dirlo a voce alta, perché ti risparmia un pomeriggio: se il microfono funziona bene durante una chiamata, quasi mai si tratta di hardware guasto. Il blocco è a monte, nel modo in cui la digitazione vocale decide che una sessione è finita. È anche per questo che le soluzioni qui sotto si dividono in due gruppi — quelle che aiutano davvero (connessione stabile, buon microfono, continuare a parlare) e l'unico limite che semplicemente non puoi eliminare (la pausa per il silenzio, voluta dal design).

La soluzione rapida che funziona per la maggior parte delle persone

Non puoi eliminare il timeout per il silenzio, ma puoi evitare di farlo scattare. Per un lungo passaggio, l'obiettivo è semplice: non stare in silenzio, non cambiare finestra e assicurati che nient'altro ti stia interrompendo. I passaggi, ricavati dalla guida di supporto di Microsoft e dal comportamento descritto nei loro thread:

Mantieni un flusso di parole costante — se ti serve un attimo per pensare, fai un mormorio o di' una parola di riempimento invece di restare del tutto in silenzio, perché sono i pochi secondi di silenzio a far scattare la pausa. Non toccare la tastiera durante la dettatura, dato che scrivere a mano chiude la sessione per design. Resta in un'unica finestra per tutta la sequenza, e premi di nuovo Win+H se hai cliccato altrove. Controlla la connessione, perché il riconoscimento vocale online ha bisogno di internet stabile; se il Wi-Fi cade, cadrà anche la dettatura. E verifica il microfono in Impostazioni, Sistema, Audio, Ingresso, poi assicurati che l'accesso al microfono sia attivo in Impostazioni, Privacy e sicurezza, Microfono — un microfono che si interrompe viene letto come silenzio e chiude la sessione. Quando tutto questo è a posto, di solito una singola sequenza ininterrotta tiene.

Cancel
Un overlay push-to-talk resta attivo per tutto il tempo in cui tieni premuto il tasto — nessun timer del silenzio, nessuna interruzione automatica mentre raccogli la frase successiva.

Questo è il rimedio che ti fa portare a termine l'attività immediata. L'overlay qui sopra è di uno strumento diverso — un'app di dettatura a livello di sistema — ed è qui per mettere in evidenza un contrasto. Un registratore push-to-talk è attivo esattamente finché tieni premuto il tasto, con o senza silenzio. Non c'è alcun conto alla rovescia che parte ogni volta che ti fermi a pensare, perché non ha mai deciso da solo che avevi finito. Se combatti ogni singolo giorno con il ciclo ferma-riprendi, la risposta duratura nella prossima sezione è usare uno strumento che non si fermi da solo in primo luogo.

La soluzione definitiva: una dettatura che non si ferma da sola

Se detti lunghi passaggi e sei stanco della barra che si chiude ogni pochi secondi, la soluzione duratura è uno strumento con un modello di accensione/spegnimento diverso. Una scorciatoia push-to-talk continua a registrare finché la tieni premuta — attraverso le pause, attraverso i momenti di riflessione, attraverso il caffè che afferri — e un motore locale trascrive sulla tua macchina, quindi non c'è alcuna connessione cloud da perdere né alcun timer del silenzio da far scattare. Ti serve un PC con Windows 10 o successivo e un microfono funzionante. Ecco la configurazione in quattro passaggi con Whisper.

Passaggio 1 — Installa Whisper e accedi.

Scarica dalla pagina di download, installa e crea un account gratuito. Nessuna carta. L'intera pipeline di trascrizione locale si apre subito.

Capirai che ha funzionato quando l'icona dell'app compare nell'area di notifica e la procedura guidata propone di scegliere un modello.

Passaggio 2 — Scegli un percorso di trascrizione locale.

L'app non sceglie al posto tuo. Per evitare del tutto le cadute di connessione, scegli Local Parakeet (il più veloce in inglese) o Local Whisper (multilingue, con traduzione). Entrambi funzionano interamente sulla tua macchina. C'è anche il Cloud, ma è l'unico percorso che usa la rete.

Capirai che ha funzionato quando un modello termina il download e risulta pronto.

Passaggio 3 — Imposta la tua scorciatoia push-to-talk.

L'impostazione predefinita su Windows è Ctrl+Space, tenuto premuto come push-to-talk — registra mentre tieni premuto il tasto e si ferma quando lo rilasci, non quando ti fermi a parlare. Scegli un'altra combinazione nelle Impostazioni se Ctrl+Space va in conflitto con un'altra app.

Capirai che ha funzionato quando puoi tenere premuto il tasto, fermarti per diversi secondi a metà frase, riprendere a parlare e catturare comunque tutto.

Passaggio 4 — Metti il cursore ovunque e parla.

Clicca in una qualsiasi casella di testo — email, documento, barra di ricerca — tieni premuta la scorciatoia, di' qualche frase con pause in mezzo, rilascia. Il testo viene incollato dove si trova il cursore, trascritto localmente, senza alcun timeout per il silenzio che ti interrompa.

Capirai che ha funzionato quando un lungo passaggio pieno di pause arriva come un unico blocco di testo, senza dover premere di nuovo nulla.

Whisper
La vera app desktop Whisper nella schermata delle impostazioni, con i pannelli Trascrizione e IA aperti.

L'unica parte lenta è il download del modello, una tantum. Dopodiché la registrazione resta attiva finché tieni premuto il tasto, e la trascrizione avviene sulla tua CPU, quindi le due cose che continuavano a fermare Win+H — un timer del silenzio e un handshake col cloud — semplicemente non esistono nel design. Premi, parla, fermati, riprendi a parlare, rilascia. È tutto qui il ciclo.

Se preferisci riparare quella integrata

Molte persone vogliono solo che Win+H si comporti bene e non vogliono un'altra app. Giusto. Ecco la risoluzione dei problemi più approfondita sul fronte Windows, nell'ordine in cui la proverei io, tutta presa dai documenti di supporto e dai thread di Microsoft. Nulla di tutto questo tocca il registro di sistema, quindi non c'è niente qui che possa danneggiare la macchina — e ti segnalerò l'unica cosa che davvero non puoi sistemare.

Primo, la connessione, perché la dipendenza dal cloud è la causa più sottovalutata. La digitazione vocale instrada l'audio attraverso il servizio vocale online di Microsoft, quindi verifica che il riconoscimento vocale online sia attivo in Impostazioni, Privacy e sicurezza, Voce, e che la tua connessione sia stabile. Con una connessione instabile si fermerà a metà frase e sembrerà un bug locale. Secondo, il microfono. Scegli l'ingresso giusto in Impostazioni, Sistema, Audio, Ingresso, alza il livello d'ingresso se è basso, e verifica che l'accesso al microfono sia attivo in Impostazioni, Privacy e sicurezza, Microfono. La risoluzione dei problemi di Microsoft suggerisce anche di passare a una cuffia o a un microfono esterno se quello integrato si interrompe — un microfono che si stacca viene letto come il silenzio che fa scattare la pausa automatica.

Terzo, la lingua. In Impostazioni, Data/ora e lingua, Voce, assicurati che la lingua del parlato corrisponda a quella in cui detti e che il relativo pacchetto di riconoscimento sia installato; una mancata corrispondenza causa comportamenti irregolari. Microsoft suggerisce anche di dettare in una stanza più silenziosa, dato che il rumore di fondo confonde l'audio. Ora la parte onesta: nessuna di queste mosse elimina la pausa automatica per il silenzio. Quella è intenzionale. Il team di supporto di Microsoft l'ha confermato direttamente e ha indirizzato gli utenti all'opzione Fornisci feedback all'interno dello strumento di dettatura per votare a favore di una modifica. Finché quel voto non passa, il massimo che puoi fare è evitare di restare in silenzio — la pausa in sé non si può disattivare. Se per te questo è insostenibile, uno strumento con un tasto push-to-talk è l'unica vera via d'uscita, ed è proprio il senso della sezione qui sopra.

Locale o cloud: quale modalità evita davvero il problema

Se il motivo per cui sei qui è una funzione che si chiude nel momento in cui la connessione vacilla, la risposta pende verso il locale. Entrambi i motori locali funzionano interamente sulla tua macchina senza inviare nulla da nessuna parte, quindi un intoppo di rete non può fermarli a metà frase come ferma Win+H. Ecco in cosa differiscono, per questo problema specifico, i tre percorsi tra cui l'app ti fa scegliere.

L'app ti fa scegliere, quindi ecco come la vedrei io quando la lamentela è "continua a fermarsi":

  • Local Parakeetil motore TDT di NVIDIA, circa 600 MB, e l'opzione locale più veloce — da 5 a 10 volte più veloce di Whisper su CPU. Copre l'inglese più altre 24 lingue europee, 25 in totale. Niente traduzione verso l'inglese. Completamente offline, quindi nessuna connessione da perdere. Se parli inglese o una lingua europea, è il modo più rapido per scendere dalla giostra dell'handshake col cloud.
  • Local Whisperpiù lento di Parakeet sulla stessa macchina, ma le build multilingue coprono 99 lingue e possono tradurre in inglese. Le build solo inglese sono solo inglese, non 99. Scegli questa per cinese, giapponese, coreano o qualsiasi lavoro di traduzione, cosa che Parakeet non può fare. Il modello inglese predefinito è di circa 480 MB. Anch'esso completamente offline.
  • Cloud (OpenAI, BYOK)la migliore accuratezza e l'accesso al web, usando la tua chiave OpenAI fatturata direttamente da OpenAI. La trascrizione gira su gpt-4o-mini-transcribe per impostazione predefinita. Ha bisogno di internet — quindi, come Win+H, dipende dalla rete e una caduta può interromperlo. La superficie Cloud fa parte di Whisper Pro.

La verità noiosa è che, per la frustrazione specifica che ti ha portato qui, il locale è la cura vera. Una caduta di connessione non può fermare una trascrizione che non tocca mai la rete, e un tasto push-to-talk non si cura di quanto a lungo ti fermi. Il cloud si guadagna il suo posto quando vuoi un'accuratezza di altissimo livello su una registrazione difficile o un dato preso dal web a metà frase. Ma se la tua lamentela è "si ferma quando il Wi-Fi fa le bizze", scegliere un altro percorso che dipende dalla rete vorrebbe dire mancare il punto. Comincia dal locale.

Testo più pulito una volta che la dettatura smette di interrompersi

Una volta che la dettatura funziona davvero dall'inizio alla fine — integrata o no — arrivi alla realtà successiva: il parlato grezzo esce come un periodo senza fine. Dici "okay quindi finisci la presentazione mandala a maria e blocca un'ora domani per provare", ed è il muro senza punteggiatura che qualsiasi motore vocale ti consegna. È nella pulizia che gli strumenti si differenziano.

La digitazione vocale di Windows può aggiungere la punteggiatura mentre parli, quando è in funzione. Per una pulizia più pesante — togliere gli "ehm", sistemare i periodi infiniti, trasformare un paragrafo parlato in qualcosa che invieresti davvero — Whisper può eseguire un passaggio di IA prima che il testo arrivi. Di' la frase di attivazione "Hey whisper" e il testo viene prima migliorato. Su un modello locale gira tramite Ollama; in modalità cloud è gpt-5-mini per impostazione predefinita.

Thinking...
Grezzo

okay quindi finisci la presentazione mandala a maria e blocca un'ora domani per provare ehm prima della call col cliente

Pulito

Okay, quindi finisci la presentazione, mandala a Maria e blocca un'ora domani per provare prima della call col cliente.

Il passaggio di pulizia è parte del motivo per cui uno strumento dedicato vale la spesa, oltre al semplice non fermarsi. Non ottieni solo una cattura che resta attiva durante le tue pause; ottieni un testo più vicino al risultato finale. Se vuoi la versione più ampia di tutto questo, lo stesso flusso parla-poi-pulisci è ciò che ti permette di scrivere più velocemente con la voce in ogni app che apri, non solo nell'unica finestra in cui Win+H è capitato prima di chiudersi.

E poiché incolla al cursore in qualsiasi campo e non si ferma mai da solo quando cambia il focus, lo stesso flusso tiene anche in una scheda del browser — dettare in Google Docs si comporta come dettare in un editor desktop, anche quando passi dall'uno all'altro, che è esattamente il punto in cui Win+H tende a far cadere la sessione.

Quando quella integrata basta

Una scrivania ordinata e tranquilla con un portatile, a suggerire un problema risolto

Ecco la parte in cui ti dissuado dall'installare qualsiasi cosa. Se detti a brevi raffiche e l'interruzione automatica non ti dà mai fastidio, non ti serve un'altra app. Una frase o due prima che scatti il timer del silenzio è esattamente ciò per cui Win+H è fatto. È gratis, integrato in Windows, e per le risposte rapide va davvero bene. Non ti dirò di installare un software per dettare un messaggio di due righe.

La strada integrata è la scelta giusta quando sono vere alcune cose: detti perlopiù testi brevi, sei comunque sempre online, non ti dispiace premere di nuovo Win+H tra un campo e l'altro, e ti sta bene che la tua voce vada al cloud di Microsoft per essere riconosciuta. Quest'ultimo punto è il vero bivio. La digitazione vocale instrada il tuo audio attraverso il servizio vocale online di Microsoft per design — va bene per una lista della spesa, merita un secondo pensiero per un'email a un cliente o per qualsiasi cosa preferiresti tenere sulla tua macchina.

Affidati a uno strumento push-to-talk e offline quando le interruzioni iniziano a far male in modo ripetuto: detti lunghi passaggi e sbatti di continuo contro la pausa per il silenzio, cambi finestra in continuazione e continui a perdere la sessione, lavori su una connessione traballante, oppure preferisci che la tua voce non lasci mai la tua macchina. Al di sotto di quella soglia, usa ciò che è gratis — le soluzioni alternative presentate prima in questa guida sono lì proprio perché tu possa farlo.

Se il problema è più grande del solo fermarsi — Win+H che non fa proprio nulla, nessun testo che compare, o la lingua sbagliata — la checklist più ampia in voce in testo che non funziona su Windows copre il resto delle modalità di guasto che non sono propriamente un'interruzione automatica.

Letture di approfondimento

Microsoft ha costruito una funzione di dettatura che decide che hai finito nel momento in cui ti fermi a pensare, poi ha confermato sul proprio forum di supporto che è voluto e non si può disattivare. Così continuiamo a parlare durante ogni pausa come se fossimo a una telefonata che temiamo di far cadere, e premiamo di nuovo gli stessi due tasti ogni volta che diamo un'occhiata a un'altra finestra. Funziona, perlopiù, per brevi raffiche. Ma la prima volta che una funzione si chiude a metà della tua frase perché hai respirato, inizi a desiderarne una che ti aspetti. Ho dettato gran parte di questa guida tenendo premuto un solo tasto, fermandomi quando ne avevo voglia. Non mi ha mai abbandonato neanche una volta.

Detta senza l'interruzione automatica

Tieni premuta una scorciatoia, parla, fermati quando ti serve, rilascia. Il testo arriva al tuo cursore in qualsiasi app — trascritto localmente, senza timer del silenzio e senza connessione cloud da perdere.

Modalità locale gratuita per qualsiasi account con cui hai effettuato l'accesso. Nessuna carta richiesta per iniziare.

Foto di Denys Medvediev

Denys Medvediev

Sono quello che legge la nostra email di supporto, molto probabilmente dettando le risposte.