Di Denys Medvediev

Guida

Come usare la digitazione vocale su Windows

Windows ha la digitazione vocale integrata. Premi il tasto Windows + H in qualsiasi campo di testo, aspetta "In ascolto" e parla. Richiede una connessione internet e un microfono funzionante. Per un uso intenso, offline o su più applicazioni, uno strumento dedicato con un solo tasto fa lo stesso lavoro ovunque.

Ultimo aggiornamento: giugno 2026

Un laptop Windows con tastiera su una scrivania, pronto per la digitazione a mani libere tramite voce

Per usare la digitazione vocale su Windows, posiziona il cursore in qualsiasi campo di testo e premi il tasto Windows + H. La barra della digitazione vocale si apre, mostra "In ascolto" e trascrive ciò che dici. Richiede un microfono funzionante, una connessione internet e il riconoscimento vocale online attivo in Impostazioni, Privacy e sicurezza, Voce.

La maggior parte delle persone non scopre mai che Windows può scrivere al posto loro. La funzione è inclusa in Windows 10 e 11, non ha nessuna procedura guidata di configurazione, e si nasconde dietro una scorciatoia da tastiera che nessuno menziona: tasto Windows + H. Posiziona il cursore in un campo di testo, tieni premuto il tasto Windows, premi H, e una piccola barra si apre in cima allo schermo e comincia ad ascoltare.

Ed è tutto qui, davvero. Per usi brevi funziona bene. Il problema è quello che Microsoft dichiara apertamente ma la maggior parte degli articoli omette: la digitazione vocale di Windows instrada il parlato attraverso il cloud Microsoft, quindi ha bisogno di una connessione internet per fare qualsiasi cosa. Questo dettaglio decide se la funzione integrata è sufficiente o se vorrai qualcos'altro. Prima ti illustro la soluzione integrata con onestà, poi ti dico dove si ferma.

Ecco la cosa che gli articoli di istruzioni tendono a seppellire. La digitazione vocale di Windows è una funzione vera, gratuita e integrata, e funziona in qualsiasi campo di testo con cursore — il browser, Word, un messaggio su Slack, la barra di ricerca. Non devi installare nulla. La scorciatoia è tasto Windows + H, e una volta che sai che esiste, la userai.

La risposta onesta si divide quindi in due parti. Parte uno: come attivare la funzione integrata e usarla bene — è quello di cui ha bisogno la maggior parte di chi cerca queste informazioni. Parte due: dove Win+H si inceppa — niente internet, dettatura lunga, parole che continua a fraintendere — e cosa risolve uno strumento dedicato in ogni caso. Tratterò entrambe, configurerò l'alternativa in due minuti, e ti dirò chiaramente quando Win+H è già sufficiente.

Cosa è davvero la digitazione vocale di Windows

Una persona che parla vicino a un laptop aperto, illustrando come parlare anziché scrivere

La digitazione vocale di Windows è una funzione integrata che ti permette di inserire testo parlando invece di scrivere. È inclusa in Windows 10 e Windows 11, non costa nulla, e funziona in qualsiasi campo di testo in cui puoi posizionare il cursore. Vale la pena citare la descrizione ufficiale di Microsoft perché definisce i limiti: la digitazione vocale "utilizza il riconoscimento vocale online, basato sui servizi Azure Speech." Da quella singola frase derivano tre conseguenze.

Prima: richiede internet. Il parlato viene inviato ai server Microsoft per essere convertito in testo, quindi senza connessione la digitazione vocale non fa nulla. Seconda: serve un microfono funzionante — quello integrato nel laptop va bene per cominciare. Terza: poiché il riconoscimento avviene nel cloud, la precisione è generalmente buona e non grava sulla CPU. Questi sono i compromessi in sintesi: gratuita e precisa, ma solo online e non privata.

Spesso le persone confondono questa funzione con il vecchio Riconoscimento vocale di Windows, con il più recente Accesso vocale, o con la dettatura interna a una singola applicazione. Per l'uso quotidiano del tipo "voglio parlare e vedere le parole apparire in qualunque cosa stia scrivendo," quella che ti serve è la digitazione vocale, aperta con il tasto Windows + H. La sezione seguente è la guida pratica.

Attivala con il tasto Windows + H

Non c'è nessuna app da avviare e nessuna procedura guidata da seguire. Posiziona il cursore dove vuoi le parole, poi avvia la digitazione vocale con una scorciatoia da tastiera. Ecco la sequenza completa, con l'unica deviazione nelle impostazioni di cui potresti aver bisogno.

Fai clic in qualsiasi campo di testo — un documento, un'email, una chat, la barra degli indirizzi — in modo che il cursore lampeggi lì. Premi il tasto Windows + H. Una piccola barra della digitazione vocale appare in cima allo schermo. Aspetta che mostri "In ascolto" prima di parlare; se inizi troppo presto, taglia le prime parole. Parla normalmente e il testo appare dove si trova il cursore. Premi il pulsante del microfono sulla barra, o di nuovo la scorciatoia, per fermarti.

Se non succede nulla, di solito ci sono due cause. Il microfono non è configurato o non ha i permessi necessari — la digitazione vocale ha bisogno di un microfono funzionante. Oppure il riconoscimento vocale online è disattivato, il che significa che la parte cloud della funzione è disabilitata. Attivalo da Start, poi Impostazioni, poi Privacy e sicurezza, poi Voce, e imposta Riconoscimento vocale online su Attivo. Se la barra si apre ma non raggiunge mai "In ascolto", quasi sempre è la connessione internet, dato che il riconoscimento avviene sui server Microsoft anziché sul tuo computer. (Se Win+H si comporta in modo più ostinato, ho scritto un articolo separato su perché Win+H smette di funzionare e come ripristinarlo.)

Il metodo migliore per un uso intenso: un tasto ovunque

La soluzione integrata è ottima finché non incontri uno dei suoi limiti — niente internet in treno, un lungo blocco di dettatura, o una parola che fraintende ogni volta. La soluzione è uno strumento a livello di sistema che fa lo stesso lavoro ma gira sul tuo computer, tiene un breve buffer per non tagliare l'ultima parola, e usa un solo tasto in ogni applicazione. Serve un PC con Windows 10 o successivo, un microfono funzionante e un account. L'intera pipeline locale è gratuita per qualsiasi account registrato, senza richiedere un metodo di pagamento all'iscrizione. Ecco la sequenza.

Passo 1 — Installa Whisper e accedi.

Scarica dalla pagina di download, installa e crea un account gratuito. Nessuna carta. La pipeline di trascrizione locale si apre subito.

Saprai che ha funzionato quando l'icona dell'app appare nella barra delle applicazioni e la procedura guidata ti propone di scegliere un modello.

Passo 2 — Scegli una modalità di trascrizione.

L'app non sceglie per te. Hai tre opzioni: Cloud (OpenAI, chiave tua), Local Parakeet o Local Whisper. Per sostituire il comportamento solo-online di Win+H con qualcosa di offline, scegli un motore locale — ne parleremo più avanti tra due sezioni.

Saprai che ha funzionato quando un modello finisce il download e appare come pronto.

Passo 3 — Conferma il tuo tasto rapido.

Su Windows il predefinito è Ctrl+Space, tenuto premuto come push-to-talk. Cambialo in Impostazioni se confligge con qualcosa che usi già. A differenza di Win+H, tenere premuto il tasto mantiene la registrazione per tutto il tempo che lo tieni premuto.

Saprai che ha funzionato quando una registrazione di prova si incolla in qualsiasi campo di testo.

Passo 4 — Posiziona il cursore ovunque e parla.

Fai clic in un documento, un'email o una casella di chat, tieni premuto il tasto rapido, di' una frase, rilascia. La trascrizione si incolla dove si trova il cursore, in qualunque applicazione abbia il focus.

Saprai che ha funzionato quando la frase pronunciata è nel campo di testo come testo scritto.

Whisper
La vera app desktop Whisper nella schermata delle impostazioni, con i pannelli Trascrizione e AI aperti.

La parte lenta è il download iniziale del modello, non la configurazione. Dopo di ciò, il gesto di scrivere in qualsiasi app smette di essere un compito di digitazione e diventa un compito di conversazione — e funziona anche quando il Wi-Fi cade.

Se hai già usato la sintesi vocale su Windows 11, è la stessa idea ma con un tasto rapido che non si ferma automaticamente.

Punteggiatura: comandi vocali o automatica

Il parlato grezzo non ha virgole. Ogni strumento di dettatura gestisce questo in uno dei due modi, e la digitazione vocale di Windows li offre entrambi. Ha la punteggiatura automatica, che aggiunge virgole e punti da sola in base a come parli, e la attivi dall'icona a forma di ingranaggio sulla barra della digitazione vocale. E ha i comandi vocali: di' "punto" o "punto fermo," "virgola," "a capo," "apre virgolette" e "chiude virgolette," e inserisce il segno al posto delle parole.

Vale la pena dare un'occhiata al menu con l'ingranaggio almeno una volta. Oltre alla punteggiatura automatica, contiene il filtro per le parolacce e la scelta del microfono predefinito. Non è nulla di nascosto; è a un clic dalla barra che si apre con Win+H. Mentre parli, un piccolo indicatore mostra che la funzione sta ascoltando — la stessa idea che usa ogni buono strumento di dettatura, così non devi mai indovinare se ti ha sentito:

Cancel
Un indicatore di registrazione: una piccola capsula che appare mentre parli, per sapere che lo strumento sta ascoltando.

Il limite della punteggiatura basata su comandi è che ti costringe a narrare la formattazione — "virgola," "a capo," "punto" — il che va bene per un testo breve ma diventa stancante in un paragrafo lungo. La punteggiatura automatica aiuta, ma ti restituisce comunque una trascrizione letterale di quello che hai detto, "um" e false partenze inclusi. Ripulire tutto questo in qualcosa che useresti davvero è un passaggio separato, ed è qui che uno strumento dedicato fa la differenza. Ne parlo più avanti.

Locale o cloud: la scelta che Win+H non ti dà

La digitazione vocale di Windows ha già fatto la scelta locale-o-cloud per te: è cloud, senza alternative. Il tuo parlato va sui server Microsoft ogni volta. Va bene per una lista della spesa, ma è un problema reale per una nota su un foglio di calcolo con gli stipendi o un'email a un cliente che preferiresti non far trascrivere altrove. Uno strumento dedicato ti dà la scelta che la funzione integrata ti toglie. Ecco come differiscono i tre percorsi, perché l'app ti chiede di scegliere e preferisco che tu scelga bene:

  • Local ParakeetIl motore TDT di NVIDIA, circa 600 MB, e l'opzione locale più veloce — da 5 a 10 volte più rapida di Whisper su CPU. Copre l'inglese più altre 24 lingue europee, 25 in totale. Nessuna traduzione verso l'inglese. Se detti in italiano o un'altra lingua europea e vuoi velocità senza che nulla lasci il tuo computer, questa è la scelta rapida.
  • Local Whisperpiù lento di Parakeet sullo stesso computer, ma le versioni multilingue coprono 99 lingue e possono tradurre in inglese. Le versioni solo inglese sono solo inglese, non 99. Scegli questo per cinese, giapponese, coreano o qualsiasi lavoro di traduzione che Parakeet non sa fare. Il modello inglese predefinito è circa 480 MB.
  • Cloud (OpenAI, BYOK)la migliore precisione e accesso al web, usando la tua chiave OpenAI fatturata direttamente da OpenAI. La trascrizione usa gpt-4o-mini-transcribe per impostazione predefinita. Richiede internet, come Win+H, ma è la tua chiave e la tua decisione. La modalità Cloud fa parte di Whisper Pro.

La verità prosaica è che per la maggior parte della scrittura quotidiana un motore locale è più che sufficiente, ed è l'unica cosa che Win+H non può offrire. Entrambe le opzioni locali girano interamente sul tuo computer senza inviare nulla a nessun server. Il Cloud merita il suo posto quando vuoi precisione massima su una registrazione difficile o hai bisogno che il modello recuperi un'informazione dal web a metà frase. Inizia in locale, e passa al cloud solo quando quello locale non basta.

Risultati più puliti senza dover dire ogni virgola

Sia Win+H che uno strumento dedicato ti danno lo stesso punto di partenza: un flusso continuo senza punteggiatura. Dici "okay quindi sposta la scadenza a venerdì dì al cliente e prenota la sala per due persone," ed è il muro non punteggiato che ti restituisce qualsiasi motore vocale. Win+H può punteggiare man mano che parli o accettare comandi vocali. Nessuno dei due elimina gli "ehm" o corregge una frase che hai ricominciato a metà.

È lì che una passata AI si guadagna il posto. Di' la frase di attivazione "Hey whisper" e il testo trascritto viene migliorato prima di arrivare — filler rimossi, frasi spezzate, maiuscole corrette. Su un modello locale che gira tramite Ollama sul tuo computer; in modalità cloud è gpt-5-mini per impostazione predefinita. Parli la versione disordinata una volta sola e ricevi quella che spediresti davvero.

Thinking...
Grezzo

okay quindi sposta la scadenza a venerdì dì al cliente e prenota la sala per due ehm prima di pranzo

Pulito

Okay, quindi sposta la scadenza a venerdì, di' al cliente e prenota la sala per due prima di pranzo.

Ci sono anche le parole che un motore generico continua a sbagliare — il nome di un prodotto, il cognome di un collega, un termine tecnico. Win+H non ti dà modo di insegnargliele. Uno strumento dedicato ti permette di orientare il riconoscimento verso il tuo vocabolario personalizzato, così le parole che usi ogni giorno smettono di tornare scritte male. Non inventerà formattazione che non hai chiesto, e chi promette "di' titolo e guardalo formattarsi da solo" ti sta vendendo una demo, non la realtà di tutti i giorni. Scrivi veloce e in modo pulito con la voce; occupati dell'impaginazione con i tasti che già conosci.

Quel flusso parla-poi-pulisce è il motivo principale per cui le persone cambiano strumento — puoi scrivere più velocemente con la voce in ogni app invece di narrare le virgole in una barra integrata che funziona solo online.

Quando Win+H è già sufficiente

Un laptop aperto su un bancone di cucina, che suggerisce una nota rapida quotidiana

A volte la cosa gratuita già sul tuo computer è la risposta giusta, e fingere il contrario sarebbe disonesto. La digitazione vocale di Windows è genuinamente utile per una grande fetta di ciò di cui le persone hanno bisogno, e installare qualcos'altro sarebbe eccessivo.

Continua a usare Win+H se sei connesso la maggior parte del tempo, la tua dettatura avviene in brevi blocchi e non ti dispiace che il tuo parlato passi attraverso il cloud Microsoft. Una risposta di due righe su Slack, una query di ricerca, una nota veloce in un documento — premi il tasto Windows + H, aspetta "In ascolto," parla, fatto. È gratuito, è integrato, e punteggia da solo. Per un promemoria di una riga, non ti dirò certo di installare un'app.

Passa a uno strumento dedicato a livello di sistema quando la funzione integrata comincia a pesare: niente internet in aereo o in treno, lunghi blocchi di dettatura in cui il push-to-talk batte una barra che va in timeout, privacy per testo che non vuoi lasciare il tuo computer, parole personalizzate che continua a sbagliare, o il desiderio di un tasto rapido che si comporti in modo identico in ogni programma. Al di sotto di quella soglia, Win+H vince su prezzo e assenza di configurazione. Al di sopra, il divario è reale.

Se stai ancora decidendo da quale parte della linea sei, il confronto più dettagliato in la guida alle alternative a Win+H mostra esattamente dove si inserisce ogni opzione, senza il luccichio del marketing.

Windows ha aggiunto la digitazione vocale anni fa e l'ha nascosta dietro una scorciatoia che nessuno pronuncia ad alta voce. Ora la conosci: tasto Windows + H, aspetta "In ascolto," parla. Per la maggior parte dei lavori veloci è tutta la risposta, ed è gratuita. Il giorno in cui sei offline, o stai dettando qualcosa di più lungo di un messaggio, o una parola continua a tornare sbagliata, saprai esattamente quale muro hai colpito — e quale strumento ti aiuta a superarlo. Ho scritto buona parte di questo con la voce, in un'app che non si preoccupa di quale campo di testo abbia il cursore. Internet è caduto due volte mentre lo facevo. La dettatura non se n'è accorta.

Prova la digitazione vocale che funziona anche offline

Tieni premuto un tasto, parla, rilascia. La trascrizione atterra in qualsiasi campo di testo in cui si trova il cursore — in treno, in aereo o con il Wi-Fi assente.

Modalità locale gratuita per qualsiasi account registrato. Nessuna carta richiesta per iniziare.

Foto di Denys Medvediev

Denys Medvediev

Sono io che legge le email di supporto, quasi certamente dettando le risposte.

Approfondimenti