How does voice typing software work?

It records audio from your microphone, runs it through a speech recognition model that converts the sound to text, and pastes the result where your cursor is. Some tools then run the text through a language model to fix punctuation and tone. The recognition can happen on your own computer or on a server.

How accurate is voice typing software?

Modern tools are good enough to trust for first drafts without training. Dragon advertises up to 99% recognition accuracy from first use, and the open-source Whisper model handles accents and noise across 99 languages on its multilingual variants. A $20 USB microphone improves accuracy more than any software upgrade. That is the boring truth.

What is the best free voice typing software?

The best free option is the one already on your device. Windows users get Voice typing with Windows key + H; Mac users get Apple Dictation; and Google Docs users get Voice typing under Tools. Whisper by Remskill's local pipeline is also free for signed-in users.

Can voice typing software type in any app?

Built-in dictation and dedicated desktop apps are system-wide. They type wherever your cursor is, in any text field. Browser-based tools like Google Docs Voice typing only work inside their own app, so they cannot fill your email or chat.

Is voice typing built into Windows and Mac?

Yes. Windows 11 has Voice typing, opened with the Windows logo key + H, though it needs an internet connection. Mac has Apple Dictation, turned on in System Settings under Keyboard. Both are free.

How much faster is voice typing than keyboard typing?

People speak at roughly 145 words a minute and type at about 40, so dictation is around three to four times faster. The real gain is not raw speed; it is skipping the keyboard entirely while your hands do something else.

Does voice typing software work offline?

Some do, some do not. Windows Voice typing requires internet because it processes in the cloud. Whisper by Remskill's local engines, Parakeet and Whisper, run fully offline on your machine, which is also why your audio never leaves the laptop.

Di Denys Medvediev13 maggio 2026

Guida

Software di dettatura vocale: opzioni gratuite integrate vs strumenti a pagamento

Alcuni dei migliori software di dettatura vocale sono già sul tuo computer. Ecco quale usare, e quando pagare per un'app dedicata ha davvero senso.

Ultimo aggiornamento: giugno 2026

Laptop elegante e bicchiere d'acqua su una scrivania luminosa, pronti per la dettatura vocale a mani libere

Il software di dettatura vocale ascolta attraverso un microfono e trascrive ciò che dici, trasformando la voce in testo modificabile a circa 145 parole al minuto contro le circa 40 della digitazione. I buoni strumenti funzionano a livello di sistema, così le parole compaiono al cursore. Alcuni sono gratuiti e integrati in Windows e Mac; le app a pagamento aggiungono la modalità offline e la rifinitura con l'AI.

Parla, e le parole compaiono al cursore

La prima volta che funziona sembra un piccolo gioco di magia. Tieni premuto un tasto, dici una frase, rilasci, e la frase è semplicemente lì nella tua email. Senza tastiera. Una mia giovane parente una volta ha dettato un messaggio di 90 parole a sua nonna prima che io finissi di spiegare cosa fosse la dettatura. La parte difficile non è mai stata parlare. Per due decenni la parte difficile è stata che il software fosse abbastanza buono da fidarsi, e quella parte è stata finalmente risolta.

Questo articolo parla di quale software di dettatura vocale vale il tuo tempo, comprese le opzioni gratuite che già possiedi.

Pasted

L'overlay di Whisper che conclude una dettatura — il testo viene incollato al cursore.

La maggior parte delle persone bloccate sulla tastiera lo fa per abitudine, non per necessità. Digitare è un compromesso appreso, un modo per far uscire i pensieri dalla testa e farli entrare in una macchina che non ha orecchie. Il software di dettatura vocale elimina il compromesso. La domanda ha smesso di essere se funziona intorno al 2022 ed è diventata quale scegliere, e se devo pagarlo.

La risposta onesta dipende da tre cose: per quanto tempo detti, se vuoi che funzioni in ogni app, e se ti interessa che le tue parole non lascino mai il tuo laptop. Alla fine saprai quale strada fa al caso tuo, e ti dirò io quando l'opzione gratuita integrata è tutto ciò di cui hai bisogno. Leggo la maggior parte delle email di assistenza di questa app, e una quota costante arriva da persone che hanno pagato per uno strumento quando quello già presente sul loro computer avrebbe fatto il lavoro. Quindi ho un piccolo interesse personale nel dissuaderti dall'acquisto.

Cos'è il software di dettatura vocale

Primo piano di un'interfaccia audio digitale che mostra un'onda sonora vivace, a illustrare la voce catturata come dati

Il software di dettatura vocale è un programma che cattura l'audio dal microfono e lo converte in testo scritto usando un modello di riconoscimento vocale. Il nome più vecchio è software di dettatura. Il nome di marketing più recente è dettatura AI, che per lo più significa la stessa cosa con un modello linguistico aggiunto per sistemare punteggiatura e tono.

Si presenta in tre forme. La dettatura integrata è fornita con il sistema operativo: Digitazione vocale di Windows, Apple Dictation. La dettatura vocale basata su browser vive dentro una sola app, come la Digitazione vocale di Google Docs. E le app desktop dedicate si installano separatamente e funzionano in tutto ciò in cui scrivi. La forma conta più del marchio. Uno strumento basato su browser che scrive solo dentro Google Docs è inutile per i tuoi messaggi su Slack, per quanto buona sia la sua precisione. La prima domanda da porsi su qualunque strumento non è quanto è preciso, ma dove ti permette di scrivere. La precisione è ormai un problema risolto per la maggior parte di essi; la portata no.

Ciò che distingue uno strumento serio da un giocattolo è dove incolla. Gli strumenti integrati e desktop dedicati funzionano a livello di sistema: premi il tasto di scelta rapida in qualsiasi campo di testo e il testo appare lì. È tutto qui il gioco. Tutto il resto — precisione, lingue, rifinitura AI — è un perfezionamento su una base: se scrive là dove stai guardando.

Una seconda cosa distingue le categorie: cosa riesce a sentire il modello. Alcuni strumenti gestiscono solo l'inglese. Altri gestiscono decine di lingue e possono passare da una all'altra a metà frase. I modelli solo inglese di Whisper supportano esattamente una lingua, mentre le sue versioni multilingue ne coprono 99. Il Parakeet di NVIDIA si colloca a metà, con 25 lingue: l'inglese più 24 europee. Se scrivi sempre e solo in inglese, niente di tutto questo conta e dovresti scegliere in base alla velocità. Se prepari bozze in due lingue prima di pranzo, conta parecchio. La maggior parte delle persone sopravvaluta quante lingue le servono e sottovaluta quanto tiene alla latenza. Il ritardo tra il rilascio del tasto e la comparsa del testo è la cosa che senti ogni singola volta.

Se preferisci vedere la versione a livello di sistema all'opera anziché leggere sulla categoria, la pagina della dettatura vocale di Whisper mostra il ciclo tieni-premuto-il-tasto su Windows e Mac, motori locali gratuiti inclusi.

Come funziona (e perché la precisione è finalmente diventata buona)

Sotto il cofano la pipeline ha tre passaggi. Il microfono registra una breve clip audio. Un modello di riconoscimento vocale trasforma quell'audio in testo. Poi il testo viene incollato, a volte dopo che un modello linguistico lo ha ripulito.

CancelTranscribing

Whisper a metà trascrizione — il modello vocale che trasforma l'audio in testo.

Il salto di precisione che tutti hanno notato è arrivato dal modello al centro. Il modello open source Whisper di OpenAI ha cambiato il significato di buono. Gestisce accenti, rumore di fondo e 99 lingue nelle sue varianti multilingue, senza alcun passaggio di addestramento. Quest'ultima parte è la rivoluzione silenziosa. Non insegni al moderno software di dettatura vocale la tua voce. Lo installi e parli.

Sono abbastanza vecchio da ricordare quando questo era fantascienza. Alla fine degli anni '90 un parente faceva girare Dragon NaturallySpeaking su un desktop con Windows 98 e 64 MB di RAM. La configurazione significava leggere ad alta voce un elenco di parole per 45 minuti, così il software poteva calibrarsi sulla tua voce. Poi funzionava, a malapena, forse con il 70% di precisione, con quattro secondi di ritardo per frase. Ci volevano quindici minuti per dettare un paragrafo di una lettera di auguri. La cuffia è stata scagliata dall'altra parte della stanza. La cuffia è sopravvissuta; l'esperimento no. Venticinque anni dopo, lo stesso compito richiede novanta secondi e zero addestramento. L'hardware ha raggiunto l'idea.

Oggi esistono due varianti del passaggio centrale. L'elaborazione locale fa girare il modello sul tuo computer, offline, così il tuo audio non lascia mai la macchina, come funziona la trascrizione vocale offline. L'elaborazione cloud invia l'audio a un server, il che può essere più veloce su hardware debole ma significa che le tue parole viaggiano. Quale preferisci dipende da cosa stai dettando. Una lista della spesa, chi se ne importa. Il contratto del tuo cliente, forse importa.

Il terzo passaggio, la rifinitura, è dove vive l'AI nella dettatura AI. La trascrizione grezza ti dà un muro di parole senza interruzioni di paragrafo e con qualche occasionale ehm. Un modello linguistico può sistemare la punteggiatura, eliminare le esitazioni e persino adattarsi a un tono che gli chiedi. In Whisper by Remskill quel passaggio è opzionale e gira localmente tramite Ollama, oppure nel cloud tramite la tua chiave OpenAI se attivi Pro. Puoi anche attivarlo con la voce: pronuncia la frase di attivazione, attualmente Hey whisper, e il testo viene passato al modello invece di essere incollato grezzo. Niente di tutto ciò cambia il trucco di fondo. Decide soltanto quanto curate sono le parole quando arrivano.

Le opzioni gratuite che hai già: Digitazione vocale di Windows, Apple Dictation, Google Docs

Prima di pagare qualcosa, controlla cosa c'è già sul tuo computer. Tre opzioni gratuite integrate coprono molto terreno.

Windows · Win + H

Listening…

macOS · Dictation

Docs · Voice typing

Click to speak

La dettatura già presente sul tuo computer, in due varianti — nessuna installazione necessaria.

Digitazione vocale di Windows

Su Windows 11, premi il tasto con il logo Windows più H in qualsiasi casella di testo e appare una barra di digitazione vocale. È ottima per i messaggi rapidi. Il rovescio della medaglia: ha bisogno di una connessione a internet e di un microfono funzionante per girare, perché il riconoscimento avviene nel cloud. Supporta 43 lingue secondo l'elenco di Microsoft. Se sei offline su un treno, smette di funzionare. C'è una guida completa nel nostro articolo sulla trascrizione vocale su Windows.

Apple Dictation

Su un Mac, attivalo in Impostazioni di sistema, Tastiera, Dettatura, poi avvialo con il tasto del microfono o la scorciatoia che hai scelto. La versione attuale trascrive testi di qualsiasi lunghezza e si ferma solo dopo 30 secondi di silenzio, non dopo un limite di tempo fisso. Su Apple Silicon può elaborare la tua voce direttamente sul dispositivo. Per le note brevi è gratuito e va benissimo; la configurazione più approfondita la trovi in trascrizione vocale su Mac.

Digitazione vocale di Google Docs

Apri un documento Google in Chrome, Edge o Safari, fai clic su Strumenti, poi su Digitazione vocale, e appare una casella con il microfono. Supporta oltre 100 lingue e varianti regionali. Il limite invalicabile è proprio lì nel nome: scrive solo dentro Google Docs e Presentazioni. Non scriverà la tua email, il tuo Slack o il tuo codice.

Il modo onesto di leggere queste tre: sono strumenti veri, non demo, e per una larga fetta di persone sono la fine della ricerca. Dove si fermano è prevedibile. La Digitazione vocale di Windows muore nel momento in cui perdi il segnale. La Digitazione vocale di Google Docs non esce mai dal documento. Apple Dictation è eccellente su un Mac e assente ovunque altrove. Se il tuo lavoro rientra entro quei confini, hai finito. Chiudi questa scheda e premi il tasto. La categoria a pagamento esiste per il lavoro che non ci rientra: dettatura tutto il giorno, offline su un aereo, ogni app invece di una sola, e audio che deve restare sul tuo disco.

Gli strumenti a pagamento da conoscere (Dragon, Wispr Flow, Superwhisper, Voicy, Whisper by Remskill)

Quando gli strumenti gratuiti finiscono lo spazio — quando detti tutto il giorno o ti serve la modalità offline o vuoi la rifinitura AI — si apre la categoria a pagamento. Ecco i nomi da conoscere, con una riga onesta ciascuno.

Se preferisci vedere l'intero panorama messo in fila in ordine, ecco i migliori software di dettatura vocale, in classifica.

Non li ho messi alla prova uno contro l'altro col cronometro, quindi non farò finta di sì. Ho scelto i nomi qui sotto su tre cose: la portata di piattaforma documentata (funziona là dove scrivi davvero), il supporto offline documentato (il tuo audio lascia la macchina) e la copertura linguistica documentata. La tabella riporta solo i fatti che ogni fornitore pubblica; ho lasciato fuori velocità e precisione perché non esiste alcun benchmark neutrale tra tutti loro, e inventarne uno sarebbe esattamente la cosa da cui sono venuto a dissuaderti.

Software di dettatura vocale a confronto per piattaforma, modalità di elaborazione, supporto offline, modello di prezzo e copertura linguistica.
Strumento	Piattaforma	Local / Cloud	Funziona offline	Modello di prezzo	Lingue	Ideale per
Digitazione vocale di Windows	Windows 11	Cloud	No	Gratuita, integrata	43	Messaggi rapidi su un PC connesso
Apple Dictation	macOS	Locale su Apple Silicon	Sì (Apple Silicon)	Gratuita, integrata	Decine	Note brevi su un Mac
Digitazione vocale di Google Docs	Browser	Cloud	No	Gratuita, funzione del browser	100+	Scrivere solo dentro Google Docs
Dragon di Nuance	Windows	Locale	Sì	A pagamento, licenza una tantum	Orientato all'inglese	Dettatura tutto il giorno su Windows
Whisper by Remskill	Windows, macOS (Apple Silicon)	Locale o Cloud (la tua chiave)	Sì (motori locali)	Locale gratuito, Pro a pagamento per il cloud	99 su Whisper multilingue	Dettatura a livello di sistema, offline, qualsiasi app

Dragon di Nuance è la vecchia guardia. Dragon Professional v16 pubblicizza una dettatura tre volte più veloce della digitazione con una precisione di riconoscimento fino al 99% fin dal primo utilizzo, ed è ottimizzato per Windows 11. Quel 99% è un dato di Nuance stessa, non un benchmark neutrale. Il rovescio della medaglia: Dragon Professional è solo per Windows, senza alcuna versione desktop attuale per Mac.

Wispr Flow, Superwhisper e Voicy sono la nuova ondata di app di dettatura AI. Avvolgono un modello vocale in un'interfaccia pulita e aggiungono la rifinitura del tono o della formattazione. Sono competenti. Lo schema, nella maggior parte di questa categoria, è la stessa architettura — un modello vocale, un'interfaccia e una fattura mensile — ed è nella fattura che differiscono di più. Se è la fattura la parte che brucia, abbiamo scritto un'onesta alternativa a superwhisper che mantiene l'intera pipeline locale gratuita per sempre.

Whisper by Remskill, la nostra app, è uno strumento desktop per Windows e macOS su Apple Silicon. Premi un tasto di scelta rapida, parli, e il testo viene incollato al cursore in qualsiasi app. Il tasto predefinito è Ctrl+Space su Windows e una combinazione push-to-talk Command+Option su Mac — tieni premuti entrambi, rilascia uno dei due per fermarti. Ciò che scegli è il motore. Scegli tra tre percorsi: NVIDIA Parakeet locale (~600 MB, 5–10× più veloce di Whisper su CPU, inglese più 24 lingue europee); Whisper locale (otto modelli, 99 lingue su quelli multilingue, traduzione in inglese); oppure la modalità Cloud, che usa la tua chiave OpenAI per gpt-4o-mini-transcribe o gpt-4o-transcribe senza alcuna trattenuta da parte nostra. Tutta la trascrizione locale è in puro Rust, senza Python. Il confronto completo del panorama più ampio vive nella nostra rassegna dei software di trascrizione.

Whisper

L'app Whisper reale — Local e Cloud, esplora il selettore dei motori.

Qui entra anche la mia unica opinione: prova prima la modalità locale. Se il tuo Mac è Apple Silicon o il tuo PC è degli ultimi quattro anni, non ti serve il cloud per la dettatura di tutti i giorni. Parakeet locale inizia a trascrivere in ben meno di due secondi su hardware moderno, il tuo audio non lascia mai il laptop, e il cloud è la via di fuga per quando vuoi la precisione di livello OpenAI o la ricerca sul web, non l'impostazione predefinita. Ricorri alla rete quando sbatti contro un muro, non prima. Sono il tipo di architetto che per riflesso ricorre alla soluzione più grande e più sofisticata, per poi convincersi a fare marcia indietro. Local-first è me che mi convinco a fare marcia indietro, in pubblico, così tu puoi saltare la parte in cui sprecherei una settimana.

La ragione pratica è l'hardware. Un laptop moderno ha già un microfono e un processore abbastanza veloce da far girare un modello vocale da solo. Inviare un paragrafo di audio a un server e farlo tornare indietro, per un lavoro che la tua macchina può fare offline in meno di due secondi, è un'abitudine ereditata da quando i laptop erano troppo lenti. Ora non lo sono più. Il cloud si guadagna il suo posto per i casi difficili: una stanza rumorosa, un accento insolito, una richiesta che ha bisogno di una risposta web in tempo reale incollata nella tua risposta. Per il flusso quotidiano di email, note e chat, il locale è più veloce ad avviarsi, privato per impostazione predefinita e gratuito per gli utenti che hanno effettuato l'accesso. La via di fuga c'è quando ti serve; la maggior parte dei giorni non ti servirà.

Quando saltare un'app dedicata e usare quella integrata

Ecco la parte che la maggior parte degli articoli sui migliori software salta. Se invii messaggi brevi — un SMS di 30 parole, una rapida risposta su Slack — la dettatura gratuita già presente sul tuo computer è tutto ciò che ti serve. La Digitazione vocale di Windows (tasto Windows + H) e Apple Dictation sono gratuite, sono integrate e funzionano. Non installare né pagare nulla per scrivere una sola frase. Un'app dedicata inizia a guadagnarsi il suo posto quando detti spesso, hai bisogno che funzioni offline su un aereo, la vuoi in ogni app e non solo in una, oppure ci tieni che le tue parole restino sul tuo dispositivo. Al di sotto di quella soglia, la noiosa verità è che possiedi già lo strumento giusto.

Quanto costa Whisper by Remskill

Whisper by Remskill è gratuito per ogni utente che ha effettuato l'accesso, per l'intera pipeline locale: Whisper locale, Parakeet, rifinitura AI basata su Ollama, cronologia, tasto di scelta rapida personalizzato, download dei modelli, senza alcun metodo di pagamento necessario per registrarsi. Whisper Pro aggiunge la superficie Cloud: trascrizione cloud OpenAI, miglioramento AI nel cloud e ricerca web vocale tramite la tua chiave OpenAI. La modalità Cloud ti addebita i costi direttamente tramite OpenAI; noi non tratteniamo nulla. I piani attuali e la prova Pro sono nella pagina dei prezzi. Non ti citerò numeri qui; la pagina lo fa meglio di quanto possa fare un paragrafo.

Approfondimenti

Un mio parente ha scagliato una cuffia dall'altra parte della stanza nel 1999 perché la dettatura era un lavoro di 45 minuti che produceva spazzatura. La cuffia è sopravvissuta all'esperimento. Venticinque anni dopo quel lavoro è scomparso. Premi un tasto e parli, e le parole compaiono. L'unica vera decisione rimasta è quale strumento usare, e per molte persone la risposta giusta è già sul loro computer, spenta, in attesa. I miei figli non sapranno mai che un tempo era difficile, che è poi l'obiettivo, anche se rende la storia meno interessante a tavola.

Prova prima quello che già possiedi

Se finisce lo spazio, scarica Whisper e scegli il motore che si adatta al tuo modo di lavorare.

Scarica Whisper Guarda come funziona

Gratuito per gli utenti che hanno effettuato l'accesso, sull'intera pipeline locale. Nessuna carta alla registrazione.

Denys Medvediev

Sono quello che legge le nostre email di assistenza, molto probabilmente dettando le risposte.

Domande frequenti

Registra l'audio dal tuo microfono, lo fa passare attraverso un modello di riconoscimento vocale che converte il suono in testo, e incolla il risultato dove si trova il cursore. Alcuni strumenti poi fanno passare il testo attraverso un modello linguistico per sistemare punteggiatura e tono. Il riconoscimento può avvenire sul tuo computer o su un server.