Di Denys Medvediev

Guida

Software di dettatura vocale: opzioni gratuite integrate vs strumenti a pagamento

Alcuni dei migliori software di dettatura vocale sono già sul tuo computer. Ecco quale usare, e quando pagare per un'app dedicata ha davvero senso.

Ultimo aggiornamento: giugno 2026

Laptop elegante e bicchiere d'acqua su una scrivania luminosa, pronti per la dettatura vocale a mani libere

Il software di dettatura vocale ascolta attraverso un microfono e trascrive ciò che dici, trasformando la voce in testo modificabile a circa 145 parole al minuto contro le circa 40 della digitazione. I buoni strumenti funzionano a livello di sistema, così le parole compaiono al cursore. Alcuni sono gratuiti e integrati in Windows e Mac; le app a pagamento aggiungono la modalità offline e la rifinitura con l'AI.

Parla, e le parole compaiono al cursore

La prima volta che funziona sembra un piccolo gioco di magia. Tieni premuto un tasto, dici una frase, rilasci, e la frase è semplicemente lì nella tua email. Senza tastiera. Una mia giovane parente una volta ha dettato un messaggio di 90 parole a sua nonna prima che io finissi di spiegare cosa fosse la dettatura. La parte difficile non è mai stata parlare. Per due decenni la parte difficile è stata che il software fosse abbastanza buono da fidarsi, e quella parte è stata finalmente risolta.

Questo articolo parla di quale software di dettatura vocale vale il tuo tempo, comprese le opzioni gratuite che già possiedi.

Pasted
L'overlay di Whisper che conclude una dettatura — il testo viene incollato al cursore.

La maggior parte delle persone bloccate sulla tastiera lo fa per abitudine, non per necessità. Digitare è un compromesso appreso, un modo per far uscire i pensieri dalla testa e farli entrare in una macchina che non ha orecchie. Il software di dettatura vocale elimina il compromesso. La domanda ha smesso di essere se funziona intorno al 2022 ed è diventata quale scegliere, e se devo pagarlo.

La risposta onesta dipende da tre cose: per quanto tempo detti, se vuoi che funzioni in ogni app, e se ti interessa che le tue parole non lascino mai il tuo laptop. Alla fine saprai quale strada fa al caso tuo, e ti dirò io quando l'opzione gratuita integrata è tutto ciò di cui hai bisogno. Leggo la maggior parte delle email di assistenza di questa app, e una quota costante arriva da persone che hanno pagato per uno strumento quando quello già presente sul loro computer avrebbe fatto il lavoro. Quindi ho un piccolo interesse personale nel dissuaderti dall'acquisto.

Cos'è il software di dettatura vocale

Primo piano di un'interfaccia audio digitale che mostra un'onda sonora vivace, a illustrare la voce catturata come dati

Il software di dettatura vocale è un programma che cattura l'audio dal microfono e lo converte in testo scritto usando un modello di riconoscimento vocale. Il nome più vecchio è software di dettatura. Il nome di marketing più recente è dettatura AI, che per lo più significa la stessa cosa con un modello linguistico aggiunto per sistemare punteggiatura e tono.

Si presenta in tre forme. La dettatura integrata è fornita con il sistema operativo: Digitazione vocale di Windows, Apple Dictation. La dettatura vocale basata su browser vive dentro una sola app, come la Digitazione vocale di Google Docs. E le app desktop dedicate si installano separatamente e funzionano in tutto ciò in cui scrivi. La forma conta più del marchio. Uno strumento basato su browser che scrive solo dentro Google Docs è inutile per i tuoi messaggi su Slack, per quanto buona sia la sua precisione. La prima domanda da porsi su qualunque strumento non è quanto è preciso, ma dove ti permette di scrivere. La precisione è ormai un problema risolto per la maggior parte di essi; la portata no.

Ciò che distingue uno strumento serio da un giocattolo è dove incolla. Gli strumenti integrati e desktop dedicati funzionano a livello di sistema: premi il tasto di scelta rapida in qualsiasi campo di testo e il testo appare lì. È tutto qui il gioco. Tutto il resto — precisione, lingue, rifinitura AI — è un perfezionamento su una base: se scrive là dove stai guardando.

Una seconda cosa distingue le categorie: cosa riesce a sentire il modello. Alcuni strumenti gestiscono solo l'inglese. Altri gestiscono decine di lingue e possono passare da una all'altra a metà frase. I modelli solo inglese di Whisper supportano esattamente una lingua, mentre le sue versioni multilingue ne coprono 99. Il Parakeet di NVIDIA si colloca a metà, con 25 lingue: l'inglese più 24 europee. Se scrivi sempre e solo in inglese, niente di tutto questo conta e dovresti scegliere in base alla velocità. Se prepari bozze in due lingue prima di pranzo, conta parecchio. La maggior parte delle persone sopravvaluta quante lingue le servono e sottovaluta quanto tiene alla latenza. Il ritardo tra il rilascio del tasto e la comparsa del testo è la cosa che senti ogni singola volta.

Se preferisci vedere la versione a livello di sistema all'opera anziché leggere sulla categoria, la pagina della dettatura vocale di Whisper mostra il ciclo tieni-premuto-il-tasto su Windows e Mac, motori locali gratuiti inclusi.

Come funziona (e perché la precisione è finalmente diventata buona)

Sotto il cofano la pipeline ha tre passaggi. Il microfono registra una breve clip audio. Un modello di riconoscimento vocale trasforma quell'audio in testo. Poi il testo viene incollato, a volte dopo che un modello linguistico lo ha ripulito.

CancelTranscribing
Whisper a metà trascrizione — il modello vocale che trasforma l'audio in testo.

Il salto di precisione che tutti hanno notato è arrivato dal modello al centro. Il modello open source Whisper di OpenAI ha cambiato il significato di buono. Gestisce accenti, rumore di fondo e 99 lingue nelle sue varianti multilingue, senza alcun passaggio di addestramento. Quest'ultima parte è la rivoluzione silenziosa. Non insegni al moderno software di dettatura vocale la tua voce. Lo installi e parli.

Sono abbastanza vecchio da ricordare quando questo era fantascienza. Alla fine degli anni '90 un parente faceva girare Dragon NaturallySpeaking su un desktop con Windows 98 e 64 MB di RAM. La configurazione significava leggere ad alta voce un elenco di parole per 45 minuti, così il software poteva calibrarsi sulla tua voce. Poi funzionava, a malapena, forse con il 70% di precisione, con quattro secondi di ritardo per frase. Ci volevano quindici minuti per dettare un paragrafo di una lettera di auguri. La cuffia è stata scagliata dall'altra parte della stanza. La cuffia è sopravvissuta; l'esperimento no. Venticinque anni dopo, lo stesso compito richiede novanta secondi e zero addestramento. L'hardware ha raggiunto l'idea.

Oggi esistono due varianti del passaggio centrale. L'elaborazione locale fa girare il modello sul tuo computer, offline, così il tuo audio non lascia mai la macchina, come funziona la trascrizione vocale offline. L'elaborazione cloud invia l'audio a un server, il che può essere più veloce su hardware debole ma significa che le tue parole viaggiano. Quale preferisci dipende da cosa stai dettando. Una lista della spesa, chi se ne importa. Il contratto del tuo cliente, forse importa.

Il terzo passaggio, la rifinitura, è dove vive l'AI nella dettatura AI. La trascrizione grezza ti dà un muro di parole senza interruzioni di paragrafo e con qualche occasionale ehm. Un modello linguistico può sistemare la punteggiatura, eliminare le esitazioni e persino adattarsi a un tono che gli chiedi. In Whisper by Remskill quel passaggio è opzionale e gira localmente tramite Ollama, oppure nel cloud tramite la tua chiave OpenAI se attivi Pro. Puoi anche attivarlo con la voce: pronuncia la frase di attivazione, attualmente Hey whisper, e il testo viene passato al modello invece di essere incollato grezzo. Niente di tutto ciò cambia il trucco di fondo. Decide soltanto quanto curate sono le parole quando arrivano.

Le opzioni gratuite che hai già: Digitazione vocale di Windows, Apple Dictation, Google Docs

Prima di pagare qualcosa, controlla cosa c'è già sul tuo computer. Tre opzioni gratuite integrate coprono molto terreno.

Windows · Win + H

Listening…

macOS · Dictation

Docs · Voice typing

Click to speak
La dettatura già presente sul tuo computer, in due varianti — nessuna installazione necessaria.

Digitazione vocale di Windows

Su Windows 11, premi il tasto con il logo Windows più H in qualsiasi casella di testo e appare una barra di digitazione vocale. È ottima per i messaggi rapidi. Il rovescio della medaglia: ha bisogno di una connessione a internet e di un microfono funzionante per girare, perché il riconoscimento avviene nel cloud. Supporta 43 lingue secondo l'elenco di Microsoft. Se sei offline su un treno, smette di funzionare. C'è una guida completa nel nostro articolo sulla trascrizione vocale su Windows.

Apple Dictation

Su un Mac, attivalo in Impostazioni di sistema, Tastiera, Dettatura, poi avvialo con il tasto del microfono o la scorciatoia che hai scelto. La versione attuale trascrive testi di qualsiasi lunghezza e si ferma solo dopo 30 secondi di silenzio, non dopo un limite di tempo fisso. Su Apple Silicon può elaborare la tua voce direttamente sul dispositivo. Per le note brevi è gratuito e va benissimo; la configurazione più approfondita la trovi in trascrizione vocale su Mac.

Digitazione vocale di Google Docs

Apri un documento Google in Chrome, Edge o Safari, fai clic su Strumenti, poi su Digitazione vocale, e appare una casella con il microfono. Supporta oltre 100 lingue e varianti regionali. Il limite invalicabile è proprio lì nel nome: scrive solo dentro Google Docs e Presentazioni. Non scriverà la tua email, il tuo Slack o il tuo codice.

Il modo onesto di leggere queste tre: sono strumenti veri, non demo, e per una larga fetta di persone sono la fine della ricerca. Dove si fermano è prevedibile. La Digitazione vocale di Windows muore nel momento in cui perdi il segnale. La Digitazione vocale di Google Docs non esce mai dal documento. Apple Dictation è eccellente su un Mac e assente ovunque altrove. Se il tuo lavoro rientra entro quei confini, hai finito. Chiudi questa scheda e premi il tasto. La categoria a pagamento esiste per il lavoro che non ci rientra: dettatura tutto il giorno, offline su un aereo, ogni app invece di una sola, e audio che deve restare sul tuo disco.

Quando saltare un'app dedicata e usare quella integrata

Ecco la parte che la maggior parte degli articoli sui migliori software salta. Se invii messaggi brevi — un SMS di 30 parole, una rapida risposta su Slack — la dettatura gratuita già presente sul tuo computer è tutto ciò che ti serve. La Digitazione vocale di Windows (tasto Windows + H) e Apple Dictation sono gratuite, sono integrate e funzionano. Non installare né pagare nulla per scrivere una sola frase. Un'app dedicata inizia a guadagnarsi il suo posto quando detti spesso, hai bisogno che funzioni offline su un aereo, la vuoi in ogni app e non solo in una, oppure ci tieni che le tue parole restino sul tuo dispositivo. Al di sotto di quella soglia, la noiosa verità è che possiedi già lo strumento giusto.

Quanto costa Whisper by Remskill

Whisper by Remskill è gratuito per ogni utente che ha effettuato l'accesso, per l'intera pipeline locale: Whisper locale, Parakeet, rifinitura AI basata su Ollama, cronologia, tasto di scelta rapida personalizzato, download dei modelli, senza alcun metodo di pagamento necessario per registrarsi. Whisper Pro aggiunge la superficie Cloud: trascrizione cloud OpenAI, miglioramento AI nel cloud e ricerca web vocale tramite la tua chiave OpenAI. La modalità Cloud ti addebita i costi direttamente tramite OpenAI; noi non tratteniamo nulla. I piani attuali e la prova Pro sono nella pagina dei prezzi. Non ti citerò numeri qui; la pagina lo fa meglio di quanto possa fare un paragrafo.

Approfondimenti

Un mio parente ha scagliato una cuffia dall'altra parte della stanza nel 1999 perché la dettatura era un lavoro di 45 minuti che produceva spazzatura. La cuffia è sopravvissuta all'esperimento. Venticinque anni dopo quel lavoro è scomparso. Premi un tasto e parli, e le parole compaiono. L'unica vera decisione rimasta è quale strumento usare, e per molte persone la risposta giusta è già sul loro computer, spenta, in attesa. I miei figli non sapranno mai che un tempo era difficile, che è poi l'obiettivo, anche se rende la storia meno interessante a tavola.

Prova prima quello che già possiedi

Se finisce lo spazio, scarica Whisper e scegli il motore che si adatta al tuo modo di lavorare.

Gratuito per gli utenti che hanno effettuato l'accesso, sull'intera pipeline locale. Nessuna carta alla registrazione.

Foto di Denys Medvediev

Denys Medvediev

Sono quello che legge le nostre email di assistenza, molto probabilmente dettando le risposte.