Confronto
Alternativa alla digitazione vocale di Google: detta ovunque
La digitazione vocale di Google resta dentro Google Docs. Ecco il confronto onesto, fianco a fianco, con un'app di dettatura desktop che scrive ovunque si trovi il cursore, e una risposta sincera su quando lo strumento gratuito integrato è ancora la scelta giusta.
Ultimo aggiornamento: giugno 2026

La migliore alternativa alla digitazione vocale di Google è un'app di dettatura desktop che scrive in ogni campo di testo, non solo in Google Docs. Whisper by Remskill gira su Windows e Mac, trascrive offline con modelli di IA locali gratuiti, punteggia automaticamente e incolla il testo ovunque si trovi il cursore: email, Slack, Word o qualsiasi browser.
Martedì mattina, un'email a un'insegnante di 80 parole da inviare prima di accompagnare i bambini a scuola. Avevo la digitazione vocale aperta in Google Docs, ho dettato tre paragrafi ordinati, sono passato a Gmail per scrivere la risposta vera e mi sono ritrovato a parlare davanti a una finestra di composizione che non ascoltava affatto. La digitazione vocale di Google ha una sola regola: resta nel documento. Il microfono vive nel menu Strumenti di Docs e non ti segue fuori.
Così detti in una scheda, copi, passi a un'altra, incolli, sistemi la punteggiatura che hai dimenticato di pronunciare ad alta voce e invii. Quella piccola staffetta è tutta la ragione per cercare un'alternativa. La scelta di questa pagina è semplice: tenere lo strumento gratuito che vive dentro una sola app, oppure passare a una dettatura che segue il cursore ovunque.
Ecco il punto debole: la digitazione vocale di Google scrive nei documenti di Google Docs e nelle note del relatore di Slides, ma la tua giornata di scrittura non si ferma lì. Nel frattempo la dettatura desktop è cresciuta: i modelli di IA locali ora girano su un portatile qualunque, ripuliscono il tuo modo di esprimerti mentre vai avanti e non inviano mai l'audio da nessuna parte.
Questo confronto mette la digitazione vocale di Google accanto a Whisper by Remskill, l'app di dettatura desktop che sviluppo io, su cinque assi: dove scrivono, punteggiatura, lingue, privacy e comportamento offline. Alla fine saprai quale si adatta al tuo modo di scrivere. Se la risposta onesta è "resta con Google", la sezione verso il fondo lo dice con parole chiare. Detto io stesso gran parte di ciò che scrivo, comprese le risposte di assistenza, quindi questo nasce dall'uso quotidiano, non da una scheda di funzionalità.
Cosa fa bene la digitazione vocale di Google, e dove si ferma
Prima i meriti. La digitazione vocale di Google è gratuita con un account Google, non richiede alcuna installazione e funziona nelle ultime versioni di Chrome, Edge e Safari. Dentro un documento Docs, o nelle note del relatore e nei sottotitoli di Slides, il riconoscimento è discreto e l'elenco delle lingue è lungo. Se scrivi tutto in Docs, vale ciò che dà, e la nostra guida alla digitazione vocale di Google Docs spiega la configurazione nel dettaglio.
Anche i limiti sono altrettanto concreti. La punteggiatura è manuale: dici "punto", "virgola", "punto interrogativo", "a capo". E la punteggiatura non è disponibile in tutte le lingue. I comandi di modifica e formattazione funzionano solo in inglese, e solo quando sia la lingua dell'account sia quella del documento sono in inglese. (Le note del relatore di Slides hanno la digitazione vocale ma nessun comando vocale. Non so nemmeno io perché.)
E poi il confine da cui è nato questo articolo: la funzione esiste dentro due superfici di Google e da nessun'altra parte. Gmail, Slack, il tuo CRM, il tuo editor di codice, un modulo web: silenzio. Niente di tutto questo è un difetto. È una funzione gratuita che fa esattamente ciò che la sua pagina di aiuto dichiara, niente di più. La domanda è se la tua scrittura entri in quella scatola. E quando smette di ascoltare a metà frase, di solito è il microfono, non tu: le nostre soluzioni per la digitazione vocale di Google Docs coprono le cause più comuni.
Un'alternativa alla digitazione vocale che funziona in ogni app
Whisper fa la scommessa opposta: la dettatura appartiene al sistema operativo, non a un singolo sito. Premi una scorciatoia: Ctrl+Space su Windows, oppure Command+Option tenuti premuti su Mac come push-to-talk. Parli. Rilasci. Il testo arriva ovunque si trovi il cursore: un'email, una finestra di chat, una cella di foglio di calcolo, un messaggio di commit. Non c'è alcun passaggio di copia, perché non esiste un "documento sorgente" da cui copiare.
L'argomento della velocità è semplice aritmetica. La dettatura va a circa 145 parole al minuto contro le 40 della digitazione: chiamala una differenza di 3,6 volte. Su un MacBook Air M1 con il modello inglese small, l'intervallo tra il rilascio del tasto e la comparsa del testo è di 1,4 secondi.
Sotto il cofano scegli uno di tre percorsi, e l'app non sceglie al posto tuo. La modalità cloud si collega a OpenAI con la tua chiave API e usa gpt-4o-mini-transcribe o gpt-4o-transcribe. Parakeet, il motore locale di NVIDIA, gira 5-10 volte più veloce dei modelli Whisper su CPU e copre l'inglese più 24 lingue europee. E i modelli locali open-source Whisper vanno da un modello inglese da 140 MB al Large v3 da 3 GB. L'app è disponibile per Windows e per i Mac con Apple Silicon.
Digitazione vocale di Google vs Whisper, fianco a fianco
I criteri, scelti prima della tabella: dove scrive lo strumento, in cosa gira, punteggiatura, comandi vocali, copertura linguistica, comportamento offline e struttura del prezzo. Sono le sette cose che hanno deciso per me quando usavo ancora il microfono di Docs. La colonna Google viene dalla pagina di aiuto di Google; la colonna Whisper viene dal codice sorgente dell'app, che da qui posso vedere.
| Digitazione vocale di Google | Whisper | |
|---|---|---|
| Dove scrive | Documenti Docs, note del relatore e sottotitoli di Slides | Qualsiasi campo di testo sul tuo computer |
| Gira in | Ultime versioni di Chrome, Edge, Safari | App desktop, Windows + macOS (Apple Silicon) |
| Punteggiatura | Pronunciata ad alta voce; non disponibile in tutte le lingue | Aggiunta dalla rifinitura IA |
| Comandi vocali | Solo inglese, lingua dell'account + del documento entrambe in inglese | Parola chiave "Hey whisper" più preset personalizzati |
| Lingue | Elenco lungo, con limiti di punteggiatura per lingua | 90+ sui modelli multilingue Whisper, 25 su Parakeet, build .en solo inglese |
| Offline | Funzione del browser; l'uso offline non è documentato | La modalità locale funziona senza alcuna connessione |
| Struttura del prezzo | Gratuita con un account Google | Modalità locale gratuita; funzioni cloud a pagamento — vedi i prezzi |
Il verdetto coincide con il primo paragrafo: Whisper è la scelta nel momento in cui la tua scrittura esce da Google Docs. La digitazione vocale di Google resta la risposta giusta per chi non la fa mai uscire. Quel caso ha la sua sezione qui sotto, e lo dico sul serio.
Digitazione vocale online vs digitazione vocale sul tuo desktop

"Digitazione vocale online" il più delle volte significa un sito che apri in una scheda: una pagina gratuita con un pulsante microfono che trascrive in una casella di testo. Questi strumenti si appoggiano al motore di riconoscimento vocale del browser, e la documentazione della Web Speech API di MDN è netta su come funziona: "Il tuo audio viene inviato a un servizio web per l'elaborazione del riconoscimento, quindi non funzionerà offline." La stessa pagina indica i due costi: la privacy, perché la tua voce lascia la macchina, e l'affidabilità, perché senza connessione non c'è trascrizione.
Per una nota occasionale, una pagina di digitazione vocale online va benissimo. Il dazio si fa sentire con la ripetizione: ogni dettatura finisce con seleziona, copia, cambia scheda, incolla. Una volta ho dettato una lista della spesa nella scheda sbagliata e l'ho incollata in un foglio di budget. Per una decina di secondi, le proiezioni del terzo trimestre includevano "yogurt quelli piccoli, non quelli grandi". Uno strumento desktop elimina tutta questa categoria di incidenti perché il testo comincia dove finisce: al tuo cursore. E quando il microfono del browser fa i capricci, la soluzione vive nelle impostazioni del browser, che è un pomeriggio a sé. Abbiamo scritto le soluzioni per la dettatura su Chrome dopo che in abbastanza ce l'hanno chiesto.
Punteggiatura e rifinitura: il dazio di editing che nessuno conta
La verità noiosa è che la trascrizione non è mai stata la parte lenta. È la rifinitura. Con la digitazione vocale di Google pronunci la punteggiatura ("punto", "a capo"), il che funziona, ma ti trasforma in una persona che declama le virgole. Ho provato i comandi per questo articolo, e il mio documento di prova è finito per contenere la parola "virgola" undici volte. L'abitudine ti segue anche a casa: da allora mi è capitato di concludere una frase pronunciata, in una conversazione vera, con "punto".
Whisper, invece, fa passare la trascrizione grezza attraverso una rifinitura IA: grammatica corretta, intercalari rimossi, punteggiatura messa dove serve. In modalità locale gira tramite Ollama; in modalità cloud usa i modelli OpenAI, con gpt-5-mini come rifinitore predefinito. Inizia una frase con "Hey whisper" e l'IA tratta ciò che segue come un'istruzione invece che come testo da scrivere: "Hey whisper, rendi questa risposta cortese ma decisa" è un flusso di lavoro reale, non una demo. La differenza nella sensazione è difficile da sopravvalutare. Uno strumento ti chiede di recitare la formattazione. L'altro ti lascia parlare come una persona e ti restituisce qualcosa che invieresti così com'è.
Privacy: dove va la tua voce
Ecco l'opinione che difenderò: una dettatura che spedisce la tua voce a un server che non controlli è un problema di privacy, e per certi lavori è un ostacolo insormontabile. La digitazione vocale basata su browser funziona inviando l'audio fuori per l'elaborazione. Va bene per una lista della spesa. È un discorso diverso per una bozza di contratto, una cartella clinica o l'email sulla situazione scolastica di tuo figlio.
Ho visto da vicino il lato dei costi di questa lezione. Un team con cui ho lavorato aveva fatto costruire da un consulente un prototipo interno di dettatura IA che chiamava un'API cloud per ogni frase. A fine trimestre il responsabile ha aperto il cruscotto dei costi: una bolletta a cinque cifre, in gran parte un solo team che trascriveva le registrazioni delle riunioni quattro volte perché la logica di retry era troppo zelante. Il consulente ha proposto di ottimizzare il prompt. Il direttore finanziario ha proposto di non pagare un server per ascoltare riunioni di cui esistevano già le note. Avevano ragione entrambi su qualcosa.
La modalità locale di Whisper chiude la questione invece di discuterla: il modello gira sulla tua macchina, niente lascia il dispositivo e non serve alcuna connessione. Stessa scorciatoia, stesso flusso, zero audio in transito.
Quando saltare Whisper e restare con Google
Se ogni parola che detti finisce in un Google Doc, resta con la digitazione vocale di Google. Non costa nulla, è già nel menu Strumenti e dentro Docs fa il suo lavoro: è una combinazione difficile da contestare, e non fingerò il contrario. Lo stesso vale se detti due volte al mese: installare un'app desktop per risparmiarti due copia-incolla è eccessivo, e lo dico da professionista. Whisper si guadagna il posto quando la tua scrittura esce regolarmente dal documento (email, chat, moduli, note), o quando contano la punteggiatura tramite IA, l'uso offline o il tenere l'audio sulla tua macchina. Fino ad allora, lo strumento gratuito integrato è lo strumento giusto.
Fonti che vale la pena leggere
Quell'email all'insegnante in cima alla pagina alla fine è partita, dettata direttamente in Gmail, senza staffetta attraverso un Doc, con la punteggiatura inclusa senza che io ne dicessi una parola. La scheda con Google Docs è rimasta chiusa. È tutto il confronto in un solo momento: lo strumento gratuito chiede alla tua scrittura di venire da lui, e l'alternativa va dove la scrittura già si trova. Scegli la direzione che corrisponde alla tua giornata.
Prova la scorciatoia alla tua prossima email
Scarica Whisper per Windows o Mac, premi una volta, parla e guarda il testo arrivare dove il cursore già si trova.
La modalità locale è gratuita, funziona offline e non invia mai l'audio da nessuna parte.



