Di Denys Medvediev

Guida

Come scrivere un libro dettando a voce

Si scrive un libro dettando esattamente come lo racconteresti a un amico: prima la scaletta, poi si narra ogni scena in Word, Scrivener o Docs con un tasto rapido globale. Non si corregge mentre si parla. Si sistema dopo.

Ultimo aggiornamento: giugno 2026

Una scrivania da scrittore con un manoscritto, una tazza di caffè e un laptop aperto in una luce soffusa

Per scrivere un libro dettando, un autore prepara prima la scaletta, poi narra ogni capitolo in Word, Scrivener o Google Docs tramite un tasto rapido di dettatura globale. La regola è parlare per tutta la scena senza fermarsi a correggere, per poi fare una revisione a parte. Parlando si raggiungono circa 145 parole al minuto, contro le 40 circa della digitazione.

La prima volta che ho provato a dettare invece di scrivere, mi sono ritrovato a correggere ogni frase non appena appariva sullo schermo. Parlavo, mi fermavo, sistemavo la virgola, riprendevo. Dopo venti minuti avevo quattro paragrafi perfetti e una mandibola dolorante. È esattamente il modo sbagliato di farlo, ed è quello con cui quasi tutti cominciano.

Dettare un libro ha meno a che fare con il software e più con un'abitudine da disimparare. Il tuo editor interiore vuole correggere le parole mentre appaiono. Tutto il vantaggio in velocità del dettato viene proprio dal dire a quell'editor di aspettare. Lascia uscire le parole alla velocità del parlato, errori compresi, e poi sistemale in un passaggio separato. Parlare è circa tre volte e mezzo più veloce che digitare, ma solo se ti lasci andare.

Ecco la parte che la maggior parte delle guide su "detta il tuo romanzo" saltano. Lo strumento conta poco. Un capitolo in Scrivener è una casella di testo, come un Google Doc o un file Word vuoto. La dettatura che incolla al cursore non sa — né le importa — in quale app stai lavorando.

Quindi la vera domanda non è "quale app scrive un libro a voce". Nessuna scrive il libro al posto tuo. La domanda è "come trasformo le parole parlate in manoscritto alla massima velocità per poi correggerle", e la risposta ha tre parti concrete: la dettatura integrata che il tuo computer ha già, un tasto rapido globale che funziona ovunque, e un flusso di lavoro che tiene a bada il tuo editor interiore finché le parole non sono sulla pagina. Spiego tutte e tre, ne configuro una in due minuti, e ti dico quando lo strumento integrato basta e avanza.

Perché gli autori dettano invece di scrivere

I numeri sono la parte facile. La maggior parte delle persone digita circa 40 parole al minuto e ne parla circa 145. Sono circa tre volte e mezzo in più, che su un manoscritto di 90.000 parole fa la differenza tra una bozza che richiede mesi e una che richiede settimane. Ma la velocità grezza non è il vero motivo per cui gli autori lo fanno.

Il motivo più importante è che il parlato è il modo in cui le storie già vivono nella tua testa. Non pensi una scena in paragrafi giustificati; la pensi come qualcuno che la racconta. Dettare ti permette di narrare la prima bozza come se stessi descrivendo il capitolo a un amico al tavolo della cucina, per poi modellarla dopo. La tastiera mette uno strato tra il pensiero e la pagina. La voce rimuove quello strato per il caotico primo passaggio — quello in cui la maggior parte dei libri si inceppa.

C'è anche una ragione fisica, e nessuno la menziona finché i polsi non iniziano a protestare intorno al capitolo dodici. Scrivere un intero libro significa moltissime battute di tasto. Dettare la struttura di base a voce e usare la tastiera solo per le correzioni fini distribuisce il carico durante la giornata. È un vantaggio di comfort e produttività, non una valutazione medica — ma se le ore di digitazione sono ciò che ti rallenta, dettare per riposare le mani parte del tempo è una leva ragionevole da usare.

Il modo più rapido: il tuo computer detta già

Un laptop su una scrivania da scrittore con un microfono, che suggerisce la dettatura vocale integrata

Prima di installare qualsiasi cosa, sappi che il tuo sistema operativo può già farlo, gratuitamente, ed è davvero sufficiente per sessioni brevi. Su Windows, metti il cursore nel tuo manoscritto e premi Tasto Windows + H. Si apre la barra Digitazione vocale, parli, e le parole appaiono dove si trova il cursore — Word, Scrivener, un Google Doc nel browser, qualsiasi cosa. Aggiunge la punteggiatura da solo mentre parli.

Su Mac, abilita la Dettatura nelle Impostazioni di sistema alla voce Tastiera, poi attivala con la scorciatoia che hai impostato lì. Funziona ovunque tu possa digitare e, su Apple Silicon, può elaborare testo generico in locale una volta scaricati i modelli vocali. Dì "virgola", "punto" o "nuovo paragrafo" e punteggia mentre vai.

Il limite per un libro intero è duplice. La Digitazione vocale di Windows passa per i server di Microsoft e richiede una connessione internet, quindi non è un'opzione offline — cosa che conta quando stai scrivendo un manoscritto che preferiresti non inviare da nessuna parte. Entrambi gli strumenti integrati sono ottimizzati per brevi raffiche: un messaggio, un'email, un paragrafo. Tendono a scadere, a fraintendere nomi di personaggi insoliti e non offrono modo di insegnare loro il tuo vocabolario inventato. Su una bozza di 80.000 parole queste piccole frizioni si sommano. È lì che uno strumento dedicato inizia a guadagnarsi il suo posto.

Configura Whisper in due minuti (Windows o Mac)

Uno strumento di dettatura globale risolve i due limiti degli strumenti integrati in una volta: funziona offline e funziona allo stesso modo in qualsiasi app di scrittura tu apra. Hai bisogno di un Mac con Apple Silicon o un PC con Windows 10 o versione successiva, un microfono funzionante e il tuo manoscritto aperto in Word, Scrivener, Google Docs o qualunque programma usi per scrivere. L'intera pipeline locale è gratuita per qualsiasi account registrato, senza richiedere un metodo di pagamento all'iscrizione. Ecco la sequenza.

Passaggio 1 — Installa Whisper e accedi.

Scarica dalla pagina di download, installa e crea un account gratuito. Nessuna carta. L'intera pipeline di trascrizione locale si apre subito.

Saprai che ha funzionato quando l'icona dell'app nella barra delle applicazioni appare e la procedura guidata di configurazione propone di scegliere un modello.

Passaggio 2 — Scegli un percorso di trascrizione.

L'app non sceglie per te. Hai tre opzioni: Cloud (OpenAI, con la tua chiave), Local Parakeet o Local Whisper. Per un manoscritto privato, inizia in locale — ne parlo tra due sezioni.

Saprai che ha funzionato quando un modello termina il download e appare come pronto.

Passaggio 3 — Conferma il tuo tasto rapido.

Su Windows il predefinito è Ctrl+Space, su Mac è Command+Option tenuto premuto come push-to-talk. Su Mac, concedi il permesso di Accessibilità quando richiesto; senza di esso, l'incolla-al-cursore non può raggiungere altre app. Entrambi i tasti sono modificabili nelle Impostazioni se confliggono con qualcosa che usi già.

Saprai che ha funzionato quando una registrazione di prova si incolla in qualsiasi campo di testo.

Passaggio 4 — Metti il cursore nel tuo manoscritto e parla.

Apri il tuo capitolo, clicca dove va il prossimo paragrafo, tieni premuto il tasto rapido, pronuncia qualche frase, rilascia. La trascrizione appare dove si trova il cursore, nel documento.

Saprai che ha funzionato quando le tue frasi parlate si trovano nel manoscritto come testo.

Whisper
La vera app desktop Whisper nella schermata delle impostazioni, con i pannelli Trascrizione e IA aperti.

La parte lenta è il download del modello, non la configurazione. Tutto il resto sono i quattro passaggi sopra. Una volta avviato, scrivere un capitolo smette di essere un compito di digitazione e diventa un compito di narrazione — che è esattamente il punto.

Se hai già configurato la dettatura su Windows o su Mac in precedenza, è la stessa memoria muscolare puntata al tuo manoscritto.

Prima la scaletta, poi detta scena per scena

La dettatura premia lo scrittore che sa dove sta andando la scena prima di aprire bocca. Il flusso di lavoro che funziona davvero è noioso e ripetibile: prima la scaletta, poi si narra il libro a pezzi, poi si corregge dopo. Salta la scaletta e ti ritroverai a narrare in vicoli ciechi.

Inizia ogni sessione con qualche punto elenco per la scena — chi c'è, cosa cambia, dove finisce. Non devono essere dettati; scrivili, sono l'impalcatura. Poi metti il cursore alla riga vuota successiva, tieni premuto il tasto rapido e narra la scena come la racconteresti ad alta voce. Una piccola capsula appare mentre parli così sai che sta ascoltando, e Whisper mantiene una breve coda dopo che rilasci in modo che l'ultima parola non venga tagliata.

Cancel
La sovrapposizione di registrazione: una piccola capsula che appare mentre parli, così sai che Whisper sta ascoltando.

La regola che conta più delle altre: non correggere mentre parli. Nel momento in cui ti fermi a sistemare una virgola o a riformulare una frase, sei uscito dalla scena e sei tornato in modalità editor, e le due non condividono la stessa marcia. Parla fino in fondo — una scena, una sezione, un momento — e solo allora guarda lo schermo. Detta in sedute da dieci o quindici minuti, nomina i tuoi personaggi e i luoghi sempre allo stesso modo in modo che la trascrizione rimanga coerente, e lascia stare i periodi sciolti e la punteggiatura mancante. Il passaggio di pulizia esiste precisamente perché il passaggio di scrittura possa essere veloce e imperfetto. Metti le parole sulla pagina alla velocità del parlato; modellale dopo, come faresti scrivere più velocemente con la voce in qualsiasi altro contesto.

Locale o cloud: quale modalità per un manoscritto

Per una bozza di libro, prova prima la modalità locale. Un manoscritto è il documento di cui la maggior parte degli autori è genuinamente gelosa — incompiuto, inedito, a volte sotto contratto. È una scelta strana tenerlo sul proprio disco e poi instradare la voce attraverso un cloud per arrivarci. Se il tuo Mac è Apple Silicon o il tuo PC è degli ultimi anni, la modalità locale gestisce un'intera sessione di scrittura senza lamentarsi, e il cloud diventa la via di fuga piuttosto che l'opzione predefinita.

Ecco come differiscono i tre percorsi, perché l'app ti fa scegliere e preferisco che tu scelga bene:

  • Local ParakeetIl motore TDT di NVIDIA, circa 600 MB, e l'opzione locale più veloce — da 5 a 10 volte più veloce di Whisper su CPU. Copre l'inglese più altre 24 lingue europee, 25 in totale. Nessuna traduzione in inglese, nessun vocabolario personalizzato. Se scrivi in inglese o in un'altra lingua europea e i nomi dei tuoi personaggi sono comuni, questa è la scelta rapida e completamente offline.
  • Local Whisperpiù lento di Parakeet sulla stessa macchina, ma le versioni multilingue coprono 99 lingue e possono tradurre in inglese, e supporta il vocabolario personalizzato — utile quando il tuo libro è pieno di nomi inventati, luoghi e termini che puoi insegnargli a scrivere correttamente. Le versioni solo inglese sono solo inglese, non 99. Il modello inglese predefinito è di circa 480 MB.
  • Cloud (OpenAI, BYOK)massima precisione e accesso al web, con la propria chiave OpenAI fatturata direttamente da OpenAI. La trascrizione usa gpt-4o-mini-transcribe per impostazione predefinita. Richiede internet, quindi è l'unico percorso che lascia la tua macchina. La superficie Cloud fa parte di Whisper Pro.

La verità scomoda è che per il tipo di prosa che riempie una prima bozza, la modalità locale è più che sufficiente. Entrambi i motori locali girano interamente sulla tua macchina senza inviare nulla a un server, il che è esattamente quello che vuoi per un manoscritto. Se il tuo libro fa affidamento su molto vocabolario inventato — nomi fantasy, luoghi fittizi, un termine tecnico di fantasia che usi quaranta volte — il vocabolario personalizzato di Local Whisper è la caratteristica decisiva, perché impedisce alla trascrizione di indovinare lo stesso nome in cinque modi diversi. Il Cloud guadagna il suo posto quando vuoi la massima precisione in una sessione di registrazione difficile. Per la scrittura quotidiana, inizia in locale e ricorri al cloud solo quando il locale ti lascia insoddisfatto.

Fai il passaggio di pulizia dopo che le parole sono sulla pagina

La dettatura grezza esce come un flusso continuo. Dici "attraversò la stanza non lo guardò aprì semplicemente la finestra ehm e aspettò", ed è la parete non punteggiata che qualsiasi motore vocale ti consegna. Va bene — è il patto che hai fatto per la velocità del parlato. La pulizia è un passaggio separato, ed è lì che la bozza ritorna prosa.

La Digitazione vocale di Windows aggiunge la punteggiatura mentre parli, e macOS Dictation gestisce le basi quando dici "virgola" o "punto". Per una pulizia più pesante — eliminare le "ehm", sistemare i periodi sciolti, trasformare un paragrafo parlato in qualcosa che terresti davvero nel manoscritto — Whisper può eseguire un passaggio IA. Dì la frase di attivazione "Hey whisper" e il testo viene migliorato prima di essere incollato. Su un modello locale funziona tramite Ollama; in modalità cloud è gpt-5-mini per impostazione predefinita.

Thinking...
Grezzo

attraversò la stanza non lo guardò aprì semplicemente la finestra ehm e aspettò che il rumore della strada riempisse il silenzio

Pulito

Attraversò la stanza. Non lo guardò; aprì semplicemente la finestra e aspettò che il rumore della strada riempisse il silenzio.

Un limite onesto, perché agli autori viene venduto il contrario. Il passaggio IA sistema la punteggiatura e le parole di riempimento. Non riscrive la tua prosa, non corregge la continuità e non decide se una scena funziona. Non si accorgerà che il colore degli occhi del tuo protagonista è cambiato tra i capitoli, e non dovrebbe — è il tuo lavoro, ed è il lavoro che rende il libro tuo. Tratta il passaggio di pulizia come un correttore che sistema la trascrizione, non come un co-autore. Il lavoro vocale ti dà una bozza rapida e grezza; la scrittura vera — le scelte, la struttura, la frase che colpisce — resta con te.

Lo stesso ritmo di parla-poi-correggi va oltre la narrativa — l'abitudine di scrittura per testi lunghi è identica sia che tu stia scrivendo un romanzo sia un capitolo di tesi, perché il flusso di lavoro è lo stesso: scaletta, narra la sezione senza fermarti, poi correggila in un passaggio a parte.

Quando lo strumento integrato basta e avanza

Due frecce su un cartello stradale che puntano in direzioni diverse, a illustrare la scelta di uno strumento

A volte lo strumento gratuito già sul tuo computer è la scelta giusta, e fingere il contrario sarebbe disonesto. Se detti solo in brevi raffiche — una battuta di dialogo che ti è venuta in mente, una nota a te stesso nella scaletta, un paragrafo tra una riunione e l'altra — il sistema operativo lo copre gratis. Tasto Windows + H su Windows, la scorciatoia di Dettatura su Mac. Non installare un'app per catturare una singola frase.

C'è anche un compito che assomiglia alla dettatura di un libro ma non lo è, e vale la pena nominarlo per non scegliere lo strumento sbagliato. Trascrivere un file audio registrato — un'intervista che hai registrato, un memo vocale di te stesso che pensa ad alta voce durante una passeggiata, la registrazione di un evento letterario — è un compito diverso dalla dettatura dal vivo. La dettatura trascrive le parole che pronunci nel microfono adesso; non è costruita per elaborare una registrazione multi-speaker dopo i fatti. Per quello, usa un servizio fatto per la trascrizione di file audio. La dettatura dal vivo e la trascrizione di audio registrato sono due lavori diversi, e uno strumento eccellente per uno è di solito mediocre per l'altro.

Ricorri a uno strumento dedicato e globale quando gli strumenti integrati iniziano a far male: capitoli interi invece di raffiche, privacy offline per un manoscritto inedito, vocabolario inventato che vuoi scritto in modo coerente, o semplicemente voler avere un tasto rapido che si comporta allo stesso modo in Scrivener, Word e nella tua email. Al di sotto di quella soglia, usa quello che è gratuito. Non ti dirò di installare un software per dettare la lista della spesa.

Se il tuo progetto è accademico invece che narrativo, la stessa logica capitolo per capitolo si applica nel dettare una dissertazione, dove il vocabolario inventato diventa gergo di settore e l'argomento della privacy diventa ancora più stringente.

Nessuna app scrive il libro. Non lo farà mai, e nei giorni in cui la scena non vuole venire, è una piccola grazia — non c'è software da incolpare, solo il lavoro. Ciò che la dettatura cambia è la velocità del caotico primo passaggio: scaletta, narrazione, pulizia. Ho scritto la maggior parte di questa guida parlando allo schermo e ho guardato le parole solo quando erano tutte sulla pagina. I primi tre paragrafi che ho cercato di perfezionare mentre parlavo sono ancora i tre peggiori che ho scritto.

Narra il tuo prossimo capitolo sulla pagina

Prepara la scaletta della scena, tieni premuto il tasto rapido, narrala fino in fondo, rilascia. La bozza appare nel manoscritto dove si trova il cursore — e in qualsiasi altra app.

Modalità locale gratuita per qualsiasi account registrato. Nessuna carta necessaria per iniziare.

Foto di Denys Medvediev

Denys Medvediev

Sono io che leggo la nostra email di supporto, molto probabilmente dettando le risposte.

Ulteriori letture