Guida
Ditta la tua tesi
Una tesi è troppo lunga per superare la pagina bianca digitando. Parla la prima bozza: premi un tasto rapido, detta un capitolo e le parole appaiono in Word, Scrivener o LaTeX. Poi correggi. La modalità locale è gratuita e funziona offline.
Ultimo aggiornamento: giugno 2026

Per dettare la tua tesi, installa uno strumento di dettatura a livello di sistema, premi un tasto rapido e parla la bozza nell'editor che usi normalmente — Word, Scrivener, Google Docs o un file LaTeX. Il testo trascritto viene incollato dove si trova il cursore. Un motore locale funziona completamente offline ed è gratuito per qualsiasi account registrato; poi correggi da tastiera.
La pagina più difficile di una tesi è quella ancora vuota. Hai letto gli articoli, hai l'argomentazione in testa, e il cursore lampeggia mentre cerchi come iniziare una frase che hai riscritto mentalmente nove volte. Ho visto amici dottorandi perdere intere serate davanti a quel cursore. Il pensiero era già fatto. Scrivere era il muro.
Parlare è un modo per aggirare il muro. Puoi dire una versione approssimativa di un paragrafo nel tempo che ci vuole a digitarne la metà, e una versione approssimativa sulla pagina è qualcosa che puoi sistemare. Una pagina bianca no. Dettare la prima bozza di un capitolo non significa scrivere più velocemente — significa tirare fuori la versione brutta perché quella buona abbia qualcosa con cui confrontarsi.
Ecco la parte che la maggior parte delle guide sulla dettatura per tesi salta. Il tuo word processor è solo un campo di testo. Lo è anche l'editor di Scrivener, lo è un Google Doc, lo è il corpo di un file `.tex` nel tuo editor di codice. Uno strumento di dettatura che incolla al cursore non si preoccupa di quale stai usando. Non c'è nessun plugin da collegare al tuo gestore di riferimenti bibliografici, nessuna speciale "modalità tesi".
Quindi la vera domanda non è "quale app supporta la dettatura". È "quale strumento di dettatura funziona sopra l'app in cui scrivo già", e per un lavoro che dura anni, spesso senza finanziamenti, due cose contano più che per una semplice email: deve funzionare offline e su un piano locale gratuito, e deve imparare i nomi e il gergo del tuo campo. Ti guiderò nel flusso di lavoro capitolo per capitolo, lo configurerò in due minuti, e ti dirò qual è il lavoro da affidare a uno strumento diverso.
Perché i dottorandi parlano la prima bozza

Il compito non è "scrivere parole più in fretta". Il compito è "smettere di fissare lo schermo". Un capitolo di tesi è tra le ottomila e le dodicimila parole, e la prima versione di ogni sezione sarà goffa indipendentemente da come la produci. L'unica domanda è se produrrai una bozza goffa in un pomeriggio parlando, o non riuscirai a produrre una versione pulita per una settimana digitando. Parlare vince perché è allergico al perfezionismo. Non puoi correggere una frase a metà respiro come puoi farlo a metà di una battitura, quindi le parole escono e restano fuori, e le sistemi dopo.
C'è un secondo motivo, ed è puramente fisico. Una tesi è la cosa più lunga che la maggior parte delle persone scriverà mai, spesso nell'arco di mesi di sessioni estenuanti, e le mani hanno un'opinione a riguardo. Dettare parte della bozza significa che parte della scrittura giornaliera avviene con le mani lontane dalla tastiera. Non lo presenterò come un'affermazione medica, perché non lo è — è una questione di produttività e comfort, come alzarsi ogni ora. Se l'affaticamento dei polsi è il tuo problema specifico, l'approfondimento su la dettatura come modo per riposare le mani tratta onestamente il lato produttività. Per la tesi in sé, il punto è più semplice: puoi continuare a scrivere anche nei giorni in cui le tue mani preferirebbero che non digitassi.
E la verità banale è che la maggior parte di una tesi non è la prosa finale elegante. È l'impalcatura — il "in questo capitolo argomento", i riassunti di cosa ha trovato un certo autore, i paragrafi di collegamento tra le sezioni. Quella impalcatura è esattamente il tipo di testo che viene fuori bene a voce e si legge altrettanto bene di quanto l'avresti scritto digitando. Tieni la tastiera per le frasi che devono davvero essere precise.
Premi un tasto rapido, parla, il testo arriva nel tuo editor
Il meccanismo è banale, che è il più alto complimento che posso fargli. Premi un tasto rapido, parli, lo rilasci, e la trascrizione viene incollata al cursore in qualsiasi finestra attiva — un'intestazione in Word, un documento in Scrivener, un paragrafo in un Google Doc, un blocco di commento nel tuo file LaTeX. Whisper mantiene una breve coda dopo che rilasci il tasto, così l'ultima parola di una frase lunga non viene tagliata. Poiché incolla nel cursore del sistema operativo, il tuo editor è semplicemente "il campo di testo che si trova davanti".
È la parte che i tutorial complicano troppo. Non c'è nessuna integrazione da installare in Word, nessun add-on per Scrivener, nessun token da incollare nel tuo gestore di riferimenti. Il tuo cursore è nel documento, parli, le parole appaiono. Una piccola capsula appare mentre parli, così sai che sta ascoltando e non ignorandoti:
Il tasto rapido è l'unica cosa che vale la pena impostare prima di iniziare una sessione lunga. Su Windows è Ctrl+Space; su Mac è Command+Option, un push-to-talk da tenere premuto mentre parli e rilasciare per fermarti. Entrambi sono modificabili nelle Impostazioni in caso di conflitti — e in un setup di scrittura pieno di scorciatoie LaTeX e hotkey del gestore bibliografico, qualcosa di solito si sovrappone. Se hai già configurato la dettatura su Windows o su Mac, è lo stesso gesto muscolare, puntato sulla tua tesi.
Configuralo in due minuti (Windows o Mac)
Hai bisogno di un Mac con Apple Silicon o un PC Windows 10 o più recente, un microfono funzionante e il tuo editor aperto — Word, Scrivener, una scheda del browser con Google Docs o il tuo editor LaTeX. L'intero sistema locale è gratuito per qualsiasi account registrato, senza che venga richiesto un metodo di pagamento all'iscrizione, il che conta quando il lavoro richiederà anni e la situazione dei finanziamenti è quella che è. Ecco la sequenza.
Passo 1 — Installa Whisper e accedi.
Scarica dalla pagina di download, installa e crea un account gratuito. Nessuna carta. L'intero sistema di trascrizione locale si apre subito.
Saprai che ha funzionato quando l'icona dell'app appare nella barra delle applicazioni e la procedura guidata propone di scegliere un modello.
Passo 2 — Scegli una modalità di trascrizione.
L'app non sceglie per te. Hai tre opzioni: Cloud (OpenAI, chiave tua), Local Parakeet o Local Whisper. Per una bozza lunga offline con termini specifici del settore, local Whisper è quello giusto — maggiori dettagli due sezioni più avanti.
Saprai che ha funzionato quando un modello finisce di scaricarsi e risulta pronto.
Passo 3 — Conferma il tuo tasto rapido.
Su Windows il predefinito è Ctrl+Space, su Mac Command+Option tenuto premuto come push-to-talk. Su Mac, concedi il permesso di Accessibilità quando richiesto; senza di esso, l'incollaggio al cursore non può raggiungere il tuo editor.
Saprai che ha funzionato quando una registrazione di prova viene incollata in qualsiasi campo di testo.
Passo 4 — Posiziona il cursore nella bozza e parla.
Apri il capitolo, clicca dove va il prossimo paragrafo, tieni premuto il tasto rapido, di' alcune frasi, rilascia. La trascrizione appare al cursore, nel documento.
Saprai che ha funzionato quando il paragrafo parlato compare nel capitolo come testo.
La parte lenta è il download iniziale del modello, non la configurazione. Tutto il resto sono i quattro passi sopra. Una volta in funzione, aprire un capitolo smette di essere "trovare l'energia per digitare" e diventa "trovare l'energia per parlare", che in un giovedì stanco è un ostacolo molto più basso.
Abbozzare un capitolo a voce, poi insegnargli il tuo gergo
Il flusso di lavoro che funziona per i testi lunghi è: parla a blocchi, correggi in passaggi. Non cercare di dettare un capitolo rifinito dall'inizio alla fine — è la mentalità della digitazione con un microfono in mano. Invece, apri la scaletta, posiziona il cursore sotto un'intestazione e di' la versione approssimativa di quella sezione ad alta voce, come la spiegheresti a un collega davanti a un caffè. Una sezione, qualche centinaio di parole, rilascia il tasto, passa all'intestazione successiva. Stai riempiendo lo scheletro, non scolpendo la statua. La scultura è la revisione, e viene dopo con la tastiera.
Ciò che fa la differenza nella dettatura accademica è il vocabolario. Una tesi è piena di parole che nessun trascrittore generico si aspetta — i metodi che citi, le sostanze chimiche, i costrutti o i teoremi del tuo campo, e soprattutto i cognomi. "Foucault", "Nyquist", "Bourdieu", il nome di un co-autore polacco o coreano scritto esattamente come la citazione lo richiede. Un motore generico farà un'ipotesi, e la farà sbagliata, come il correttore automatico che storpia un nome che non ha mai visto. È qui che local Whisper guadagna il suo posto: supporta un vocabolario personalizzato — gli fornisci un elenco di hotword, i nomi degli autori e i termini del campo che usi continuamente, e favorisce la trascrizione corretta. Parakeet, il motore locale più veloce, non supporta le hotword, quindi per una bozza ricca di gergo Whisper è la scelta locale. Anche la modalità Cloud è forte in termini di accuratezza, ma la funzione del vocabolario personalizzato è specificamente una caratteristica di local Whisper.
Configura quell'elenco una volta all'inizio della tesi e ti ripaga per due anni. Aggiungi i venti o trenta termini e nomi che ricorrono nel tuo lavoro, e la trascrizione continua che ricevi smette di richiedere un trova-e-sostituisci per "Burdieu" ad ogni paragrafo. Correggerei ancora qualcosa — nessuno strumento scrive correttamente ogni nome al primo tentativo — ma stai correggendo l'errore occasionale invece di riscrivere ogni termine tecnico che usi.
Locale o cloud per un lavoro pluriennale e riservato
Per una tesi, io partirei dal locale, e non solo per principio. Ricerca non pubblicata, un'argomentazione incompiuta, materiale di interviste che sei tenuto a mantenere riservato — niente di tutto ciò ha motivo di viaggiare verso il server di qualcuno perché tu possa digitarlo con la voce. Un motore locale gira interamente sul tuo computer senza inviare nulla da nessuna parte, con lo stesso ragionamento alla base della scelta di un sistema di riconoscimento vocale privato e offline in primo luogo. Non ha costi al minuto né richiede internet, il che conta quando la scrittura avviene in uno scantinato di biblioteca con Wi-Fi traballante nel corso di qualche anno senza finanziamenti. Ecco come differiscono le tre opzioni, perché l'app ti chiede di scegliere.
L'app non sceglie per te, quindi scegli pensando alla tua bozza concreta:
- Local Parakeet — Il motore TDT di NVIDIA, circa 600 MB, è l'opzione locale più veloce — da 5 a 10 volte più veloce di Whisper su CPU. Inglese più 24 altre lingue europee, 25 in totale. Nessuna traduzione in inglese e nessun vocabolario personalizzato, quindi non è la scelta giusta per una tesi ricca di gergo. Ottimo per bozze veloci in inglese semplice quando i termini sono comuni.
- Local Whisper — più lento di Parakeet sullo stesso computer, ma copre 99 lingue, può tradurre in inglese e, cosa fondamentale, supporta vocabolario personalizzato e hotword per i termini del tuo campo e i nomi citati. Per una tesi piena di cognomi e gergo, questo è il motore locale da usare. Il modello inglese predefinito è circa 480 MB; i modelli più grandi scambiano velocità per precisione.
- Cloud (OpenAI, BYOK) — massima precisione grezza e accesso al web in tempo reale, usando la tua chiave OpenAI fatturata direttamente da OpenAI. La trascrizione usa gpt-4o-mini-transcribe per impostazione predefinita. Richiede internet, quindi è l'unica modalità che lascia il tuo computer — va bene per le sezioni non sensibili, meno ideale per il materiale riservato. La modalità Cloud fa parte di Whisper Pro.
La risposta onesta è che per la maggior parte di una tesi, local Whisper con un buon elenco di vocabolario è più che sufficiente, non costa nulla e rimane sul tuo laptop. Il Cloud guadagna il suo posto quando vuoi la massima precisione su una registrazione difficile o hai bisogno di un'informazione dal web a metà frase. Per due anni di scrittura riservata, il locale è la scelta predefinita e il cloud è la valvola di sfogo occasionale.
Trasformare un capitolo parlato in prosa presentabile
La dettatura grezza esce come un flusso continuo. Dici "quindi questo capitolo esamina come la nozione di disciplina di Foucault si applica alla sorveglianza nei luoghi di lavoro moderni sulla base del lavoro empirico nel capitolo tre", e quello è il muro non punteggiato che qualsiasi motore vocale ti restituisce. Va bene — è una prima bozza, e le prime bozze devono essere brutte. La pulizia è dove diventa leggibile.
Il Digitazione vocale di Windows aggiunge la punteggiatura mentre parli, e la Dettatura di macOS gestisce la punteggiatura di base quando dici "virgola" o "punto". Per una pulizia più profonda — eliminare gli "ehm", correggere i flussi di coscienza, spezzare una frase senza respiro in tre — Whisper può eseguire un passaggio AI prima che il testo arrivi. Di' la frase di attivazione "Hey whisper" e il testo viene migliorato in entrata. Su un modello locale che gira attraverso Ollama, completamente offline; in modalità cloud è gpt-5-mini per impostazione predefinita. Sistema la meccanica così puoi dedicare il tempo di revisione all'argomentazione, non alle virgole.
quindi questo capitolo esamina come la nozione di disciplina di foucault si applica alla sorveglianza nei luoghi di lavoro moderni sulla base del lavoro empirico nel capitolo tre ehm e i dati delle interviste
Questo capitolo esamina come la nozione di disciplina di Foucault si applica alla sorveglianza nei luoghi di lavoro moderni, basandosi sul lavoro empirico nel Capitolo Tre e sui dati delle interviste.
Ciò che un passaggio AI non farà, e non dovrebbe fare, è la revisione accademica. Non verificherà se la tua citazione supporta l'affermazione, non correggerà una data errata, né noterà che il paragrafo quattro contraddice il paragrafo uno. Quello è compito tuo, ed è il compito vero, e la dettatura non finge altrimenti. La sequenza onesta è: parla la bozza grezza, esegui la pulizia perché la meccanica sia sensata, poi rileggi ogni riga tu stesso con la tastiera e l'ultimo set di commenti del tuo relatore aperto. Lo strumento ti consegna una bozza leggibile un'ora prima. Non ti consegna un'argomentazione difendibile — quella parte è ancora a tuo carico, come è giusto che sia.
Quel ritmo parla-poi-pulisci vale anche oltre la tesi — puoi scrivere più velocemente con la voce nelle email, nelle domande di finanziamento e nelle future lettere di candidatura, tutto con lo stesso tasto rapido.
Quando la dettatura è lo strumento sbagliato

La dettatura abbozza le parole che dici tu. Non è un servizio di trascrizione per le parole che dicono gli altri, e confondere le due cose ti costerà un pomeriggio frustrante. Il disallineamento più comune nel lavoro di ricerca: trasformare un'intervista registrata, un focus group o una sessione sul campo in testo. Quello è un lavoro diverso. Non stai abbozzando — stai trascrivendo una registrazione multi-speaker, spesso con sovrapposizioni, accenti e la necessità di etichette per i parlanti e timestamp. Per questo, rivolgiti a un servizio di trascrizione dedicato per file audio. Un tasto rapido di dettatura dal vivo ha una forma completamente sbagliata; ascolta il tuo microfono adesso, non un MP3 di due ore di martedì scorso.
E per i pezzi davvero brevi, lo strumento giusto è quello gratuito già sul tuo computer. Se stai aggiungendo una nota di una riga al tuo gestore di riferimenti o un commento veloce in un documento condiviso, il tuo sistema operativo è sufficiente. Su Windows, premi Tasto Windows + H e la barra di Digitazione vocale integrata si apre dove si trova il cursore. Il limite: passa per i server Microsoft e richiede internet, quindi non è un'opzione offline, il che conta più del solito per la ricerca riservata. Su Mac, Dettatura ti permette di parlare ovunque tu possa digitare, configurabile in Impostazioni di Sistema sotto Tastiera, e su Apple Silicon il testo generico può essere elaborato sul dispositivo.
Passa a uno strumento dedicato a livello di sistema quando quelli integrati iniziano a limitarti: capitoli lunghi, gergo tecnico che richiede un vocabolario personalizzato, privacy offline per lavoro non pubblicato, o la necessità di un tasto rapido che si comporti allo stesso modo in Word, Scrivener e nel tuo editor LaTeX. Sotto quella soglia, usa quello gratuito, e per l'audio delle interviste usa qualcosa costruito per quello. Non ti dirò di dettare un capitolo di tesi nello stesso strumento che useresti per trascrivere una registrazione — sono due lavori diversi, e fare finta che siano uno solo è come le persone finiscono per essere deluse da entrambi.
Nessun editor ha mai incluso un pulsante "scrivi la mia tesi", e dopo qualche anno nelle trincee smetti di aspettarti che arrivi. Il cursore è l'integrazione: parla nel documento, ottieni una bozza grezza, poi guadagna la versione pulita con la tastiera e molto caffè. Tira fuori la bozza brutta dalla testa e mettila sulla pagina dove puoi combatterci. Il combattimento è il vero lavoro — la dettatura ti porta allo scontro qualche ora prima, che nei giorni in cui la pagina è bianca è tutto ciò che conta.
Porta il prossimo capitolo all'esistenza parlando
Apri la bozza, posiziona il cursore sotto l'intestazione, tieni premuto il tasto rapido e di' la versione approssimativa ad alta voce. Correggila dopo. Una pagina bianca è più difficile di una brutta.
Modalità locale gratuita per qualsiasi account registrato. Nessuna carta richiesta per iniziare.



