Di Denys Medvediev

Guida

Dalla voce al testo in Joplin

L'app desktop di Joplin non ha la dettatura integrata: la sua digitazione vocale è una funzione disponibile solo su Android. La soluzione è uno strumento di sistema: premi un tasto di scelta rapida, parla e la trascrizione viene incollata dove si trova il cursore, in qualsiasi nota di Joplin. Funziona anche la dettatura del tuo sistema operativo, per acquisizioni brevi.

Ultimo aggiornamento: giugno 2026

Un quaderno aperto e una penna accanto a un laptop su una scrivania scura, a evocare la presa di appunti e la dettatura

Dalla voce al testo in Joplin su desktop funziona tramite uno strumento di sistema, non tramite Joplin stesso. La digitazione vocale integrata di Joplin è una funzione disponibile solo su Android; l'app desktop non ne ha alcuna. La soluzione è uno strumento come Whisper: premi un tasto di scelta rapida, parla e la trascrizione viene incollata dove si trova il cursore, in qualsiasi nota di Joplin. Funziona anche la dettatura del sistema operativo, per le note brevi.

Tengo le mie note in Joplin perché mi fido più di una cartella di markdown puro che si sincronizza con uno spazio di archiviazione che controllo io, che del cloud di qualcun altro. L'unica cosa che continuavo a cercare era un modo per parlare dentro una nota invece di scriverla. Così sono andato a caccia dell'impostazione sul mio laptop. L'impostazione non c'è. L'app desktop di Joplin non ha alcun pulsante del microfono e, dopo aver scavato a fondo, sono certo che non ne nasconda nessuno.

Ecco il punto che manda in confusione le persone. Joplin ha davvero la digitazione vocale integrata, ma solo su Android. La sua stessa documentazione per sviluppatori lo dice chiaramente. La gente sente "Joplin ha la digitazione vocale", la cerca sul desktop, non trova niente e dà per scontato di essersi persa un interruttore. Non è così. L'interruttore è sul telefono. La buona notizia: la soluzione per il desktop richiede circa due minuti, funziona completamente offline se vuoi e, come bonus, funziona in ogni altra app che apri.

Ecco la cosa che la maggior parte delle pagine che girano intorno a questa parola chiave non dice apertamente. Una nota di Joplin non è altro che una casella di testo in markdown, esattamente come Gmail o una barra di ricerca. Una dettatura che incolla dove si trova il cursore non si cura di quale app contenga quel cursore.

Quindi la vera domanda non è "come attivo la digitazione vocale in Joplin sul mio laptop". Sul desktop non c'è alcun interruttore. La domanda è "quale strumento di dettatura faccio girare sopra Joplin", e la risposta dipende dal fatto che tu voglia qualcosa di gratuito e integrato, a livello di sistema operativo, oppure un unico tasto di scelta rapida offline che si comporta allo stesso modo ovunque. Le passerò in rassegna tutte, ne configurerò una in due minuti e ti dirò quando saltare la strada dello strumento dedicato.

Joplin ha la dettatura integrata?

Mani che scrivono su un taccuino di carta accanto a una tastiera, a contrapporre la digitazione alla dettatura

Su desktop, no. L'app desktop di Joplin per Windows, Mac e Linux non ha alcuna funzione integrata di trascrizione vocale, dettatura o digitazione a voce per scrivere dentro una nota parlando. Non c'è alcun pulsante del microfono, nessun comando vocale, nessuna preferenza nascosta. Se hai passato al setaccio le Impostazioni cercandola, puoi smettere. Non c'è.

Ciò che invece esiste, ed è qui che tutti si confondono, è la digitazione vocale nell'app Android di Joplin. La documentazione per sviluppatori di Joplin lo dice esplicitamente: l'applicazione mobile per Android supporta la digitazione vocale integrata e offline, di default tramite Whisper. Il team ci ha lavorato seriamente, aggiungendo la punteggiatura automatica e un glossario personalizzato. È una funzione davvero buona. Solo che vive sul telefono. Confondere "Joplin ha la digitazione vocale" con "Joplin ha la digitazione vocale sul mio laptop" ti costa un pomeriggio, e preferirei che tu te lo risparmiassi.

Quindi il quadro mobile è chiaro: su Android ce l'hai integrata, su iPhone ti appoggeresti al microfono della tastiera e, in entrambi i casi, è una funzione del telefono. Sulla nota desktop in cui la maggior parte delle persone vive davvero, ti serve uno strumento che stia sopra Joplin. Ci sono un paio di strade oneste, e il resto di questa guida le illustra.

Premi un tasto di scelta rapida, parla, il testo finisce nella nota

È tutto qui il meccanismo, ed è noioso nel migliore dei modi. Premi un tasto di scelta rapida, parli, rilasci, e la trascrizione viene incollata dove si trova il cursore, in qualunque campo di testo abbia il focus. Whisper trattiene una breve coda dopo che rilasci il tasto, così la tua ultima parola non viene tagliata. Poiché incolla dove si trova il cursore del sistema operativo, una nota di Joplin è semplicemente "una casella di testo qualunque". Editor markdown, editor a testo formattato, la barra di ricerca: stesso comportamento.

È questa la parte che le landing page complicano inutilmente. Non c'è alcun plugin da installare in Joplin, nessun token API da incollare, nessun processo di sincronizzazione da sorvegliare. Il cursore è in una nota, parli, le parole compaiono nella nota. Una piccola capsula appare mentre parli, così sai che ti sta ascoltando:

Cancel
L'overlay di registrazione: una piccola capsula che appare mentre parli, così sai che Whisper ti sta ascoltando.

Il tasto di scelta rapida è l'unica cosa che vale la pena impostare bene fin da subito. Su Windows è Ctrl+Space; su Mac è Command+Option, un push-to-talk con soli modificatori che tieni premuto mentre parli. Entrambi si possono cambiare nelle Impostazioni se vanno in conflitto con qualcosa che usi già. (Una volta mia figlia più piccola mi ha detto che un tasto di scelta rapida "non funzionava" nella sua app da disegno. Era un conflitto, non un bug, ed è così che ho imparato che la persona media non ha la minima idea di cosa sia un conflitto fra tasti di scelta rapida. Per questo adesso ogni tasto di scelta rapida è personalizzabile.) Se hai mai configurato la dettatura su Mac, è la stessa memoria muscolare puntata su un'app diversa.

Configuralo in due minuti (Windows o Mac)

Ti serve un Mac con Apple Silicon o un PC Windows 10 o più recente, un microfono funzionante e Joplin aperto sul desktop. Tutto il flusso locale è gratuito per qualsiasi account con cui hai effettuato l'accesso, senza che venga richiesto alcun metodo di pagamento alla registrazione. Ecco la sequenza.

Passo 1 — Installa Whisper e accedi.

Scarica dalla pagina di download, installa e crea un account gratuito. Niente carta. Tutto il flusso di trascrizione locale si apre subito.

Capirai che ha funzionato quando compare l'icona dell'app nella barra delle applicazioni e la procedura guidata di configurazione propone di scegliere un modello.

Passo 2 — Scegli un percorso di trascrizione.

L'app non sceglie al posto tuo. Ne hai tre: Cloud (OpenAI, usa la tua chiave), Local Parakeet o Local Whisper. Per le note private che tieni in markdown puro, parti dal locale: ne parlo meglio due sezioni più avanti.

Capirai che ha funzionato quando un modello finisce di scaricarsi e risulta pronto.

Passo 3 — Conferma il tuo tasto di scelta rapida.

Windows usa di default Ctrl+Space, Mac Command+Option tenuto premuto come push-to-talk. Su Mac, concedi il permesso di Accessibilità quando ti viene richiesto; senza, l'incollaggio dove si trova il cursore non può raggiungere le altre app.

Capirai che ha funzionato quando una registrazione di prova viene incollata in un qualsiasi campo di testo.

Passo 4 — Metti il cursore in una nota di Joplin e parla.

Apri Joplin, clicca dentro il corpo di una nota, tieni premuto il tasto di scelta rapida, di' una frase, rilascia. La trascrizione compare dove si trova il cursore, nella nota.

Capirai che ha funzionato quando la frase che hai pronunciato si trova nella nota di Joplin come testo.

Whisper
La vera app desktop di Whisper nella schermata delle impostazioni, con i pannelli Trascrizione e IA aperti.

La parte lenta è il download del modello, non la configurazione. Tutto il resto sono i quattro passi qui sopra. Una volta avviato, l'atto di fissare un pensiero in una nota smette di essere un compito di digitazione e diventa un compito di parola.

Desktop o mobile: dove vive davvero la digitazione vocale di Joplin

Vale la pena chiarirlo, perché è all'origine di quasi ogni domanda del tipo "perché non riesco a trovarla". La digitazione vocale integrata di Joplin è una funzione Android. La documentazione è esplicita: l'app Android fa la digitazione vocale offline tramite Whisper, con punteggiatura e glossario. Sull'app desktop, quella funzione non esiste. Stesso prodotto, stesse note, due capacità molto diverse a seconda del dispositivo che hai aperto.

Quindi se acquisisci soprattutto dal telefono, potresti non avere bisogno di nulla di più: la digitazione vocale di Android è proprio lì, nell'editor delle note. La lacuna è il laptop, dove avviene la maggior parte della scrittura più lunga e dove Joplin non ti dà nulla. Un tasto di scelta rapida di sistema colma quella lacuna. Incolla dove si trova il cursore del sistema operativo a prescindere da quale finestra lo possiede, così lo stesso tasto che riempie una nota di Joplin riempie anche la tua casella di composizione di Gmail, un messaggio su Slack e un messaggio di commit. Un solo strumento, ogni campo di testo, sia su Windows sia su Mac.

C'è anche un'ordinata coerenza nel mantenere lo stesso flusso tra i dispositivi. Sul telefono usi la digitazione vocale di Joplin; sul desktop usi il tasto di scelta rapida. Entrambi mettono le parole nella stessa nota in markdown. Non devi reimparare nulla quando cambi macchina, e lo strumento desktop non si cura del fatto che si tratti proprio di Joplin, il che significa che copre anche ogni altro programma in cui scrivi. Io punterei sull'unico tasto di scelta rapida perché cambio app circa quaranta volte all'ora e non voglio quaranta pulsanti di dettatura diversi da ricordare.

Locale o cloud: quale modalità per un archivio privato

Per Joplin, prova prima la modalità locale. La ragione per cui molti di noi hanno scelto Joplin è proprio che è markdown puro local-first, che sincronizzi con uno spazio di archiviazione che controlli tu: il riassunto di una riunione, un'idea ancora abbozzata, una voce di diario che non vorresti mai sul server di qualcun altro. Sarebbe una scelta strana tenere le tue note in una cartella che possiedi e poi instradare la tua voce attraverso un cloud per arrivarci. Se il tuo Mac ha Apple Silicon o il tuo PC è degli ultimi anni, il locale gestisce la dettatura di tutti i giorni senza fare storie, e il cloud diventa la via di fuga anziché l'impostazione predefinita.

Ecco come si differenziano i tre percorsi, perché l'app ti obbliga a scegliere e preferirei che tu scegliessi bene:

  • Local Parakeetil motore TDT di NVIDIA, circa 600 MB, e l'opzione locale più veloce: dalle 5 alle 10 volte più rapido di Whisper su CPU. Copre l'inglese più altre 24 lingue europee, 25 in totale. Niente traduzione in inglese. Se scrivi note in inglese o in un'altra lingua europea, questa è la scelta rapida e completamente offline.
  • Local Whisperpiù lento di Parakeet sulla stessa macchina, ma le versioni multilingua coprono 99 lingue e possono tradurre in inglese. Le versioni solo inglese sono solo inglese, non 99. Scegli questo per cinese, giapponese, coreano o qualsiasi lavoro di traduzione, che Parakeet non può fare. Il modello inglese predefinito pesa circa 480 MB.
  • Cloud (OpenAI, BYOK)la massima accuratezza e l'accesso al web, usando la tua chiave OpenAI fatturata direttamente da OpenAI. La trascrizione gira su gpt-4o-mini-transcribe di default. Richiede internet, quindi è l'unico percorso che esce dalla tua macchina. La parte Cloud fa parte di Whisper Pro.

La noiosa verità è che, per il genere di testo che la maggior parte delle persone mette in Joplin, il locale è più che sufficiente. Entrambi i motori locali girano interamente sulla tua macchina, senza inviare nulla a un server, il che è in linea con lo spirito di un'app per note che hai scelto proprio perché i dati restano tuoi. Si allinea anche con la digitazione vocale Android di Joplin, che il team ha tenuto interamente offline per lo stesso motivo. Il cloud si guadagna il suo posto quando vuoi la massima accuratezza su una registrazione difficile o hai bisogno che il modello peschi un'informazione dal web a metà frase. Per l'abitudine di prendere appunti tutti i giorni, parti dal locale e ricorri al cloud solo quando il locale ti lascia con qualcosa in meno.

Punteggiatura, markdown e ripulitura a voce

La dettatura grezza esce come un fiume in piena. Dici "ok allora scrivi la nota della revisione dell'architettura assegnale il tag project alpha e ricordamelo giovedì", ed è il muro senza punteggiatura che ti consegna qualsiasi motore vocale. Ripulirlo è il punto in cui i percorsi divergono.

La digitazione vocale di Windows aggiunge la punteggiatura mentre parli, e la dettatura di macOS gestisce la punteggiatura di base quando dici "virgola" o "punto". Per una ripulitura più pesante — eliminare gli "ehm", correggere i fiumi in piena, trasformare un paragrafo parlato in qualcosa che terresti davvero in una nota — Whisper può eseguire una passata con l'IA. Pronuncia la frase di attivazione "Hey whisper" e il testo viene migliorato prima di arrivare. Su un modello locale gira tramite Ollama; in modalità cloud è gpt-5-mini di default.

Thinking...
Grezzo

ok allora scrivi la nota della revisione dell'architettura assegnale il tag project alpha e ricordamelo giovedì ehm prima dello standup

Ripulito

Ok, allora scrivi la nota della revisione dell'architettura, assegnale il tag Project Alpha e ricordamelo giovedì prima dello standup.

Per il markdown vero e proprio di Joplin — titoli, elenchi puntati, caselle di spunta, i link interni [[note]] — la risposta onesta è che la voce ti dà il testo e le scorciatoie markdown di Joplin ti danno la struttura. Detta la frase, poi digita il # per un titolo, il - per un punto elenco, oppure - [ ] per una casella di spunta, come hai sempre fatto. Nessuno strumento di dettatura fa apparire la sintassi markdown a comando; chiunque ti prometta "di' titolo project alpha e guardalo formattarsi" ti sta vendendo una demo, non una giornata qualsiasi. Metti giù le parole in fretta a voce, dai forma al markdown con i tasti che già conosci.

Lo stesso flusso parla-poi-ripulisci ripaga ben oltre le tue note: puoi anche dettare una prosa pulita in qualsiasi app con l'unico tasto di scelta rapida, così una nota lunga diventa qualche frase pronunciata invece di un paragrafo da scrivere a mano.

Quando rinunciare a uno strumento di dettatura per Joplin

Due frecce disegnate col gessetto sull'asfalto che puntano in direzioni diverse, a illustrare una scelta tra strumenti

A volte lo strumento giusto è quello gratuito che hai già sulla tua macchina, e far finta del contrario sarebbe disonesto. Se in Joplin butti dentro solo acquisizioni brevi — una riga veloce, un promemoria di due parole — e sei sul telefono, la digitazione vocale Android di Joplin la copre già a costo zero. Sul desktop, il tuo sistema operativo fa lo stesso.

Su Windows, premi il tasto Windows + H e la barra della digitazione vocale integrata si apre dove si trova il cursore, nota di Joplin inclusa. Mette la punteggiatura da sola ed è perfetta per brevi raffiche. L'inghippo: passa attraverso i server di Microsoft e ha bisogno di una connessione a internet, quindi non è un'opzione offline, cosa che conta più del solito quando l'intero senso delle tue note è restare in locale. Su Mac, la dettatura ti permette di parlare per inserire testo ovunque tu possa scrivere, si configura in Impostazioni di Sistema sotto Tastiera, e su Apple Silicon il testo generico può essere elaborato sul dispositivo.

Ricorri a uno strumento dedicato, a livello di sistema, quando le funzioni integrate iniziano a far male: note lunghe, lavoro multilingua, privacy offline su Windows, oppure quando vuoi un unico tasto di scelta rapida che si comporti allo stesso modo in Joplin, nella tua email e nel tuo editor. Al di sotto di quella soglia, usa ciò che è gratuito: il sistema operativo sul desktop, la digitazione vocale di Joplin su Android. Non ti dirò di installare un'app per un promemoria di una riga.

Lo stesso compromesso si presenta se tieni note anche altrove: la logica del dettare in Obsidian è identica, perché entrambe sono app markdown local-first in cui l'integrazione vera è il cursore, non un plugin.

Approfondimenti

Joplin ha rilasciato un pulsante del microfono — su Android, non sul mio laptop, e dopo aver scritto questo dubito che quello desktop arrivi presto. Non ne ha bisogno, perché sul desktop l'integrazione è il cursore. Parla dentro la nota, ottieni il testo, dagli forma con le scorciatoie markdown che già conosci. Ho dettato gran parte di questa guida in una casella di testo che non era Joplin, con uno strumento a cui non importa di quale casella si tratti, e poi ho incollato tutto nella mia nota. È tutto qui il trucco.

Provalo nella tua prossima nota di Joplin

Tieni premuto il tasto di scelta rapida, parla, rilascia. La trascrizione finisce in qualunque nota abbia il cursore, e in ogni altra app.

Modalità locale gratuita per qualsiasi account con cui hai effettuato l'accesso. Nessuna carta richiesta per iniziare.

Foto di Denys Medvediev

Denys Medvediev

Sono io quello che legge le email di assistenza, molto probabilmente dettando le risposte.