Guida
Da voce a testo in Logseq
Logseq non ha la dettatura integrata sul desktop. La soluzione è uno strumento di sistema: premi una scorciatoia, parla e il testo trascritto viene incollato nel punto del cursore, in qualsiasi blocco di Logseq. Anche la dettatura del tuo sistema operativo funziona, per le note brevi.
Ultimo aggiornamento: giugno 2026

Da voce a testo in Logseq funziona tramite uno strumento di sistema, non tramite Logseq stesso. L'app desktop di Logseq non ha la dettatura integrata. La soluzione è uno strumento come Whisper: premi una scorciatoia, parla e il testo trascritto viene incollato nel punto del cursore, in qualsiasi blocco di Logseq. Anche la dettatura del tuo sistema operativo funziona, per le note brevi.
Tengo il mio diario quotidiano in Logseq perché mi fido più di una cartella di semplice markdown che di qualsiasi cloud. L'unica cosa che ho sempre desiderato era parlare dentro un blocco invece di scriverlo. Sono andato a cercare l'impostazione. Non c'è nessuna impostazione. Logseq non ha un pulsante del microfono e, dopo aver scavato a fondo, sono certo che non me ne stia nascondendo uno.
Le persone cercano "da voce a testo in Logseq", non trovano niente nell'app e danno per scontato di essersi persi un interruttore. Non è così. L'interruttore non è mai stato creato. La buona notizia è che la soluzione richiede circa due minuti, funziona completamente offline se lo desideri e, come bonus, funziona in ogni altra app che apri.
Ecco la cosa che la maggior parte delle pagine che girano attorno a questa parola chiave non dice apertamente. Un blocco di Logseq è semplicemente una casella di testo, esattamente come Gmail o una barra di ricerca. La dettatura che incolla nel punto del cursore non si cura di sapere in quale app si trovi il cursore.
Quindi la vera domanda non è "come attivo la digitazione vocale in Logseq". Non c'è nessun interruttore. La domanda è "quale strumento di dettatura uso sopra Logseq", e la risposta dipende dal fatto se vuoi qualcosa di gratuito e integrato, solo per Mac, oppure un'unica scorciatoia offline che si comporta allo stesso modo ovunque. Le esaminerò tutte, ne configurerò una in due minuti e ti dirò quando saltare la strada dedicata.
Logseq ha la dettatura integrata?

No. L'app desktop di Logseq non ha alcuna funzione integrata di riconoscimento vocale, dettatura o digitazione vocale per scrivere in un blocco con la voce. Non c'è nessun pulsante del microfono su un blocco, nessun comando vocale, nessuna preferenza nascosta. Se hai passato al setaccio le Impostazioni cercandola, puoi smettere. Non c'è.
Quello che esiste è un insieme di plugin della community con "whisper" nel nome, ed è qui che le persone si confondono. Quei plugin trascrivono in testo un file audio o un link di YouTube a posteriori. Sono utili, ma non sono dettatura in tempo reale. Non puoi mettere il cursore nel diario di oggi, parlare e vedere le parole comparire. Elaborano una registrazione; non scrivono per te mentre pensi. Confondere le due cose costa un pomeriggio, e preferirei che tu te lo risparmiassi.
La situazione su mobile è una storia a sé, e merita una frase per non rincorrerla sul dispositivo sbagliato: la più recente app mobile di Logseq ha aggiunto un po' di trascrizione vocale, ma è una funzione del telefono, e su un telefono useresti comunque il microfono della tastiera. Sul grafo desktop in cui la maggior parte delle persone vive davvero, ti serve uno strumento che stia sopra Logseq. Ci sono tre categorie oneste, e il resto di questa guida le affronta.
Premi una scorciatoia, parla e il testo finisce nel blocco
Questo è tutto il meccanismo, ed è noioso nel migliore dei modi. Premi una scorciatoia, parli, rilasci, e il testo trascritto viene incollato nel punto del cursore, in qualsiasi campo di testo abbia il focus. Whisper mantiene una breve coda dopo che rilasci il tasto, così la tua ultima parola non viene tagliata. Poiché incolla nel punto del cursore del sistema, un blocco di Logseq è semplicemente "una casella di testo qualsiasi". App desktop o versione browser, stesso comportamento.
Questa è la parte che le landing page complicano inutilmente. Non c'è nessun plugin da installare in Logseq, nessun token API da incollare, nessun lavoro di sincronizzazione da sorvegliare. Il cursore è in un blocco, parli, le parole compaiono nel blocco. Mentre parli appare una piccola capsula, così sai che sta ascoltando:
La scorciatoia è l'unica cosa che vale la pena impostare bene fin dall'inizio. Su Windows è Ctrl+Space; su Mac è Command+Option, un push-to-talk con soli modificatori che tieni premuto mentre parli. Entrambe sono modificabili nelle Impostazioni se vanno in conflitto con qualcosa che usi già. (Mia figlia più piccola una volta mi disse che una scorciatoia "non funzionava" nella sua app di disegno. Era un conflitto, non un bug, ed è così che ho imparato che la persona media non ha la minima idea di cosa sia un conflitto di scorciatoie. Quindi ora ogni scorciatoia è personalizzabile.) Se hai mai configurato la dettatura su Windows o su Mac, è la stessa memoria muscolare puntata su un'app diversa.
Configurarlo in due minuti (Windows o Mac)
Ti serve un Mac con Apple Silicon o un PC con Windows 10 o più recente, un microfono funzionante e Logseq aperto nell'app desktop o nel browser. L'intera pipeline locale è gratuita per qualsiasi account con accesso effettuato, senza richiesta di un metodo di pagamento alla registrazione. Ecco la sequenza.
Passo 1 — Installa Whisper e accedi.
Scarica dalla pagina di download, installa e crea un account gratuito. Nessuna carta. L'intera pipeline di trascrizione locale è subito disponibile.
Saprai che ha funzionato quando l'icona dell'app appare nella barra delle applicazioni e la procedura guidata di configurazione propone di scegliere un modello.
Passo 2 — Scegli un percorso di trascrizione.
L'app non sceglie al posto tuo. Hai tre opzioni: Cloud (OpenAI, con la tua chiave), Parakeet locale o Whisper locale. Per le note private del diario, inizia in locale — ne parlo meglio due sezioni più avanti.
Saprai che ha funzionato quando un modello termina il download e risulta pronto.
Passo 3 — Conferma la tua scorciatoia.
Windows usa di default Ctrl+Space, Mac Command+Option tenuto premuto come push-to-talk. Su Mac, concedi l'autorizzazione di Accessibilità quando richiesto; senza, l'incollaggio nel punto del cursore non riesce a raggiungere le altre app.
Saprai che ha funzionato quando una registrazione di prova viene incollata in un campo di testo qualsiasi.
Passo 4 — Metti il cursore in un blocco di Logseq e parla.
Apri il tuo grafo, clicca dentro un blocco, tieni premuta la scorciatoia, di' una frase, rilascia. Il testo trascritto compare dove si trova il cursore, nel blocco.
Saprai che ha funzionato quando la frase che hai pronunciato è lì, come testo, nel blocco di Logseq.
La parte lenta è il download del modello, non la configurazione. Tutto il resto sono i quattro passi qui sopra. Una volta avviato, l'atto di catturare un pensiero nel tuo grafo smette di essere un compito di scrittura e diventa un compito di parlato.
Un plugin di Logseq vs. una scorciatoia di sistema
La maggior parte delle pagine posizionate per questa parola chiave ti indirizza a un plugin di Logseq o a Blurt, uno strumento dedicato per la barra dei menu di Mac che parla direttamente nel tuo outline. Sono risposte valide, con una limitazione strutturale ciascuna. I plugin in stile whisper trascrivono file audio, non parlato in tempo reale nel blocco che stai modificando. E Blurt, per sua stessa ammissione, è solo per macOS — se sei su Windows, non è affatto un'opzione.
Una scorciatoia di sistema aggira entrambi i limiti. Incolla nel punto del cursore del sistema indipendentemente da quale finestra lo possieda, così lo stesso tasto che riempie un blocco di Logseq riempie anche la tua casella di composizione di Gmail, un messaggio Slack e un messaggio di commit. Un solo strumento, ogni campo di testo, sia su Windows che su Mac. Non devi reimparare nulla quando cambi app, e non ti serve una soluzione diversa a seconda del portatile.
Se sei su un Mac e catturi sempre e solo dentro Logseq, Blurt è una scelta ordinata e mirata, da prendere in considerazione. Nel momento in cui sei su Windows, o vuoi lo stesso flusso in ogni programma che apri, vince la strada di sistema. Io opterei per l'unica scorciatoia perché cambio app circa quaranta volte all'ora e non voglio dover ricordare quaranta pulsanti di dettatura diversi.
Locale o cloud: quale modalità per un grafo privato
Per Logseq, prova prima la modalità locale. Tutto il motivo per cui molti di noi hanno scelto Logseq è che è testo semplice local-first — un riassunto di una riunione, un'idea ancora in formazione, una voce di diario che non vorresti mai sul server di qualcun altro. Sarebbe una scelta strana tenere le note sul proprio disco e poi far passare la voce attraverso un cloud per arrivarci. Se il tuo Mac è con Apple Silicon o il tuo PC è degli ultimi anni, il locale gestisce la dettatura quotidiana senza fatica, e il cloud diventa la via di fuga anziché l'impostazione predefinita.
Ecco come differiscono i tre percorsi, perché l'app ti fa scegliere e preferirei che tu scegliessi bene:
- Parakeet locale — Il motore TDT di NVIDIA, circa 600 MB, e l'opzione locale più veloce — da 5 a 10 volte più rapida di Whisper su CPU. Copre l'inglese più altre 24 lingue europee, 25 in totale. Niente traduzione in inglese. Se scrivi il diario in inglese o in un'altra lingua europea, è la scelta rapida e completamente offline.
- Whisper locale — più lento di Parakeet sulla stessa macchina, ma le build multilingua coprono 99 lingue e possono tradurre in inglese. Le build solo inglese sono solo inglese, non 99. Scegli questo per cinese, giapponese, coreano o qualsiasi lavoro di traduzione, che Parakeet non può fare. Il modello inglese predefinito è di circa 480 MB.
- Cloud (OpenAI, BYOK) — la migliore precisione e l'accesso al web, usando la tua chiave OpenAI fatturata direttamente da OpenAI. La trascrizione gira su gpt-4o-mini-transcribe per impostazione predefinita. Richiede internet, quindi è l'unico percorso che lascia la tua macchina. La superficie Cloud fa parte di Whisper Pro.
La noiosa verità è che per il tipo di testo che la maggior parte delle persone mette in Logseq, il locale è più che sufficiente. Entrambi i motori locali girano completamente sulla tua macchina senza inviare nulla a un server, che è l'intero senso di un grafo local-first. Il cloud si guadagna il suo posto quando vuoi una precisione di altissimo livello su una registrazione difficile o ti serve che il modello recuperi un'informazione dal web a metà frase. Per l'abitudine del diario quotidiano, inizia in locale e ricorri al cloud solo quando il locale ti lascia insoddisfatto.
Punteggiatura, blocchi e markdown di Logseq con la voce
La dettatura grezza esce come un periodo continuo. Dici "okay allora rivedi il documento di architettura taggalo project alpha e ricordami giovedì", ed è il muro senza punteggiatura che qualsiasi motore vocale ti consegna. Ripulirlo è dove i percorsi divergono.
La Digitazione vocale di Windows aggiunge la punteggiatura mentre parli, e la Dettatura di macOS gestisce la punteggiatura di base quando dici "virgola" o "punto". Per una pulizia più consistente — eliminare gli "ehm", sistemare i periodi continui, trasformare un paragrafo parlato in qualcosa che terresti davvero nel tuo grafo — Whisper può eseguire una passata con l'AI. Pronuncia la frase di attivazione "Hey whisper" e il testo viene migliorato prima di arrivare. Su un modello locale gira tramite Ollama; in modalità cloud è gpt-5-mini per impostazione predefinita.
okay allora rivedi il documento di architettura taggalo project alpha e ricordami giovedì ehm prima dello standup
Okay, allora rivedi il documento di architettura, taggalo Project Alpha e ricordami giovedì prima dello standup.
Per la struttura di Logseq vera e propria — blocchi annidati, i link #tag e [[pagina]], i marcatori TODO — la risposta onesta è che la voce ti dà il testo e la sintassi di Logseq ti dà la struttura. Detta la frase, poi premi Tab per indentare, # per un tag, oppure [[ per un link a una pagina, come hai sempre fatto. Nessuno strumento di dettatura fa apparire dal nulla la sintassi dell'outline di Logseq su comando; chiunque ti prometta "di' tag project alpha e guardalo collegarsi" ti sta vendendo una demo, non un martedì qualunque. Butta giù le parole in fretta con la voce, dai forma ai blocchi con i tasti che già conosci.
Lo stesso flusso parla-poi-pulisci dà i suoi frutti ben oltre il tuo grafo — puoi anche dettare prosa pulita in qualsiasi app con l'unica scorciatoia, così un blocco lungo diventa qualche frase pronunciata invece di un paragrafo che digiti.
Quando rinunciare a uno strumento di dettatura per Logseq

A volte lo strumento giusto è quello gratuito già presente sulla tua macchina, e fingere il contrario sarebbe disonesto. Se inserisci in Logseq solo brevi appunti — una rapida riga di diario, un promemoria di due parole — il tuo sistema operativo se ne occupa gratis.
Su Windows, premi tasto Windows + H e la barra integrata della Digitazione vocale si apre ovunque sia il tuo cursore, blocco di Logseq compreso. Aggiunge la punteggiatura da sola e va bene per brevi raffiche. Il rovescio della medaglia: passa per i server di Microsoft e richiede una connessione internet, quindi non è un'opzione offline, cosa che conta più del solito quando l'intero senso del tuo grafo è restare in locale. Su Mac, la Dettatura ti consente di parlare per inserire testo ovunque tu possa scrivere, si configura in Impostazioni di sistema sotto Tastiera, e su Apple Silicon il testo generico può essere elaborato sul dispositivo. E se sei un utente Mac che vive interamente dentro Logseq, Blurt è una scelta mirata e nativa, creata esattamente per questo.
Ricorri a uno strumento dedicato di sistema quando gli strumenti integrati iniziano a far male: note lunghe, lavoro multilingua, privacy offline su Windows, oppure quando vuoi un'unica scorciatoia che si comporti allo stesso modo in Logseq, nella tua email e nel tuo editor. Al di sotto di quella soglia, usa ciò che è gratuito. Non ti dirò di installare un'app per un promemoria di una riga.
Lo stesso compromesso emerge se tieni appunti anche altrove — la logica nel dettare in Obsidian è identica, perché entrambi sono app markdown local-first dove il cursore, non un plugin, è la vera integrazione.
Approfondimenti
Logseq non ha mai rilasciato un pulsante del microfono e, dopo aver scritto questo, sono abbastanza sicuro che non lo farà mai. Non ne ha bisogno, perché il cursore è l'integrazione. Parla dentro il blocco, ottieni il testo, dagli forma con la sintassi che già conosci. Ho dettato gran parte di questa guida in una casella di testo che non era Logseq, con uno strumento a cui non importa quale casella sia, e poi ho incollato il tutto nel mio grafo. È tutto qui il trucco.
Provalo nel tuo prossimo blocco di Logseq
Tieni premuta la scorciatoia, parla, rilascia. Il testo trascritto finisce nel blocco in cui si trova il tuo cursore — e in ogni altra app, allo stesso modo.
Modalità locale gratuita per qualsiasi account con accesso effettuato. Nessuna carta richiesta per iniziare.



