Di Denys Medvediev

Guida

Da voce a testo in Roam Research

Roam Research non ha una dettatura integrata. La soluzione è uno strumento di sistema: premi una scorciatoia, parla e la trascrizione viene incollata al cursore in qualunque blocco di Roam. Anche la dettatura del tuo sistema operativo funziona, per gli appunti brevi.

Ultimo aggiornamento: giugno 2026

Quaderno aperto e penna accanto a un laptop su una scrivania scura, a evocare la presa di appunti interconnessa e la dettatura

La conversione da voce a testo in Roam Research funziona attraverso uno strumento di sistema, non Roam stesso. Roam Research non ha una dettatura integrata. La soluzione è uno strumento come Whisper: premi una scorciatoia, parla e la trascrizione viene incollata al cursore in qualunque blocco di Roam. Anche la dettatura del sistema operativo funziona, per le note brevi.

Tengo una pagina di note quotidiane in Roam perché il pensiero collegato ha davvero cambiato il modo in cui custodisco le idee — ogni blocco è un nodo, ogni [[pagina]] è un filo che posso tirare in seguito. L'unica cosa che ho sempre desiderato era poter dire un pensiero in un blocco invece di scriverlo. Sono andato a cercare l'impostazione. Non c'è nessuna impostazione. Roam non ha un pulsante per il microfono e, dopo un bel po' di ricerche, sono sicuro che non me ne stia nascondendo uno.

Le persone cercano "da voce a testo in Roam Research", non trovano nulla nell'app e pensano di essersi persi un interruttore. Non è così. L'interruttore non è mai stato creato. La buona notizia è che la soluzione richiede circa due minuti, funziona del tutto offline se vuoi e, come bonus, funziona in ogni altra app che apri.

Ecco la cosa che la maggior parte delle pagine che girano attorno a questa parola chiave non dice chiaramente. Un blocco di Roam è solo una casella di testo, esattamente come Gmail o una barra di ricerca. Una dettatura che incolla al cursore non si cura di sapere in quale app si trovi il cursore.

Quindi la vera domanda non è "come attivo la digitazione vocale in Roam". Non c'è alcun interruttore. La domanda è "quale strumento di dettatura faccio girare sopra Roam", e la risposta dipende dal fatto che tu voglia qualcosa di gratuito e integrato, oppure un'unica scorciatoia offline che si comporta allo stesso modo ovunque. Esaminerò tutto, ne configurerò uno in due minuti e ti dirò quando saltare del tutto la strada dello strumento dedicato.

Roam Research ha una dettatura integrata?

Mani che scrivono su un quaderno di carta accanto a una tastiera, a contrapporre la scrittura alla dettatura

No. Roam Research non ha alcuna funzione integrata di riconoscimento vocale, dettatura o digitazione vocale per scrivere in un blocco con la voce. Non c'è un pulsante per il microfono su un blocco, nessun comando vocale, nessuna preferenza nascosta. Roam accetta input digitato. Se hai setacciato i menu in cerca di un interruttore per la dettatura, puoi smettere. Non c'è.

Ciò che esiste è una manciata di estensioni di Roam Depot e un Live AI Assistant con "speech" nella descrizione, ed è qui che le persone si confondono. Quegli strumenti trascrivono in testo un file audio che hai già registrato — una riunione, un'intervista, un clip caricato con /upload — a posteriori, di solito chiamando l'API OpenAI Whisper con la tua chiave. Sono utili, ma non sono una dettatura dal vivo. Non puoi mettere il cursore nella nota di oggi, parlare e vedere comparire le parole. Elaborano una registrazione; non scrivono per te mentre pensi. Confondere le due cose costa un pomeriggio, e preferirei evitartelo.

La situazione su mobile è un discorso a parte, e merita una frase per non rincorrerla sul dispositivo sbagliato: ci sono app di acquisizione complementari che inviano una nota da voce a testo nel tuo grafo da un telefono, ma è una funzione del telefono, e su un telefono useresti comunque il microfono della tastiera. Sul grafo desktop in cui la maggior parte delle persone vive davvero, ti serve uno strumento che stia sopra Roam. Ci sono un paio di categorie oneste, e il resto di questa guida le illustra.

Premi una scorciatoia, parla, il testo finisce nel blocco

È tutto qui il meccanismo, ed è noioso nel migliore dei modi. Premi una scorciatoia, parli, rilasci, e la trascrizione viene incollata al cursore, in qualunque campo di testo abbia il focus. Whisper mantiene una breve coda dopo che hai lasciato il tasto, così la tua ultima parola non viene tagliata. Poiché incolla al cursore del sistema operativo, un blocco di Roam è semplicemente "una qualsiasi casella di testo". L'app nel browser o un wrapper desktop, stesso comportamento — non c'è alcuna differenza che Roam possa nemmeno percepire.

È questa la parte che le landing page complicano troppo. Non c'è alcuna estensione da installare in Roam, nessun token API da incollare, nessun processo di sincronizzazione da sorvegliare. Il cursore è in un blocco, parli, le parole compaiono nel blocco. Una piccola capsula appare mentre parli, così sai che ti sta ascoltando:

Cancel
Il riquadro di registrazione: una piccola capsula che appare mentre parli, così sai che Whisper sta ascoltando.

La scorciatoia è l'unica cosa che vale la pena impostare bene fin da subito. Su Windows è Ctrl+Space; su Mac è Command+Option, un push-to-talk con soli modificatori che tieni premuto mentre parli. Entrambe sono modificabili nelle Impostazioni se vanno in conflitto con qualcosa che usi già. (Mia figlia più piccola una volta mi disse che una scorciatoia "non funzionava" nella sua app di disegno. Era un conflitto, non un bug, ed è così che ho imparato che la persona media non ha la minima idea di cosa sia un conflitto di scorciatoie. Così ora ogni scorciatoia è personalizzabile.) Se hai mai configurato la dettatura su Mac, è la stessa memoria muscolare puntata su un'app diversa.

Configuralo in due minuti (Windows o Mac)

Ti serve un Mac con Apple Silicon o un PC Windows 10 o più recente, un microfono funzionante e Roam aperto nel browser. L'intero processo locale è gratuito per qualsiasi account con accesso effettuato, senza alcun metodo di pagamento richiesto alla registrazione. Ecco la sequenza.

Passo 1 — Installa Whisper e accedi.

Scarica dalla pagina di download, installa e crea un account gratuito. Nessuna carta. L'intero processo di trascrizione locale si apre subito.

Saprai che ha funzionato quando comparirà l'icona dell'app nella barra delle applicazioni e la procedura guidata di configurazione ti proporrà di scegliere un modello.

Passo 2 — Scegli un percorso di trascrizione.

L'app non sceglie al posto tuo. Ne hai tre: Cloud (OpenAI, porta la tua chiave), Parakeet locale o Whisper locale. Per le note quotidiane private, parti dal locale — più dettagli due sezioni più avanti.

Saprai che ha funzionato quando un modello finisce di scaricarsi e risulta pronto.

Passo 3 — Conferma la tua scorciatoia.

Su Windows il valore predefinito è Ctrl+Space, su Mac è Command+Option tenuto premuto come push-to-talk. Su Mac, concedi il permesso di Accessibilità quando richiesto; senza, l'incollamento al cursore non può raggiungere il browser.

Saprai che ha funzionato quando una registrazione di prova viene incollata in un qualsiasi campo di testo.

Passo 4 — Metti il cursore in un blocco di Roam e parla.

Apri il tuo grafo, clicca in un blocco, tieni premuta la scorciatoia, di' una frase, rilascia. La trascrizione compare dove si trova il cursore, nel blocco.

Saprai che ha funzionato quando la frase che hai detto sarà lì, come testo, nel blocco di Roam.

Whisper
La vera app desktop Whisper nella schermata delle impostazioni, con i pannelli Trascrizione e IA aperti.

La parte lenta è lo scaricamento del modello, non la configurazione. Tutto il resto sono i quattro passi qui sopra. Una volta avviato, l'atto di catturare un pensiero nel tuo grafo smette di essere un compito di scrittura e diventa un compito di parlato.

da voce a testo su Windows · su Mac

Un'estensione di Roam contro una scorciatoia di sistema

La maggior parte delle pagine che si posizionano per questa parola chiave ti indirizza verso un'estensione di Roam Depot — il Live AI Assistant, l'importatore di Otter, qualcosa con "speech" nel nome. Sono buoni strumenti, con un limite strutturale in comune. Trascrivono audio che hai già registrato — un file di una riunione, una sessione di Otter, un clip caricato in un blocco — non parlato dal vivo nel blocco che stai modificando in questo momento. Registri, poi trascrivi, poi sistemi il risultato. È un flusso di trascrizione, non di dettatura. Risolvono "ho un'ora di audio" piuttosto che "voglio dire questa frase nella mia nota quotidiana".

Una scorciatoia di sistema aggira tutto questo. Incolla al cursore del sistema operativo a prescindere da quale finestra lo possieda, così lo stesso tasto che riempie un blocco di Roam riempie anche la tua casella di scrittura di Gmail, un messaggio di Slack e un messaggio di commit. Uno strumento, ogni campo di testo, sia su Windows sia su Mac. Non devi reimparare nulla quando cambi app, e niente deve sapere che si tratta di Roam — è il cursore a fare l'integrazione.

Se hai principalmente registrazioni da trascrivere — chiamate, lezioni, memo vocali che hai già catturato — un'estensione di Depot che chiama Whisper sul file è la forma giusta, e vale la pena dare un'occhiata. Nel momento in cui ciò che vuoi davvero è pensare ad alta voce in un blocco nuovo, dal vivo, vince la strada di sistema. Io punterei sull'unica scorciatoia perché cambio app circa quaranta volte all'ora e non voglio ricordare quaranta diversi pulsanti di dettatura.

Locale o cloud: quale modalità per un grafo privato

Per Roam, prova prima la modalità locale. Un grafo si riempie di cose non filtrate — un'idea a metà, il resoconto di una riunione, una pagina di diario che non vorresti mai sul server di qualcun altro. Se ci pensassi due volte prima di pubblicare un blocco pubblicamente, probabilmente ci penseresti due volte prima di far passare la tua voce attraverso un cloud per scriverlo. Se il tuo Mac è Apple Silicon o il tuo PC è degli ultimi anni, il locale gestisce la dettatura di tutti i giorni senza fare storie, e il cloud diventa l'uscita di emergenza anziché l'impostazione predefinita.

Ecco come differiscono i tre percorsi, perché l'app ti fa scegliere e preferirei che tu scegliessi bene:

  • Parakeet localeIl motore TDT di NVIDIA, circa 600 MB, e l'opzione locale più veloce — da 5 a 10 volte più veloce di Whisper su CPU. Copre l'inglese più altre 24 lingue europee, 25 in totale. Nessuna traduzione verso l'inglese. Se scrivi il tuo diario in inglese o in un'altra lingua europea, questa è la scelta rapida e completamente offline.
  • Whisper localepiù lento di Parakeet sulla stessa macchina, ma le build multilingue coprono 99 lingue e possono tradurre verso l'inglese. Le build solo-inglese sono solo inglese, non 99. Scegli questa per cinese, giapponese, coreano o qualsiasi lavoro di traduzione, cosa che Parakeet non può fare. Il modello inglese predefinito è di circa 480 MB.
  • Cloud (OpenAI, BYOK)la migliore accuratezza e l'accesso al web, usando la tua chiave OpenAI fatturata direttamente da OpenAI. La trascrizione gira su gpt-4o-mini-transcribe per impostazione predefinita. Richiede internet, quindi è l'unica strada che lascia la tua macchina. La superficie Cloud fa parte di Whisper Pro.

La verità noiosa è che, per il tipo di testo che la maggior parte delle persone mette in Roam, il locale è più che sufficiente. Entrambi i motori locali girano interamente sulla tua macchina, senza inviare nulla a un server. Il cloud si guadagna il suo posto quando vuoi un'accuratezza di prim'ordine su una registrazione difficile o hai bisogno che il modello recuperi un dato dal web a metà frase. Per l'abitudine delle note quotidiane, parti dal locale e ricorri al cloud solo quando il locale ti lascia con la voglia di qualcosa di più.

Punteggiatura, blocchi e sintassi di Roam con la voce

La dettatura grezza esce come un flusso ininterrotto. Dici "okay quindi rivedi il documento dell'architettura assegnagli il tag progetto alpha e ricordami giovedì", ed è il muro senza punteggiatura che qualsiasi motore vocale ti restituisce. È nel ripulirlo che le strade si dividono.

La Digitazione vocale di Windows aggiunge la punteggiatura mentre parli, e la Dettatura di macOS gestisce la punteggiatura di base quando dici "virgola" o "punto". Per una pulizia più pesante — eliminare gli "ehm", correggere i flussi ininterrotti, trasformare un paragrafo parlato in qualcosa che terresti davvero nel tuo grafo — Whisper può eseguire una passata di IA. Pronuncia la frase di attivazione "Hey whisper" e il testo viene migliorato prima di atterrare. Su un modello locale gira attraverso Ollama; in modalità cloud è gpt-5-mini per impostazione predefinita.

Thinking...
Grezzo

okay quindi rivedi il documento dell'architettura assegnagli il tag progetto alpha e ricordami giovedì ehm prima dello standup

Ripulito

Okay, quindi rivedi il documento dell'architettura, assegnagli il tag Project Alpha e ricordami giovedì prima dello standup.

Per la struttura propria di Roam — blocchi annidati, i link #tag e [[page]], i marcatori TODO — la risposta onesta è che la voce ti dà il testo e la sintassi di Roam ti dà la struttura. Detta la frase, poi premi Tab per indentare il blocco, # per un tag o [[ per un link a una pagina come hai sempre fatto. Nessuno strumento di dettatura evoca la sintassi degli elenchi di Roam dal nulla su comando; chiunque ti prometta "di' doppia-parentesi progetto alpha e guardalo collegarsi" ti sta vendendo una demo, non un martedì qualsiasi. Metti giù le parole in fretta con la voce, dai forma ai blocchi con i tasti che già conosci.

Questo stesso flusso parla-poi-pulisci ripaga ben oltre il tuo grafo — puoi anche dettare prosa pulita in qualsiasi app con l'unica scorciatoia, così un blocco lungo diventa qualche frase pronunciata invece di un paragrafo da digitare.

Quando rinunciare a uno strumento di dettatura per Roam Research

Due frecce disegnate col gessetto sull'asfalto che puntano in direzioni diverse, a illustrare una scelta tra strumenti

A volte lo strumento giusto è quello gratuito che hai già sulla tua macchina, e fingere il contrario sarebbe disonesto. Se in Roam butti solo brevi appunti — una rapida riga di nota quotidiana, un promemoria di due parole — il tuo sistema operativo se ne occupa senza costi.

Su Windows, premi tasto Windows + H e si apre la barra integrata di Digitazione vocale ovunque sia il tuo cursore, un blocco di Roam incluso. Aggiunge la punteggiatura da sola e va bene per brevi raffiche. Il rovescio della medaglia: passa per i server di Microsoft e ha bisogno di una connessione a internet, quindi non è un'opzione offline, cosa che conta più del solito quando il tuo grafo è pieno di pensieri semiprivati. Su Mac, la Dettatura ti permette di parlare per inserire testo ovunque tu possa digitare, si configura in Impostazioni di sistema sotto Tastiera, e su Apple Silicon il testo generico può essere elaborato sul dispositivo. E se ciò che hai davvero è audio registrato — una chiamata, una lezione — un'estensione di Roam Depot che trascrive il file è più adatta di qualsiasi strumento di dettatura dal vivo.

Ricorri a uno strumento dedicato di sistema quando gli strumenti integrati cominciano a farti soffrire: note lunghe, lavoro multilingue, privacy offline su Windows, o il desiderio di un'unica scorciatoia che si comporti allo stesso modo in Roam, nella tua email e nel tuo editor. Al di sotto di quella soglia, usa ciò che è gratis. Non ti dirò di installare un'app per un promemoria di una riga.

Lo stesso compromesso si presenta se tieni appunti anche altrove — la logica nel dettare in Obsidian è identica, perché anche lì è il cursore, non un plugin, a essere la vera integrazione.

Approfondimenti

Roam non ha mai rilasciato un pulsante per il microfono e, dopo aver scritto questo, sono abbastanza sicuro che non lo farà mai. Non ne ha bisogno, perché l'integrazione è il cursore. Parla nel blocco, ottieni il testo, dagli forma con i [[ e i # che già conosci. Ho dettato gran parte di questa guida in una casella di testo che non era Roam, con uno strumento a cui non importa di quale casella si tratti, poi ho incollato il tutto nel mio grafo. È tutto qui il trucco.

Provala nel tuo prossimo blocco di Roam

Tieni premuta la scorciatoia, parla, rilascia. La trascrizione atterra nel blocco in cui si trova il cursore — e anche in ogni altra app.

Modalità locale gratuita per qualsiasi account con accesso effettuato. Nessuna carta richiesta per iniziare.

Foto di Denys Medvediev

Denys Medvediev

Sono quello che legge la nostra email di supporto, molto probabilmente dettando le risposte.