Veiledning
Tale til tekst i Roam Research
Roam Research har ingen innebygd diktering. Løsningen er et systemomfattende verktøy: trykk på en hurtigtast, snakk, og transkripsjonen limes inn ved markøren i hvilken som helst Roam-blokk. Operativsystemets egen diktering fungerer også, til korte notater.
Sist oppdatert: juni 2026

Tale til tekst i Roam Research fungerer gjennom et systemomfattende verktøy, ikke gjennom Roam selv. Roam Research har ingen innebygd diktering. Løsningen er et verktøy som Whisper: trykk på en hurtigtast, snakk, og transkripsjonen limes inn ved markøren i hvilken som helst Roam-blokk. Operativsystemets egen diktering fungerer også, til korte notater.
Jeg fører en daglig-notater-side i Roam fordi det med koblet tenkning faktisk endret måten jeg holder på ideer på — hver blokk er en node, hver [[side]] er en tråd jeg kan dra i senere. Det ene jeg alltid ønsket meg, var å snakke en tanke inn i en blokk i stedet for å skrive den. Jeg lette etter innstillingen. Det finnes ingen innstilling. Roam har ingen mikrofonknapp, og etter en god del graving er jeg sikker på at den ikke gjemmer en for meg.
Folk søker etter «tale til tekst i Roam Research», finner ingenting i appen, og antar at de overså en bryter. Det gjorde de ikke. Bryteren ble aldri laget. Den gode nyheten er at løsningen tar omtrent to minutter, kjører helt frakoblet hvis du vil, og fungerer i alle andre apper du åpner som en bonus.
Her er det de fleste sidene som danser rundt dette søkeordet ikke sier rett ut. En Roam-blokk er bare et tekstfelt, akkurat som Gmail eller en søkelinje. Diktering som limer inn ved markøren bryr seg ikke om hvilken app markøren befinner seg i.
Så det egentlige spørsmålet er ikke «hvordan slår jeg på taleskriving i Roam». Det finnes ingen bryter. Spørsmålet er «hvilket dikteringsverktøy kjører jeg oppå Roam», og svaret avhenger av om du vil ha gratis-og-innebygd, eller én frakoblet hurtigtast som oppfører seg likt overalt. Jeg går gjennom alt, setter opp ett på to minutter, og forteller deg når du bør hoppe over den dedikerte veien.
Har Roam Research innebygd diktering?

Nei. Roam Research har ingen innebygd tale-til-tekst, diktering eller taleskrivingsfunksjon for å skrive inn i en blokk med stemmen. Det finnes ingen mikrofonknapp på en blokk, ingen talekommando, ingen skjult innstilling. Roam tar imot skrevet inndata. Hvis du har gjennomsøkt menyene etter en dikteringsbryter, kan du stoppe. Den er ikke der.
Det som finnes, er en håndfull Roam Depot-utvidelser og en Live AI Assistant med «speech» i beskrivelsen, og det er her folk blir forvirret. De transkriberer en lydfil du allerede har spilt inn — et møte, et intervju, et klipp du lastet opp med /upload — til tekst i etterkant, vanligvis ved å kalle OpenAI Whisper API med din egen nøkkel. De er nyttige, men de er ikke sanntidsdiktering. Du kan ikke sette markøren i dagens daglige notat, snakke, og se ordene dukke opp. De behandler et opptak; de skriver ikke for deg mens du tenker. Å blande sammen de to koster en ettermiddag, og jeg vil heller at du slipper den ettermiddagen.
Mobilbildet er sin egen sak, og verdt én setning så du ikke jakter på det på feil enhet: det finnes følgeapper for fangst som sender et tale-til-tekst-notat inn i grafen din fra en telefon, men det er en telefonfunksjon, og på en telefon ville du uansett bare brukt tastaturets mikrofon. På skrivebordsgrafen de fleste faktisk lever i, trenger du et verktøy som sitter oppå Roam. Det finnes et par ærlige kategorier, og resten av denne veiledningen dekker dem.
Trykk på en hurtigtast, snakk, teksten lander i blokken
Dette er hele mekanikken, og den er kjedelig på den beste måten. Du trykker på en hurtigtast, du snakker, du slipper, og transkripsjonen limes inn ved markøren, i hvilket tekstfelt som enn har fokus. Whisper holder en kort hale etter at du slipper tasten, så det siste ordet ditt ikke blir kuttet. Fordi den limer inn ved OS-markøren, er en Roam-blokk bare «et hvilket som helst tekstfelt». Nettleserappen eller en skrivebordsversjon, samme oppførsel — det er ingen forskjell Roam i det hele tatt kan merke.
Det er den delen landingssidene gjør for komplisert. Det finnes ingen utvidelse å installere i Roam, ingen API-token å lime inn, ingen synkroniseringsjobb å passe på. Markøren din er i en blokk, du snakker, ordene dukker opp i blokken. En liten kapsel vises mens du snakker så du vet at den lytter:
Hurtigtasten er det ene det er verdt å få riktig fra starten. På Windows er den Ctrl+Space; på Mac er den Command+Option, en trykk-og-snakk med kun modifikatortaster som du holder mens du snakker. Begge kan endres i Innstillinger hvis de kolliderer med noe du allerede bruker. (Den yngste datteren min fortalte meg en gang at en hurtigtast «ikke virket» i tegneappen hennes. Det var en konflikt, ikke en feil, og slik lærte jeg at den gjennomsnittlige personen ikke aner hva en hurtigtastkonflikt i det hele tatt er. Så nå er hver hurtigtast tilpassbar.) Hvis du noen gang har satt opp diktering på Mac, er dette den samme muskelhukommelsen rettet mot en annen app.
Sett det opp på to minutter (Windows eller Mac)
Du trenger en Mac med Apple Silicon eller en Windows 10-eller-nyere-PC, en fungerende mikrofon, og Roam åpen i nettleseren. Hele den lokale pipelinen er gratis for enhver innlogget konto, uten at det spørres om betalingsmetode ved registrering. Her er rekkefølgen.
Steg 1 — Installer Whisper og logg inn.
Last ned fra nedlastingssiden, installer, og opprett en gratis konto. Ingen kort. Hele den lokale transkripsjonspipelinen åpner seg med en gang.
Du vet at det fungerte når appens ikon dukker opp i systemstatusfeltet og oppsettsveiviseren tilbyr å velge en modell.
Steg 2 — Velg en transkripsjonsvei.
Appen velger ikke for deg. Du får tre: Cloud (OpenAI, ta med egen nøkkel), Local Parakeet, eller Local Whisper. For private daglige notater, start lokalt — mer om det to seksjoner lenger ned.
Du vet at det fungerte når en modell er ferdig nedlastet og vises som klar.
Steg 3 — Bekreft hurtigtasten din.
Windows har Ctrl+Space som standard, Mac Command+Option holdt som trykk-og-snakk. På Mac, gi tilgjengelighetstillatelsen når du blir bedt om det; uten den når ikke innlimingen-ved-markøren nettleseren din.
Du vet at det fungerte når et testopptak limes inn i hvilket som helst tekstfelt.
Steg 4 — Sett markøren i en Roam-blokk og snakk.
Åpne grafen din, klikk inn i en blokk, hold hurtigtasten, si en setning, slipp. Transkripsjonen dukker opp der markøren er, i blokken.
Du vet at det fungerte når den uttalte setningen din sitter i Roam-blokken som tekst.
Den trege delen er modellnedlastingen, ikke oppsettet. Alt annet er de fire stegene over. Når det først kjører, slutter det å være en skriveoppgave å fange en tanke inn i grafen din og blir en snakkeoppgave.
En Roam-utvidelse vs. en systemomfattende hurtigtast
De fleste sidene som rangerer for dette søkeordet peker deg mot en Roam Depot-utvidelse — Live AI Assistant, Otter-importøren, noe med «speech» i navnet. De er fine verktøy, med én strukturell hake til felles. De transkriberer lyd du allerede har spilt inn — en møtefil, en Otter-økt, et klipp lastet opp i en blokk — ikke sanntidstale inn i blokken du redigerer akkurat nå. Du tar opp, så transkriberer du, så rydder du opp i resultatet. Det er en transkripsjonsarbeidsflyt, ikke diktering. De løser «jeg har en time med lyd» heller enn «jeg vil snakke denne setningen inn i det daglige notatet mitt».
En systemomfattende hurtigtast omgår det helt. Den limer inn ved OS-markøren uansett hvilket vindu som eier den, så den samme tasten som fyller en Roam-blokk fyller også Gmail-skrivefeltet ditt, en Slack-melding, og en commit-melding. Ett verktøy, hvert tekstfelt, på både Windows og Mac. Du lærer ikke noe på nytt når du bytter app, og ingenting trenger å vite at det er Roam — markøren gjør integreringen.
Hvis du for det meste har opptak å transkribere — samtaler, forelesninger, talememoer du allerede har fanget — er en Depot-utvidelse som kaller Whisper på filen riktig form, og verdt et blikk. I det øyeblikket det du faktisk vil, er å tenke høyt inn i en fersk blokk, i sanntid, vinner den systemomfattende veien. Jeg ville grepet etter den ene hurtigtasten fordi jeg bytter app omtrent førti ganger i timen og ikke vil ha førti forskjellige dikteringsknapper å huske.
Lokalt eller sky: hvilken modus for en privat graf
For Roam, prøv lokal modus først. En graf fylles opp med det ufiltrerte — en halvferdig idé, et møtereferat, en dagbokoppføring du aldri ville hatt på noen andres server. Hvis du ville tenkt deg om to ganger før du la ut en blokk offentlig, ville du sannsynligvis tenkt deg om to ganger før du rutet stemmen din gjennom en sky for å skrive den. Hvis Mac-en din har Apple Silicon eller PC-en din er fra de siste årene, håndterer lokalt hverdagsdiktering uten å klage, og skyen blir nødutgangen heller enn standardvalget.
Slik skiller de tre veiene seg, fordi appen får deg til å velge og jeg vil heller at du velger godt:
- Local Parakeet — NVIDIAs TDT-motor, rundt 600 MB, og det raskeste lokale alternativet — 5 til 10 ganger raskere enn Whisper på CPU. Dekker engelsk pluss 24 andre europeiske språk, 25 totalt. Ingen oversettelse-til-engelsk. Hvis du fører dagbok på engelsk eller et annet europeisk språk, er dette det raske, helt frakoblede valget.
- Local Whisper — tregere enn Parakeet på samme maskin, men de flerspråklige byggene dekker 99 språk og kan oversette til engelsk. De engelsk-bare byggene er kun engelsk, ikke 99. Velg dette for kinesisk, japansk, koreansk, eller alt oversettelsesarbeid, som Parakeet ikke kan gjøre. Standard engelsk modell er rundt 480 MB.
- Cloud (OpenAI, BYOK) — best nøyaktighet og web-tilgang, ved bruk av din egen OpenAI-nøkkel fakturert direkte av OpenAI. Transkripsjon kjører på gpt-4o-mini-transcribe som standard. Trenger internett, så det er den ene veien som forlater maskinen din. Cloud-flaten er en del av Whisper Pro.
Den kjedelige sannheten er at for den typen tekst de fleste legger i Roam, holder lokalt i massevis. Begge de lokale motorene kjører helt på maskinen din uten at noe sendes til en server. Skyen gjør seg fortjent til plassen sin når du vil ha toppnøyaktighet på et vanskelig opptak, eller du trenger at modellen henter et faktum fra nettet midt i en setning. For en daglig-notater-vane, start lokalt og grip kun etter skyen når lokalt etterlater deg ønskende mer.
Tegnsetting, blokker, og Roam-syntaks med stemmen
Rå diktering kommer ut som én lang setning. Du sier «ok så se gjennom arkitekturdokumentet merk det project alpha og minn meg på torsdag», og det er den utegnsatte veggen enhver talemotor gir deg. Å rydde opp i den er der veiene skiller lag.
Windows Voice Typing legger til tegnsetting mens du snakker, og macOS Dictation håndterer grunnleggende tegnsetting når du sier «komma» eller «punktum». For tyngre opprydding — fjerne «eh-ene», fikse de lange setningene, gjøre et talt avsnitt til noe du faktisk ville beholdt i grafen din — kan Whisper kjøre en AI-runde. Si aktiveringsfrasen «Hey whisper» og teksten blir forbedret før den lander. På en lokal modell går det gjennom Ollama; i skymodus er det gpt-5-mini som standard.
ok så se gjennom arkitekturdokumentet merk det project alpha og minn meg på torsdag eh før standupen
Ok, så se gjennom arkitekturdokumentet, merk det Project Alpha, og minn meg på torsdag før standupen.
For Roams egen struktur — nøstede blokker, #tag- og [[side]]-lenkene, TODO-markørene — er det ærlige svaret at stemmen gir deg teksten og Roams egen syntaks gir deg strukturen. Diktér setningen, og skriv så Tab for å rykke inn blokken, # for en tag, eller [[ for en sidelenke slik du alltid gjør. Ingen dikteringsverktøy tryller frem Roams disposisjonssyntaks på kommando; den som lover «si dobbel-klamme project alpha og se den lenke» selger deg en demo, ikke en tirsdag. Få ordene ned raskt med stemmen, form blokkene med tastene du allerede kan.
Den samme snakk-så-rens-flyten lønner seg langt utover grafen din — du kan også diktere ren prosa inn i hvilken som helst app med den ene hurtigtasten, så en lang blokk blir noen få talte setninger i stedet for et avsnitt du skriver ut.
Når du bør hoppe over et dikteringsverktøy for Roam Research

Noen ganger er det riktige verktøyet det gratis som allerede er på maskinen din, og å late som noe annet ville vært uærlig. Hvis du bare slipper korte notater inn i Roam — en rask daglig-notat-linje, en to-ords påminnelse — dekker operativsystemet ditt det gratis.
På Windows, trykk Windows-tasten + H og den innebygde Voice Typing-linjen åpner seg der markøren din er, en Roam-blokk inkludert. Den setter tegn selv og er fin til korte drypp. Haken: den ruter gjennom Microsofts servere og trenger en internettforbindelse, så den er ikke et frakoblet alternativ, noe som betyr mer enn vanlig når grafen din er full av halvprivat tenkning. På Mac lar Dictation deg snakke for å skrive inn tekst hvor som helst du kan skrive, satt opp i Systeminnstillinger under Tastatur, og på Apple Silicon kan generell tekst behandles på enheten. Og hvis det du virkelig har er innspilt lyd — en samtale, en forelesning — passer en Roam Depot-utvidelse som transkriberer filen bedre enn noe sanntidsdikteringsverktøy.
Grip etter et dedikert, systemomfattende verktøy når de innebygde begynner å gjøre vondt: lange notater, flerspråklig arbeid, frakoblet personvern på Windows, eller ønsket om én hurtigtast som oppfører seg likt i Roam, e-posten din, og editoren din. Under den terskelen, bruk det som er gratis. Jeg kommer ikke til å be deg installere en app for en énlinjes påminnelse.
Den samme avveiingen dukker opp hvis du også fører notater andre steder — logikken i diktering inn i Obsidian er identisk, fordi også der er markøren, ikke en plugin, den ekte integreringen.
Mer å lese
Roam leverte aldri en mikrofonknapp, og etter å ha skrevet dette er jeg ganske sikker på at den aldri vil. Den trenger det ikke, fordi markøren er integreringen. Snakk inn i blokken, få tekst, form den med [[ og # du allerede kan. Jeg dikterte det meste av denne veiledningen inn i et tekstfelt som ikke var Roam, med et verktøy som ikke bryr seg om hvilket felt det er, og limte så hele greia inn i min egen graf. Det er hele trikset.
Prøv det i din neste Roam-blokk
Hold hurtigtasten, snakk, slipp. Transkripsjonen lander i hvilken blokk markøren din enn er i — og i alle andre apper også.
Gratis lokal modus for enhver innlogget konto. Ingen kort kreves for å starte.



