Gids
Spraak naar tekst in Roam Research
Roam Research heeft geen ingebouwde dicteerfunctie. De oplossing is een systeembrede tool: druk op een sneltoets, spreek, en de transcriptie wordt op je cursor geplakt in elk Roam-blok. Het dicteren van je besturingssysteem werkt ook, voor korte notities.
Laatst bijgewerkt: juni 2026

Spraak naar tekst in Roam Research werkt via een systeembrede tool, niet via Roam zelf. Roam Research heeft geen ingebouwde dicteerfunctie. De oplossing is een tool zoals Whisper: druk op een sneltoets, spreek, en de transcriptie wordt op de cursor geplakt in elk Roam-blok. Het dicteren van je eigen besturingssysteem werkt ook, voor korte notities.
Ik houd een dagelijkse-notities-pagina bij in Roam, omdat dat principe van gelinkt denken echt veranderde hoe ik ideeën vasthoud — elk blok is een knooppunt, elke [[page]] is een draad die ik later kan terugtrekken. Het enige wat ik altijd al wilde, was een gedachte een blok in praten in plaats van hem te typen. Ik ging op zoek naar de instelling. Die instelling bestaat niet. Roam heeft geen microfoonknop, en na flink wat zoeken durf ik te zeggen dat hij er ook niet verstopt zit.
Mensen zoeken op "spraak naar tekst in Roam Research", vinden niets in de app, en gaan ervan uit dat ze een schakelaar over het hoofd zagen. Dat deden ze niet. Die schakelaar is nooit gebouwd. Het goede nieuws is dat de oplossing zo'n twee minuten kost, volledig offline draait als je dat wilt, en als bonus werkt in elke andere app die je opent.
En hier komt het punt dat de meeste pagina's die om dit zoekwoord heen dansen niet ronduit zeggen. Een Roam-blok is gewoon een tekstvak, net als Gmail of een zoekbalk. Dicteren dat op je cursor plakt, maakt het niet uit in welke app de cursor staat.
De echte vraag is dus niet "hoe zet ik spraakgestuurd typen aan in Roam." Er is geen schakelaar. De vraag is "welke dicteertool draai ik bovenop Roam", en het antwoord hangt ervan af of je gratis-en-ingebouwd wilt, of één offline sneltoets die zich overal hetzelfde gedraagt. Ik loop alles na, zet er in twee minuten één op, en zeg je wanneer je de aparte route kunt overslaan.
Heeft Roam Research een ingebouwde dicteerfunctie?

Nee. Roam Research heeft geen ingebouwde functie voor spraak naar tekst, dicteren of spraakgestuurd typen om met je stem in een blok te schrijven. Er is geen microfoonknop op een blok, geen spraakopdracht, geen verborgen voorkeur. Roam neemt getypte invoer aan. Als je de menu's hebt uitgekamd op zoek naar een dicteerschakelaar, kun je stoppen. Hij is er niet.
Wat er wel bestaat, is een handvol Roam Depot-extensies en een Live AI Assistant met "speech" in de beschrijving, en juist hier raken mensen op het verkeerde been. Die zetten een audiobestand dat je al hebt opgenomen — een vergadering, een interview, een clip die je met /upload uploadde — achteraf om naar tekst, meestal door de OpenAI Whisper API met je eigen sleutel aan te roepen. Ze zijn nuttig, maar het is geen live dicteren. Je kunt je cursor niet in de dagelijkse notitie van vandaag zetten, praten, en woorden zien verschijnen. Ze verwerken een opname; ze typen niet voor je terwijl je nadenkt. De twee door elkaar halen kost je een middag, en die middag wil ik je graag besparen.
Het mobiele plaatje is een verhaal apart, en één zin waard zodat je het niet op het verkeerde apparaat najaagt: er zijn losse vastleg-apps die een spraak-naar-tekst-notitie vanaf een telefoon naar je graph sturen, maar dat is een telefoonfunctie, en op een telefoon zou je toch gewoon de microfoon van het toetsenbord gebruiken. Op de desktop-graph waar de meeste mensen echt leven, heb je een tool nodig die bovenop Roam zit. Er zijn een paar eerlijke categorieën, en de rest van deze gids behandelt ze.
Druk op een sneltoets, praat, tekst landt in het blok
Dit is het hele mechanisme, en het is saai op de beste manier. Je drukt op een sneltoets, je spreekt, je laat los, en de transcriptie wordt op je cursor geplakt, in welk tekstveld ook de focus heeft. Whisper houdt nog een korte staart vast nadat je de toets loslaat, zodat je laatste woord niet wordt afgekapt. Omdat het op de cursor van het besturingssysteem plakt, is een Roam-blok gewoon "elk tekstvak". De browser-app of een desktop-versie, hetzelfde gedrag — er is geen verschil dat Roam überhaupt kan zien.
Dat is het deel dat de landingspagina's te ingewikkeld maken. Er is geen extensie om in Roam te installeren, geen API-token om te plakken, geen sync-taak om te bewaken. Je cursor staat in een blok, je praat, de woorden verschijnen in het blok. Een kleine capsule verschijnt terwijl je spreekt, zodat je weet dat hij luistert:
De sneltoets is het enige wat het waard is om vooraf goed te zetten. Op Windows is het Ctrl+Space; op Mac is het Command+Option, een push-to-talk met alleen modifiers die je ingedrukt houdt terwijl je spreekt. Beide zijn aanpasbaar in Instellingen als ze botsen met iets dat je al gebruikt. (Mijn jongste dochter zei ooit dat een sneltoets "het niet deed" in haar tekenapp. Het was een conflict, geen bug, en zo leerde ik dat de gemiddelde mens geen idee heeft wat een sneltoetsconflict überhaupt is. Dus nu is elke sneltoets aanpasbaar.) Als je ooit dicteren op Mac hebt ingesteld, is dit hetzelfde spiergeheugen, gericht op een andere app.
Stel het in twee minuten in (Windows of Mac)
Je hebt een Mac met Apple Silicon of een Windows 10-pc of nieuwer nodig, een werkende microfoon, en Roam open in je browser. De hele lokale pijplijn is gratis voor elk ingelogd account, zonder dat er bij het aanmelden om een betaalmethode wordt gevraagd. Hier is de volgorde.
Stap 1 — Installeer Whisper en log in.
Download vanaf de downloadpagina, installeer, en maak een gratis account aan. Geen kaart. De hele lokale transcriptiepijplijn gaat meteen open.
Je weet dat het werkte als het systeemvakpictogram van de app verschijnt en de installatiewizard aanbiedt om een model te kiezen.
Stap 2 — Kies een transcriptiepad.
De app kiest niet voor je. Je krijgt er drie: Cloud (OpenAI, je eigen sleutel), Local Parakeet, of Local Whisper. Voor privé dagelijkse notities begin je lokaal — meer daarover twee secties verderop.
Je weet dat het werkte als een model klaar is met downloaden en als gereed wordt weergegeven.
Stap 3 — Bevestig je sneltoets.
Windows staat standaard op Ctrl+Space, Mac op Command+Option ingedrukt als push-to-talk. Geef op Mac de toegankelijkheidsmachtiging wanneer daarom wordt gevraagd; zonder die machtiging kan het plakken-op-cursor je browser niet bereiken.
Je weet dat het werkte als een testopname in een willekeurig tekstveld wordt geplakt.
Stap 4 — Zet je cursor in een Roam-blok en praat.
Open je graph, klik in een blok, houd de sneltoets ingedrukt, zeg een zin, laat los. De transcriptie verschijnt waar de cursor staat, in het blok.
Je weet dat het werkte als je uitgesproken zin als tekst in het Roam-blok staat.
Het trage deel is het downloaden van het model, niet de installatie. Al het andere zijn de vier stappen hierboven. Zodra het draait, is het vastleggen van een gedachte in je graph geen typeklus meer, maar een praatklus.
Een Roam-extensie versus een systeembrede sneltoets
De meeste pagina's die op dit zoekwoord scoren, wijzen je naar een Roam Depot-extensie — de Live AI Assistant, de Otter-importeur, iets met "speech" in de naam. Het zijn prima tools, met één structureel addertje dat ze gemeen hebben. Ze zetten audio om die je al hebt opgenomen — een vergaderbestand, een Otter-sessie, een clip die in een blok is geüpload — niet live spraak in het blok dat je nu aan het bewerken bent. Je neemt op, dan transcribeer je, dan ruim je het resultaat op. Dat is een transcriptie-workflow, geen dicteer-workflow. Ze lossen "ik heb een uur audio" op, niet "ik wil deze zin mijn dagelijkse notitie in praten".
Een systeembrede sneltoets omzeilt dat helemaal. Hij plakt op de cursor van het besturingssysteem, ongeacht welk venster die cursor bezit, dus dezelfde toets die een Roam-blok vult, vult ook je Gmail-opstelvenster, een Slack-bericht, en een commit-bericht. Eén tool, elk tekstveld, op zowel Windows als Mac. Je hoeft niets opnieuw te leren als je van app wisselt, en niets hoeft te weten dat het Roam is — de cursor doet het integreren.
Als je vooral opnames hebt om te transcriberen — gesprekken, colleges, spraakmemo's die je al vastlegde — dan is een Depot-extensie die Whisper op het bestand aanroept de juiste vorm, en een blik waard. Op het moment dat je eigenlijk hardop wilt denken in een vers blok, live, wint de systeembrede route. Ik grijp naar die ene sneltoets, omdat ik ruwweg veertig keer per uur van app wissel en geen veertig verschillende dicteerknoppen wil onthouden.
Lokaal of cloud: welke modus voor een privé graph
Probeer voor Roam eerst de lokale modus. Een graph loopt vol met het ongefilterde spul — een half gevormd idee, een vergadersamenvatting, een dagboeknotitie die je nooit op iemand anders' server zou willen. Als je twee keer zou nadenken voordat je een blok openbaar maakt, denk je waarschijnlijk ook twee keer na voordat je je stem via een cloud stuurt om het te schrijven. Als je Mac Apple Silicon heeft of je pc van de laatste paar jaar is, verwerkt lokaal het alledaagse dicteren zonder gemopper, en wordt cloud de nooduitgang in plaats van de standaard.
Zo verschillen de drie paden, want de app laat je kiezen en ik wil graag dat je goed kiest:
- Local Parakeet — NVIDIA's TDT-engine, ongeveer 600 MB, en de snelste lokale optie — 5 tot 10 keer sneller dan Whisper op de CPU. Dekt Engels plus 24 andere Europese talen, 25 in totaal. Geen vertaling naar het Engels. Als je in het Engels of een andere Europese taal je dagboek bijhoudt, is dit de snelle, volledig offline keuze.
- Local Whisper — trager dan Parakeet op dezelfde machine, maar de meertalige builds dekken 99 talen en kunnen naar het Engels vertalen. De Engels-only builds zijn alleen Engels, geen 99. Kies dit voor Chinees, Japans, Koreaans, of welk vertaalwerk dan ook, wat Parakeet niet kan. Het standaard Engelse model is ongeveer 480 MB.
- Cloud (OpenAI, eigen sleutel) — de beste nauwkeurigheid en webtoegang, met je eigen OpenAI-sleutel die rechtstreeks door OpenAI wordt gefactureerd. Transcriptie draait standaard op gpt-4o-mini-transcribe. Heeft internet nodig, dus het is het enige pad dat je machine verlaat. De Cloud-functionaliteit is onderdeel van Whisper Pro.
De saaie waarheid is dat voor het soort tekst dat de meeste mensen in Roam zetten, lokaal ruim voldoende is. Beide lokale engines draaien volledig op je machine, zonder dat er iets naar een server gaat. Cloud verdient zijn plek wanneer je topklasse nauwkeurigheid wilt op een lastige opname, of wanneer je het model midden in een zin een feit van het web wilt laten plukken. Voor een dagelijkse-notities-gewoonte begin je lokaal en grijp je alleen naar cloud wanneer lokaal je tekortdoet.
Interpunctie, blokken en Roam-syntax met je stem
Ruwe dictatie komt eruit als één lange dooreenloop. Je zegt "oké dus bekijk het architectuurdocument tag het project alpha en herinner me donderdag", en dat is de ongeïnterpungeerde muur die elke spraakengine je voorschotelt. Het opschonen is waar de paden uiteenlopen.
Windows Voice Typing voegt interpunctie toe terwijl je spreekt, en macOS Dictation regelt basisinterpunctie als je "komma" of "punt" zegt. Voor zwaarder opschoonwerk — de "ehms" eruit halen, de dooreenlopen rechttrekken, een gesproken alinea omtoveren tot iets dat je daadwerkelijk in je graph zou bewaren — kan Whisper een AI-passage draaien. Zeg de activeringszin "Hey whisper" en de tekst wordt verbeterd voordat hij landt. Op een lokaal model loopt dat via Ollama; in cloudmodus is het standaard gpt-5-mini.
oké dus bekijk het architectuurdocument tag het project alpha en herinner me donderdag ehm voor de standup
Oké, dus bekijk het architectuurdocument, tag het Project Alpha, en herinner me donderdag voor de standup.
Voor Roams eigen structuur — geneste blokken, de #tag- en [[page]]-links, TODO-markeringen — is het eerlijke antwoord dat de stem je de tekst geeft en Roams eigen syntax je de structuur geeft. Dicteer de zin, en typ daarna de Tab om het blok in te springen, de # voor een tag, of de [[ voor een paginalink zoals je dat altijd doet. Geen dicteertool tovert Roams outline-syntax op commando tevoorschijn; wie je "zeg dubbele-haak project alpha en kijk hoe het linkt" belooft, verkoopt je een demo, geen doordeweekse dag. Krijg de woorden snel op papier met je stem, vorm de blokken met de toetsen die je al kent.
Diezelfde spreek-dan-opschoon-stroom werpt ook ver buiten je graph vruchten af — je kunt ook nette tekst in elke app dicteren met die ene sneltoets, zodat een lang blok een paar gesproken zinnen wordt in plaats van een alinea die je uittypt.
Wanneer je een dicteertool voor Roam Research kunt overslaan

Soms is de juiste tool de gratis tool die al op je machine staat, en doen alsof dat niet zo is, zou oneerlijk zijn. Als je alleen korte notities in Roam zet — een snelle regel in de dagelijkse notitie, een herinnering van twee woorden — dan dekt je besturingssysteem dat voor niets.
Op Windows druk je op Windows-toets + H en gaat de ingebouwde Voice Typing-balk open waar je cursor ook staat, een Roam-blok inbegrepen. Hij zet zelf de interpunctie en is prima voor korte uitbarstingen. Het addertje: hij loopt via de servers van Microsoft en heeft een internetverbinding nodig, dus het is geen offline optie, wat meer dan gewoonlijk telt wanneer je graph vol staat met half-privé gedachten. Op Mac laat Dictation je tekst inspreken overal waar je kunt typen, in te stellen in Systeeminstellingen onder Toetsenbord, en op Apple Silicon kan algemene tekst op het apparaat zelf worden verwerkt. En als je eigenlijk opgenomen audio hebt — een gesprek, een college — dan past een Roam Depot-extensie die het bestand transcribeert beter dan welke live-dicteertool ook.
Grijp naar een speciale, systeembrede tool zodra de ingebouwde opties pijn beginnen te doen: lange notities, meertalig werk, offline privacy op Windows, of de wens van één sneltoets die zich in Roam, je e-mail en je editor hetzelfde gedraagt. Onder die grens gebruik je wat gratis is. Ik ga je niet aanraden een app te installeren voor een herinnering van één regel.
Dezelfde afweging duikt op als je ook elders notities bijhoudt — de logica in dicteren in Obsidian is identiek, want ook daar is de cursor, niet een plug-in, de echte integratie.
Verder lezen
Roam heeft nooit een microfoonknop uitgebracht, en na het schrijven van dit stuk ben ik er vrij zeker van dat dat ook nooit gebeurt. Het hoeft ook niet, want de cursor is de integratie. Praat in het blok, krijg tekst, vorm het met de [[ en # die je al kent. Ik dicteerde het grootste deel van deze gids in een tekstvak dat geen Roam was, met een tool die het niet uitmaakt welk vak het is, en plakte daarna het geheel in mijn eigen graph. Dat is de hele truc.
Probeer het in je volgende Roam-blok
Houd de sneltoets ingedrukt, praat, laat los. De transcriptie landt in welk blok je cursor ook staat — en in elke andere app ook.
Gratis lokale modus voor elk ingelogd account. Geen kaart nodig om te beginnen.



