Door Denys Medvediev

Gids

Realtime dicteer-app voor schrijvers

Met een realtime dicteer-app voor schrijvers spreek je een zin in en staat die een tel later al bij je cursor. Met Whisper houd je een sneltoets ingedrukt, spreek je, laat je los — en de transcriptie wordt geplakt in alles waar je in schrijft. Op lokale modellen duurt dat ongeveer anderhalve seconde.

Laatst bijgewerkt: juni 2026

Handen van een schrijver naast een toetsenbord en een open document op een donker bureau, als oproep voor schrijven met stem

Een realtime dicteer-app voor schrijvers zet spraak om in tekst op de cursorpositie, bijna zonder vertraging. Whisper werkt met push-to-talk: houd een sneltoets in, spreek een zin, laat los — en de transcriptie verschijnt in de editor. Op lokale modellen zit er vanaf het loslaten van de toets tot de tekst ongeveer 1,4 seconde tussen. Het werkt offline, gratis, in elke desktopapp.

Ik bouwde Whisper omdat typen het traagste onderdeel van schrijven was. Niet het nadenken, niet het redigeren — maar het letterlijke bewegen van vingers, snel genoeg om bij te houden wat ik in mijn hoofd al klaar had. Stem lost dat op. Je praat met zo'n 145 woorden per minuut; je typt misschien 40. Dat verschil is het hele verhaal.

Maar "realtime" is een zwaar beladen woord, en de meeste pagina's die dicteren aan schrijvers verkopen laten je de verkeerde dingen inbeelden. Dus voordat je iets downloadt, wil ik eerlijk zijn over wat realtime hier werkelijk betekent, hoe de vertraging aanvoelt, en waar dit past in een echte schrijfsessie — lange stukken proza, blogberichten, fictie, die e-mail die je al weken uitstelt.

Dit is de eerlijke versie die de meeste marketingpagina's overslaan. Whisper werkt met push-to-talk. Je houdt een sneltoets ingedrukt, spreekt een of drie volledige zinnen in, en laat los. De transcriptie wordt bij loslaten op je cursor geplakt — niet woord voor woord terwijl je spreekt, zoals op het scherm van een stenograaf in de rechtszaal. De eenheid is de uiting, niet de lettergreep.

Dat onderscheid is belangrijk, want het stelt de juiste verwachting. Als je je voorstelt dat woorden in de pas met je mond over het scherm kruipen, dan heb je het over live ondertiteling — een ander hulpmiddel voor een andere taak. Wat Whisper een schrijver geeft, is in de praktijk sneller dan dat: je zegt een gedachte, die verschijnt, je zegt de volgende. Op een lokaal model duurt de hele cyclus zo'n 1,4 seconde. Snel genoeg dat je het niet meer opmerkt en gewoon begint te schrijven.

Wat "realtime" werkelijk betekent voor een schrijver

Een schrijver die typt op een laptop met een notitieboek erbij, als illustratie van de schrijfstroom die stem vervangt

Schrijvers grijpen naar dicteren om dezelfde reden als ik: het concept zit al in je hoofd en het toetsenbord staat in de weg. Een eerste versie moet snel en ruw zijn. Het toetsenbord maakt het traag en netjes, precies andersom. Praten laat je de rommelige versie vastleggen op de snelheid waarop je denkt, en redigeren — het deel waarvoor je vingers echt nodig zijn — komt daarna.

Dus als een schrijver zoekt op "realtime dicteren", wil die meestal dit: een zin uitspreken en zien dat die verschijnt voordat de volgende gedachte alweer weg is. Dat is de echte lat. Niet letter-voor-letter streaming — een gat van minder dan twee seconden, zodat de woorden er staan voordat de gedachte verdampt. Whisper haalt dat. Van het loslaten van de sneltoets tot tekst in je document duurt het zo'n 1,4 seconde op een lokaal model op een M1 Air, iets boven de twee seconden op een gemiddelde Windows-machine met een groter model. (Ik heb de flow zien breken zodra de vertraging voorbij de twee seconden kruipt — je hersenen koppelen weer in op het scherm en je verliest de draad. Dat getal obsedeerd me dan ook.)

Het andere wat schrijvers willen, is het document nooit verlaten. Een lange tekst is een flow-toestand, en die overleeft het niet als je een apart transcriptievenster opent, op opnemen drukt, wacht, kopieert en terugplakt. Whisper plakt op de cursor in de app waar je al in zit — Scrivener, Word, Google Docs in een browser, een simpele tekstverwerker, je CMS. Je wisselt niet van venster. Je houdt een toets in en schrijft door. Dat is het deel dat het aanvoelt als realtime, ook al plakt het strikt genomen pas bij loslaten.

Houd een sneltoets in, spreek, laat los — de tekst plakt zichzelf

De werking is saai, en dat is het grootste compliment dat ik een stuk software kan geven. Je houdt een sneltoets in, spreekt, laat los, en de transcriptie verschijnt op je cursor in alles wat de focus heeft. Whisper houdt een korte staart aan — 250 milliseconden — nadat je loslaat, zodat je laatste woord niet wordt afgekapt. Omdat het plakt op de besturingssysteemcursor is je manuscript gewoon "een tekstvak". Scrivener, Final Draft, Word, een Substack-concept in de browser — zelfde gedrag, geen instellingen per app.

Terwijl je spreekt verschijnt er een kleine capsule zodat je weet dat er geluisterd wordt, daarna toont die kort de transcriptiestap voordat de woorden landen. Dat is de hele cyclus. Er is geen apart appvenster om naartoe te schakelen, geen opnameknop om te zoeken, geen bestand om te exporteren. Je cursor staat in de alinea, je praat, de zin verschijnt in de alinea:

Cancel
De opname-overlay: een kleine capsule die verschijnt terwijl je spreekt, zodat je weet dat Whisper luistert.

De sneltoets is het enige wat de moeite waard is om vroeg goed in te stellen. Op Windows is het Ctrl+Space; op Mac is het Command+Option, een push-to-talk die je ingedrukt houdt terwijl je spreekt. Beide zijn aanpasbaar in Instellingen, wat voor schrijvers uitmaakt omdat veel schrijfapps toetsen claimen voor hun eigen snelkoppelingen. (Mijn jongste dochter vertelde me ooit dat een sneltoets "niet werkte" in haar tekenprogramma. Het was een conflict, geen bug — zo leerde ik dat de gemiddelde persoon geen idee heeft wat een sneltoetsconflict is. Dus nu is elke sneltoets aanpasbaar.) Als je al dicteren op Windows of op Mac hebt ingesteld, is dit hetzelfde spiergeheugen, nu gericht op je schrijfapp.

In twee minuten instellen (Windows of Mac)

Je hebt een Mac met Apple Silicon of een Windows 10-of-nieuwer pc nodig, een werkende microfoon, en de editor waarin je schrijft open. De hele lokale pipeline is gratis voor elk ingelogd account, zonder betaalmethode bij aanmelding. Hier de stappen.

Stap 1 — Installeer Whisper en log in.

Download vanaf de downloadpagina, installeer en maak een gratis account aan. Geen kaart. De hele lokale transcriptiepipeline is meteen beschikbaar.

Je weet dat het werkt wanneer het systeemvakpictogram van de app verschijnt en de installatiewizard aanbiedt om een model te kiezen.

Stap 2 — Kies een transcriptiepad.

De app kiest niet voor je. Je krijgt drie opties: Cloud (OpenAI, eigen sleutel), Lokale Parakeet, of Lokale Whisper. Voor privé proza schrijven: begin lokaal — meer daarover twee secties verderop.

Je weet dat het werkt wanneer een model klaar is met downloaden en als gereed wordt weergegeven.

Stap 3 — Bevestig je sneltoets.

Windows staat standaard op Ctrl+Space, Mac op Command+Option als push-to-talk. Geef op Mac de toegankelijkheidsrechten toe wanneer gevraagd; zonder die rechten kan het plakken op de cursor je schrijfapp niet bereiken.

Je weet dat het werkt wanneer een testopname in elk tekstveld wordt geplakt.

Stap 4 — Zet je cursor in je concept en praat.

Open het document, klik waar je de volgende zin wilt, houd de sneltoets in, zeg de zin, laat los. De transcriptie verschijnt op de cursor, midden in de alinea en al.

Je weet dat het werkt wanneer je gesproken zin als tekst in het concept staat.

Whisper
De echte Whisper-desktopapp op het instellingenscherm, met de transcriptie- en AI-panelen open.

Het trage onderdeel is het downloaden van het model, niet de installatie. De rest zijn gewoon de vier stappen hierboven. Als het eenmaal draait, is een zin op de pagina krijgen geen typetaak meer maar een praattaak — voor een lang concept het verschil tussen een middag en een avond.

spraak naar tekst op Windows · op Mac

Hoe het voelt om een concept in te dicteren

De truc bij het dicteren van proza is te stoppen met het dicteren van perfect proza. Nieuwe schrijvers proberen met komma's en alinea-overgangen te spreken en zijn daardoor trager dan typen. De snelle manier is in hele gedachten praten — zeg de zin zoals je die aan een vriend zou zeggen, laat los, zeg de volgende. Laat de eerste doorloop ruw zijn. Je legt het concept vast, je zetterij. Een blogbericht van 1.500 woorden dat me negentig minuten typt te schrijven, kost me de helft om in te spreken — en het meeste van die besparing zit hem simpelweg in niet halverwege een zin stoppen om iets te verbeteren.

Het push-to-talk-ritme past bij hoe schrijvers werkelijk denken. Je houdt de toets ingedrukt voor één idee, laat los, kijkt wat er staat, besluit de volgende zin, houdt weer in. De pauzes tussen de aandrukken zijn denktijd, geen dode tijd — het hulpmiddel neemt je "eh"s niet op terwijl je naar de muur staart en bedenkt waar de scène naartoe gaat. Voor fictie in het bijzonder is dit dichter bij hoe dialoog in je hoofd klinkt dan typen ooit is; je speelt de regel, en dan staat die op de pagina om te snijden.

Twee praktische tips voor lange sessies. Ten eerste: dicteer in brokken van een of drie zinnen, niet hele alinea's in één adem — kortere bursts plakken sneller en zijn makkelijker te corrigeren als een woord verkeerd uitkomt. Ten tweede: je microfoon doet er meer toe dan je denkt. Een USB-microfoon van $20 doet meer voor de nauwkeurigheid dan welke modelupgrade dan ook, omdat schoon geluid is wat het model mee werkt. Dat is de saaie waarheid die niemand die je "AI-nauwkeurigheid" verkoopt voorop wil stellen. Als de woorden zo snel stromen, kun je complete concepten inspreken en het toetsenbord behandelen als redigeergereedschap — waarvoor het altijd al beter geschikt was.

Lokaal of cloud: welke modus voor een schrijver

Begin voor het schrijven met de lokale modus. Een manuscript in wording, een pitch die je nog niet hebt verstuurd, een dagboekvermelding — niets van dat alles hoeft je laptop te verlaten om tekst te worden. Als je Mac Apple Silicon heeft of je pc van de afgelopen paar jaar is, verwerkt de lokale modus dagelijks dicteren probleemloos, en cloud wordt de nooduitgang in plaats van de standaard. Zo verschillen de drie paden, want de app laat je kiezen en ik wil liever dat je goed kiest:

  • Lokale ParakeetNVIDIA's TDT-engine, zo'n 600 MB, en de snelste lokale optie — 5 tot 10 keer sneller dan Whisper op CPU. Ondersteunt Engels plus 24 andere Europese talen, 25 in totaal. Geen vertaling naar Engels. Als je in het Engels of een andere Europese taal schrijft, is dit de snelle, volledig offline keuze — en de optie die de vertraging laag houdt.
  • Lokale WhisperTrager dan Parakeet op dezelfde machine, maar de meertalige versies ondersteunen 99 talen en kunnen vertalen naar Engels. De Engelstalige versies zijn alleen voor Engels, niet 99 talen. Kies dit als je Chinees, Japans of Koreaans schrijft (wat Parakeet niet kan), vertaling nodig hebt, of hotwoord-biasing wilt voor karakternamen en bedachte woorden. Standaard Engels model is zo'n 480 MB.
  • Cloud (OpenAI, BYOK)Beste nauwkeurigheid en webtoegang, met je eigen OpenAI-sleutel die rechtstreeks door OpenAI wordt gefactureerd. Transcriptie gebruikt standaard gpt-4o-mini-transcribe. Vereist internet — het is het enige pad dat je machine verlaat — en maakt deel uit van Whisper Pro.

De nuchtere waarheid is dat voor de meeste proza de lokale modus meer dan genoeg is — beide lokale engines draaien volledig op je eigen machine zonder dat er iets naar een server wordt gestuurd. Cloud verdient zijn plek als je topnauwkeurigheid wilt bij een lastige opname, of als je halverwege een zin iets van het web nodig hebt. Cloud is op een goede verbinding ook het snelste pad met zo'n 1,1 seconde, omdat de netwerkronde sneller is dan lokale berekening op een tragere laptop. Begin lokaal; grijp pas naar cloud als lokaal tekortschiet.

Eén mening waar ik achter sta: cloud-alleen dicteren is een privacyramp die wacht om uitgeschreven te worden. Ik heb eens een intern team gezien dat in een kwartaal een vijfcijferige cloudrekening opbouwde, grotendeels door een "slimme herpoging"-lus die dezelfde opnames vier keer opnieuw transcribeerde. De CFO opende het dashboard tijdens de kwartaalevaluatie en het werd heel stil in de kamer. Je eerste concept hoeft niet in de logs van een leverancier te leven om tekst te worden. Je laptop heeft al een microfoon en een CPU.

Van gesproken concept naar gepolijst proza

Ruw gedicteerde tekst is een aaneenschakeling. Je zegt "oké dus het hoofdstuk begint op het treinstation ze is te laat ze heeft de verbinding gemist eh en het hele verhaal begint daarvandaan," en dat is de ongeleesterde muur die elke spraakengine je geeft. Voor een concept is dat prima — je gaat toch redigeren. Maar er is een snellere weg naar leesbare tekst.

Windows Spraaktypen voegt leestekens toe terwijl je spreekt, en macOS Dictation verwerkt de basis wanneer je "komma" of "punt" zegt. Voor zwaardere opschoning — "ehs" verwijderen, aaneenrijgingen oplossen, een gesproken alinea omzetten in iets wat je wilt bewaren — kan Whisper een AI-doorloop uitvoeren. Zeg de activeringsfrase "Hey whisper" en de tekst wordt verbeterd voordat die landt. Op een lokaal model gaat dat via Ollama; in cloudmodus is het standaard gpt-5-mini.

Thinking...
Rauw

oké dus het hoofdstuk begint op het treinstation ze is te laat ze heeft de verbinding gemist eh en het hele verhaal begint daarvandaan

Opgeschoond

Oké, dus het hoofdstuk begint op het treinstation. Ze is te laat — ze heeft de verbinding gemist — en het hele verhaal begint daarvandaan.

Een waarschuwing die schrijvers in het bijzonder moeten horen: de AI-opschoning is een interpunctie-en-opvullerpass, geen mede-auteur. Het corrigeert de techniek; het herschrijft je stem niet, en dat moet je ook niet toelaten. Voor fictie of alles met een uitgesproken stijl gebruik ik de lichtere lokale verbetering of sla die bij de eerste versie helemaal over en redigeer later met de hand — want het hele punt van snel dicteren is dat de ruwe versie van jou is. Gebruik de opschoning om aantekeningen leesbaar te maken. Het eigenlijke schrijven doe je zelf.

Dezelfde spreek-dan-schoon-maak-stroom werkt overal waar je tekst bijhoudt — het is precies hoe ik aantekeningen dicteer en ideeën vastleg tussen schrijfsessies door, zodat een onderzoeksgedachte of een plotpunt van gesproken terzijde naar een nette regel gaat zonder de stroom te breken.

Wanneer een realtime dicteer-app het verkeerde gereedschap is

Twee met krijt getekende pijlen op een stoep die verschillende kanten op wijzen, als illustratie van een gereedschapskeuze

Soms is het eerlijke antwoord dat je iets anders nodig hebt, en dat zeg ik liever dan je het verkeerde ding te verkopen. Whisper is push-to-talk dicteren in de app waar je in schrijft. Het is geen live ondertiteling, geen interview-transcriptie, en geen telefoongereedschap.

Als je echt woorden op het scherm nodig hebt terwijl je spreekt — ondertiteling bij een live lezing, subtitels die meeschuiven tijdens een stream, een toegankelijkheidsondertiteltrack — dan heb je echte live ondertiteling nodig, een aparte categorie gebouwd voor doorlopende streaming, niet voor druk-en-loslaat-dicteren. Grijp naar een ondertitelingsprogramma. Als je een opgenomen interview of een vergadering van twee uur wilt omzetten in een transcript, dan is dat bestandstranscriptie met sprekerlabels — een dienst zoals Otter.ai of Rev past beter dan een dicteersneltoets; een andere categorie, gebruik geen schrijfgereedschap voor een transcriptieklus. En als je alleen maar een notitie van 30 woorden onderweg inspreekt, is de microfoon van je telefoonstuurprogramma gratis en al in je zak; Whisper is een desktoptool voor Windows en macOS, dus daarvoor is er geen app om te installeren.

Grijp naar een realtime dicteer-app wanneer de klus schrijven is: lange stukken proza, een blogbericht, een hoofdstuk, een e-mail die je maar blijft uitstellen — geschreven aan je bureau, in de app die je al gebruikt, waar spreken sneller is dan typen en je de woorden een seconde later op je cursor wilt. Daaronder: gebruik wat gratis is. Ik ga je niet vragen een desktopapp te starten om een eenregelige sms te sturen.

De meeste schrijvers van wie ik hoor, zitten op het ene of het andere platform. Als je de platformspecifieke uitleg wilt, behandelt de setup in dicteersoftware voor schrijvers de workflow van begin tot eind — van het kiezen van een model tot het de hele sessie van het toetsenbord afblijven.

"Realtime" betekent voor een schrijver niet dat letters in de pas met je mond over de pagina kruipen. Het betekent dat je een zin zegt en die er al staat voordat de volgende gedachte weg is — zo'n anderhalve seconde, in de app waar je al in zit, niets verzonden. Dat is de truc, en het is een stille. Ik heb het grootste deel van deze gids zin voor zin ingesproken, de toets loslaten tussen gedachten, de woorden zien verschijnen terwijl ik de volgende regel bedacht. Het toetsenbord lag de hele tijd klaar, nuttig alleen voor de bewerkingen. Precies waar ik het wil hebben.

Spreek je volgende concept de pagina op

Houd de sneltoets in, zeg een zin, laat los. De woorden landen op je cursor in alles waar je in schrijft — zo'n anderhalve seconde later, niets verzonden.

Gratis lokale modus voor elk ingelogd account. Geen kaart nodig om te starten.

Foto van Denys Medvediev

Denys Medvediev

Ik ben degene die onze support-e-mail leest — hoogstwaarschijnlijk door de antwoorden in te dicteren.

Verder lezen