Door Denys Medvediev

Uitleg

Privé spraak naar tekst, op het apparaat

Privé spraak naar tekst betekent dat je stem wordt omgezet op je eigen apparaat, zonder dat er iets naar een server wordt geüpload. Lokale Whisper en Parakeet werken volledig offline. Clouddicteer stuurt je audio juist weg om te worden omgezet.

Laatst bijgewerkt: juni 2026

Een hangslot op een laptoptoetsenbord in weinig licht, een beeld van privacy op het apparaat

Privé spraak naar tekst is transcriptie die op het eigen apparaat van de gebruiker draait, zodat de opgenomen stem het apparaat nooit verlaat. Lokale engines zoals Whisper en Parakeet werken volledig offline en sturen niets naar een server. Clouddicteerservices uploaden audio om op afstand te worden omgezet. Kies voor maximale privacy een lokale, offline tool.

Elke dicteertool noemt zichzelf privé. De meeste zijn het niet. Het woord wordt opgerekt tot iets als "we versleutelen de upload" of "we verwijderen hem na 30 dagen," maar je stem heeft toch je apparaat verlaten, op iemands server gezeten en is omgezet door een computer die niet van jou is. Dat is een privacybeleid, geen privacy. Er bestaat een echte, scherpe definitie van het woord, en het is de moeite waard die helder te hebben voordat je een tool vertrouwt met de e-mail aan je advocaat.

De eerlijke definitie is eenvoudig: privé spraak naar tekst betekent dat audio op jouw apparaat wordt omgezet naar woorden, en dat er niets naartoe wordt gestuurd. Geen upload, geen server, geen internet nodig. Die versie bestaat, is gratis voor de lokale pipeline en draait op de laptop die je al hebt. Het addertje — en ik ben daar eerlijk over — is dat het moment waarop je overschakelt naar een cloudmodus voor betere nauwkeurigheid, die belofte verandert. Ik trek die lijn duidelijk.

Dit is wat begraven ligt onder marketing. "Privé" is geen gevoel, het is een vraag met één antwoord: verlaat de audio het apparaat of niet. Als dat zo is, kan iemand anders die in principe horen. Als dat niet zo is, niet. Al het andere — versleuteling, bewaartermijnen, compliance-badges — is schadebeperking voor het geval het wél het apparaat verlaat.

De echte vraag is dus niet "is deze tool privé." Het is "wordt mijn stem op mijn machine omgezet of op die van hen." Lokale Whisper en Parakeet doen het op die van jou, offline, met het model geladen in je eigen RAM. Clouddicteer doet het op die van hen. Deze gids legt uit wat dat onderscheid je oplevert, hoe je de lokale versie in twee minuten instelt, en de ene eerlijke uitzondering waarbij het sturen van audio naar de cloud een redelijke afweging is.

Wat "privé" echt betekent voor spraak naar tekst

Een gesloten hangslot op een laptop-trackpad, als beeld van privacy van gegevens op het apparaat

Privé spraak naar tekst betekent één specifiek ding: je opgenomen stem wordt op je eigen apparaat omgezet naar tekst, en de audio verlaat dat apparaat nooit. Geen upload naar een server, geen heen-en-weerverkeer over internet, geen derde partij in het proces. De transcriptie vindt plaats in je eigen geheugen en CPU, net zoals spellingcontrole werkt, en daarna is de audio verdwenen. Dat is de volledige definitie, en de meeste tools die het woord "privé" gebruiken voldoen er niet aan.

Wat doorgaans als "privé" wordt verkocht, is de cloudversie met een beter slot op de deur. De audio reist nog steeds naar de servers van een leverancier om te worden omgezet; de leverancier belooft alleen hem onderweg te versleutelen en op enig moment te verwijderen. Dat is oprecht beter dan niets, en voor veel mensen is het prima. Maar het is niet hetzelfde als audio die het apparaat nooit verlaat. Een belofte om te verwijderen is een belofte. Verwerking op het apparaat is een feit — er valt niets te verwijderen omdat er niets is verstuurd. Wanneer privacy er echt toe doet — een salarisgetal, een medische notitie, een concepttekst die je nooit geïndexeerd wilt zien — maakt het verschil tussen een belofte en een feit alles uit.

De reden dat transcriptie op het apparaat überhaupt mogelijk is, is dat de modellen kleiner zijn geworden en de laptops sneller. Een paar jaar geleden had je een datacenter nodig voor goede spraakherkenning, en daarom verdween alles naar de cloud. Vandaag draait een open Whisper-model lokaal op een middenklasse laptop, en Parakeet is nog sneller. De cloud was een tijdelijke oplossing voor hardware die je niet langer beperkt. Privé spraak naar tekst is geen premiumfunctie waarvoor je extra betaalt — het is de standaard die praktisch is geworden, en de rest van deze gids gaat over het gebruik ervan.

Waarom de meeste clouddicteer niet privé is

Wanneer je een toets indrukt in een clouddicteer-tool, gebeurt dit onder de motorkap: je microfoon neemt een paar seconden audio op, dat audiobestand wordt via internet naar een server gestuurd, een model op die server zet het om, en de tekst komt terug op je scherm. Het geheel duurt nauwelijks een seconde, en dat is precies waarom het onzichtbaar aanvoelt. Maar je stem — de echte opname, niet alleen de woorden — heeft een reis gemaakt naar een machine die jij niet beheert en terug.

Windows Spraaktypist is het duidelijkste voorbeeld, omdat de meeste mensen het al hebben. Druk op de Windows-toets + H en er verschijnt een balkje dat je spraak typt in het veld dat actief is. Het werkt goed. Het is ook een clouddienst — de online spraakherkenning van Microsoft — en dat is waarom het een internetverbinding nodig heeft en niet werkt in een vliegtuig. Je audio gaat naar de servers van Microsoft om tekst te worden. Hetzelfde geldt voor de meeste "AI-dicteer"-apps die vandaag verschijnen: het slimme gedeelte draait op andermans hardware, en een stille maandelijkse factuur is de huurprijs. Een lokale tool toont een klein kapselje terwijl hij luistert, en de audio die hij opneemt verlaat de laptop nooit:

Cancel
De opname-overlay: een klein kapselje dat verschijnt terwijl je spreekt. Met een lokale engine wordt de opgenomen audio op het apparaat omgezet en nooit geüpload.

Ik zeg niet dat cloudtranscriptie slecht is — ik verdedig het verderop voor de gevallen waar het zijn waarde bewijst. Ik zeg dat het marketingwoord "privé" doorgaans het slot op de upload beschrijft, niet de afwezigheid van een upload. Clouddicteer is een privacyramp die wacht om te worden omgezet, en degenen die dat als eerste voelen zijn de mensen die de rekening niet kunnen zien. Ik heb eens een team in één kwartaal een vijfcijferige cloud-AI-rekening zien oplopen, grotendeels door een "slim opnieuw proberen"-bug die dezelfde standup-opnames vier keer opnieuw verstuurde. De CFO opende het dashboard bij de kwartaalevaluatie en het werd zeer stil in de kamer. Niemand had besloten al die audio naar een server te sturen. De tool deed het gewoon, elke keer, want zo werkte hij.

Hoe lokale spraak naar tekst het privé houdt

De privéversie draait volledig op je machine. Je drukt op een sneltoets, spreekt, laat los, en een model dat al in je eigen RAM is geladen zet de audio om naar tekst en plakt die bij je cursor — geen internet, geen server, niets verstuurd. Je hebt een Mac op Apple Silicon of een Windows 10-of-nieuwer-pc nodig, een werkende microfoon en een paar minuten. De volledige lokale pipeline is gratis voor elk ingelogd account, zonder dat er bij aanmelding om een betaalmethode wordt gevraagd. Dit is de volgorde.

Stap 1 — Installeer Whisper en log in.

Download van de downloadpagina, installeer en maak een gratis account aan. Geen kaart nodig. De volledige lokale transcriptiepipeline is meteen beschikbaar, offline.

Je weet dat het werkt wanneer het systeemvakpictogram van de app verschijnt en de installatiewizard aanbiedt een model te kiezen.

Stap 2 — Kies een lokaal transcriptiepad.

De app kiest niet voor jou. Kies voor privé, offline dicteer Local Parakeet of Local Whisper — beide draaien op jouw machine. De derde optie, Cloud, uploadt audio, dus laat die uit als privacy het doel is.

Je weet dat het werkt wanneer een lokaal model klaar is met downloaden en als gereed wordt weergegeven.

Stap 3 — Bevestig je sneltoets.

Windows gebruikt standaard Ctrl+Space, Mac Command+Option ingedrukt houden als push-to-talk. Verleen op Mac de Toegankelijkheidsmachtiging wanneer daarom wordt gevraagd; zonder die machtiging kan de plak-bij-cursor andere apps niet bereiken.

Je weet dat het werkt wanneer een testopname in elk tekstveld wordt geplakt.

Stap 4 — Trek de netwerkkabel eruit en praat toch.

Dit is de privacytest. Zet Wi-Fi uit, zet je cursor in een tekstvak, houd de sneltoets ingedrukt, zeg een zin, laat los. De transcriptie verschijnt nog steeds, omdat het model lokaal draaide.

Je weet dat het werkt wanneer dicteer werkt terwijl internet volledig is uitgeschakeld.

Whisper
De echte Whisper-desktop-app op het instellingenscherm, met de lokale Transcriptie- en AI-panelen open.

Het langzame deel is de eenmalige modeldownload, waarvoor uiteraard internet nodig is. Daarna gaat de audio in de lokale modus nooit meer online. De kabel-uittrekken-test in stap vier is geen gimmick — het is het enige bewijs dat ertoe doet. Als dicteer blijft werken met het netwerk uit, wordt de audio op jouw apparaat omgezet, punt. Als het stopt, ging het ergens naartoe. Die ene test snijdt door elke "privé"-claim op elke marketingpagina heen.

spraak naar tekst op Windows · op Mac

Zelfs de AI-opschoning kan op je machine blijven

Dit is het deel waar de meeste mensen niet aan denken te vragen. Ruwe dicteer komt eruit als een aaneenschakeling — geen interpunctie, af en toe een "eh", zinnen die maar doorgaan. De oplossing is een AI-doorloop die de tekst opruimt tot iets wat je daadwerkelijk zou bewaren. En dit is precies waar veel "privé" lokale tools stilletjes naar huis bellen: ze zetten op het apparaat om, maar sturen de rommelige transcriptie dan toch naar een cloudmodel voor de opschoning. De audio bleef privé; de woorden niet.

Whisper verwerkt de opschoning ook lokaal, via Ollama — een gratis lokale modelrunner die op je machine draait via localhost en internet nooit aanraakt. Zeg de activeringsfrase "Hey whisper" en de tekst wordt verbeterd voordat hij bij je cursor belandt, waarbij de volledige rondrit binnen je laptop plaatsvindt. De keten blijft dus ongebroken: je stem wordt tekst op je apparaat, en die tekst wordt opgeschoond op je apparaat. Niets van de zin — niet de audio, niet het concept, niet de opgeschoonde versie — verlaat het apparaat ooit.

Dit is het detail dat ik bij elke tool zou controleren die zichzelf privé noemt. Het is eenvoudig om de transcriptie lokaal te houden en de verbetering stiekem in de cloud te stoppen, want die verbetering heeft een groot model nodig, en grote modellen zijn verleidelijk om te huren. De onopwindende waarheid is dat voor alledaags dicteer een lokaal model via Ollama meer dan genoeg is om interpunctie te corrigeren en opvulwoorden te verwijderen. Je hebt alleen een cloudmodel nodig wanneer je iets echt moeilijks vraagt, en dat is een keuze die je bewust moet maken — niet één die de tool op de achtergrond voor je maakt.

Lokaal of cloud: welke modus voor een privéworkflow

Start voor alles wat je privé zou noemen lokaal. Als je Mac Apple Silicon is of je pc van de afgelopen jaren is, verwerken de lokale engines alledaags dicteer zonder moeite, en wordt de cloud een nooduitgang in plaats van de standaard. De app laat je bewust een pad kiezen — hij dwingt geen standaard op — en zo verschillen de drie, met privacy in het zicht:

De keuze hangt af van waar de audio wordt verwerkt en wat je van de transcriptie nodig hebt.

  • Lokale ParakeetDe TDT-engine van NVIDIA, circa 600 MB, en de snelste lokale optie — 5 tot 10 keer sneller dan Whisper op CPU. Ondersteunt Engels plus 24 andere Europese talen, 25 in totaal. Geen vertaling naar Engels. Volledig op het apparaat, niets geüpload. De snelle privékeuze als je Engels of een andere Europese taal spreekt.
  • Lokale WhisperLangzamer dan Parakeet op dezelfde machine, maar de meertalige versies ondersteunen 99 talen en kunnen naar Engels vertalen. De Engelstalige versies zijn alleen voor Engels, niet voor 99. Ook volledig op het apparaat. Kies dit voor Chinees, Japans, Koreaans of vertaalwerk, wat Parakeet niet kan. Het standaard Engelse model is circa 480 MB.
  • Cloud (OpenAI, BYOK)Beste nauwkeurigheid en webtoegang, met je eigen OpenAI-sleutel die direct door OpenAI wordt gefactureerd. Transcriptie gebruikt standaard gpt-4o-mini-transcribe. Dit is het enige pad dat je audio uploadt — het verlaat je machine om OpenAI te bereiken. Het is opt-in, onderdeel van Whisper Pro, en staat uit tenzij je het inschakelt.

De lijn is helder: de twee lokale paden zijn door opzet privé — de audio wordt op je apparaat omgezet en er valt niets te lekken. Het cloudpad is dat niet, en we doen alsof niet anders. Het stuurt je audio naar OpenAI, via je eigen sleutel, want dat is de enige manier om de nauwkeurigheid van OpenAI en live webtoegang te krijgen. Als je Mac M-serie is of je pc recent is, begin met de lokale modus en grijp pas naar de cloud als lokaal je echt tekortschiet. Cloud is de uitzondering die je kiest, niet de standaard die je erft.

Wat er in elke modus je machine verlaat

Laten we concreet zijn over de gegevens, want "privé" is betekenisloos zonder te benoemen wat er reist. In de lokale modus is het antwoord niets — niet de audio, niet de transcriptie, niet de opgeschoonde versie. De opname wordt verwerkt in je RAM, de opschoning loopt via Ollama op je machine, en het enige wat ooit is bewogen waren de woorden, van het model naar je tekstvak. Je kunt het verifiëren met het netwerk losgekoppeld.

Wanneer de AI-opschoning draait, toont de overlay een verbeteringsstatus terwijl het lokale model de aaneenschakeling omzet naar iets leesbaars. Dit is het soort transformatie dat het doet — de ruwe dicteer bovenaan, de opgeschoonde tekst eronder — allemaal op je apparaat wanneer je in de lokale modus bent:

Thinking...
De overlay tijdens de AI-opschoonronde. In de lokale modus draait dit via Ollama op je machine, zodat de tekst het apparaat nooit verlaat.
Ruw

okay so send the q3 numbers to marcus before the board call and flag the margin dip um but dont cc the whole finance list

Opgeschoond

Okay, so send the Q3 numbers to Marcus before the board call and flag the margin dip — but don't cc the whole finance list.

In de cloudmodus is de eerlijke boekhouding anders en dat moet je weten voordat je de schakelaar omzet. Je audio wordt geüpload naar het transcriptie-eindpunt van OpenAI, via je eigen API-sleutel, om daar naar tekst te worden omgezet. Als je ook Cloud AI-verbetering gebruikt, gaat de transcriptie naar een GPT-model; als je webzoekopdrachten gebruikt, gaat er ook een zoekopdracht uit. Niets loopt via Remskill — het is een directe lijn van je machine naar OpenAI op jouw sleutel — maar het verlaat wel je machine, en dat is het enige wat bepaalt of iets privé is. Die zin over de Q3-cijfers en Marcus is precies het soort ding dat ik lokaal zou houden. Een recept dat ik voor de lol dicteer, kan me echt niets schelen.

Diezelfde spreek-dan-opschoon-flow werkt in elke app, dus als het eenmaal is ingesteld kun je sneller typen met je stem in je editor, je e-mail en je terminal — privé, zonder dat er in de lokale modus iets de laptop verlaat.

Wanneer audio naar de cloud sturen een eerlijke afweging is

Een weegschaal op een bureau, als beeld van het afwegen van privacy tegen nauwkeurigheid

Ik zou liegen als ik zei dat lokaal altijd het antwoord is. Soms is de cloud de juiste keuze, en doen alsof het anders is om een privacyhoek te pushen zou dezelfde marketingoneerlijkheid zijn waar ik zojuist zes secties over heb geklaagd. De afweging is reëel: je geeft de garantie op dat audio je machine nooit verlaat, en je krijgt de beste beschikbare transcriptienauwkeurigheid plus live webtoegang op dezelfde sneltoets.

Grijp naar de cloudmodus wanneer de inhoud niet gevoelig is maar de nauwkeurigheid dat wel is. Een podcasttranscriptie, een openbaar blogconcept, een boodschappenlijstje, een lastige opname met een zwaar accent of een lawaaierige kamer waar het lokale model struikelt — niets van dat alles hoeft op je machine te blijven, en de modellen van OpenAI leveren een schoner resultaat. Je gebruikt je eigen API-sleutel, dus de audio gaat rechtstreeks naar OpenAI en de kosten per minuut zijn voor jou, zonder tussenpersoonskortingen. Voor niet-gevoelig werk waarvoor je betaalt voor kwaliteit is dat een verstandige afweging. De fout is niet de cloud gebruiken — het is de cloud standaard gebruiken voor alles, inclusief de dingen die je nooit op een server zou willen hebben.

En voor echt korte dingen, sla de speciale tool helemaal over. Als je een tekst van 30 woorden dicteert, is Windows-toets + H of macOS Dicteer gratis en al geïnstalleerd — maar let op: Windows Spraaktypist is zelf ook een clouddienst, dus dat is niet de privéoptie, alleen de handige. Op Apple Silicon kan macOS Dicteer algemene tekst op het apparaat verwerken, waardoor het de enige ingebouwde is die echt privé is voor korte fragmenten. Onder de 200 woorden ga ik je niet adviseren iets te installeren. De speciale tool verdient zijn plek wanneer notities lang worden, wanneer je offline privacy op Windows wilt, of wanneer je één sneltoets wilt die overal hetzelfde werkt.

Als je een tool kiest vooral voor de privacygarantie, leeft de diepere versie van dit argument in de gids over offline spraak naar tekst die doorloopt hoe je alles draait met het netwerk losgekoppeld.

"Privé" is het meest overgebruikte woord in deze categorie en het gemakkelijkst te testen: koppel het netwerk los en kijk of het nog werkt. Lokale Whisper en Parakeet slagen voor die test omdat de audio je machine nooit verlaat, en de AI-opschoning ook omdat Ollama er recht naast draait. De cloudmodus zakt bewust, want die huurt de nauwkeurigheid van OpenAI, en dat is een eerlijke afweging voor de juiste klus. Ik heb het grootste deel van deze gids gedicteerd met de Wi-Fi uit, wat ofwel een sterke productdemo is ofwel een teken dat ik vaker de deur uit moet. Beide kunnen waar zijn.

Privé dicteren, direct beginnen

Kies een lokaal model, koppel het netwerk los en praat. De transcriptie belandt bij je cursor — en je stem heeft de laptop nooit verlaten.

Gratis lokale modus voor elk ingelogd account. Geen kaart nodig om te starten.

Foto van Denys Medvediev

Denys Medvediev

Ik ben degene die onze supportmail leest, waarschijnlijk door de antwoorden te dicteren.

Verder lezen