Probleemoplossing
Dicteersoftware die verkeerde woorden typt? 5 oplossingen
Dicteersoftware typt verkeerde woorden wanneer het model één klank verkeerd hoort en dan raadt. Vijf oorzaken, vier ervan los je op in tien minuten.
Laatst bijgewerkt: juni 2026

Dicteersoftware typt verkeerde woorden wanneer het spraakmodel één klank verkeerd hoort en de zin herschrijft rondom zijn gok. De gebruikelijke oorzaken zijn een zwakke microfoon, achtergrondgeluid, een homofoon die het model niet kan onderscheiden, een verkeerde taalinstelling, of een naam die het nooit heeft gezien. Los eerst het geluid op, en leer de tool daarna jouw woordenschat.
Je zegt "stuur naar acceptatie." Het scherm toont "verander de situatie." Je verbetert het. Volgende zin, hetzelfde. Bij de derde correctie typ je sneller dan je praat — wat het hele punt van dicteren tenietdoet. Ik heb deze exacte cirkel een schrijver, een verkoper en mijn eigen moeder zien frustreren. Zij probeerde dicteren één keer en ging daarna uit protest weer met twee vingers typen. Het goede nieuws: bijna elk verkeerd woord herleid je tot één van vijf oorzaken, en vier ervan los je in de komende tien minuten op.
Dit vertelt niemand je. De meeste dicteersoftware is niet kapot als dit gebeurt. Ze gokken, in real time, onder slechte omstandigheden, zonder idee wat de naam van je collega is of dat "Kubernetes" een woord is. Whisper's lokale modus heeft een instelling die het laatste probleem in één keer oplost — een veld voor aangepaste woorden waar je namen en jargon ingeeft die het moet herkennen, zodat het ze correct spelt in plaats van iets te bedenken dat erop lijkt. Het is gratis en werkt offline. We komen er zo. Maar de saaie waarheid is dat de microfoon meer uitmaakt dan de software, dus beginnen we daar.
Je dicteersoftware is niet kapot. Die gokt.

Spraak-naar-tekst hoort geen letters. Het hoort geluid en wedt op de meest waarschijnlijke woorden voor dat geluid — en past die gok aan naarmate er meer geluid binnenkomt. Daarom herschrijft dicteersoftware soms tekst die je al had uitgesproken. Het hoort een woord laat in de zin verkeerd, besluit dat een eerder woord iets anders moet zijn geweest om de grammatica kloppend te maken, en wijzigt het stilletjes.
"Been" en "ben." "Haard" en "hard." "Word" en "wordt." Dit zijn homofonies — woorden die identiek klinken — en hoe duidelijk je ook spreekt, dat lost het niet op, want duidelijkheid was nooit het probleem. Het model moet raden op basis van context, en soms raadt het verkeerd.
Dan zijn er woorden die het model gewoonweg nooit heeft tegengekomen. De achternaam van je manager. Een productcode. "Remskill." Het model kan niet spellen wat het niet kent, dus vervangt het het door het dichtstbijzijnde echte woord dat het wél kent. Dat is geen bug. Dat is een vocabulairegat, en er is een specifieke oplossing voor die we hieronder bespreken.
Jouw microfoon is de gebruikelijke verdachte

Voordat je de software de schuld geeft, kijk eens naar wat er ingevoerd wordt. De ingebouwde microfoon van een laptop zit naast de ventilator, wijst naar het plafond en vangt de ruimte minstens zo goed op als jouw stem. Rommel erin, verkeerde woorden eruit.
Dit is de ene mening waarop ik het hele artikel durf te zetten: "AI" lost slechte audio niet op. Een USB-microfoon van twintig euro doet meer voor nauwkeurigheid dan elke modelupgrade die je kunt maken. Ik heb een week lang grotere, langzamere modellen geladen om mijn eigen fouten op te lossen, voordat ik doorhad dat de microfoon van mijn laptop op de ventilator gericht was. De microfoon was de hele tijd het probleem. Ik bouw deze software voor mijn werk. Geef het geld eerst aan hardware uit. Het model is het goedkope onderdeel.
De verificatietest: dicteer dezelfde drie zinnen met de ingebouwde microfoon en daarna met een headset of USB-microfoon. Als het aantal fouten daalt, was de microfoon het probleem en ben je klaar. De meeste mensen stoppen hier met lezen, en dat is prima.
Achtergrondgeluid en kamerakoestiek

Een vaatwasser twee kamers verderop. Het telefoongesprek van een collega. Het soort open kantoor waar je iemand hoort chips eten van tien meter afstand. Het model kan jouw stem niet onderscheiden van het lawaai — het transcribeert het hardste geluid, en soms winnen de chips.
Google's AI Overview voor dit exacte probleem noemt achtergrondgeluid als primaire oorzaak, direct naast accenten en homofonies. De oplossing is niet glamoureus: doe de deur dicht, zet de ventilator uit, ga weg bij het open raam. Een stille kamer doet meer dan een slim algoritme.
Verificatie: probeer hetzelfde dicteren in een stille ruimte versus jouw gebruikelijke omgeving. Als de fouten afnemen in stilte, was geluid de boosdoener. Als je geen stille kamer kunt krijgen, is een gerichte of ruisonderdrukkende microfoon die alleen luistert naar wat recht voor hem is, de beste volgende stap — en dan zijn we weer terug bij hardware, waar het geld sowieso naartoe moet.
Verkeerde taal of accentmismatch

Als je dicteersoftware is ingesteld op automatische detectie en je wisselt tussen talen, besteedt het model moeite aan het identificeren van de taal voordat het woorden herkent — en een verkeerde gok over de taal vergiftigt alles erna. Stel de taal expliciet in wanneer je kunt.
In Whisper doe je dat via Instellingen, Transcriptie, Taal. Je gesproken taal direct kiezen slaat de detectiestap over en helpt het model je woorden nauwkeuriger op te pikken. Laat het op automatische detectie staan alleen als je echt van taal wisselt midden in een sessie. Whisper's meertalige modellen ondersteunen 99 talen met automatische detectie; de Engelstalige versies zijn vergrendeld op Engels, wat precies is wat je wilt als je alleen Engels spreekt.
Accentmismatch is een variant van dit probleem. Een Americaans-Engels model dat voornamelijk is getraind op Amerikaans-Engelse sprekers zal struikelen over een sterk regionaal accent. Stel de dichtstbijzijnde regionale variant in die jouw tool biedt, en geef het een schoon signaal — dat verkleint het verschil.
Oplossen op Windows, Mac en iPhone
Het ingebouwde dicteer op elk platform heeft zijn eigen eigenaardigheden en zijn eigen plafond. Op Windows open je Spraaktyperen met de Windows-toets plus H, maar je cursor moet in een tekstveld staan en je hebt een internetverbinding nodig — de ingebouwde tool stuurt je audio naar de cloud om het te transcriberen. Als het onzin typt, controleer dan eerst de verbinding; de Apple-ondersteuningsforums voor hetzelfde probleem met verkeerde woorden zetten "controleer internetverbinding" bovenaan de lijst. (Voor een uitgebreide uitleg, zie onze gids over spraak-naar-tekst werkt niet op Windows.)
Op Mac zet je Dicteren aan met de Microfoontoets in de functietoetsrij, de Dicteersnelkoppeling, of via Bewerk en dan Dicteer. Eén misverstand dat we meteen kunnen wegnemen: de huidige macOS Dicteren laat je tekst van elke lengte dicteren zonder tijdslimiet — het stopt pas na ongeveer 30 seconden stilte, wat mensen verwarren met een harde begrenzing. Als de fouten aanhouden, gaat onze gids voor het oplossen van problemen met spraak-naar-tekst op Mac stap voor stap te werk. Op iPhone wijzen de Apple-forums ook op het uitschakelen van voorspellend typen, dat soms twijfelt aan wat dicteren correct heeft gedaan.
Het hardere plafond: Windows Spraaktyperen (Win+H) geeft je geen manier om aangepaste woorden toe te voegen of het woordenboek te trainen. De aparte dicteerinterface van Word laat je wel een klein dicteerwoordenboek opbouwen, maar de tool die de meeste mensen gebruiken — Win+H — kan je vocabulaire helemaal niet leren. Wat ons brengt bij de ene oplossing die écht het verschil maakt voor het probleem met verkeerde namen en verkeerd jargon.
Leer het jouw woorden: aangepast vocabulaire
Dit is de oplossing die de ingebouwde tools je niet kunnen geven. Wanneer je een Whisper-model in de lokale modus van Whisper uitvoert, krijg je een veld voor aangepaste woorden — een kommagescheiden lijst met namen, producttermen en jargon die je verwacht te zeggen. Je typt "Kubernetes, PostgreSQL, Remskill, Jan de Vries" in, en de transcriptie neigt ernaar die correct te spellen wanneer ze in je spraak voorkomen. Dit vind je bij Instellingen, Transcriptie, in de gratis lokale versie — geen betaalkaart, geen cloud.
Eén kanttekening die het waard is te weten: Aangepaste woorden is een functie van Whisper-modellen. Parakeet, de snellere lokale optie, accepteert geen aangepaste woorden of prompthints — de eigen beschrijving zegt dat ook gewoon. Dus als het leren van je vocabulaire aan de tool belangrijk voor je is, kies dan een Whisper-model, niet Parakeet.
Ik leerde hoe belangrijk dit is van mijn jongste dochter. Ik liet haar dicteren zien — drukken, praten, loslaten. Ze schreef meteen een e-mail van 90 woorden aan haar oma over een tand die ze had verloren en de wisselkoers van de tandenfee, zonder vragen te stellen. Daarna kwam ze boos terug omdat het steeds de naam van haar beste vriendin verknoeide. Ze wist niet wat een vocabulairegat was. Ze wist alleen dat de naam fout ging. Ik voegde de naam toe aan Aangepaste woorden, en de klachten stopten. De gemiddelde persoon wil niet begrijpen waarom dicteersoftware een naam verkeerd spelt. Ze willen een vakje om de naam in te typen. Dat vakje is het hele punt van dit gedeelte.
Een tweede mogelijkheid, als je die wilt: Whisper biedt een Profielinstelling — Snel, Gebalanceerd of Nauwkeurig — die bepaalt hoe zorgvuldig het model luistert. Nauwkeurig is langzamer maar vangt meer op. En een groter model kiezen uit de acht die Whisper levert, van Base op ongeveer 140 MB tot Large v3 op ongeveer 3 GB, ruilt snelheid in voor nauwkeurigheid. Geen van deze is "de juiste keuze" voor iedereen — het zijn knoppen, en het probleem met verkeerde woorden bepaalt welke je draait. Als je niet zeker weet welk model je moet laden, legt onze gids voor het kiezen van een Whisper-model de afwegingen uit.
Een opruimstap die de rest oplost
Zelfs nadat het geluid schoon is en het vocabulaire is geladen, slippen er nog een paar resterende fouten doorheen. Whisper kan een optionele AI-opruimstap uitvoeren op de ruwe transcriptie voordat die bij je cursor terechtkomt — het corrigeert grammatica, interpunctie en hoofdlettergebruik, en verwijdert stopwoorden als "eh" en "weet je wel". Het draait gratis op je apparaat, of in cloudmodus met OpenAI als je je eigen sleutel hebt opgegeven.
Dit is het vangnet, niet de eerste stap. Los de microfoon op, stil de kamer, stel de taal in, leer het je woorden — en laat de opruimstap dan doen wat overblijft. Proberen AI-tekstcorrectie te laten compenseren voor een ventilatorbeschoten ingebouwde microfoon is het verkeerde probleem oplossen met het dure gereedschap. Ik weet het, want ik bracht de opruimstap als eerste uit en de taalkiezer als tweede, precies in de verkeerde volgorde, en gebruikte daarna een maand lang mijn eigen app en vroeg me af waarom. Voor wie fijnere controle wil, gaat onze Whisper-promptgids dieper in op het vormgeven van de uitvoer.
De sneltoets om op te nemen is Ctrl+Space op Windows en Command+Option op Mac, beide aanpasbaar in Instellingen als ze conflicteren met iets dat je al gebruikt.
Wanneer de ingebouwde tool niet te repareren is
Soms is het antwoord geen reparatie — maar een ander hulpmiddel, of helemaal geen. Als je slechts af en toe een berichtje van 30 woorden stuurt, zijn Apple Dictation en Windows Spraaktyperen gratis en ingebouwd, en is het najagen van perfecte nauwkeurigheid overdreven. Gebruik wat er al is.
Maar er is een echt plafond. Windows Spraaktyperen heeft het internet nodig en kan je vocabulaire niet leren. Als het probleem met verkeerde woorden specifiek is dat de tool namen, producttermen of technisch jargon blijft verknoeien — en je die woorden nergens kunt toevoegen — dan is de ingebouwde tool voor jouw gebruik gewoonweg niet te repareren. Dat is de grens waar een leerbaar, offline hulpmiddel zijn plaats verdient. En als je voornamelijk vergaderingen met meerdere sprekers transcribeert in plaats van je eigen tekst te dicteren, is dat een geheel andere categorie — vergadertranscriptie, niet dicteren. Dwing een dicteerapp niet in een functie waarvoor die niet gebouwd is.
Hoe nauwkeurig mag je dicteren verwachten?
Stel verwachtingen realistisch in. Schoon geluid, een bekende taal en een geladen vocabulaire brengen je tot het punt waar correcties de uitzondering zijn, niet de regel. Openbare Whisper-benchmarks landen rond een woordfoutpercentage van 3% op schone, voorgelezen spraak met het middelgrote Engelse model. In het echte leven — jouw accent, jouw kamer, jouw jargon — ligt het hoger. Dat is normaal.
Het doel is niet nul fouten. Het doel is minder fouten dan typen in dezelfde tijd zou hebben opgeleverd, en die lat ligt lager dan mensen denken. Dicteren op 145 woorden per minuut is beter dan typen op 40, zelfs als je stopt om een woord of twee te corrigeren. Als je elk ander woord corrigeert, is er nog iets op de bovenstaande lijst dat niet klopt. Als je elk tiende woord corrigeert, heb je al gewonnen.
Als je dicteersoftware steeds de verkeerde woorden typt: los het geluid op, stel de taal in en leer het je namen — en laat het dan typen terwijl jij iets anders doet. Mijn jongste dochter noemt het nog steeds "de pratende computer." Ze heeft geen idee dat er een vocabulaireveld, een taalkiezer of acht modellen achter drukken-praten-loslaten zitten. Dat is de versie die echt werkt — wanneer de verkeerde woorden stoppen en je het hulpmiddel helemaal niet meer opmerkt.
Wil je dat namen altijd goed uitkomen?
Download Whisper, voeg je eerste aangepaste woord toe en zie hoe de fouten al in de eerste zin stoppen.



