Door Denys Medvediev

Gids

OpenAI Whisper voor Windows

OpenAI Whisper is een gratis, open-source spraak-naar-tekstmodel onder de MIT-licentie. Op Windows draait het normaal via Python en de opdrachtregel om audiobestanden te transcriberen. Whisper by Remskill bundelt diezelfde modellen in een desktop-app, zodat je in plaats daarvan live in elke app kunt dicteren.

Laatst bijgewerkt: juni 2026

Een Windows-laptop op een bureau met een code-editor in beeld, die een opgeruimde werkplek voor dicteren oproept

OpenAI Whisper is een gratis, open-source spraak-naar-tekstmodel dat is uitgebracht onder de MIT-licentie. Op Windows draait het normaal via Python en de opdrachtregel, waarbij het audiobestanden transcribeert die je het aanwijst. Whisper by Remskill bundelt diezelfde modellen in een desktop-app, zodat je in plaats daarvan live in elke app kunt dicteren.

OpenAI Whisper is een gratis, open-source model. Op een verse Windows-machine wil de officiële versie Python, ffmpeg en de opdrachtregel om bestanden te transcriberen. Heb je een bestand, dan klaren gratis GUI-tools als Buzz of Whisper Desktop de klus. Wil je praten en je woorden zien verschijnen bij de cursor in elke app, dan bundelt Whisper by Remskill diezelfde modellen, zonder dat je iets hoeft te bouwen, met een gratis lokaal niveau.

Wat mensen bedoelen met "OpenAI Whisper voor Windows"

De saaie waarheid is dat "OpenAI Whisper" twee verschillende dingen zijn die dezelfde naam dragen, en de zoekresultaten halen ze dagelijks door elkaar.

Het eerste is het model. Whisper is een spraakherkenningsmodel dat OpenAI open-source maakte onder de MIT-licentie, dus zowel de code als de getrainde gewichten zijn gratis te downloaden en te gebruiken. Het komt in zes formaten (tiny, base, small, medium, large en turbo), waarvan er vier een Engels-only variant hebben, die snelheid inruilen voor nauwkeurigheid. Het is meertalig en kan spraak met één vlag naar het Engels vertalen. Dat is oprecht indrukwekkend, en het is oprecht gratis.

Het tweede is de manier waarop je het daadwerkelijk draait. De officiële Whisper is een Python-pakket. Je installeert het met pip, je installeert het opdrachtregelprogramma ffmpeg ernaast, en dan voer je het een audiobestand vanuit een terminal. Als "terminal", "pip" en "ffmpeg" nu al klinken als een zaterdag waar je niet om gevraagd had, dan heb je het gat gevonden waar dit hele artikel over gaat. De opdrachtregel is het hulpmiddel waarmee je opdrachten typt naar de computer in plaats van te klikken. De meeste mensen op Windows hebben hem nog nooit met opzet geopend.

Dus als iemand "OpenAI Whisper voor Windows" in Google typt, willen ze meestal een van twee antwoorden. Ofwel: hoe krijg ik dit gratis model mijn bestanden aan het transcriberen zonder een informaticadiploma? Of: ik wil gewoon praten en mijn woorden zien verschijnen, kan dit ding dat? Dat zijn verschillende behoeften, en ze vragen om verschillende tools. Ik beantwoord ze allebei, en ik ben eerlijk over welke tool elk daarvan wint.

Het gratis model is geweldig. De installatie is de adder onder het gras.

Hier is het deel dat de productpagina's overslaan. Whisper het model kost niets. Whisper de ervaring kost je, op een verse Windows-machine, een middag.

Om de officiële OpenAI Whisper te draaien installeer je Python, dan installeer je het Whisper-pakket, dan installeer je ffmpeg en zorg je dat Windows het kan vinden, dan open je een terminal en voer je voor elk bestand een opdracht uit. Niets hiervan is moeilijk voor een ontwikkelaar. Maar voor iedereen anders is het een muur: de schrijver, de advocaat, de student, de verkoper, mijn eigen moeder, die bij de derde demo instemde om dicteren te proberen en die precies nul demo's had goedgekeurd waarin de zin "voeg ffmpeg toe aan je PATH" voorkwam.

Er zijn vriendelijkere routes, en die zijn het waard om te kennen. Whisper.cpp is een kale C/C++-versie van hetzelfde model: MIT-gelicentieerd, snel en CPU-only, helemaal zonder Python. Maar je bouwt het nog steeds uit de broncode of draait het vanaf de opdrachtregel. Het is een prachtig staaltje techniek, recht gericht op mensen die plezier beleven aan compilers. De rest van dit artikel is voor de mensen die dat niet doen.

Wanneer je liever de opdrachtregel-Whisper wilt (of een bestandstranscribeerder)

Ik ga je nu ergens anders heen sturen, want dit is het eerlijke deel.

Als wat je eigenlijk hebt een audiobestand is (een opgenomen interview, een podcastaflevering, een Teams-gesprek dat je hebt bewaard, een spraakmemo), dan is onze app het verkeerde gereedschap, en dat vertel ik je liever dan je iets verkeerds aan te smeren. Wij doen live dicteren: jij praat, de woorden landen bij je cursor. Wij nemen geen bestaand bestand en transcriberen het niet. Andere klus.

Voor die klus zijn drie gratis tools oprecht goed, en ze zijn er precies voor gebouwd:

  • Buzz transcribeert en vertaalt audiobestanden offline, aangedreven door OpenAI's Whisper, MIT-gelicentieerd, en het draait op Windows. Wil je een echt venster met knoppen in plaats van een terminal, begin dan hier.
  • Whisper Desktop (Const-me) is een Windows-GUI-app. Je pakt hem uit, draait WhisperDesktop.exe, wijst hem een bestand aan, en het transcribeert met je GPU via DirectCompute. Het is MPL-2.0-gelicentieerd en snel op een fatsoenlijke videokaart.
  • whisper.cpp is de kale optie als je je thuis voelt op de opdrachtregel en pure snelheid wilt zonder Python.

Dat is niet om diplomatiek te zijn voor de vorm. Je naar het juiste gereedschap sturen wanneer dat niet het onze is, is precies de reden waarom je de rest hiervan zou moeten geloven. Heb je een bestand, gebruik dan Buzz. Heb je een microfoon en een zin in je hoofd, lees dan verder.

Wat Whisper by Remskill daadwerkelijk doet op Windows

We hebben dezelfde open-source Whisper-modellen genomen, plus een tweede engine, en ze verpakt in een Windows-app, zodat er niets te bouwen valt en niets in een terminal te typen.

Je installeert één app, ongeveer 25 MB. Je logt in. Je drukt op de sneltoets, standaard Ctrl + Space en volledig herinstelbaar. Je praat. Je laat los. De tekst verschijnt bij je cursor in welke app je ook al gebruikte: Word, Outlook, de browser, Slack, een code-editor, het zoekvak. Geen bestand, geen terminal, geen GPU nodig; alle lokale transcriptie draait op je CPU.

Whisper
De live Whisper by Remskill-app — zijbalk, transcriptiepaneel en AI-instructiekaarten. Dit is de echte interface, geen screenshot.

Onder de motorkap kies je uit drie routes, want wij kiezen geen model voor je:

  • Lokale Whisper (8 modellen) is de open-source Whisper waarvoor je hier kwam, gebundeld en klaar voor gebruik. Engels-geoptimaliseerd van Base (~140 MB) tot Medium (~1,5 GB), plus meertalige builds tot Large v3 (~3 GB). De meertalige builds dekken 99 talen en kunnen naar het Engels vertalen.
  • Parakeet (NVIDIA TDT, ~600 MB) is een aparte engine, 5 tot 10 keer sneller dan Whisper op CPU, die Engels plus 24 andere Europese talen dekt. Geen vertalen-naar-Engels. Kies hem als je snelheid wilt en vooral in het Engels werkt.
  • Cloud (OpenAI, BYOK) laat je je eigen OpenAI-sleutel meenemen voor topnauwkeurigheid en webzoeken; wij nemen geen cent. Dit is de enige Pro-functie.

De lokale pipeline (elk Whisper-model, Parakeet, AI-opschoning via Ollama, geschiedenis, presets, eigen sneltoets, modeldownloads) is gratis voor elke ingelogde gebruiker, zonder kaart bij aanmelden. De Cloud-route is het betaalde Pro-niveau; de cijfers zie je op de prijzenpagina.

Waarom een echte Windows-dicteer-app moeilijker is dan pip install

Hier is het ding waar niemand je voor waarschuwt als ze zeggen: "verpak Whisper gewoon in een UI."

Het model is het makkelijke deel. Een sneltoets zich netjes laten gedragen op Windows is dat niet. De eerste versie van onze sneltoets-handler vuurde de stop-opname-callback zes keer af voor één echte toetsaanslag. Hij werkte perfect op een Mac. Hij werkte perfect op een schone Windows-installatie. Hij viel uit elkaar op echte klantmachines, die met een invoermethode voor talen ingeschakeld, die op Windows op onvoorspelbare momenten spook-Ctrl + Space-loslaatgebeurtenissen genereert. Het kostte dagen aan telemetrie, dan een 50ms-debounce die niet genoeg was, dan een 300ms-debounce die het eindelijk wel was. Ik leerde meer over het Windows-invoermethodekader dan iemand zou moeten, en ik heb een masterdiploma. Het oordeel van mijn oudste dochter, toen ik het uitlegde: "dit is waarom papa's e-mails eeuwen duren."

Pasted
De uitgeleverde overlay na het dicteren — hoe één gratis, volledig lokale dictee eruitziet op het moment dat hij klaar is.

Dat is het verschil tussen een model en een product. De gratis Whisper geeft je een transcriptie van een bestand. Een dicteer-app moet de echte Windows-desktop overleven, in echte apps, terwijl jij iets anders doet. Het model krijgt dat gevecht nooit te zien. Wij wel, en we verloren het de eerste week ongeveer.

Wanneer de ingebouwde Windows-tool alles is wat je nodig hebt

Vertel mensen wanneer ze jouw ding niet moeten kopen, en misschien geloven ze je over de rest. Dus: als je alleen af en toe een korte notitie dicteert, heb je dit allemaal misschien niet nodig. Windows 11 heeft een ingebouwde spraaktyp-tool die je opent met Win + H. Die is gratis en prima voor een paar regels, al stuurt hij je audio naar Microsofts online spraakherkenning in plaats van op je eigen machine te draaien. Voor een snel Teams-antwoord is dat ruim voldoende.

Wij beginnen de installatie waard te worden rond het punt waar je echte tekst opstelt (lange e-mails, memo's, collegesamenvattingen, codecommentaar, marketingvarianten) en je wilt dat het op je eigen machine blijft, in 99 talen, met overal dezelfde sneltoets. Als je dag uit tweeregelige chats bestaat, ben je klaar. Als je dag uit schrijven bestaat, hou de app dan.

Verder lezen

OpenAI Whisper is een gratis, open-source model, en op Windows wil het normaal Python, ffmpeg en een terminal om bestanden te transcriberen. Heb je een bestand, dan doen Buzz of Whisper Desktop het gratis met een echt venster. Wil je eigenlijk praten en je woorden zien landen bij de cursor in elke app, zonder iets te bouwen, zonder opdrachtregel, lokaal draaiend op je CPU, dan is dat wat wij hebben gemaakt.

Voor de uitgebreidere behandeling van het gratis-versus-betaald-landschap, zie spraak naar tekst op Windows. Om te kiezen tussen onze twee lokale engines, zie Whisper vs Parakeet.

Dicteer je eerste zin in ongeveer een minuut

Download Whisper by Remskill voor Windows, log in zonder dat een kaart nodig is, druk op Ctrl + Space en praat. De lokale pipeline is gratis zolang je hem gebruikt.

Voor altijd gratis lokale transcriptie. Geen betaalmethode bij aanmelden. Het Cloud-niveau is de enige betaalde functie.

Foto van Denys Medvediev

Denys Medvediev

Ik ben degene die onze supportmail leest, hoogstwaarschijnlijk door de antwoorden te dicteren.