Guide
OpenAI Whisper til Windows
OpenAI Whisper er en gratis, open source-model til tale-til-tekst under MIT-licensen. På Windows kører den normalt gennem Python og kommandolinjen for at transskribere lydfiler. Whisper by Remskill pakker de samme modeller ind i en skrivebordsapp, så du i stedet kan diktere live ind i en hvilken som helst app.
Senest opdateret: juni 2026

OpenAI Whisper er en gratis, open source-model til tale-til-tekst udgivet under MIT-licensen. På Windows kører den normalt gennem Python og kommandolinjen og transskriberer de lydfiler, du peger den mod. Whisper by Remskill pakker de samme modeller ind i en skrivebordsapp, så du i stedet kan diktere live ind i en hvilken som helst app.
OpenAI Whisper er en gratis, open source-model. På en frisk Windows-maskine vil den officielle udgave have Python, ffmpeg og kommandolinjen for at transskribere filer. Hvis du har en fil, klarer gratis GUI-værktøjer som Buzz eller Whisper Desktop opgaven. Vil du tale og se dine ord lande ved markøren i en hvilken som helst app, pakker Whisper by Remskill de samme modeller ind, uden noget at bygge og med et gratis lokalt niveau.
Hvad folk mener med "OpenAI Whisper til Windows"
Den kedelige sandhed er, at "OpenAI Whisper" er to forskellige ting med samme navn, og søgeresultaterne blander dem sammen hver eneste dag.
Det første er modellen. Whisper er en talegenkendelsesmodel, som OpenAI har gjort open source under MIT-licensen, så både koden og de trænede vægte er gratis at downloade og bruge. Den findes i seks størrelser (tiny, base, small, medium, large og turbo), hvoraf fire har en engelsk-kun-variant, og bytter hastighed for præcision. Den er flersproget, og den kan oversætte tale til engelsk med ét enkelt flag. Det er ægte imponerende, og det er ægte gratis.
Det andet er måden, du rent faktisk kører den på. Den officielle Whisper er en Python-pakke. Du installerer den med pip, du installerer kommandolinjeværktøjet ffmpeg ved siden af, og så fodrer du den med en lydfil fra en terminal. Hvis "terminal", "pip" og "ffmpeg" allerede lyder som en lørdag, du ikke havde planlagt, så har du fundet det hul, hele denne artikel handler om. Kommandolinjen er det værktøj, du bruger til at skrive kommandoer til computeren i stedet for at klikke. De fleste på Windows har aldrig åbnet den med vilje.
Så når nogen skriver "OpenAI Whisper til Windows" i Google, vil de som regel have et af to svar. Enten: hvordan får jeg denne gratis model til at transskribere mine filer uden en datalogi-grad? Eller: jeg vil bare tale og se mine ord dukke op — kan den her tingest det? Det er forskellige behov, og de kræver forskellige værktøjer. Jeg svarer på begge, og jeg er ærlig om, hvilket værktøj der vinder hvilket.
Den gratis model er fantastisk. Opsætningen er hagen ved det.
Her er den del, produktsiderne springer over. Whisper som model koster ingenting. Whisper som oplevelse koster dig en eftermiddag på en frisk Windows-maskine.
For at køre den officielle OpenAI Whisper installerer du Python, så installerer du Whisper-pakken, så installerer du ffmpeg og sørger for, at Windows kan finde det, og så åbner du en terminal og kører en kommando for hver fil. Intet af det er svært for en udvikler. Alt af det er en mur for alle andre: forfatteren, advokaten, den studerende, sælgeren, min egen mor, som gik med til at prøve diktering ved tredje demo og ville have sagt nej til præcis nul demoer, der involverede sætningen "tilføj ffmpeg til din PATH".
Der findes mere venlige veje ind, og de er værd at kende. Whisper.cpp er en ren C/C++-port af den samme model: MIT-licenseret, hurtig og kun CPU, helt uden Python. Men du skal stadig bygge den fra kildekode eller køre den fra kommandolinjen. Det er et smukt stykke ingeniørarbejde rettet lige mod folk, der nyder compilere. Resten af denne artikel er til dem, der ikke gør.
Når du i stedet vil have kommandolinje-Whisper (eller en fil-transskribent)
Nu sender jeg dig et andet sted hen, for det her er den ærlige del.
Hvis det, du faktisk har, er en lydfil (et optaget interview, et podcast-afsnit, et Teams-opkald, du gemte, en talebesked), så er vores app det forkerte værktøj, og det vil jeg hellere fortælle dig end at sælge dig et mismatch. Vi laver live-diktering: du taler, og ordene lander ved din markør. Vi tager ikke en eksisterende fil og transskriberer den. Det er en anden opgave.
Til den opgave er tre gratis værktøjer ægte gode, og de er bygget præcis til den:
- Buzz transskriberer og oversætter lydfiler offline, drevet af OpenAI's Whisper, MIT-licenseret, og det kører på Windows. Vil du have et rigtigt vindue med knapper i stedet for en terminal, så start her.
- Whisper Desktop (Const-me) er en Windows-GUI-app. Du pakker den ud, kører WhisperDesktop.exe, peger den mod en fil, og den transskriberer ved hjælp af din GPU via DirectCompute. Den er MPL-2.0-licenseret og hurtig på et anstændigt grafikkort.
- whisper.cpp er det slanke valg, hvis du er fortrolig med kommandolinjen og vil have rå hastighed uden Python.
Det er ikke mig, der er diplomatisk for diplomatiets skyld. At sende dig til det rette værktøj, når det ikke er vores, er hele grunden til, at du bør tro på resten af det her. Har du en fil, så brug Buzz. Har du en mikrofon og en sætning i hovedet, så læs videre.
Hvad Whisper by Remskill faktisk gør på Windows
Vi tog de samme open source-Whisper-modeller plus en ekstra motor og pakkede dem ind i en Windows-app, så der ikke er noget at bygge og ikke noget at skrive i en terminal.
Du installerer én app på omkring 25 MB. Du logger ind. Du trykker på genvejstasten, som er Ctrl + Space som standard og fuldt remappbar. Du taler. Du slipper. Teksten dukker op ved din markør i den app, du allerede var i: Word, Outlook, browseren, Slack, en kodeeditor, søgefeltet. Ingen fil, ingen terminal, ingen GPU påkrævet — al lokal transskription kører på din CPU.
Under motorhjelmen vælger du mellem tre veje, for vi vælger ikke en model for dig:
- Lokal Whisper (8 modeller) er den open source-Whisper, du kom her efter, pakket ind og klar. Engelsk-optimeret fra Base (~140 MB) op til Medium (~1,5 GB), plus flersprogede builds op til Large v3 (~3 GB). De flersprogede builds dækker 99 sprog og kan oversætte til engelsk.
- Parakeet (NVIDIA TDT, ~600 MB) er en separat motor, 5 til 10 gange hurtigere end Whisper på CPU, og dækker engelsk plus 24 andre europæiske sprog. Ingen oversættelse til engelsk. Vælg den, hvis du vil have hastighed og mest arbejder på engelsk.
- Cloud (OpenAI, BYOK) lader dig bruge din egen OpenAI-nøgle til topklasse-præcision og websøgning; vi tager ingen andel. Det er den ene Pro-funktion.
Den lokale pipeline (alle Whisper-modeller, Parakeet, AI-oprydning via Ollama, historik, forudindstillinger, brugerdefineret genvejstast, modeldownloads) er gratis for enhver indlogget bruger, uden kort ved tilmelding. Cloud-vejen er det betalte Pro-niveau; du kan se tallene på prissiden.
Hvorfor en rigtig Windows-dikteringsapp er sværere end pip install
Her er det, ingen advarer dig om, når de siger "pak bare Whisper ind i en brugergrænseflade."
Modellen er den nemme del. At få en genvejstast til at opføre sig ordentligt på Windows er det ikke. Den første version af vores genvejstast-håndtering udløste stop-optagelses-callbacket seks gange for ét rigtigt tastetryk. Den virkede perfekt på en Mac. Den virkede perfekt på en ren Windows-installation. Den faldt fra hinanden på rigtige kundemaskiner — dem med en sproginput-metode aktiveret, som på Windows genererer fantom-Ctrl + Space-slipevents på uforudsigelige tidspunkter. Det tog dage med telemetri, så en 50 ms debounce, der ikke var nok, og så en 300 ms debounce, der endelig var. Jeg lærte mere om Windows' input-metode-framework, end noget menneske burde, og jeg har en kandidatgrad. Min ældste datters dom, da jeg forklarede det: "det er derfor, fars mails tager en evighed."
Det er forskellen mellem en model og et produkt. Den gratis Whisper giver dig en transskription af en fil. En dikteringsapp skal overleve det rigtige Windows-skrivebord, i rigtige apps, mens du laver noget andet. Modellen ser aldrig den kamp. Det gør vi, og vi tabte den i omkring en uge først.
Når det indbyggede Windows-værktøj er alt, hvad du har brug for
Fortæl folk, hvornår de ikke skal købe din ting, og så tror de måske på dig om resten. Så: hvis du kun dikterer den lejlighedsvise korte note, har du måske ikke brug for noget af det her. Windows 11 har et indbygget tale-skrivning-værktøj, du åbner med Win + H. Det er gratis og fint til et par linjer, selvom det sender din lyd til Microsofts online-talegenkendelse i stedet for at køre på din maskine. Til et hurtigt Teams-svar er det rigeligt.
Vi begynder at være installationen værd omkring det punkt, hvor du skriver rigtig tekst (lange mails, indlæg, forelæsningsresuméer, kodekommentarer, marketingvarianter) og vil have den til at blive på din maskine, på 99 sprog, med den samme genvejstast overalt. Hvis din dag består af to-linjers chats, er du færdig. Hvis din dag består af at skrive, så behold appen.
Læs mere
OpenAI Whisper er en gratis, open source-model, og på Windows vil den normalt have Python, ffmpeg og en terminal for at transskribere filer. Har du en fil, klarer Buzz eller Whisper Desktop det gratis med et rigtigt vindue. Er det, du faktisk vil, at tale og se dine ord lande ved markøren i en hvilken som helst app, uden noget at bygge, ingen kommandolinje, kørende lokalt på din CPU, så er det det, vi har lavet.
For en længere gennemgang af landskabet mellem gratis og betalt, se tale til tekst på Windows. For at vælge mellem vores to lokale motorer, se Whisper vs Parakeet.
Dikter din første sætning på cirka et minut
Download Whisper by Remskill til Windows, log ind uden kort, tryk på Ctrl + Space, og tal. Den lokale pipeline er gratis, så længe du bruger den.
Gratis lokal transskription for evigt. Ingen betalingsmetode ved tilmelding. Cloud-niveauet er den eneste betalte funktion.



