Förklaring
Är Whisper gratis att använda?
Ja — OpenAI:s Whisper är öppen källkod under MIT-licensen, vilket innebär att modellen är gratis att ladda ner och använda, även kommersiellt. Det som kostar är att köra den: installation, beroenden och din egen hårdvara. Den enkla gratisvägen är att köra Whisper lokalt via en skrivbordsapp.
Senast uppdaterad: juni 2026

Whisper är gratis. OpenAI har släppt både koden och modellvikterna under den tillåtande MIT-licensen, vilket innebär att vem som helst kan ladda ner, köra och till och med använda tal-till-text-modellen kommersiellt utan kostnad. Det enda hindret är installationen: att köra Whisper själv kräver Python, ffmpeg och din egen hårdvara. En skrivbordsapp tar bort det hindret.
Folk frågar "är Whisper gratis" och förväntar sig en hake, för 2026 är nästan ingenting bra faktiskt gratis. Låt mig vara rak innan förbehållen: jo. OpenAI släppte Whisper under MIT-licensen — både kod och modellvikter — vilket är ungefär så tillåtande som mjukvarulicenser kan bli. Du kan ladda ner det, köra det, modifiera det, bygga in det i din egen produkt och ta betalt för produkten, och OpenAI ber inte om ett öre eller ett omnämnande.
Det är rubriken och den stämmer. Det rubriken utelämnar är skillnaden mellan "modellen är gratis" och "att använda modellen är gratis." Det är inte samma sak. Modellen är en fil. Att förvandla den filen till ord på skärmen kräver installation, lite tålamod med terminalen och en dator som klarar beräkningarna. Inget av det är dolt — det är bara arbete, och arbete är det verkliga priset på den öppna källkodsversionen.
Det är det som de flesta sidor som jagar det här sökordet blandar ihop. Det finns två Whisper i samtalet. Den ena är den öppna källkodsmodell som OpenAI släppte på GitHub — gratis, MIT, din att köra. Den andra är OpenAI:s molnbaserade transkriptions-API, som använder samma modellfamilj men fakturerar per minut. Samma namn, helt olika räkning.
Så "är Whisper gratis" ger tre ärliga svar. Modellen i sig: gratis, punkt slut. Att köra den själv: gratis i kronor, men du betalar i tid och hårdvara. Att låta någon hosta den åt dig: det kostar pengar, oavsett om det är OpenAI:s API eller en betalapps molnnivå. Den här guiden går igenom alla tre, visar den enkla gratisvägen och är ärlig om vad som faktiskt inte är gratis.
Vad Whisper egentligen är

Whisper är en tal-till-text-modell som OpenAI släppte i slutet av 2022. Du matar in ljud, du får ut text. Den är bra på det — tränad på en enorm mängd flerspråkigt ljud, så den hanterar accenter, bakgrundsljud och dussintals språk bättre än den dikteringsprogramvara de flesta av oss vuxit upp och svurit åt. Den kan också översätta tal på andra språk till engelsk text, vilket är ett snyggt trick de äldre verktygen aldrig lyckades med ordentligt.
Det viktiga ordet är "modell." Whisper är inte en app du dubbelklickar på. Det är hjärnan — en fil med tränade vikter plus koden för att köra dem. Ensam har den inget fönster, ingen knapp, ingen mikrofonkoppling. Det är motorn, inte bilen. Massor av produkter du hört talas om är i tysthet bara Whisper med ett lager färg över, vilket är helt okej, men det är värt att veta att motorn under huven är samma gratisdel i var och en av dem.
Den distinktionen är hela anledningen till att frågan är förvirrande. När någon säger "Whisper kostar 30 dollar i månaden" menar de inte modellen — de menar någon app som packade in modellen och tog betalt för förpackningen. När någon säger "Whisper är gratis" menar de motorn OpenAI gav bort. Båda påståendena är sanna samtidigt, om olika saker, vilket är exakt anledningen till att du sökte efter ett rakt svar.
Ja, MIT-licensen gör den genuint gratis
Det här är inte marknadsföringsgratis, där "gratis" betyder en provperiod som tar slut eller en nivå som irriterar dig. OpenAI släppte Whispers kod och modellvikter under MIT-licensen. MIT-licensen är en tillåtande, välförstådd öppen källkodslicens: den låter dig använda, kopiera, modifiera och distribuera programvaran, inklusive kommersiellt, med i princip ett villkor — behåll upphovsrättsmeddelandet. Ingen avgift, ingen royalty, ingen per-platskostnad, inget behov av att be om lov.
I praktiken innebär det: du kan ladda ner Whisper för privat bruk, köra det i ett företag, bygga in det i en produkt du säljer och transkribera en podcast åt en klient — allt utan att betala OpenAI. Modellvikterna — den tränade delen som är dyr att producera — är också gratis, inte bara omslagskoden. Det är den delen folk knappt tror på, för företag brukar hålla de tränade vikterna låsta. OpenAI gjorde inte det här.
Värt ett ärligt förbehåll så att ingen citerar mig fel senare. "Gratis under MIT" handlar om licensen, inte ett löfte om att det inte kostar något att driva. El är inte gratis. En dator är inte gratis. Din tid är inte gratis. Men programvaran och modellen — de delar ett företag normalt tar betalt en prenumeration för — de är genuint, permanent, utan asterisk gratis. (Den sortens gratis där du läser licensen två gånger för att du är säker på att du missat något. Det har du inte.)
Haken är att köra den själv
Här är där gratisversionen får sin prislapp, betald i tid i stället för pengar. Att köra Whisper på det råa, öppna källkodsättet innebär att gå via terminalen. Standardinstallationen är ett Python-paket, vilket betyder att du först behöver ha Python korrekt inställt. Whisper behöver också ffmpeg, ett separat ljudverktyg, installerat och i din systemmiljö. På vissa datorer behöver du dessutom Rust för att ett tokeniseringsberoende ska kunna byggas. Inget av det är exotiskt för en utvecklare. För alla andra är det en hel eftermiddag.
Sedan finns hårdvaran. Whisper gör riktiga beräkningar, och de större, mer exakta modellerna gör massor av dem. På en vanlig CPU kan den stora modellen ta längre tid att transkribera ett klipp än klippet varar. För att få fart vill du ha ett anständigt grafikkort, vilket de flesta bärbara datorer inte har. Den ärliga kostnaden för gratisversionen är alltså inte kronor — det är en Python-miljö du underhåller, ett kommando du kör för hand för varje fil och en dator som är tillräckligt snabb för att inte hålla dig väntande. (Jag har sett en icke-utvecklare följa ett blogginlägg om "5-minuters Whisper-installation." Det tog inte fem minuter. Det var en lördag och ett telefonsamtal till mig.)
Och ytterligare en sak den råa versionen inte ger dig: live-diktering. Whisper via terminalen transkriberar en fil du redan spelat in. Den sitter inte i bakgrunden, väntar på en tangentbordsgenväg och klistrar in text vid markören medan du pratar. För det — det folk faktiskt vill ha när de söker efter det här — behöver du ett skal runt modellen. Den goda nyheten är att det bästa skalet också är gratis, vilket är vad nästa avsnitt handlar om.
Den enkla gratisvägen: kör Whisper i en app
Du kan behålla allt "gratis" från öppen källkodsmodellen och hoppa över hela "köra det själv"-skatten. Det är hela anledningen till att vi byggde Whisper by Remskill — den kör samma öppna källkodsmodell lokalt på din dator, utan Python, utan ffmpeg, utan terminal. Hela det lokala flödet är gratis för alla inloggade konton, utan att ett betalmedel efterfrågas vid registrering. Du får öppen källkodsmotor utan öppen källkodshemläxa. Så här sätter du upp det.
Steg 1 — Installera appen och logga in.
Ladda ner från nedladdningssidan, installera och skapa ett gratiskonto. Inget kort. Det lokala transkriptionsflödet öppnar direkt — ingen Python, ingen ffmpeg, inget av det.
Du vet att det fungerade när ikonen i systemfältet dyker upp och installationsguiden erbjuder dig att välja en modell.
Steg 2 — Välj en lokal modell.
Appen väljer inte åt dig. För lokalt får du Whisper (8 modeller, 99 språk, översättning till engelska) eller Parakeet (snabbare, engelska plus 24 europeiska språk). Modellen laddas ner en gång och körs helt på din dator.
Du vet att det fungerade när en modell är klar att ladda ner och visas som redo.
Steg 3 — Bekräfta din tangentbordsgenväg.
Windows använder Ctrl+Space som standard, Mac använder Command+Option hållt intryckt som push-to-talk. På Mac, ge Tillgänglighetsbehörighet när du uppmanas, annars kan inklistring vid markören inte nå andra appar.
Du vet att det fungerade när en testinspelning klistras in i ett textfält.
Steg 4 — Placera markören var som helst och prata.
Klicka i ett textfält — ett mejl, ett dokument, ett sökfält — håll genvägen, säg en mening, släpp. Transkriptet visas där markören är, transkriberat av Whisper, på din dator, gratis.
Du vet att det fungerade när din talade mening sitter i fältet som text.
Det långsamma är den engångsmässiga modellnedladdningen, inte något installationsritual. Därefter sitter samma öppna källkodsmodell som ville ha en Python-miljö och ett kommando per fil bara i ditt systemfält och klistrar in text när du trycker på en knapp. Om du har vägt dikteringsalternativ på Windows eller Mac är det här versionen där Whisper äntligen känns som en app i stället för ett projekt.
Lokalt Whisper är gratis, molnet är den betalda delen
Det är här svaret på "är det gratis" behöver en tydlig linje dragen genom sig. Att köra Whisper lokalt är gratis — din dator, din CPU, ingen server, ingen per-minuts-räkning. Den betalda delen är molnet: OpenAI:s molnbaserade transkriptions-API tar betalt per minut och alla appar med molnnivå vidarebefordrar den kostnaden. I vår app är hela det lokala flödet gratis; molnytan är det enda som kräver Whisper Pro. Så här skiljer sig de tre vägarna faktiskt åt, för du får välja:
- Lokalt Parakeet — gratis — NVIDIA:s TDT-motor, ungefär 600 MB, och det snabbaste lokala alternativet — 5 till 10 gånger snabbare än Whisper på CPU. Täcker engelska plus 24 andra europeiska språk, 25 totalt. Ingen översättning till engelska. Om du mestadels pratar engelska och vill ha fart på blygsam hårdvara är det här det snabba, helt offline och kostnadsfria valet.
- Lokalt Whisper — gratis — den faktiska öppna källkodsmodellen Whisper, som körs på din dator utan kostnad. De flerspråkiga byggena täcker 99 språk och kan översätta till engelska; de engelskspråkiga byggena är bara engelska. Långsammare än Parakeet på samma hårdvara, men rätt val för kinesiska, japanska, koreanska eller vilket översättningsarbete som helst. Standard engelsk modell är ungefär 480 MB.
- Moln (OpenAI, BYOK) — betalt per minut — bästa noggrannheten och liveåtkomst till webben, med din egen OpenAI-nyckel fakturerad direkt av OpenAI — transkriptionen körs på gpt-4o-mini-transcribe som standard. Det är den del som kostar pengar, fakturerad per minut av OpenAI, inte av oss. Kräver internet. Molnytan är det enda som ingår i Whisper Pro.
Den tråkiga sanningen är att för de flesta vardagliga dikteringar räcker lokalt Whisper eller Parakeet gott och väl, och det är gratisvägen hela vägen. Båda körs helt på din dator utan att något skickas till en server. Molnet tjänar sin per-minuts-kostnad bara när du vill ha förstklassig noggrannhet på en svår inspelning eller behöver att modellen hämtar ett faktum från webben mitt i en mening. Om din fråga strikt var "är Whisper gratis" är det svar som spelar roll: det lokala flödet är det, börja där.
Modeller, noggrannhet och att städa upp rå text
Gratismodellen är inte en modell — det är en familj, och vilken du väljer är den verkliga noggrannhetsspaken. Mindre modeller är snabba och lätta; den stora flerspråkiga modellen är mest noggrann och tyngst. I den öppna källkodsversionen via terminalen väljer du modellstorlek och lever med hastigheten. I en app väljer du från en lista och modellen laddas ned en gång. Den viktigare poängen: noggrannheten kommer från modellen och din mikrofon mycket mer än från vad du betalar. En USB-mikrofon för 200 kronor gör mer för dina transkriptioner än någon uppgradering.
Oavsett vilken modell du kör kommer rå diktering ut som en lång följd utan interpunktion. Du säger "okej alltså modellen är gratis under MIT men att köra den själv kräver python och ffmpeg" och det är den interpunktionslösa vägg som varje taligenkänningsmotor ger dig. Att städa upp det är ett eget steg. Whisper by Remskill kan köra ett AI-pass över transkriptet: säg aktiveringsfrasen "Hey whisper" och texten förbättras innan den landar — utfyllnadsord borttagna, interpunktion tillagd. På en lokal modell körs det via Ollama gratis; i molnläge är det gpt-5-mini som standard.
okay so the model is free under mit but running it yourself needs python and ffmpeg and um a decent computer otherwise its slow
Okay, so the model is free under MIT, but running it yourself needs Python and ffmpeg, and a decent computer — otherwise it's slow.
Så noggrannhetsfrågan har två gratisspakar och en betald. Gratisspakarna: välj en modell som passar din hårdvara och mata den med rent ljud från en halvbra mikrofon. Den betalda spaken: molntranskription, som ger dig de senaste molnmodellerna när den lokala kvaliteten inte räcker. För den stora majoriteten av dikteringar är det gratisspakarna som spelar roll. Ingen som lovar "perfekta transkriptioner, noll ansträngning" är ärlig mot dig — modellen är gratis, men bra indata gör fortfarande det mesta av jobbet.
Samma tala-och-städa-flöde lönar sig överallt, inte bara här — du kan diktera välformulerad text direkt i vilken app som helst med en tangentbordsgenväg, så ett långt meddelande blir några talade meningar i stället för ett stycke du skriver ut.
När det faktiskt är värt att betala för Whisper

Eftersom hela artikeln handlar om "det är gratis" är jag skyldig dig den ärliga andra halvan: det finns tillfällen när betalning är rätt val, och att låtsas annat vore ett säljsnack, inte ett svar. Om det lokala gratisflödet täcker ditt behov, ta det och stäng fliken — de flesta är klara här. Men några situationer förtjänar verkligen en betald nivå.
Betala för molnvägen när noggrannheten på en svår inspelning är viktigare än pengarna — en intervju med tung accent, en bullrig fältinspelning, ett juridiskt transkript där ett fel ord kostar dig. De molnbaserade OpenAI-modellerna slår lokala på svårt material, och du betalar OpenAI per minut för precis den fördelen. Betala för det också om du vill att assistenten ska hämta ett faktum live från webben mitt i en mening, vilket en lokal modell helt enkelt inte kan göra offline. Och om du verkligen behöver noll installation på en dator du inte kontrollerar — en låst jobbdator där du inte kan installera Python eller ladda ner en modell — kan en molntjänst vara den enda öppna dörren. Utanför de fallen är det lokala gratisflödet inte en sämre version. Det är samma öppna källkodsmodell, som gör samma jobb, utan kostnad.
Nå för betalt när den inbyggda gratisvägen börjar göra ont: förstklassig noggrannhet på svårt ljud, live-webbsökningar eller en dator där du inte kan köra något lokalt. Under det ribban är den kostnadsfria modellen på din egen hårdvara rätt svar, och jag tänker inte uppmana dig att betala för det OpenAI redan gett bort. Gratisversionen finns, den fungerar och det är samma motor under huven.
Och om anledningen till att du vill ha gratis, lokalt Whisper är integritet — att hålla din röst borta från någons server — är argumentet för helt offline tal-till-text värt att läsa härnäst, för det är precis vad du köper genom att köra modellen på din egen dator.
Så: är Whisper gratis? Modellen är det, genuint, MIT-licensierad och din att köra. Att använda den gratis innebär antingen en eftermiddag vid terminalen eller en app som gjort den eftermiddagen åt dig. Den betalda delen är alltid och bara molnet — en hosting du inte strikt behöver för vardaglig diktering. Jag dikterade det mesta av det här genom att prata mot ett textfält, med den kostnadsfria lokala modellen som lyssnade, på en bärbar dator som aldrig en enda gång bett mig om ett kreditkort för att transkribera en mening. Det är hela svaret, och det är ovanligt att kunna ge ett sådant.
Kör gratis Whisper utan installation
Håll genvägen, prata, släpp. Den öppna källkodsmodellen transkriberar på din dator, gratis, och klistrar in texten var din markör än är.
Gratis lokalt läge för alla inloggade konton. Inget kort krävs för att börja.



