Guide
Whisper för Mac
"Whisper för Mac" kan betyda två saker. Antingen är det den öppna källkodsmodellen OpenAI Whisper som körs på en Mac via Python och kommandoraden, eller så är det en Mac-app som använder Whisper under huven. De flesta vill ha det andra. De vet bara inte om det ännu.
Senast uppdaterad: juni 2026

Whisper för Mac är två olika saker som bär samma namn. Modellen är öppen källkod och gratis, men det officiella sättet att köra den kräver Python och kommandoraden, och den transkriberar filer snarare än ditt direkta tal. Vill du trycka på ett kortkommando och få dina ord att landa i vilken Mac-app som helst, då vill du ha en dikteringsapp som Whisper by Remskill, vars hela lokala pipeline är gratis för alla inloggade användare.
Whisper är en modell, inte en Mac-app
Låt mig reda ut namnförvirringen, för sökresultaten blandar ihop det.
Whisper är en tal-till-text-modell med öppen källkod från OpenAI, släppt under MIT-licensen. Modellen är gratis. Koden är gratis. Du kan ladda ner vikterna och köra dem på din egen maskin, utan konto. Den delen är genuint "Whisper för Mac" i bokstavlig mening.
Haken är hur du kör den. Det officiella OpenAI Whisper är ett verktyg för Python och kommandoraden. Du installerar det med pip, du behöver dessutom kommandoradsverktyget ffmpeg, och sedan pekar du det mot en ljudfil. Det transkriberar inspelningar: audio.mp3, audio.wav, den typen av filer. Det skriver inte ditt direkta tal in i Mail eller Slack. Det förvandlar en fil du redan har till text.
Det finns sex modellstorlekar (tiny, base, small, medium, large och turbo), fyra av dem med varianter enbart för engelska som byter noggrannhet mot hastighet. Whisper är flerspråkig och kan översätta tal till engelska med en enda flagga. Bra modell. Den tråkiga sanningen är att modellen aldrig var det svåra. Att koppla in den i hur du faktiskt arbetar på en Mac är det.
Mac-verktygen som bygger på Whisper, och vad var och ett är till för
De flesta som söker på "Whisper för Mac" vill inte röra pip. De vill ha en app. Det finns flera bra sådana, och de är inte utbytbara. De delar in sig i två läger.
Läger ett: transkribera filer
whisper.cpp är en ren C/C++-port av Whisper, MIT-licensierad, och den är en förstklassig medborgare på Apple Silicon, optimerad med ARM NEON, Accelerate-ramverket, Metal och Core ML. Den körs enbart på CPU, du bygger den från källkod, och du styr den från kommandoraden. Är du bekväm i en terminal och vill ha rå, snabb, lokal filtranskribering är den utmärkt. MacWhisper ger dig en grafisk version av samma idé. Den transkriberar ljud- och videofiler lokalt på enheten med OpenAI Whisper och NVIDIA Parakeet, utan att någon data lämnar din maskin, plus en systemövergripande dikteringsfunktion. Om ditt jobb är att förvandla inspelningar till transkriberingar är det lägret det rätta.
Läger två: skriv ditt direkta tal
Det här är diktering. Du trycker på ett kortkommando, du pratar, och texten dyker upp vid markören i vilken app som än är aktiv. VoiceInk hör hemma här. Den är öppen källkod under GPL-3.0, den kör lokala modeller på Apple Neural Engine inklusive Parakeet v3, och den klistrar in vid markören med en push-to-talk-genväg. Den kräver Apple Silicon och macOS 14.4 eller senare. superwhisper finns också här, med direkt diktering plus filtranskribering, lokalt eller i molnet, på Mac, Windows och iOS.
Whisper by Remskill, appen jag bygger, hör hemma i läger två. Diktering först. Värt att veta vilket läger du tillhör innan du laddar ner något.
Vad Whisper by Remskill gör på en Mac
Jag beskriver det jag byggt, sedan kan du bedöma det mot resten.
Det är en dikteringsapp. Du trycker på ett kortkommando, du talar, och texten landar vid markören i vilken app som helst: Mail, Anteckningar, Slack, din kodeditor, rutan där du fyller i årets samtycke från skolan. Standardkortkommandot på en Mac är Command och Option tryckta samtidigt, och det går helt att ändra. All transkribering sker på din Mac. Ingen fil att ladda upp, ingen inspelning att hantera.
Du kör heller ingen Python. Det finns ingen pip, ingen ffmpeg, ingen terminal, ingen GPU. Hela grejen är ren Rust. Whisper- och Parakeet-motorerna körs via ett bibliotek som heter transcribe-rs, utan någon inbäddad Python-sidoprocess. Lokal transkribering körs på din CPU, ingen dedikerad GPU behövs, och appen är ungefär 25 MB på disken.
När det gäller själva modellen väljer du. Lokal Whisper ger dig 8 modeller, 99 språk, översättning till engelska, eget vokabulär, kontroll över beam-storlek och hotword-viktning. Långsammare, men mest kontroll. Parakeet är NVIDIA:s TDT-motor, ungefär 600 MB, och den körs 5 till 10 gånger snabbare än Whisper på en CPU, täcker engelska plus 24 andra europeiska språk, utan översättning till engelska. Molnläge är den tredje vägen: du tar med din egen OpenAI-nyckel, och vi tar ingen andel. Jag väljer medvetet inte åt dig. Vi går igenom skillnaderna i Whisper vs Parakeet om du vill ha den långa versionen.
Lokal noggrannhet hamnar vanligtvis mellan 95 % och 99 %. Hela den lokala pipelinen är gratis för alla inloggade användare: Whisper, Parakeet, offline-AI-städning via Ollama, transkriberingshistorik, förinställningar, hotwords, hårdvaruacceleration, modellnedladdningar och det egna kortkommandot. Ingen betalmetod vid registrering. Du kan använda den på upp till 3 enheter. Den betalda nivån, Whisper Pro, lägger bara till molnytan: OpenAI-molntranskribering, AI-städning i molnet och webbsökning. Priserna finns på prissidan. Jag anger inga siffror här, för prissidor förändras och du bör läsa det direkt från källan.
En ärlig begränsning: vårt Mac-bygge är enbart för Apple Silicon, M1 till M4. Sitter du på en Intel-Mac är den här appen inget för dig, och jag berättar strax vad som passar i stället.
Så här ser din första diktering faktiskt ut. Tryck på kortkommandot, en liten inspelningsindikator dyker upp, du pratar, du släpper, och den städade texten landar precis där markören satt. Overlayen nedan är det riktiga som appen visar, inte en attrapp.
Installationen är kort. Ladda ner appen, logga in, låt den hämta hem en modell. Parakeet är minst, runt 600 MB, eller en Whisper-modell om du vill ha språk eller översättning. Välj ditt kortkommando eller behåll Command och Option. Öppna sedan Mail, håll inne kortkommandot och säg en mening. Det är hela introduktionen. Min yngre dotter klarade det utan en enda följdfråga, vilket är det enda användbarhetstest jag verkligen litar på. Vill du ha den längre genomgången skärmdump för skärmdump med alla tre modellvägar har jag skrivit en egen guide: röst till text på Mac.
Varför jag håller det lokalt på en Mac
Här är min enda starka åsikt i den här artikeln: diktering enbart i molnet är en integritetskatastrof.
Din chefs löneblad, mejlet till ditt barns skola, den juridiska inlagan du skriver på tåget. Inget av det borde passera en leverantörs servrar bara för att du ville skriva med rösten. Din Mac har redan en mikrofon och en CPU. För ett stycke diktering behöver den ingen server i loopen. Med de lokala motorerna lämnar ljudet aldrig din maskin. Det är standardvalet jag skulle ta till, och det är gratis.
Molnläge finns för när du faktiskt vill ha de senaste OpenAI-modellerna eller webbsvar, på din egen nyckel. Det är nödutgången, inte huvudingången.
När MacWhisper, VoiceInk eller kommandoraden är det bättre valet
Jag vore en dålig guide om jag låtsades att en app vinner i varje fall. Det gör den inte. Här är var jag skulle skicka dig någon annanstans.
Du transkriberar mest inspelningar
Om din dag handlar om att mata in podcastavsnitt, intervjuinspelningar eller mötesinspelningar i en transkribering vill du ha ett filtranskriberingsverktyg, inte en dikteringsapp. MacWhisper är byggt för precis det: dra in en fil, få ut text, lokalt på enheten. Använd den. Vi gör ingen filuppladdning. Vi skriver ditt direkta tal.
Du vill ha något rått, skriptbart, gratis, och du lever i terminalen
Då är whisper.cpp svaret. Den är MIT-licensierad, optimerad för Apple Silicon, enbart CPU, och du kan pipa in den i vad som helst. Är du den sortens person som gillar att bygga från källkod blir du lyckligare där än i något grafiskt gränssnitt.
Du vill ha helt öppen källkod för diktering och du är på Apple Silicon
VoiceInk är GPL-3.0, du kan läsa eller granska varje rad, och den klistrar in vid markören som vi gör. Det är ett gediget gratisalternativ. Vi är en hanterad app, med konton, historik, BYOK i molnet och Windows-stöd, och vi är inte öppen källkod. Så om öppen källkod är ett absolut krav är det ditt val, och VoiceInk är ett bra sådant.
Du sitter på en Intel-Mac
Vår app kör inte. Den öppna källkoden whisper.cpp kan byggas och köras på Intel, och Apples egen inbyggda Diktering är gratis för korta anteckningar. Båda slår att vänta på en Apple Silicon-maskin du ännu inte köpt.
Om du bara minns en sak
Modellen är gratis och öppen. Beslutet som spelar roll är vad du bygger runt den: en terminal, ett grafiskt filtranskriberingsverktyg, eller ett kortkommando som skriver ditt direkta tal in i det du tittar på. Matcha förpackningen mot uppgiften, och på en Mac, strunta i Python om du inte genuint gillar det. Det finns tre sorters människor som letar efter Whisper på en Mac: de med en mapp full av inspelningar, de som aldrig vill skriva igen, och de som bara gillade namnet. Två av dem är i fel läger tills de läst så här långt.
Jag dikterade det mesta av den här artikeln i stället för att skriva den, vilket kändes passande. Det enda stycket jag skrev för hand hade fler skrivfel.
Vidare läsning
Prova det på din Mac
Ladda ner Whisper by Remskill, logga in och diktera din första mening på din Mac. Den lokala nivån är gratis, och du kan bestämma senare om du någonsin behöver molnet.
Gratis lokal transkribering för alltid. Ingen betalmetod vid registrering. Endast Apple Silicon.



