Af Denys Medvediev

Guide

Whisper til Mac

"Whisper til Mac" kan betyde to ting. Enten den open source-baserede OpenAI Whisper-model, der kører på en Mac via Python og kommandolinjen, eller en Mac-app, der bruger Whisper under motorhjelmen. De fleste vil have den anden. De ved det bare ikke endnu.

Senest opdateret: juni 2026

En MacBook og en mikrofon på et skrivebord, der signalerer Whisper-stemmediktering på Mac

Whisper til Mac er to forskellige ting under samme navn. Modellen er open source og gratis, men den officielle måde at køre den på kræver Python og kommandolinjen, og den transskriberer filer frem for din direkte tale. Vil du trykke på en genvejstast og få dine ord til at lande i en hvilken som helst Mac-app, skal du have en dikteringsapp som Whisper by Remskill, hvis hele lokale pipeline er gratis for enhver bruger, der er logget ind.

Whisper er en model, ikke en Mac-app

Lad mig rydde op i navngivningen, for søgeresultaterne blander det hele sammen.

Whisper er en open source-tale-til-tekst-model fra OpenAI, udgivet under MIT-licensen. Modellen er gratis. Koden er gratis. Du kan downloade vægtene og køre dem på din egen maskine, helt uden en konto. Den del er reelt "Whisper til Mac" i bogstavelig forstand.

Hagen ved det er, hvordan du kører den. Den officielle OpenAI Whisper er et Python- og kommandolinjeværktøj. Du installerer det med pip, du skal også bruge kommandolinjeværktøjet ffmpeg, og så peger du det mod en lydfil. Det transskriberer optagelser: audio.mp3, audio.wav, den slags. Det skriver ikke din direkte tale ind i Mail eller Slack. Det forvandler en fil, du allerede har, til tekst.

Der findes seks modelstørrelser (tiny, base, small, medium, large og turbo), hvoraf fire har engelsk-kun-varianter, der bytter hastighed for nøjagtighed. Whisper er flersproget og kan oversætte tale til engelsk med et enkelt flag. God model. Den kedelige sandhed er, at modellen aldrig var den svære del. At koble den ind i den måde, du rent faktisk arbejder på på en Mac, er det.

De Mac-værktøjer, der pakker Whisper ind, og hvad hvert enkelt er til

De fleste, der søger på "Whisper til Mac", vil ikke røre pip. De vil have en app. Der findes flere gode af slagsen, og de er ikke udskiftelige. De deler sig i to lejre.

Lejr et: transskriber filer

whisper.cpp er en ren C/C++-port af Whisper, MIT-licenseret, og den er en førsteklasses borger på Apple Silicon, optimeret med ARM NEON, Accelerate-frameworket, Metal og Core ML. Den kører kun på CPU, du bygger den fra kildekode, og du styrer den fra kommandolinjen. Er du tryg i en terminal og vil have rå, hurtig, lokal filtransskription, er den fremragende. MacWhisper giver dig en grafisk version af samme idé. Den transskriberer lyd- og videofiler lokalt på enheden med OpenAI Whisper og NVIDIA Parakeet, uden at data forlader din maskine, plus en systemdækkende dikteringsfunktion. Er din opgave at lave optagelser om til transskriptioner, er den lejr den rigtige.

Lejr to: skriv din direkte tale

Det er diktering. Du trykker på en genvejstast, du taler, og teksten dukker op ved markøren i den app, der er i fokus. VoiceInk hører til her. Den er open source under GPL-3.0, den kører lokale modeller på Apple Neural Engine, herunder Parakeet v3, og den indsætter ved markøren med en push-to-talk-genvej. Den kræver Apple Silicon og macOS 14.4 eller nyere. superwhisper er også her, med direkte diktering plus filtransskription, lokalt eller i skyen, på Mac, Windows og iOS.

Whisper by Remskill, appen jeg bygger, er i lejr to. Diktering først. Det er værd at vide, hvilken lejr du er i, før du downloader noget.

Hvad Whisper by Remskill gør på en Mac

Jeg beskriver det, jeg har bygget, så kan du bedømme det op imod resten.

Whisper
Den live Whisper by Remskill-app — sidemenu, transskriptionspanel og AI-instruktionskort. Det er den ægte grænseflade, ikke et skærmbillede.

Det er en dikteringsapp. Du trykker på en genvejstast, du taler, og teksten lander ved markøren i en hvilken som helst app: Mail, Notes, Slack, din kodeeditor, feltet hvor du udfylder dette års tilladelsesseddel fra skolen. Standardgenvejen på en Mac er Command og Option holdt nede samtidig, og den kan ændres helt frit. Al transskription sker på din Mac. Ingen fil at uploade, ingen optagelse at holde styr på.

Du kører heller ikke Python. Ingen pip, ingen ffmpeg, ingen terminal, ingen GPU. Det hele er ren Rust. Whisper- og Parakeet-motorerne kører gennem et bibliotek ved navn transcribe-rs, uden nogen Python-sidecar pakket ind. Lokal transskription kører på din CPU, uden behov for et dedikeret GPU, og appen fylder omkring 25 MB på disken.

Hvad selve modellen angår, vælger du selv. Lokal Whisper giver dig 8 modeller, 99 sprog, oversættelse til engelsk, brugerdefineret ordforråd, kontrol over beam-størrelse og hotword-justering. Langsommere, men med mest kontrol. Parakeet er NVIDIAs TDT-motor på cirka 600 MB, og den kører 5 til 10 gange hurtigere end Whisper på en CPU og dækker engelsk plus 24 andre europæiske sprog, uden oversættelse til engelsk. Cloud-tilstand er den tredje vej: du medbringer din egen OpenAI-nøgle, og vi tager intet i provision. Jeg vælger bevidst ikke en for dig. Vi gennemgår forskellene i Whisper vs Parakeet, hvis du vil have den lange version.

Lokal nøjagtighed lander typisk mellem 95 % og 99 %. Hele den lokale pipeline er gratis for enhver bruger, der er logget ind: Whisper, Parakeet, offline AI-oprydning via Ollama, transskriptionshistorik, forindstillinger, hotwords, hardwareacceleration, modeldownloads og den brugerdefinerede genvejstast. Ingen betalingsmetode ved tilmelding. Du kan bruge den på op til 3 enheder. Det betalte niveau, Whisper Pro, tilføjer kun cloud-fladen: OpenAI cloud-transskription, AI-oprydning i skyen og websøgning. Priser findes på prissiden. Jeg nævner ikke tal her, for prissider ændrer sig, og du bør læse det direkte fra kilden.

En ærlig begrænsning: vores Mac-build er kun til Apple Silicon, M1 til M4. Sidder du på en Intel-Mac, er denne app ikke noget for dig, og jeg fortæller dig om lidt, hvad der så er.

Sådan ser din første diktering rent faktisk ud. Tryk på genvejstasten, en lille optagelsesindikator dukker op, du taler, du slipper, og den oprydede tekst falder ned, lige der hvor markøren stod. Overlejringen nedenfor er det ægte, appen viser, ikke en attrap.

Pasted
Den udsendte "færdig"-overlejring efter diktering — den ægte app-grænseflade i det øjeblik, en fuldt lokal diktering er færdig.

Opsætningen er kort. Download appen, log ind, lad den hente én model ned. Parakeet er den mindste på omkring 600 MB, eller en Whisper-model, hvis du vil have sprog eller oversættelse. Vælg din genvejstast eller behold Command og Option. Åbn så Mail, hold genvejstasten nede, og sig en sætning. Det er hele introforløbet. Min yngste datter klarede det uden at stille mig et eneste opfølgende spørgsmål, hvilket er den eneste brugervenlighedstest, jeg fuldt ud stoler på. Vil du have den længere, skærmbillede-for-skærmbillede-gennemgang med alle tre modelveje, har jeg skrevet en dedikeret guide: stemme til tekst på Mac.

Hvorfor jeg holder det lokalt på en Mac

Her er min ene stærke holdning i denne artikel: diktering kun i skyen er en privatlivskatastrofe.

Din chefs lønregneark, mailen til dit barns skole, det juridiske notat du skriver i toget. Intet af det bør passere gennem en leverandørs servere, bare fordi du gerne ville skrive med stemmen. Din Mac har allerede en mikrofon og en CPU. Til ét afsnits diktering behøver den ikke en server i loopet. Med de lokale motorer forlader lyden aldrig din maskine. Det er den standard, jeg ville række ud efter, og den er gratis.

Cloud-tilstand findes til, når du rent faktisk vil have de nyeste OpenAI-modeller eller svar fra nettet, på din egen nøgle. Det er nødudgangen, ikke hoveddøren.

Når MacWhisper, VoiceInk eller kommandolinjen er det bedre valg

Jeg ville være en dårlig guide, hvis jeg lod som om én app vinder hver gang. Det gør den ikke. Her er, hvor jeg ville sende dig videre.

Du transskriberer for det meste optagelser

Går din dag med at fodre podcast-afsnit, interviewoptagelser eller mødeoptagelser ind i en transskription, skal du have et filtransskriptionsværktøj, ikke en dikteringsapp. MacWhisper er bygget til lige præcis det: træk en fil ind, få tekst ud, lokalt på enheden. Brug det. Vi laver ikke filupload. Vi skriver din direkte tale.

Du vil have noget råt, scriptbart og gratis, og du lever i terminalen

Så er whisper.cpp svaret. Den er MIT-licenseret, optimeret til Apple Silicon, kun CPU, og du kan pipe den ind i hvad som helst. Er du typen, der nyder at bygge fra kildekode, vil du være gladere der end i nogen grafisk grænseflade.

Du vil have fuldt open source-diktering, og du er på Apple Silicon

VoiceInk er GPL-3.0, du kan læse eller gennemgå hver eneste linje, og den indsætter ved markøren ligesom os. Det er et solidt gratis valg. Vi er en administreret app med konti, historik, cloud-BYOK og Windows-understøttelse, og vi er ikke open source. Så er open source et ufravigeligt krav, er det din beslutning, og VoiceInk er et godt valg.

Du er på en Intel-Mac

Vores app kører ikke. Den open source-baserede whisper.cpp kan bygges og køres på Intel, og Apples egen indbyggede Dictation er gratis til korte noter. Begge dele slår at vente på en Apple Silicon-maskine, du endnu ikke har købt.

Hvis du kun husker én ting

Modellen er gratis og åben. Den beslutning, der betyder noget, er, hvad du pakker rundt om den: en terminal, en grafisk filtransskriptionsapp eller en genvejstast, der skriver din direkte tale ind i det, du kigger på. Match indpakningen til opgaven, og på en Mac kan du ignorere Python, medmindre du virkelig nyder det. Der er tre slags mennesker, der går på jagt efter Whisper på en Mac: dem med en mappe fuld af optagelser, dem der aldrig vil skrive igen, og dem der bare kunne lide navnet. To af dem er i den forkerte lejr, indtil de har læst så langt.

Jeg dikterede det meste af denne artikel i stedet for at skrive den, hvilket føltes passende. Det ene afsnit, jeg skrev i hånden, havde flere slåfejl.

Videre læsning

Prøv det på din Mac

Download Whisper by Remskill, log ind, og dikter din første sætning på din Mac. Det lokale niveau er gratis, og du kan beslutte senere, om du nogensinde får brug for skyen.

Gratis lokal transskription for altid. Ingen betalingsmetode ved tilmelding. Kun Apple Silicon.

Foto af Denys Medvediev

Denys Medvediev

Jeg er den, der læser vores support-mail, højst sandsynligt ved at diktere svarene.