Forklart
Hvilken Whisper-modell bør jeg bruke
Det finnes ingen enkelt riktig Whisper-modell – den rette avhenger av om du bryr deg mest om hastighet, nøyaktighet, språk eller diskplass. Denne guiden kobler hver modell som følger med til et bruksområde, slik at du kan velge på omtrent ett minutt, og forteller deg når du heller bør droppe Whisper til fordel for Parakeet.
Sist oppdatert: juni 2026

Den beste Whisper-modellen avhenger av oppgaven: velg en liten engelsk modell for hverdagsdiktering på engelsk, en flerspråklig modell for andre språk, den store modellen for topp nøyaktighet, eller Turbo for hastighet nær den store kvaliteten. For mest engelsk og høy hastighet slår Parakeet Whisper. Appen viser dem alle og lar brukeren velge.
Jeg får dette spørsmålet oftere enn noe annet, vanligvis formulert som «jeg lastet ned appen, hvilken modell velger jeg nå». Det er et rimelig spørsmål, og det ærlige første svaret er at det ikke finnes én modell som vinner. Det finnes en modell som vinner for din maskin, ditt språk og hvor mye du bryr deg om å vente et halvt sekund ekstra. Så appen velger ikke for deg. Den viser deg alternativene og holder seg unna.
Det høres ut som en unnvikelse helt til du ser spennet. Den minste engelske modellen er rundt 140 MB og kjører på en laptop fra 2016. Den beste flerspråklige er rundt 3 GB og vil ha 16 GB RAM. Mellom disse to ligger seks andre valg pluss en egen motor kalt Parakeet. Velg feil, og du enten venter for lenge eller transkriberer på feil språk. Velg riktig, og du glemmer at modellen finnes – noe som er målet.
Her er rammen som får hele listen til å klikke på plass. Hver modell er en avveining mellom fire ting: hastighet, nøyaktighet, hvor mange språk den kan, og hvor mye disk og RAM den spiser. Du kan ikke maksimere alle fire. En 3 GB-modell er mer nøyaktig og kan flere språk, men den er tregere og passer ikke på en 8 GB-maskin. En 140 MB-modell er øyeblikkelig, men gjør bare engelsk og bare sånn passe godt.
Så det egentlige spørsmålet er ikke «hvilken modell er best». Det er «hvilken avveining vil jeg ha». Når du først vet om du er en engelsk-bare-dikterer på en beskjeden laptop, en oversetter som jobber på tvers av ni språk, eller noen som bare vil ha det raskeste lokale alternativet som finnes, faller valget på plass av seg selv. Jeg går gjennom de engelsk-bare-modellene, de flerspråklige, hvor Parakeet slår dem alle, og enlinjes-anbefalingen hvis du ikke gidder å lese resten.
Start med ett spørsmål: hva bryr du deg mest om?

Før noe modellnavn, svar på ett spørsmål: hvilken av disse betyr mest for deg akkurat nå – hastighet, nøyaktighet, språkdekning eller diskplass? Du får bare velge én som prioritet, fordi modellene avveies mot hverandre. De fleste som plages med dette har ikke bestemt seg for hva de optimaliserer for, og det er derfor listen virker lammende. Det er den ikke. Det er fire korte svar forkledd som åtte navn.
Hvis du vil ha hastighet og du snakker engelsk, ender du opp på en liten engelsk modell eller, mer sannsynlig, på Parakeet. Hvis du trenger et annet språk enn engelsk, er du i den flerspråklige familien enten du liker det eller ei. Hvis du vil ha den mest nøyaktige transkripsjonen du kan få lokalt og du har RAM til det, er det den store modellen. Og hvis diskplassen er knapp, er den minste modellen din venn, og 3 GB-modellen er uaktuell. Det er hele beslutningstreet, og resten av denne guiden fyller bare inn navnene.
Én ting appen gjør med vilje: den tvinger aldri et standardvalg på deg. Det finnes ingen «anbefalt»-merke som dytter deg mot modellen som tilfeldigvis får oss til å se bra ut i en benchmark. Du ser Cloud, du ser Parakeet, du ser de åtte Whisper-modellene delt i engelsk-bare og flerspråklig, og du velger. Hvis du har satt opp tale til tekst på Windows eller på Mac før, er dette den samme skjermen rettet mot et annet spørsmål.
De engelsk-bare-modellene, fra liten laptop til topp nøyaktighet
Hvis du bare noensinne dikterer på engelsk, er de engelsk-bare-modellene det effektive valget – de dropper det flerspråklige maskineriet og bruker det budsjettet på engelsk i stedet. Det er fire av dem, og de stiller seg pent opp fra «gammel laptop» til «beste engelsk du kan kjøre lokalt». Du trykker på hurtigtasten, snakker, slipper, og transkripsjonen limes inn ved markøren uansett hvilken du valgte; den eneste forskjellen er hastighet og hvor ofte den treffer et vrient ord. En liten kapsel dukker opp mens du snakker, så du vet at den lytter:
Den minste er Base, rundt 140 MB. Det er den å velge på en 2016-laptop eller en 8 GB-maskin der du vil ha diktering som bare fungerer uten å tenke på RAM. Over den ligger Small på rundt 480 MB, det balanserte engelske alternativet – tregere enn Parakeet, men den støtter oversettelse-til-engelsk og forsterkning av nøkkelord, noe Parakeet ikke gjør. Så Medium på rundt 1,5 GB, som vil ha 16 GB RAM og gir deg den høyeste rene engelske nøyaktigheten i familien. (På en offentlig benchmark lander den engelske medium-modellen på rundt 3 % ordfeilrate på rent lydopptak; Small ligger nærmere 5 %. Tall i praksis avhenger langt mer av mikrofonen din enn av hvilken av disse du velger.)
Den fjerde forvirrer folk, så la meg være tydelig om den. Turbo, som er distil-large-v3-modellen, er også rundt 1,5 GB og beskrives som 6× raskere enn den store modellen med 99 % av nøyaktigheten. Det høres ut som en gratis lunsj, og for engelsk er det nesten det – det er valget når du vil ha nær-best engelsk nøyaktighet uten hastighetstapet til den fulle store modellen. Haken er «engelsk-bare»-merkelappen: disse fire kan engelsk og bare engelsk. I det øyeblikket du trenger et annet språk, har du forlatt denne familien helt, og det er neste avsnitt.
De flerspråklige modellene, for de andre 98 språkene
I det øyeblikket lydopptaket ditt ikke er engelsk, vil du ha en flerspråklig modell. Whispers flerspråklige bygg dekker 99 språk med autogjenkjenning, og de er den eneste lokale veien som kan oversette tale til engelsk mens den transkriberer. De engelsk-bare-modellene kan ikke gjøre det, og det kan ikke Parakeet heller. Så hvis du dikterer på ukrainsk, skriver et notat på japansk, eller vil at et spansk opptak skal komme ut som engelsk tekst, er denne familien svaret, punktum.
Det er fire her også, og de speiler de engelsk-bare-størrelsene. Small, rundt 480 MB, er den raske flerspråklige grunnlinjen – standardmodellen appen leveres med totalt sett, fordi den er den tryggeste første gjetningen når ingen ennå vet hvilket språk du har. Medium, rundt 1,5 GB, bytter hastighet mot merkbart bedre kvalitet. Large v3, på rundt 3 GB, er den beste nøyaktigheten du kan få lokalt og det rette valget for profesjonelt flerspråklig arbeid, forutsatt at du har 16 GB RAM å mate den med. Og Large v3 Turbo, rundt 1,62 GB, er det raske flerspråklige nivået – mesteparten av den store modellens kvalitet på en brøkdel av ventetiden.
Et ord om språktellingen, fordi det markedsføringstrygge tallet og det reelle er forskjellige avhengig av hva du mener. De flerspråklige modellene dekker virkelig 99 språk; de engelsk-bare-modellene dekker nøyaktig ett. Hvis du for det meste snakker engelsk og av og til treffer et annet europeisk språk, har du et raskere alternativ enn noen av disse, og det er Parakeet – som er det neste å forstå, fordi det er modellen folk oftest velger ved en feiltakelse eller hopper over ved en feiltakelse.
Når Parakeet slår Whisper, og når den ikke gjør det

Parakeet er ikke en Whisper-modell i det hele tatt – det er NVIDIAs TDT-motor, rundt 600 MB, og det er det raskeste lokale alternativet appen leveres med, beskrevet som 5 til 10 ganger raskere enn Whisper på CPU. Hvis du har en eldre CPU i laptop-klassen uten en ledig GPU, er det hastighetsgapet forskjellen mellom diktering som føles øyeblikkelig og diktering som lar deg vente. For daglig engelsk arbeid er Parakeet den jeg griper til først.
Den dekker engelsk pluss 24 andre europeiske språk – 25 totalt – så for mange europeiske brukere holder det i massevis. Det den med vilje ikke gjør, er det som bare hører Whisper til: ingen oversettelse-til-engelsk, ingen forsterkning av nøkkelord, ingen ledetekst for egendefinert ordforråd. Hvis arbeidet ditt er enspråklig engelsk (eller ett av de 24 europeiske språkene) og du bare vil ha det raskt, vinner Parakeet og spørsmålet er over. Det er mer om den i gjennomgangen av Parakeet-modellen hvis du vil ha hele bildet.
Whisper vinner i det øyeblikket du går utenfor den boksen. Trenger du kinesisk, japansk eller koreansk? Flerspråklig Whisper, fordi Parakeet ikke snakker dem. Trenger du å oversette et opptak til engelsk? Whisper flerspråklig, den eneste lokale veien som gjør det. Vil du vri modellen mot en liste med produktnavn eller fagsjargong, så den slutter å mangle dem? Whisper, via nøkkelord. Tommelfingerregelen: Parakeet for engelsk hastighet, Whisper for språk, oversettelse og kontroll. Appen leveres med begge fordi ingen av dem er det rette svaret for alle.
Størrelse, hastighet og nøyaktighet: hvordan avveiningen faktisk fungerer
Det hjelper å se de tre kreftene side om side, fordi hver modell bare er et annet punkt på den samme trekanten. Større filer er mer nøyaktige og tregere; mindre filer er raskere og lettere på RAM; og spesialmotorene bøyer kurven. Her er den ærlige versjonen av hver kraft, siden appen lar deg velge og jeg heller vil at du velger med kunnskap om hva det koster.
Tre måter å lese oppstillingen på, avhengig av hva som klemmer deg:
- Hvis hastighet er problemet — grip Parakeet først – rundt 600 MB og 5 til 10 ganger raskere enn Whisper på CPU. På en maskin uten GPU er det ingenting lokalt som slår den for daglig engelsk. Kostnaden er ingen oversettelse-til-engelsk og ingen nøkkelord.
- Hvis nøyaktighet eller språk er problemet — gå større i Whisper-familien. Large v3 på rundt 3 GB er den beste lokale nøyaktigheten og dekker 99 språk, men den vil ha 16 GB RAM. Turbo-variantene gir deg mesteparten av den kvaliteten med langt mindre venting. Small og Medium er den fornuftige middelveien.
- Hvis diskplass eller RAM er problemet — hold deg liten (Base på rundt 140 MB), eller dropp lokalt helt og bruk Cloud-modus, som kjører på hvilken som helst maskinvare fordi det bare er et nettverkskall til OpenAI med din egen nøkkel. Cloud er en del av Whisper Pro og trenger internett.
Den kjedelige sannheten er at for de fleste, på en nyere maskin, er forskjellen mellom mellomstore modeller mindre enn forskjellen mikrofonen din utgjør. En USB-mikrofon til 20 dollar gjør mer for nøyaktigheten enn å hoppe fra Small til Large – de offentlige Whisper-benchmarkene bekrefter dette, og jeg har sett det utspille seg på mitt eget skrivebord mer enn én gang. Så ikke plag deg med Medium mot Large på dag én. Velg noe som passer din RAM, kom i gang med å diktere, og oppgrader modellen senere hvis et ord stadig kommer ut feil. Modellen du faktisk beholder er den som er rask nok til at du glemmer at den er der.
Prøv én, så bytt med to klikk hvis den er feil
Her er den delen som tar trykket av hele avgjørelsen: du gifter deg ikke med modellen du velger først. Å bytte er to klikk i Innstillinger, og den eneste reelle kostnaden er nedlastingen for den modellen du flytter til. Så den rette strategien er ikke å forske i en time – det er å gjøre en rimelig første gjetning, diktere med den i en dag, og bytte hvis den irriterer deg. Hele den lokale arbeidsflyten er gratis for enhver innlogget konto, uten at det spørres om betalingsmåte ved registrering, så å prøve noen modeller koster deg ingenting annet enn diskplass.
Steg 1 – Åpne Innstillinger og finn Transkripsjon-panelet.
Det er der modellisten ligger, delt i engelsk-bare og flerspråklig, med Parakeet og Cloud ved siden av. Ingenting er forhåndsvalgt som «det beste».
Du vet at du er på rett sted når du ser modellisten med størrelser ved siden av hvert navn.
Steg 2 – Gjør din første gjetning ut fra avsnittet ovenfor.
Engelsk og vil ha hastighet: Parakeet. Engelsk og vil ha nøyaktighet: Small eller Medium engelsk. Andre språk: en flerspråklig modell. Knapp på RAM: Base.
Du vet at det virket når modellen er ferdig nedlastet og vises som klar.
Steg 3 – Dikter med den i en dag.
Bruk den på ekte arbeid, ikke en testsetning. Du lærer mer av én ettermiddag med faktiske notater enn av et hvilket som helst benchmark-diagram.
Du vet at det er rett modell når du slutter å legge merke til den og bare snakker.
Steg 4 – Bytt hvis den er feil.
For treg, velg noe mindre eller Parakeet. Mangler et språk eller mangler ord, gå flerspråklig eller større. To klikk, én nedlasting, ferdig.
Du vet at det virket når den nye modellen lastes inn og neste opptak bruker den.
Folk behandler dette som en enveisdør, og det er det ikke. Den første modellen jeg kjørte var ikke den jeg beholdt; jeg startet på en flerspråklig modell av vane, innså at jeg dikterte på engelsk hele dagen, og gikk over til Parakeet for hastigheten. Tok to klikk og en kaffekopps verdi av nedlasting. Behandle ditt første valg som et utkast.
Den raske anbefalingen, hvis du hoppet til slutten
Hvis du ikke leser noe annet, her er det. Engelsk, vil ha det raskt, beskjeden maskin: Parakeet. Engelsk, vil ha den beste lokale nøyaktigheten: Medium engelsk-modellen, eller Turbo hvis du vil ha den nøyaktigheten uten ventingen. Et annet språk, eller du trenger oversettelse: en flerspråklig modell – Small til å begynne med, Large v3 hvis nøyaktighet betyr noe og du har 16 GB RAM. Knapp på disk eller RAM: Base. Vil ha toppnøyaktighet med nettilgang og du er greit med å bruke din egen OpenAI-nøkkel: Cloud. Det er hele kartet.
Uansett hva du velger, kommer det rå transkriptet ut som ett sammenhengende kjør, og det gjelder enhver talemotor, ikke bare vår. Du sier «okay så sett møtemodellen til medium og minn meg på å teste den store senere», og det er den uten tegnsetting du får tilbake. Whisper kan kjøre en AI-opprydding for å fikse tegnsettingen og fjerne fyllordene før teksten lander – si aktiveringsfrasen «Hey whisper», så rydder den opp først. På en lokal modell kjører det gjennom Ollama; i cloud-modus er det gpt-5-mini som standard.
okay så sett møtemodellen til medium og minn meg på å teste den store senere eh kanskje parakeet til de raske tingene
Okay, så sett møtemodellen til Medium og minn meg på å teste den store senere – kanskje Parakeet til de raske tingene.
Ett ærlig forbehold som hører hjemme på slutten av enhver «hvilken modell»-guide: hvis alt du noensinne gjør er å slippe et notat på 30 ord inn i et tekstfelt, trenger du kanskje ikke å velge en modell i det hele tatt. På Windows åpnes den innebygde Taleskriving-linjen med Windows-tasten + H der markøren din er – den setter tegn av seg selv og er gratis, men den går gjennom Microsofts servere og trenger internett. På en Mac gjør Diktering i Systeminnstillinger det samme, og på Apple Silicon kan generell tekst behandles på enheten. Under terskelen der nøyaktighet og lengde begynner å gjøre vondt, bruk det som allerede er på maskinen din. Vi begynner å være verdt nedlastingen når du har reelt volum, vil ha frakoblet personvern, eller trenger et språk og en kontroll de innebygde ikke tilbyr. Jeg skal ikke be deg installere en app for å diktere en handleliste.
Den «beste» Whisper-modellen er den du slutter å tenke på. Velg avveiningen du bryr deg om, gjør en første gjetning, og bytt med to klikk hvis den irriterer deg. Jeg har levert systemer der arkitekturdiagrammet var feil allerede ved andre commit, så jeg har en sunn respekt for «bare prøv og juster». Modellvalget ditt har lavere innsats enn det, og er mye lettere å angre. Begynn et sted. Nedlastingen er den trege delen; beslutningen bør ikke være det.
Velg en modell og begynn å snakke
Gjør en første gjetning, dikter i en dag, bytt med to klikk hvis den er feil. Appen viser deg hvert alternativ og lar deg velge.
Gratis lokal modus for enhver innlogget konto. Ingen kort kreves for å starte.



