Av Denys Medvediev

Jämförelse

Whisper vs Parakeet

Whisper och Parakeet är de två lokala taligenkänningsmotorerna i Whisper by Remskill, och valet handlar om en enda avvägning. Parakeet är 5 till 10 gånger snabbare än Whisper på en CPU men hanterar engelska plus 24 europeiska språk. Whisper är långsammare men täcker 99 språk, översätter till engelska och ger dig finkornig kontroll.

Senast uppdaterad: juni 2026

Färgglada ljudvågformer på en mörk redigeringsskärm, en bild av två taligenkänningsmotorer

Whisper och Parakeet följer båda med gratis i Whisper by Remskill, och du växlar mellan dem från en rullgardinsmeny. Parakeet är 5 till 10 gånger snabbare på en CPU och täcker engelska plus 24 europeiska språk. Whisper är långsammare men täcker 99 språk, översätter till engelska och ger dig anpassad vokabulär och beam-kontroll. Snabb mot flexibel, inte bra mot dålig.

Whisper och Parakeet är de två lokala taligenkänningsmotorerna i Whisper by Remskill, och valet handlar om en enda avvägning. Parakeet är 5 till 10 gånger snabbare än Whisper på en CPU men hanterar engelska plus 24 europeiska språk. Whisper är långsammare men täcker 99 språk, översätter till engelska och ger dig finkornig kontroll.

Vi levererar båda, så det här är ingen säljpitch

De flesta "X vs Y"-artiklar är skrivna av någon som säljer X. Den här är annorlunda. Vi levererar båda motorerna i samma app. Du väljer den du vill ha från en rullgardinsmeny, laddar ner den en gång och växlar när du vill.

Det betyder att jag inte har någon anledning att övertala dig till fel motor. Om Parakeet passar dig vill jag att du använder Parakeet. Om du behöver Whisper vill jag att du kör Whisper. Appen väljer inte åt dig, och det gör inte jag heller. Jag visar dig bara vad var och en faktiskt är bra på.

Båda körs helt offline. Båda är gratis för alla inloggade användare. Inget kort, ingen molnräkning per minut, ingen extra avgift för den andra motorn.

Parakeet är den snabba

Parakeet är NVIDIA:s TDT-modell. Det står för Token-and-Duration Transducer, en FastConformer-kodare kopplad till en avkodare som förutsäger både orden och hur länge vart och ett varar. Du behöver inte komma ihåg något av det. Det som spelar roll står i nästa mening.

Den är 5 till 10 gånger snabbare än Whisper på en vanlig CPU. Ingen GPU krävs, ingen väntan. Du släpper snabbtangenten och texten är i princip redan där.

Modellen som följer med är Parakeet v3, ungefär 600 MB på disk, och den täcker engelska plus 24 andra europeiska språk, 25 totalt. Kvaliteten är bra. Inte Whisper-large-bra, men mer än tillräcklig för vardaglig diktering: mejl, anteckningar, meddelanden, det som de flesta av oss skriver hela dagarna.

Det Parakeet inte gör: den översätter inte ditt tal till engelska, och den tar inte emot anpassad vokabulär eller hotword-tips. Dikterar du på franska får du fransk text. Vilket är precis vad de flesta fransktalande vill ha, så det här är bara ett problem om översättning är hela anledningen till att du dök upp.

Whisper är den grundliga

Whisper är OpenAI:s öppna modell, och i vår app kommer den i åtta varianter. Fyra enbart för engelska och fyra flerspråkiga, från en Base-modell på ungefär 140 MB upp till en Large v3 på ungefär 3 GB. Du väljer den storlek som passar din dator och ditt tålamod.

De flerspråkiga modellerna täcker 99 språk, inte 25. Det inkluderar kinesiska, japanska, koreanska och arabiska, de som Parakeet hoppar över helt. Whisper översätter dessutom vilket som helst av dem till engelska i ett steg, vilket Parakeet inte kan.

Och Whisper ger dig kontroll som Parakeet inte gör: anpassad vokabulär, beam-storleksinställningar och hotword-styrning så att den slutar förvränga din kollegas namn eller din produkts namn. Dikterar du fackuttryck hela dagarna är den kontrollen skillnaden mellan ren text och ett sök-och-ersätt-pyssel.

Priset är hastighet. På samma CPU är Whisper långsammare, ibland mycket långsammare på de större modellerna. Den tråkiga sanningen är att de flesta som väljer Whisper inte väljer noggrannhet framför Parakeet utan snarare väljer språk och kontroll framför hastighet.

Whisper
Den riktiga modellväljaren i Whisper by Remskill — båda motorerna valbara i den faktiska appen, inte en skärmbild.

Den ärliga jämförelsen, i en tabell

Här är hela beslutet i sju rader. Inga dollarbelopp i den — båda motorerna är gratis på samma nivå.

Funktionsjämförelse mellan Parakeet och Whisper i Whisper by Remskill
FunktionParakeetWhisper
MotorNVIDIA TDT (FastConformer + Token-and-Duration Transducer)OpenAI Whisper
Nedladdningsstorlek~600 MB (en modell)~140 MB till ~3 GB (8 modeller)
Språk25, engelska + 24 europeiska99 (flerspråkiga modeller)
Översätt till engelskaNejJa
Hastighet på CPU5 till 10 gånger snabbareLångsammare
Anpassad vokabulär / hotwords / beam-kontrollNejJa
Bäst förSnabb diktering på engelska/EU-språk på en CPU99 språk, översättning, finkornig kontroll

Båda är lokala, båda är offline, båda är gratis på samma nivå. Tabellen handlar inte om "bra mot dålig". Den handlar om "snabb mot flexibel".

Vilken bör du faktiskt välja

Det här är den del de flesta jämförelseartiklar smiter undan, så här kommer den rakt på.

För de flesta engelskspråkiga användare, välj Parakeet. Hastigheten vinner varje dag. Du dikterar dussintals gånger om dagen, och glappet mellan "texten dyker upp direkt" och "texten dyker upp efter ett ögonblick" är glappet mellan att hålla kvar tankegången och tappa den. Allt över ungefär två sekunder och hjärnan börjar koppla in sig på appen du var i, och du glömmer vad du höll på att säga. Att Parakeet är 5 till 10 gånger snabbare på en CPU är inget skryt på ett specifikationsblad. Det är något du känner hundra gånger om dagen.

Välj Whisper när du behöver en av tre saker som Parakeet inte kan ge dig: ett språk utanför de 25 europeiska (kinesiska, japanska, koreanska, arabiska), översättning till engelska, eller anpassad vokabulär och hotword-kontroll för namn och fackuttryck.

Jag är den sortens person som ritar arkitekturdiagrammet innan jag installerar runtime, så min instinkt är alltid "använd det mer kapabla verktyget". Den instinkten är fel här. Det mer kapabla verktyget är Whisper, men rätt verktyg för en daglig engelsk dikteringsvana är oftast det snabbare. Kapacitet du inte använder är bara nedladdningsstorlek.

CancelTranscribing
Det riktiga inspelningsöverlägget mitt i en diktering — samma snabbtangent och samma överlägg oavsett vilken motor du väljer.

Ett verkligt fall där Whisper vinner

Tidigt, vecka tre efter lanseringen, mejlade en användare och frågade om appen kunde hantera ukrainska till engelska mitt i en mening. Han läste nyheter från Kiev i realtid och bytte språk var par ord. Jag hade antagit att "flerspråkig" betydde välj-ett-språk-per-session. Han menade äkta kodväxling, på ett språk som Parakeets 25 inte ens fullt ut täcker för det arbetsflödet. Whispers flerspråkiga modell klarade det: 99 språk, automatisk identifiering, översätt-till-engelska i samma svep. Han skrev aldrig tillbaka för att bekräfta. Jag väljer att tolka det som ett gott tecken.

Det är hela regeln i en enda berättelse. Om din dag ser ut som hans hjälper inte Parakeets hastighet dig, eftersom Parakeet inte kan göra jobbet alls. För alla vars dag ser ut som att diktera engelska mejl mellan möten är hastigheten själva poängen.

Så växlar du mellan dem

Du behöver inte binda dig. Öppna modellväljaren, välj Parakeet eller vilken Whisper-modell som helst, så laddas den ner en gång. Växla tillbaka närhelst arbetet ändras: Parakeet till morgonens mejlbatch, Whisper Large v3 den eftermiddag du transkriberar en japansk intervju.

Samma snabbtangent, samma överlägg, samma inställningar oavsett. På Windows är standarden Ctrl+Space. På Mac är det ett Command+Option push-to-talk-grepp, och det går att mappa om om det krockar med något. Motorn är en rullgardinsmeny, inte en ominstallation.

Om du bara minns en sak

Parakeet för hastighet och engelska. Whisper för 99 språk, översättning och kontroll. Du behöver inte välja vid installationen, för båda följer med i samma app och att växla är en rullgardinsmeny, inte ett nedladdningsbeslut du sitter fast med.

Vill du ha den längre bilden av varför det är bättre att köra det här på din egen maskin än att skicka ljud till en server, så skrev jag om det i offline-taligenkänning. Och om du väger oss mot en specifik betalapp så täcker superwhisper-alternativet den jämförelsen ansikte mot ansikte.

Installera båda motorerna och låt den första eftermiddagen avgöra

Ladda ner appen, installera Parakeet och en Whisper-modell — båda är gratis — och låt din egen första eftermiddag avgöra saken.

Båda lokala motorerna är gratis för alltid. Ingen betalningsmetod vid registrering. Molnets 7-dagars provperiod ber om ett kort först vid uppgradering.

Foto av Denys Medvediev

Denys Medvediev

Jag är den som läser vår supportmejl, troligen genom att diktera svaren.

Vidare läsning