Autor: Denys Medvediev

Porównanie

Whisper kontra Parakeet

Whisper i Parakeet to dwa lokalne silniki mowy w aplikacji Whisper by Remskill, a wybór sprowadza się do jednego kompromisu. Parakeet jest 5 do 10 razy szybszy od Whispera na procesorze, ale obsługuje angielski plus 24 języki europejskie. Whisper jest wolniejszy, za to obejmuje 99 języków, tłumaczy na angielski i daje precyzyjną kontrolę.

Ostatnia aktualizacja: czerwiec 2026

Kolorowe fale dźwiękowe na ciemnym ekranie edycji, nawiązujące do dwóch silników mowy

Whisper i Parakeet są wbudowane za darmo w Whisper by Remskill, a przełączasz się między nimi z listy rozwijanej. Parakeet jest 5 do 10 razy szybszy na procesorze i obejmuje angielski plus 24 języki europejskie. Whisper jest wolniejszy, ale obsługuje 99 języków, tłumaczy na angielski i daje własny słownik oraz kontrolę nad parametrem beam. Szybki kontra elastyczny, a nie dobry kontra zły.

Whisper i Parakeet to dwa lokalne silniki mowy w aplikacji Whisper by Remskill, a wybór sprowadza się do jednego kompromisu. Parakeet jest 5 do 10 razy szybszy od Whispera na procesorze, ale obsługuje angielski plus 24 języki europejskie. Whisper jest wolniejszy, za to obejmuje 99 języków, tłumaczy na angielski i daje precyzyjną kontrolę.

Dostarczamy oba, więc to nie jest sprzedażowa gadka

Większość artykułów typu „X kontra Y” pisze ktoś, kto sprzedaje X. Ten jest inny. Dostarczamy oba silniki w tej samej aplikacji. Wybierasz ten, który chcesz, z listy rozwijanej, pobierasz raz i przełączasz się w dowolnej chwili.

To znaczy, że nie mam powodu, żeby namawiać Cię na ten niewłaściwy. Jeśli Parakeet jest dla Ciebie odpowiedni, chcę, żebyś używał Parakeeta. Jeśli potrzebujesz Whispera, chcę, żebyś był na Whisperze. Aplikacja nie wybiera za Ciebie i ja też nie będę. Po prostu rozłożę na czynniki to, w czym każdy z nich jest naprawdę dobry.

Oba działają całkowicie offline. Oba są darmowe dla każdego zalogowanego użytkownika. Bez karty, bez rachunku za chmurę liczonego za minutę, bez dopłaty za drugi silnik.

Parakeet to ten szybki

Parakeet to model TDT firmy NVIDIA. Skrót oznacza Token-and-Duration Transducer — enkoder FastConformer połączony z dekoderem, który przewiduje zarówno słowa, jak i to, jak długo każde z nich trwa. Nie musisz tego zapamiętywać. To, co naprawdę się liczy, jest w następnym zdaniu.

Jest 5 do 10 razy szybszy od Whispera na zwykłym procesorze. Bez GPU, bez czekania. Puszczasz skrót klawiszowy, a tekst praktycznie już tam jest.

Dostarczany model to Parakeet v3, około 600 MB na dysku, i obejmuje angielski plus 24 inne języki europejskie, w sumie 25. Jakość jest dobra. Nie tak dobra jak Whisper-large, ale więcej niż wystarczająca do codziennego dyktowania: maile, notatki, wiadomości — rzeczy, które większość z nas pisze przez cały dzień.

Czego Parakeet nie robi: nie przetłumaczy Twojej mowy na angielski i nie przyjmuje własnego słownika ani podpowiedzi z gorącymi słowami. Jeśli dyktujesz po francusku, dostajesz francuski tekst. A to dokładnie tego chce większość mówiących po francusku, więc jest to problem tylko wtedy, gdy tłumaczenie to cały powód, dla którego się tu zjawiłeś.

Whisper to ten dokładny

Whisper to otwarty model OpenAI, a w naszej aplikacji występuje w ośmiu odmianach. Cztery wyłącznie angielskie i cztery wielojęzyczne, od modelu Base ważącego mniej więcej 140 MB po Large v3 ważący około 3 GB. Wybierasz rozmiar, który pasuje do Twojej maszyny i Twojej cierpliwości.

Modele wielojęzyczne obejmują 99 języków, a nie 25. W tym chiński, japoński, koreański i arabski — te, które Parakeet pomija całkowicie. Whisper przetłumaczy też każdy z nich na angielski w jednym kroku, czego Parakeet nie potrafi.

I Whisper daje kontrolę, której Parakeet nie ma: własny słownik, ustawienia rozmiaru beam i nakierowanie na gorące słowa, żeby przestał kaleczyć nazwisko Twojego współpracownika albo nazwę Twojego produktu. Jeśli dyktujesz techniczne terminy przez cały dzień, ta kontrola to różnica między czystym tekstem a żmudnym znajdź-i-zamień.

Ceną jest szybkość. Na tym samym procesorze Whisper jest wolniejszy, czasem dużo wolniejszy na większych modelach. Nudna prawda jest taka, że większość ludzi wybierających Whispera nie wybiera tyle dokładności ponad Parakeeta, co języków i kontroli ponad szybkość.

Whisper
Działający selektor modeli Whisper by Remskill — oba silniki do wyboru w prawdziwej aplikacji, nie zrzut ekranu.

Uczciwe porównanie w jednej tabeli

Oto cała decyzja w siedmiu wierszach. Bez kwot w dolarach — oba silniki są darmowe w tym samym planie.

Porównanie funkcji Parakeeta i Whispera w aplikacji Whisper by Remskill
FunkcjaParakeetWhisper
SilnikNVIDIA TDT (FastConformer + Token-and-Duration Transducer)OpenAI Whisper
Rozmiar pobierania~600 MB (jeden model)~140 MB do ~3 GB (8 modeli)
Języki25, angielski + 24 europejskie99 (modele wielojęzyczne)
Tłumaczenie na angielskiNieTak
Szybkość na procesorze5 do 10 razy szybszyWolniejszy
Własny słownik / gorące słowa / kontrola beamNieTak
Najlepszy doSzybkie dyktowanie po angielsku / w UE na procesorze99 języków, tłumaczenie, precyzyjna kontrola

Oba są lokalne, oba działają offline, oba są darmowe w tym samym planie. Tabela nie pokazuje „dobry kontra zły”. Pokazuje „szybki kontra elastyczny”.

Który tak naprawdę powinieneś wybrać

To część, którą większość artykułów porównawczych omija, więc oto ona wprost.

Dla większości użytkowników angielskiego wybierz Parakeeta. Szybkość wygrywa na co dzień. Dyktujesz dziesiątki razy dziennie, a różnica między „tekst pojawia się natychmiast” a „tekst pojawia się po chwili” to różnica między utrzymaniem toku myśli a jego utratą. Wszystko powyżej mniej więcej dwóch sekund i Twój mózg zaczyna z powrotem skupiać się na aplikacji, w której byłeś, i zapominasz, co chciałeś powiedzieć. To, że Parakeet jest 5 do 10 razy szybszy na procesorze, to nie przechwałka ze specyfikacji. To coś, co czujesz sto razy dziennie.

Wybierz Whispera, gdy potrzebujesz jednej z trzech rzeczy, których Parakeet nie da: języka spoza tych 25 europejskich (chiński, japoński, koreański, arabski), tłumaczenia na angielski albo kontroli nad własnym słownikiem i gorącymi słowami dla nazwisk i żargonu.

Jestem typem osoby, która rysuje diagram architektury, zanim zainstaluje środowisko uruchomieniowe, więc mój instynkt zawsze podpowiada „używaj bardziej zaawansowanego narzędzia”. Tutaj ten instynkt jest błędny. Bardziej zaawansowanym narzędziem jest Whisper, ale właściwym narzędziem do codziennego nawyku dyktowania po angielsku jest zwykle to szybsze. Możliwości, z których nie korzystasz, to tylko rozmiar pobierania.

CancelTranscribing
Prawdziwa, dostarczana nakładka nagrywania w trakcie dyktowania — ten sam skrót klawiszowy i ta sama nakładka, niezależnie od wybranego silnika.

Prawdziwy przypadek, w którym Whisper wygrywa

Na początku, w trzecim tygodniu po premierze, napisał do mnie użytkownik z pytaniem, czy aplikacja poradzi sobie z tłumaczeniem ukraińskiego na angielski w środku zdania. Czytał na żywo wiadomości z Kijowa i przełączał języki co kilka słów. Założyłem, że „wielojęzyczny” oznacza wybierz-jeden-język-na-sesję. On miał na myśli prawdziwe przełączanie kodów, w języku, którego te 25 Parakeeta nawet w pełni nie obejmuje dla takiego przepływu pracy. Wielojęzyczny model Whispera dał radę: 99 języków, automatyczne wykrywanie, tłumaczenie na angielski w tym samym przejściu. Nigdy nie odpisał, żeby to potwierdzić. Postanawiam czytać to jako dobry znak.

To cała zasada w jednej historii. Jeśli Twój dzień wygląda jak jego, szybkość Parakeeta Ci nie pomaga, bo Parakeet w ogóle nie wykona tej pracy. Dla każdego, czyj dzień wygląda jak dyktowanie angielskich maili między spotkaniami, szybkość jest sednem.

Jak się między nimi przełączać

Nie musisz się do niczego zobowiązywać. Otwórz selektor modeli, wybierz Parakeeta albo dowolny model Whispera, a pobierze się raz. Przełączaj się z powrotem, kiedy zmienia się praca: Parakeet do porannej porcji maili, Whisper Large v3 na popołudnie, gdy transkrybujesz japoński wywiad.

Ten sam skrót klawiszowy, ta sama nakładka, te same ustawienia w obu przypadkach. W systemie Windows domyślnym skrótem jest Ctrl+Space. Na Macu to akord push-to-talk Command+Option, a można go zmienić, jeśli koliduje z czymś innym. Silnik to lista rozwijana, a nie ponowna instalacja.

Jeśli masz zapamiętać tylko jedno

Parakeet dla szybkości i angielskiego. Whisper dla 99 języków, tłumaczenia i kontroli. Nie musisz wybierać przy instalacji, bo oba są dostarczane w tej samej aplikacji, a przełączanie to lista rozwijana, a nie decyzja o pobraniu, z którą tkwisz na zawsze.

Jeśli chcesz szerszego obrazu, dlaczego uruchamianie tego na własnej maszynie bije wysyłanie dźwięku na serwer, pisałem o tym w tekście zamiana mowy na tekst offline. A jeśli porównujesz nas z konkretną płatną aplikacją, tekst alternatywa dla superwhisper omawia to starcie bezpośrednio.

Zainstaluj oba silniki i pozwól pierwszemu popołudniu zadecydować

Pobierz aplikację, zainstaluj Parakeeta i model Whispera — oba są darmowe — i pozwól, by Twoje własne pierwsze popołudnie rozstrzygnęło spór.

Oba lokalne silniki są darmowe na zawsze. Bez metody płatności przy rejestracji. 7-dniowy okres próbny chmury prosi o kartę dopiero przy uaktualnieniu.

Zdjęcie Denysa Medviedieva

Denys Medvediev

To ja czytam nasze maile do wsparcia, najpewniej dyktując odpowiedzi.

Dalsza lektura