Poradnik
Whisper na Maca
"Whisper na Maca" oznacza jedną z dwóch rzeczy. Albo jest to otwartoźródłowy model OpenAI Whisper uruchamiany na Macu przez Pythona i wiersz poleceń, albo aplikacja na Maca, która korzysta z Whispera pod maską. Większość osób chce tej drugiej. Tylko jeszcze o tym nie wie.
Ostatnia aktualizacja: czerwiec 2026

Whisper na Maca to dwie różne rzeczy noszące jedną nazwę. Model jest otwartoźródłowy i darmowy, ale oficjalny sposób jego uruchomienia wymaga Pythona i wiersza poleceń, a do tego transkrybuje pliki, a nie Twoją mowę na żywo. Jeśli chcesz nacisnąć skrót i sprawić, by Twoje słowa pojawiły się w dowolnej aplikacji na Macu, potrzebujesz aplikacji do dyktowania, takiej jak Whisper by Remskill, której cały lokalny mechanizm jest darmowy dla każdego zalogowanego użytkownika.
Whisper to model, a nie aplikacja na Maca
Wyjaśnijmy nazewnictwo, bo wyniki wyszukiwania zlewają to wszystko w jedno.
Whisper to otwartoźródłowy model zamiany mowy na tekst od OpenAI, wydany na licencji MIT. Model jest darmowy. Kod jest darmowy. Możesz pobrać wagi i uruchomić je na własnym komputerze, bez zakładania konta. To naprawdę jest "Whisper na Maca" w dosłownym sensie.
Haczyk tkwi w tym, jak go uruchomić. Oficjalny OpenAI Whisper to narzędzie oparte na Pythonie i wierszu poleceń. Instalujesz je za pomocą pip, potrzebujesz też narzędzia wiersza poleceń ffmpeg, a następnie wskazujesz mu plik audio. Transkrybuje nagrania: audio.mp3, audio.wav, takie rzeczy. Nie wpisuje Twojej mowy na żywo do Maila czy Slacka. Zamienia gotowy plik na tekst.
Istnieje sześć rozmiarów modelu (tiny, base, small, medium, large i turbo), z czego cztery mają warianty wyłącznie angielskie, które wymieniają dokładność na szybkość. Whisper jest wielojęzyczny i potrafi przetłumaczyć mowę na angielski za pomocą jednej flagi. Dobry model. Nudna prawda jest taka, że model nigdy nie był tą trudną częścią. Trudne jest wpięcie go w sposób, w jaki naprawdę pracujesz na Macu.
Narzędzia na Maca, które opakowują Whispera, i do czego każde z nich służy
Większość osób szukających "Whisper na Maca" nie chce dotykać pip. Chcą aplikacji. Jest kilka dobrych, i nie są one wymienne. Dzielą się na dwa obozy.
Obóz pierwszy: transkrypcja plików
whisper.cpp to czysty port Whispera w C/C++, na licencji MIT, i jest pełnoprawnym obywatelem na Apple Silicon, zoptymalizowanym pod ARM NEON, framework Accelerate, Metal i Core ML. Działa wyłącznie na CPU, budujesz go ze źródeł i obsługujesz z wiersza poleceń. Jeśli czujesz się swobodnie w terminalu i chcesz surowej, szybkiej, lokalnej transkrypcji plików, jest świetny. MacWhisper daje Ci graficzną wersję tego pomysłu. Transkrybuje pliki audio i wideo na urządzeniu, korzystając z OpenAI Whisper i NVIDIA Parakeet, bez wysyłania danych poza Twój komputer, plus oferuje ogólnosystemową funkcję dyktowania. Jeśli Twoim zadaniem jest zamiana nagrań na transkrypcje, to ten obóz jest właściwy.
Obóz drugi: wpisywanie mowy na żywo
To dyktowanie. Naciskasz skrót, mówisz, a tekst pojawia się przy kursorze w dowolnej aktywnej aplikacji. Tutaj mieszka VoiceInk. Jest otwartoźródłowy na licencji GPL-3.0, uruchamia lokalne modele na Apple Neural Engine, w tym Parakeet v3, i wkleja tekst przy kursorze za pomocą skrótu push-to-talk. Wymaga Apple Silicon i macOS 14.4 lub nowszego. superwhisper też tu jest, z dyktowaniem na żywo oraz transkrypcją plików, lokalnie lub w chmurze, na Macu, Windowsie i iOS.
Whisper by Remskill, aplikacja, którą tworzę, należy do obozu drugiego. Dyktowanie przede wszystkim. Warto wiedzieć, w którym obozie jesteś, zanim cokolwiek pobierzesz.
Co Whisper by Remskill robi na Macu
Opiszę rzecz, którą zbudowałem, a potem możesz ocenić ją na tle reszty.
To aplikacja do dyktowania. Naciskasz skrót, mówisz, a tekst pojawia się przy kursorze w dowolnej aplikacji: Mail, Notatki, Slack, Twój edytor kodu, pole, w którym wpisujesz tegoroczną zgodę na wycieczkę szkolną. Domyślny skrót na Macu to wciśnięte razem Command i Option, w pełni przekonfigurowalny. Cała transkrypcja odbywa się na Twoim Macu. Żadnego pliku do przesłania, żadnego nagrania do ogarnięcia.
Nie uruchamiasz też Pythona. Żadnego pip, żadnego ffmpeg, żadnego terminala, żadnego GPU. Całość to czysty Rust. Silniki Whisper i Parakeet działają przez bibliotekę o nazwie transcribe-rs, bez dołączonego pythonowego sidecara. Lokalna transkrypcja działa na Twoim CPU, bez potrzeby dedykowanego GPU, a aplikacja zajmuje na dysku około 25 MB.
Co do samego modelu — wybierasz Ty. Lokalny Whisper daje Ci 8 modeli, 99 języków, tłumaczenie na angielski, własne słownictwo, kontrolę rozmiaru wiązki (beam-size) i wpływanie na rozpoznawanie słów kluczowych. Wolniejszy, ale daje najwięcej kontroli. Parakeet to silnik NVIDIA TDT, około 600 MB, działa od 5 do 10 razy szybciej niż Whisper na CPU, obejmuje angielski plus 24 inne języki europejskie, bez tłumaczenia na angielski. Tryb chmurowy to trzecia droga: korzystasz z własnego klucza OpenAI, a my nie pobieramy żadnej prowizji. Celowo nie wybieram za Ciebie. Rozkładamy różnice na czynniki pierwsze w Whisper kontra Parakeet, jeśli chcesz dłuższą wersję.
Lokalna dokładność zwykle mieści się między 95% a 99%. Cały lokalny mechanizm jest darmowy dla każdego zalogowanego użytkownika: Whisper, Parakeet, czyszczenie tekstu przez AI w trybie offline za pomocą Ollama, historia transkrypcji, ustawienia wstępne, słowa kluczowe, akceleracja sprzętowa, pobieranie modeli oraz własny skrót klawiszowy. Bez metody płatności przy rejestracji. Możesz z niej korzystać na maksymalnie 3 urządzeniach. Plan płatny, Whisper Pro, dodaje wyłącznie warstwę chmurową: transkrypcję chmurową OpenAI, czyszczenie tekstu przez AI w chmurze oraz wyszukiwanie w sieci. Ceny znajdziesz na stronie z cennikiem. Nie podaję tu kwot, bo strony z cennikiem się zmieniają i lepiej, żebyś przeczytał je prosto u źródła.
Jedno uczciwe ograniczenie: nasza wersja na Maca działa wyłącznie na Apple Silicon, od M1 do M4. Jeśli masz Maca z procesorem Intela, ta aplikacja nie jest dla Ciebie — i za chwilę powiem, co nią jest.
Tak właśnie wygląda Twoje pierwsze dyktowanie. Naciskasz skrót, pojawia się mały wskaźnik nagrywania, mówisz, zwalniasz, a oczyszczony tekst wskakuje tam, gdzie stał Twój kursor. Nakładka poniżej to prawdziwa rzecz, którą pokazuje aplikacja, a nie makieta.
Konfiguracja jest krótka. Pobierz aplikację, zaloguj się, pozwól jej ściągnąć jeden model. Parakeet jest najmniejszy, około 600 MB, albo wybierz model Whisper, jeśli zależy Ci na językach lub tłumaczeniu. Wybierz swój skrót albo zostaw Command i Option. Potem otwórz Mail, przytrzymaj skrót i powiedz zdanie. To całe wdrożenie. Moja młodsza córka zrobiła to bez zadawania mi ani jednego dodatkowego pytania, a to jedyny test użyteczności, któremu w pełni ufam. Jeśli chcesz dłuższy, przeprowadzony krok po kroku przewodnik ze zrzutami ekranu i wszystkimi trzema ścieżkami modeli, napisałem dedykowany poradnik: zamiana głosu na tekst na Macu.
Dlaczego trzymam to lokalnie na Macu
Oto moja jedna mocna opinia do tego artykułu: dyktowanie wyłącznie w chmurze to katastrofa dla prywatności.
Arkusz z pensjami Twojego szefa, mail do szkoły Twojego dziecka, pismo procesowe, które piszesz w pociągu. Nic z tego nie powinno przechodzić przez serwery dostawcy tylko dlatego, że chciałeś pisać głosem. Twój Mac ma już mikrofon i procesor. Dla jednego akapitu dyktowania nie potrzebuje serwera w obiegu. Przy silnikach lokalnych dźwięk nigdy nie opuszcza Twojego komputera. To domyślne ustawienie, po które bym sięgnął, i jest darmowe.
Tryb chmurowy istnieje na chwile, gdy naprawdę chcesz najnowszych modeli OpenAI albo odpowiedzi z sieci, na własnym kluczu. To wyjście awaryjne, a nie drzwi frontowe.
Kiedy MacWhisper, VoiceInk albo wiersz poleceń to lepszy wybór
Byłbym kiepskim przewodnikiem, gdybym udawał, że jedna aplikacja wygrywa w każdym przypadku. Nie wygrywa. Oto, gdzie odesłałbym Cię gdzie indziej.
Głównie transkrybujesz nagrania
Jeśli Twój dzień to wrzucanie odcinków podcastów, nagrań wywiadów albo zapisów spotkań do transkrypcji, potrzebujesz narzędzia do transkrypcji plików, a nie aplikacji do dyktowania. MacWhisper jest zbudowany dokładnie do tego: przeciągasz plik, dostajesz tekst, na urządzeniu. Korzystaj z niego. My nie przesyłamy plików. My wpisujemy Twoją mowę na żywo.
Chcesz surowo, skryptowalnie, za darmo i mieszkasz w terminalu
Wtedy odpowiedzią jest whisper.cpp. Jest na licencji MIT, zoptymalizowany pod Apple Silicon, działa wyłącznie na CPU i możesz przepuścić go przez cokolwiek. Jeśli jesteś osobą, która lubi budować ze źródeł, będziesz tam szczęśliwszy niż w jakimkolwiek interfejsie graficznym.
Chcesz w pełni otwartoźródłowego dyktowania i masz Apple Silicon
VoiceInk jest na licencji GPL-3.0, możesz przeczytać lub zweryfikować każdą linijkę, a wkleja tekst przy kursorze tak jak my. To solidna darmowa opcja. My jesteśmy aplikacją zarządzaną — z kontami, historią, chmurą na własnym kluczu i obsługą Windowsa — i nie jesteśmy otwartoźródłowi. Więc jeśli otwartość źródeł to twardy wymóg, to Twoja decyzja, a VoiceInk jest dobrym wyborem.
Masz Maca z procesorem Intela
Nasza aplikacja nie uruchomi się. Otwartoźródłowy whisper.cpp da się zbudować i uruchomić na Intelu, a wbudowane w Apple Dictation jest darmowe do krótkich notatek. Każde z nich bije czekanie na maszynę z Apple Silicon, której jeszcze nie kupiłeś.
Jeśli masz zapamiętać tylko jedną rzecz
Model jest darmowy i otwarty. Decyzją, która ma znaczenie, jest to, co wokół niego opakujesz: terminal, graficzne narzędzie do transkrypcji plików albo skrót, który wpisuje Twoją mowę na żywo wszędzie tam, gdzie patrzysz. Dopasuj opakowanie do zadania, a na Macu zignoruj Pythona, chyba że naprawdę go lubisz. Są trzy rodzaje ludzi, którzy szukają Whispera na Macu: ci z folderem nagrań, ci, którzy nigdy więcej nie chcą pisać, i ci, którym po prostu spodobała się nazwa. Dwoje z nich jest w niewłaściwym obozie — dopóki nie doczytają do tego miejsca.
Większość tego artykułu podyktowałem zamiast wpisywać, co wydawało się odpowiednie. W jedynym akapicie, który napisałem ręcznie, było więcej literówek.
Dalsza lektura
Wypróbuj na swoim Macu
Pobierz Whisper by Remskill, zaloguj się i podyktuj swoje pierwsze zdanie na Macu. Warstwa lokalna jest darmowa, a później sam zdecydujesz, czy kiedykolwiek będziesz potrzebować chmury.
Darmowa lokalna transkrypcja na zawsze. Bez metody płatności przy rejestracji. Tylko Apple Silicon.



