Autor: Denys Medvediev

Porównanie

Najlepsza aplikacja do zamiany mowy na tekst na Maca

Apple Dictation jest darmowe i sprawdza się przy krótkich notatkach. W momencie, gdy dyktowanie staje się dłuższe, bardziej techniczne albo musi trafić bez problemu do dowolnej aplikacji, potrzebujesz dedykowanego narzędzia. Oto jak wybrać je dla swojego Maca.

Ostatnia aktualizacja: czerwiec 2026

Smukły laptop, roślina i lampka biurkowa na drewnianym stole — spokojne miejsce do dyktowania na Macu

Najlepsza aplikacja do zamiany mowy na tekst na Maca zależy od długości tekstu: Apple Dictation jest darmowe i wystarcza do krótkich notatek, ale się urywa i ma problem z tekstem technicznym. Do dłuższego pisania w dowolnej aplikacji narzędzie oparte na modelu lokalnym, takie jak Whisper by Remskill, działa offline na Apple Silicon, obsługuje skrót typu push-to-talk i wkleja transkrypcję w miejscu kursora.

Wtorkowe popołudnie, moja młodsza córka przy kuchennym stole, siedmiolatka, zapytała, czy może "mówić do komputera zamiast pisać". Pokazałem jej raz: przytrzymaj klawisze, mów, puść. Napisała dziewięćdziesięciowyrazowy e-mail do babci w Ukrainie — o utraconym ząbku, kursie wymiany u zębowej wróżki i zajęciach z tańca — nie zadając ani jednego pytania po pokazie. To jest poprzeczka dla słowa "najlepsza" na Macu. Nie najdłuższa lista funkcji. Coś, czego potrafi użyć siedmiolatka, a co jednocześnie sprawdza się, gdy dyktujesz pismo procesowe w pociągu.

Oto nudna prawda, którą większość zestawień o dyktowaniu na Macu pomija: Apple daje ci już darmowe dyktowanie, a do trzydziestowyrazowej wiadomości jest naprawdę w porządku. Powód, dla którego szukasz aplikacji, jest taki, że to darmowe rozwiązanie kończy się gdzieś za krótkimi notatkami. Ten artykuł jest o tym, gdzie przebiega ta granica, które narzędzia ją przekraczają i jak wybrać jedno dla swojego konkretnego Maca. Czytałem maile wsparcia od ludzi, którzy pierwszego dnia wybrali złą drogę, więc powiem ci też, kiedy odpuścić sobie naszą aplikację.

Krótka odpowiedź: czego używać i kiedy Apple Dictation wystarcza

Dla większości użytkowników Maca w 2026 roku wyborem jest aplikacja do dyktowania oparta na modelu lokalnym, z opcją chmurową jako awaryjnym wyjściem. Jeśli wysyłasz głównie krótkie wiadomości, wbudowane Apple Dictation nic nie kosztuje i działa w każdym polu tekstowym. W momencie, gdy dyktowanie staje się dłuższe, bardziej techniczne albo musi trafić do aplikacji, do której Apple nie sięga bez problemów, potrzebujesz dedykowanego narzędzia.

Dedykowane narzędzie, po które sam bym sięgnął, wykonuje transkrypcję na twoim komputerze. Na Macu z Apple Silicon jest to szybkie, prywatne i działa w samolocie z wyłączonym Wi-Fi. Whisper by Remskill uruchamia dwa lokalne silniki — otwartoźródłową rodzinę Whisper i Parakeet od NVIDIA — w całości na urządzeniu, bez Pythona, bez serwera w środku. Przytrzymujesz razem Command i Option, żeby nagrywać, puszczasz dowolny z klawiszy, żeby zatrzymać, a tekst pojawia się tam, gdzie masz kursor. Jeśli wolisz najnowsze modele OpenAI dla najwyższej dokładności, jest tryb chmurowy korzystający z twojego własnego klucza OpenAI. Ten sam skrót, ten sam panel, jeden przełącznik.

Dwa akapity i to cała decyzja. Reszta tego artykułu to argumentacja za tym wyborem, uczciwe ograniczenia oraz aplikacje, o których warto wiedzieć, zanim się na coś zdecydujesz.

Jak wybierałem, żebyś mógł się ze mną nie zgodzić świadomie. Ważyłem cztery rzeczy, w tej kolejności. Czy dźwięk pozostaje na twoim Macu, bo prywatność to nie funkcja, którą dokleja się później. Czy wkleja w miejscu kursora w dowolnej aplikacji, czy więzi twoje słowa we własnym oknie. Czy radzi sobie z mową długą i techniczną, a nie tylko z krótkimi notatkami. I ile kosztuje codzienne korzystanie. Narzędzie może przegrać w czystej dokładności i wciąż wygrać, jeśli świetnie spełnia dwa pierwsze warunki. Większość z nich przegrywa w dwóch pierwszych, krzycząc o czwartym. Jestem typem architekta, który rysuje tabelę porównawczą, zanim zainstaluje choć jedną aplikację, i tabela zawsze okazuje się błędna przy drugim pobraniu. Ta przetrwała zderzenie z rzeczywistością.

Dlaczego Apple Dictation kończy się gdzieś po drodze

Dictation
Apple Dictation: pływający widżet mikrofonu, wbudowany w macOS. Darmowy i w porządku, dopóki dyktowanie nie zrobi się długie.

Przez połowę artykułów o dyktowaniu na Macu przewija się mit: Apple Dictation twardo przerywa po sześćdziesięciu sekundach. Kiedyś było to prawdą na starszych wydaniach macOS, gdzie ciągłe dyktowanie nie było domyślnie włączone. Aktualna dokumentacja Apple mówi coś przeciwnego: możesz dyktować tekst dowolnej długości bez limitu czasu, a dyktowanie samo się zatrzymuje dopiero po trzydziestu sekundach ciszy. Tak więc sześćdziesięciosekundowe odcięcie nie jest już prawdziwym ograniczeniem.

Prawdziwe ograniczenia są cichsze. Dokładność spada przy terminach technicznych, nazwach i mowie z akcentem, a to dokładnie tam, gdzie żyje praca z dłuższym tekstem. Apple liczy ponad czterdzieści wariantów językowych i regionalnych, ale dzieli angielski (USA) i angielski (Wielka Brytania), żeby dojść do tej liczby, więc liczba w nagłówku jest większa niż liczba odrębnych języków. Nie ma niestandardowego słownika, nie ma faworyzowania twojego żargonu, nie ma czyszczenia luźnej mowy przez AI w dopracowany tekst. To dobry darmowy mikrofon, który pisze. To nie jest narzędzie do pisania.

Ta luka jest całym powodem, dla którego ludzie wpisują w wyszukiwarkę "alternatywa dla Apple Dictation". Spróbowali tego darmowego. Doprowadziło ich do krótkich notatek i przestało wystarczać.

Lokalnie czy w chmurze na Macu: prywatność, szybkość i różnica w dokładności

Każda aplikacja do dyktowania na Macu jest po jednej stronie pewnej granicy: albo uruchamia model na twoim komputerze, albo wysyła twój dźwięk na serwer. Ta granica liczy się bardziej niż marketing.

Lokalnie przede wszystkim oznacza, że dźwięk nigdy nie opuszcza twojego Maca. Po jednorazowym pobraniu modelu transkrypcja działa offline: bez internetu, bez sprawdzania konta, bez niczego w logach dostawcy. Do e-maila do szkoły twojego dziecka, arkusza z pensjami, pisma, które właśnie redagujesz — to jest właściwe ustawienie domyślne. Na Apple Silicon jest to też szybkie, bo model działa na sprzęcie, który bezczynnie czeka, kiedy mówisz. Pierwszy raz, gdy podyktujesz akapit w samolocie z wyłączonym Wi-Fi i zobaczysz, jak tekst się pojawia, debata chmura kontra lokalność przestaje być abstrakcyjna.

Whisper
Prawdziwa aplikacja Whisper, działająca na żywo — kliknij w Ustawienia i zobacz powierzchnie Local i Cloud obok siebie.

Jedna dźwignia dokładności, o której prawie nikt nie wspomina, bije wybór modelu na głowę: twój mikrofon. Przyzwoity mikrofon USB robi dla dokładności transkrypcji więcej niż przeskok z małego modelu na duży. Jeśli twoje słowa wychodzą zniekształcone, napraw wejście, zanim zaczniesz obwiniać silnik. Spędziłem cały wieczór, przełączając modele, żeby naprawić coś, co okazało się tym, że mój laptop stał obok pracującej zmywarki. Nudne rozwiązanie jest zwykle tym właściwym.

Cancel
Panel nagrywania Whisper — mały pływający widżet w firmowym błękicie, kiedy mówisz. To nie zrzut ekranu; siedzi na wierzchu każdej aplikacji.

Chmura oznacza najnowsze modele i najlepszą surową dokładność. Modele transkrypcji OpenAI prowadzą w dokładności w realnych warunkach, dlatego opcja chmurowa zasługuje na swoje miejsce przy najtrudniejszym dźwięku. W trybie chmurowym Whisper podajesz własny klucz OpenAI. Transkrypcja działa na gpt-4o-mini-transcribe lub gpt-4o-transcribe, a dźwięk idzie prosto z twojego komputera do OpenAI. Nigdy nie jesteśmy pośrodku i nie przechowujemy żadnego dźwięku ani transkrypcji w żadnym z trybów.

Widziałem, jak wszystko-w-chmurze idzie nie tak. Zespół, z którym pracowałem, miał wykonawcę, który zbudował wewnętrzny prototyp dyktowania na modelu z najwyższej półki, wywołując API przy każdej wypowiedzi, z logiką ponawiania, która była nieco zbyt gorliwa. Pulpit kosztów chmury na koniec kwartału pokazał pięciocyfrowy rachunek, w większości z transkrybowania tych samych nagrań standupów po cztery razy. Reakcja dyrektora finansowego była prosta: może nie powinniśmy płacić serwerowi za transkrybowanie spotkań, które i tak mają notatki. Na Macu zwykle nie potrzebujesz serwera. Chmura to awaryjne wyjście, a nie ustawienie domyślne.

Aplikacje do dyktowania na Macu, o których warto wiedzieć

Nie przyszedłeś tu po jedną opcję, więc oto te, które pojawiają się, gdy ludzie porównują narzędzia do dyktowania na Macu (tak, włącznie z dwoma nazwanymi po tym samym otwartoźródłowym modelu, co utrzymuje skrzynkę wsparcia w pełni żywą). Jednozdaniowe oceny, uczciwe tam, gdzie są luki.

  • Apple Dictation: darmowe, wbudowane, działa w każdym polu tekstowym. Najlepsze do krótkich notatek; brak niestandardowego słownika, a dokładność słabnie przy długiej lub technicznej mowie.
  • Whisper by Remskill: dwa lokalne silniki plus tryb chmurowy z własnym kluczem, skrót push-to-talk, wkleja w miejscu kursora w dowolnej aplikacji, darmowe dla całego lokalnego procesu.
  • Superwhisper: macowa aplikacja oparta na Whisper, która działa offline, reklamuje ponad 100 języków z tłumaczeniem na angielski i ma darmowy poziom po krótkim okresie próbnym Pro. Jeśli ważysz barierę okresu próbnego i limit słów, oto nasza darmowa alternatywa dla superwhisper.
  • MacWhisper: popularna nakładka tylko na Maca, która uruchamia modele Whisper lokalnie, z darmową wersją i płatnym Pro, sprzedawana przez Gumroad.
  • Wispr Flow: chmurowa aplikacja do zamiany głosu na tekst na Maca, Windows, iPhone'a i Androida, reklamująca ponad 100 języków z automatycznym wykrywaniem i automatyczną redakcją luźnej mowy przez AI. Oparta na chmurze, nie offline w pierwszej kolejności.
  • Dragon (Nuance): dawny ciężkościowy zawodnik, ale Nuance wycofał indywidualny produkt Dragon dla Maca lata temu, więc nie jest to żywa opcja dla nowych użytkowników Maca.
  • Otter.ai: narzędzie do notatek ze spotkań, które dołącza do Zooma, Teams i Google Meet; inna kategoria niż dyktowanie w miejscu kursora, z darmowym poziomem ograniczonym do 300 minut miesięcznie.

Oto porównanie z prawdziwymi specyfikacjami, a nie ściana słów "szybkie" i "łatwe".

AplikacjaLokalnie czy w chmurzeZakres językówWkleja w miejscu kursora w dowolnej aplikacjiNajlepsze do
Apple DictationNa urządzeniu na Apple SiliconPonad 40 wariantów regionalnychTakKrótkie notatki, za darmo
Whisper by RemskillOba (lokalnie domyślnie, chmura opcjonalnie)99 na wielojęzycznym Whisper; Parakeet 25; ~57 w chmurze OpenAITakDługie pisanie, offline, dowolna aplikacja
SuperwhisperLokalnie (offline)Deklarowane 100+, z tłumaczeniemTakOffline Whisper na Macu
Wispr FlowChmuraDeklarowane 100+, automatyczne wykrywanieTakWieloplatformowa redakcja przez AI
Otter.aiChmuraZ naciskiem na angielskiNie (notatki ze spotkań)Transkrypcja spotkań

Uwaga o tych liczbach języków, bo większość zestawień podaje je błędnie. 99 języków Whisper dotyczy wyłącznie modeli wielojęzycznych; wersje tylko angielskie robią angielski i nic więcej. Parakeet obejmuje angielski plus 24 języki europejskie, dwadzieścia pięć w sumie, bez języków azjatyckich i bez tłumaczenia na angielski. Chmurowa transkrypcja OpenAI wymienia około pięćdziesięciu siedmiu języków. "Obsługuje każdy język" to zdanie marketingowe, a nie specyfikacja.

Dobór odpowiedniej konfiguracji dla twojego Maca

Właściwy wybór zależy od dwóch rzeczy: twojego Maca i tego, co dyktujesz. Aplikacja nie wybiera za ciebie. Przedstawia trzy ścieżki, a ty wybierasz.

Whisper
Prawdziwa aplikacja Whisper — kliknij w Ustawienia i selektor modelu, żeby wybrać Parakeet, model Whisper albo tryb chmurowy.

Jeśli masz Maca z Apple Silicon, dowolny układ z serii M, masz całe menu. Lokalny Parakeet jest najszybszy, działa od pięciu do dziesięciu razy szybciej niż Whisper na CPU, i w zupełności wystarcza do codziennego dyktowania po angielsku. Lokalny Whisper jest wolniejszy, ale obsługuje 99 języków, tłumaczenie na angielski i niestandardowy słownik, więc to wybór, jeśli przełączasz języki albo potrzebujesz kontroli. Tryb chmurowy to wybór, gdy chcesz najnowszej dokładności OpenAI i nie masz nic przeciwko płaceniu OpenAI bezpośrednio przez własny klucz.

Rozmiar modelu to druga dźwignia. Lokalna oferta Whisper sięga od modelu Base o wielkości około 140 MB aż po Large v3 o wielkości 3 GB, przy czym Parakeet plasuje się w okolicach 600 MB. Na Macu z 8 GB RAM trzymaj się Parakeet albo mniejszych modeli Whisper i odpuść te powyżej 1,5 GB. Na Macu z Apple Silicon i 16 GB wszystko działa. Jeśli masz starszego Maca z procesorem Intel, tryb chmurowy działa na dowolnym sprzęcie, a małe modele lokalne zadziałają tam, gdzie duże się zatną, choć to Apple Silicon jest miejscem, w którym aplikacja desktopowa ma błyszczeć.

Żeby ustawić skrót: na macOS domyślnie przytrzymuje się razem Command i Option jako push-to-talk, a w Ustawieniach możesz przypisać go do czegokolwiek, co nie koliduje ze Spotlight ani z systemowym klawiszem dyktowania. Jeśli chcesz pełny przewodnik, nasz poradnik o zamianie głosu na tekst na Macu opisuje konfigurację krok po kroku, a poradnik o zamianie mowy na tekst offline zagłębia się w uruchamianie wszystkiego z wyłączoną siecią.

Kiedy odpuścić sobie naszą aplikację i użyć czegoś innego

Powiem tę cichą część na głos. Jeśli całe twoje użycie to wysyłanie trzydziestowyrazowych wiadomości i okazjonalnej krótkiej notatki, nie instaluj niczego. Apple Dictation jest darmowe, wbudowane w twojego Maca i działa w każdym polu tekstowym. Zaczynamy być warci pobrania gdzieś za punktem, w którym dokładność Apple i brak niestandardowego słownika zaczynają boleć: długie pisanie, techniczny żargon, praca wielojęzyczna, dyktowanie wewnątrz aplikacji, gdzie chcesz czystego wklejania w miejscu kursora. Jeśli głównie potrzebujesz uchwycić spotkania z wieloma osobami wraz z podsumowaniami i linkami do kalendarza, to robota Otter, nie nasza; jego darmowy poziom daje ci 300 minut miesięcznie. Inna kategoria. Użyj właściwego narzędzia.

Cennik

Whisper jest darmowy dla każdego zalogowanego użytkownika w całym lokalnym procesie: oba lokalne silniki, wszystkie języki, ulepszanie przez AI za pomocą Ollama, historia, presety, niestandardowy skrót, akceleracja sprzętowa. Bez metody płatności przy rejestracji. To, za co płacisz, to Whisper Pro, które dodaje powierzchnię chmurową: chmurową transkrypcję OpenAI, chmurowe ulepszanie przez AI oraz głosowe wyszukiwanie w sieci przez twój własny klucz OpenAI. Opcje planów znajdziesz na stronie z cennikiem, więc liczby są zawsze aktualne. Apple Dictation, dla porządku, pozostaje darmowe. To jest poziom odniesienia, który każde płatne narzędzie do dyktowania na Macu musi pokonać.

Dwa dni po tym pokazie przy kuchennym stole moja córka wróciła ze skargą: skrót nie działał w jej aplikacji do rysowania. Nie wiedziała, co to konflikt skrótów. Po prostu wiedziała, że przestało działać. To jest cała robota dobrej aplikacji do dyktowania na Macu: nie wygrać wojnę na liczbę funkcji, ale zniknąć w akcie pisania i dać się naprawić, kiedy zawiedzie. Najlepsza dla ciebie jest ta, o której zapominasz, że jej używasz.

Chcesz to zobaczyć na swoim Macu?

Pobierz Whisper, przytrzymaj Command i Option i patrz, jak transkrypcja pojawia się w miejscu kursora w dowolnej aplikacji.

Darmowe lokalne dyktowanie dla każdego zalogowanego użytkownika. Pro dodaje funkcje chmurowe w ramach osobnego okresu próbnego.

Zdjęcie Denysa Medvedieva

Denys Medvediev

Jestem tym, który czyta nasze maile wsparcia, najpewniej dyktując odpowiedzi.

Dalsza lektura