Autor: Denys Medvediev

Porównanie

superwhisper na Windows

superwhisper doczekał się aplikacji na Windows, więc stara odpowiedź ("tylko Mac, niestety") jest już nieaktualna. Prawdziwe pytanie brzmi: które narzędzie do dyktowania pasuje do twojego komputera z Windows. Oto uczciwe spojrzenie na superwhisper na Windows i najbliższą lokalną alternatywę.

Ostatnia aktualizacja: czerwiec 2026

Laptop z Windows na ciemnym biurku z mikrofonem w pobliżu, nawiązujący do dyktowania na komputerze stacjonarnym

superwhisper na Windows to już rzeczywistość. Od 2026 roku superwhisper.com oferuje do pobrania aplikację na Windows 10 i 11 z lokalnym, offline'owym dyktowaniem AI w dowolnym polu tekstowym. Najbliższą lokalną alternatywą jest Whisper by Remskill — również natywny dla Windows, bezpłatny w trybie lokalnym, z ogólnosystemowym skrótem push-to-talk i przepustką czyszczenia AI.

Przez długi czas wyszukiwanie frazy „superwhisper dla Windows” kończyło się smutnym wynikiem. superwhisper zaczął jako aplikacja na Mac, potem trafiło na iOS, a użytkownicy Windows nieustannie pytali na forum, kiedy przyjdzie ich kolej. Jeśli szukałeś tego w zeszłym roku, każda strona mówiła to samo: tylko Mac, tu jest zamiennik, przepraszamy.

Ta odpowiedź jest już nieaktualna. superwhisper.com ma stronę dla Windows i plik do pobrania na Windows — Windows 10 i 11, x64 i ARM64, transkrypcja lokalnie bez internetu. Pytanie nie brzmi już „czy mogę to zainstalować”. Brzmi: „czy to właściwy wybór dla mojego komputera z Windows, czy coś innego pasuje mi lepiej?”. Codziennie dyktuję na Windows, będę fair wobec mocnych stron superwhisper i powiem ci, gdzie zamiast niego pasuje Whisper by Remskill.

Oto co starsze artykuły pomijały i warto to powiedzieć wprost, żebyś nie tracił czasu na szukanie obejść, których już nie potrzebujesz. superwhisper nie jest już tylko dla Mac. Wersja na Windows to prawdziwa, wydana aplikacja dostępna na ich własnej stronie — nie zapisy do bety. Jeśli właśnie superwhisper miałeś na myśli, możesz go zainstalować już dziś.

Problem przestał być pytaniem „jak uruchomić aplikację Mac na Windows”, a stał się zwykłym wyborem narzędzia. Teraz na Windows działają dwie solidne aplikacje do lokalnego dyktowania. Reszta tego poradnika to uczciwe porównanie: czym jest superwhisper, dlaczego ludzie wciąż szukają alternatyw, jak wypadają oba narzędzia i kiedy superwhisper — lub wbudowana opcja Windows — to mądrzejszy wybór.

Czym jest superwhisper i dla kogo jest przeznaczony

Mikrofon na biurku obok klawiatury, ilustrujący dyktowanie głosowe na stanowisku pracy

superwhisper to aplikacja do dyktowania z AI. Mówisz, ona transkrybuje i wkleja sformatowany tekst do dowolnej aplikacji, w której pracujesz — e-maila, czatu, edytora kodu. Według własnego opisu działa ogólnosystemowo w każdej aplikacji, samodzielnie obsługuje interpunkcję i formatowanie oraz obsługuje ponad 100 języków z automatycznym wykrywaniem języka. Transkrybuje też pliki audio i wideo, nie tylko żywą mowę. To naprawdę dobry zestaw funkcji i nie zamierzam tego ukrywać.

Najmocniejszym argumentem superwhisper jest prywatność. Strona Windows mówi wprost: „Modele AI działają lokalnie. Twój dźwięk nigdy nie opuszcza urządzenia i nie potrzebujesz internetu.” To właściwy odruch w przypadku narzędzia do dyktowania i taki sam odruch stoi za Whisper by Remskill. Każdy, kto obserwował rosnący rachunek w chmurze, wie, dlaczego lokalność ma znaczenie. (Kiedyś widziałem, jak zespół naciągnął pięciocyfrowy rachunek za chmurowe AI w jednym kwartale — głównie przez ponowne transkrybowanie nagrań ze standupów cztery razy, bo „inteligentne ponawianie” było zbyt gorliwe. CFO otworzył dashboard w środku przeglądu i w pokoju zrobiło się cicho.) Lokalne dyktowanie omija całą tę kategorię problemów.

Dla kogo więc superwhisper jest przeznaczony? Dla kogoś, kto chce dopracowanej, nowoczesnej aplikacji do dyktowania, lubi możliwość wyboru spośród kilku modeli AI do czyszczenia tekstu i korzysta z Mac albo przesiadł się na nową wersję Windows. superwhisper dorastał na macOS, gdzie jest mocnym i cenionym wyborem. Wersja na Windows to nowszy członek rodziny. To nie jest zarzut — po prostu tak jest i ma to znaczenie dla porównania poniżej.

„Dlaczego nie ma go na Windows” — i dlaczego w końcu się to zmieniło

Przez lata uczciwa odpowiedź na „superwhisper dla Windows” brzmiała: „nie ma, to aplikacja na Mac i iPhone”. Zaczęcie od Mac to powszechna ścieżka dla niezależnych narzędzi deweloperskich — jedna platforma do obsługi, ścisła integracja z systemem, mniej rzeczy, które mogą się posypać. Windows jest trudniejszy. Sam mechanizm obsługi wejścia jest bardziej skomplikowany; nauczyłem się o systemie obsługi metod wprowadzania Windows więcej, niż kiedykolwiek chciałem, gdy nasz własny skrót wywoływał wywołanie zwrotne zatrzymania nagrywania sześć razy przy jednym naciśnięciu klawisza na maszynach z włączoną obsługą wejścia językowego. Naprawienie tego zajęło 300 ms debounce. Mac tego błędu nigdy nie miał.

Ta luka sprawiła, że ludzie szukali alternatyw i dlatego ta fraza jest wciąż wpisywana. Stare przyzwyczajenia, stare artykuły i fakt, że wersja Windows jest na tyle nowa, że wiele osób nie wie jeszcze, że się pojawiła. Mechanizm wspólny dla obu narzędzi jest prosty: naciśnij skrót, mów, puść — i słowa wklejają się przy kursorze. Podczas mówienia pojawia się mała kapsułka, żebyś wiedział, że narzędzie słucha.

Cancel
Nakładka nagrywania: mała kapsułka pojawiająca się podczas mówienia, sygnalizująca, że narzędzie słucha.

W Whisper by Remskill skrót push-to-talk to Ctrl+Space na Windows — trzymasz go podczas mówienia, a w Ustawieniach możesz go zmienić, jeśli koliduje z czymś innym. (Moja młodsza córka powiedziała mi kiedyś, że skrót „nie działa” w jej aplikacji do rysowania. To był konflikt, nie błąd — i tak dowiedziałem się, że przeciętna osoba nie ma pojęcia, czym jest konflikt skrótów. Dlatego teraz każdy skrót jest konfigurowalny.) Jeśli kiedykolwiek konfigurowano dyktowanie na Windows, to ta sama pamięć mięśniowa.

Konfiguracja Whisper na Windows w dwie minuty

Jeśli chcesz wypróbować alternatywę obok superwhisper, oto cała konfiguracja. Potrzebujesz PC z Windows 10 lub nowszym, działającego mikrofonu i kilku minut. Cały lokalny pipeline jest bezpłatny dla każdego zalogowanego konta — bez podawania danych płatniczych przy rejestracji.

Krok 1 — Zainstaluj Whisper i zaloguj się.

Pobierz ze strony pobierania, zainstaluj i utwórz bezpłatne konto. Bez karty. Cały lokalny pipeline transkrypcji jest dostępny od razu.

Będziesz wiedzieć, że działa, gdy pojawi się ikona w zasobniku systemowym i kreator konfiguracji zaproponuje wybór modelu.

Krok 2 — Wybierz ścieżkę transkrypcji.

Aplikacja nie wybiera za ciebie. Masz trzy opcje: Cloud (OpenAI, własny klucz), Local Parakeet lub Local Whisper. Do prywatnej pracy zacznij od trybu lokalnego — więcej o tym za dwie sekcje.

Będziesz wiedzieć, że działa, gdy model zakończy pobieranie i pojawi się jako gotowy.

Krok 3 — Potwierdź skrót.

Domyślnie na Windows jest to Ctrl+Space — trzymasz go jako push-to-talk. Zmień go w Ustawieniach, jeśli koliduje z czymś, czego już używasz.

Będziesz wiedzieć, że działa, gdy testowe nagranie wklei się w dowolnym polu tekstowym.

Krok 4 — Ustaw kursor w dowolnym miejscu i mów.

Kliknij w dowolne pole tekstowe — e-mail, dokument, czat — przytrzymaj skrót, powiedz zdanie, puść. Transkrypcja pojawia się tam, gdzie jest kursor.

Będziesz wiedzieć, że działa, gdy twoje wypowiedziane zdanie pojawi się w polu jako tekst.

Whisper
Prawdziwa aplikacja Whisper na ekranie ustawień z otwartymi panelami Transkrypcja i AI.

Najwolniejsza część to pobieranie modelu, nie sama konfiguracja. Reszta to cztery powyższe kroki. Gdy już działa, dyktowanie do pola przestaje być zadaniem do pisania i staje się zadaniem do mówienia. To samo dzieje się po zainstalowaniu superwhisper — oba narzędzia to jeden skrót i mikrofon od działania wszędzie.

Jak superwhisper i Whisper wypada naprawdę

Oba działają teraz na Windows, oba transkrybują lokalnie, oba działają w każdej aplikacji, oba obsługują długą listę języków. To dużo punktów wspólnych i wolę to przyznać, niż udawać, że przepaść istnieje. Różnią się w detalach. superwhisper oferuje zestaw modeli do czyszczenia tekstu — na stronie wymieniane są m.in. GPT, Claude, Llama, Grok, Gemini i Mistral — oraz system niestandardowych „trybów” do kształtowania tonu. Jeśli lubisz mieć tyle gałek do przestawienia, to prawdziwa zaleta i superwhisper robi to naprawdę dobrze.

Whisper by Remskill jest zbudowany nieco inaczej. Nie wybiera za ciebie silnika transkrypcji — stawia przed tobą trzy ścieżki i pozwala wybrać: szybki silnik lokalny, wielojęzyczny silnik lokalny z możliwością tłumaczenia na angielski albo opcję chmurową z własnym kluczem OpenAI. Na Windows skrót push-to-talk to Ctrl+Space, konfigurowalny. Lokalny pipeline — każdy lokalny model, czyszczenie AI przez lokalny model, historia, presety, niestandardowy skrót, trzy urządzenia — jest bezpłatny dla każdego zalogowanego konta, bez karty przy rejestracji. Płatny plan dodaje wyłącznie dostęp do chmury. To inny kształt niż typowy podział na bezpłatny tier i Pro.

Jedyne uczciwe zastrzeżenie wobec superwhisper na Windows dotyczy dojrzałości, nie możliwości. Wersja Windows jest nowsza niż jej siostra na macOS, a nowe oprogramowanie desktopowe na Windows ma przez jakiś czas więcej szorstkich krawędzi — to po prostu koszt problemów z mechaniką wejścia, o których wspomniałem wcześniej. Jeśli chcesz wersji z największym stażem, to macOS dla superwhisper i Windows-i-Mac-od-samego-początku dla Whisper. Jeśli jesteś zadowolonym użytkownikiem superwhisper na Mac i ciekawisz się Windows, spróbuj — tylko nie oczekuj parytetu z platformą, na której aplikacja dorastała.

Lokalnie czy w chmurze: który tryb Whisper na Windows

Jeśli wybierzesz Whisper, najpierw wypróbuj tryb lokalny. Większość rzeczy, które ludzie dyktują — e-mail, niepełna notatka, wiadomość, której nigdy nie chciałbyś mieć w logach dostawcy — nie ma żadnego powodu opuszczać laptopa dla jednego akapitu tekstu. Jeśli twój komputer pochodzi z ostatnich kilku lat, tryb lokalny bez problemu obsługuje codzienne dyktowanie, a chmura staje się wyjściem awaryjnym, a nie domyślnym wyborem. Oto jak różnią się trzy ścieżki, bo aplikacja wymaga wyboru i wolę, żebyś wybrał świadomie.

Wybór sprowadza się do szybkości, zakresu języków lub najwyższej dokładności.

  • Local ParakeetSilnik TDT od NVIDIA, około 600 MB, najszybsza opcja lokalna — 5 do 10 razy szybsza niż Whisper na CPU. Obsługuje angielski i 24 inne języki europejskie, łącznie 25. Bez tłumaczenia na angielski. Jeśli mówisz głównie po angielsku lub w innym języku europejskim, to szybki i w pełni offline'owy wybór.
  • Local WhisperWolniejszy niż Parakeet na tym samym sprzęcie, ale wielojęzyczne wersje obsługują 99 języków i mogą tłumaczyć na angielski. Wersje tylko angielskie są wyłącznie angielskie, nie 99. Wybierz tę opcję do chińskiego, japońskiego, koreańskiego lub jakiejkolwiek pracy z tłumaczeniem, której Parakeet nie obsługuje. Domyślny model angielski waży około 480 MB.
  • Cloud (OpenAI, BYOK)Najwyższa dokładność i dostęp do internetu, z własnym kluczem OpenAI rozliczanym bezpośrednio przez OpenAI. Transkrypcja działa domyślnie przez gpt-4o-mini-transcribe. Wymaga internetu, więc to jedyna ścieżka, która wychodzi poza twój komputer. Dostęp do chmury jest częścią Whisper Pro.

Nudna prawda jest taka, że dla większości rzeczy, które ludzie dyktują na komputerze z Windows, tryb lokalny w zupełności wystarcza. Oba silniki lokalne działają w pełni na twoim sprzęcie, nic nie jest wysyłane na serwer — ta sama obietnica lokalności, którą składa superwhisper. Chmura zasługuje na swoje miejsce, gdy chcesz najwyższej dokładności dla trudnego nagrania albo potrzebujesz, żeby model wyciągnął fakty z internetu w połowie zdania. Zacznij lokalnie, sięgaj po chmurę tylko wtedy, gdy tryb lokalny cię zawodzi.

Przepustka czyszczenia AI, która zamienia chaotyczną mowę w porządną prozę

Surowe dyktowanie wychodzi jak niekończący się potok słów. Mówisz „dobra więc przejrzyj doc architektury oznacz to projekt alfa i przypomnij mi w czwartek” — i właśnie tę nieformatowaną ścianę tekstu dostajesz najpierw od każdego silnika mowy. To, co z nią zrobisz, decyduje o wartości narzędzia.

superwhisper czyści tekst przez swój dobór modeli i niestandardowe tryby. Whisper by Remskill też uruchamia przepustkę AI: powiedz frazę aktywacyjną „Hey whisper”, a tekst zostaje poprawiony zanim trafi na miejsce — wypełniacze usunięte, run-ony naprawione, mówiony akapit zamieniony w coś, co naprawdę wysłałbyś. Na modelu lokalnym ta przepustka działa przez Ollama, całkowicie offline; w trybie chmurowym domyślnie przez gpt-5-mini. W obu przypadkach cel jest ten sam — mówisz swobodnie, tekst trafia schludny.

Thinking...
Surowe

dobra więc przejrzyj doc architektury oznacz to projekt alfa i przypomnij mi w czwartek eem przed standupem

Poprawione

Dobra, przejrzyj doc architektury, oznacz to Project Alpha i przypomnij mi w czwartek przed standupem.

Przepustka czyszczenia to różnica między dyktowaniem, które musisz poprawiać, a dyktowaniem, które możesz od razu wysłać. To też moment, w którym linia między lokalnym a chmurowym ma największe znaczenie: model czyszczący działający na twoim komputerze nigdy nie widzi serwera — i właśnie po to dyktujesz lokalnie. Jeśli potrzebujesz tylko surowych transkryptów, nie będzie ci jej brakować. Gdy zaczniesz wysyłać prawdziwe e-maile głosem, to funkcja, której przestaniesz zauważać, bo po prostu działa.

Ten sam przepływ mów-potem-czyść sprawia, że głos jest szybszy od klawiatury — możesz pisać szybciej głosem w dowolnej aplikacji, więc długi akapit staje się kilkoma wypowiedzianymi zdaniami zamiast pięciu minutami pisania.

Jeśli masz Mac

MacBook otwarty na drewnianym biurku w miękkim świetle, reprezentujący dyktowanie na macOS

Bądź ze sobą szczery co do swojego sprzętu, bo właściwa odpowiedź się zmienia. Jeśli czytasz to na Mac, superwhisper jest mocnym wyborem i powiedziałbym ci to prosto w oczy. Zaczął na macOS, był tam dopracowywany przez lata i na Apple Silicon jego lokalne modele działają dobrze. Dla użytkownika Mac szukającego dojrzałej, natywnej aplikacji do dyktowania z bogatym doborem modeli, superwhisper naprawdę zasłużył na rekomendację. Nie będę cię odciągać od dobrego narzędzia tylko po to, żeby zdobyć punkt.

Warto wiedzieć: Whisper by Remskill działa też na Mac, na Apple Silicon, z tym samym lokalnym pipeline i skrótem command+option jako push-to-talk trzymanym podczas mówienia. Wybór na Mac to więc nie superwhisper albo nic — to dwie solidne opcje lokalne, a która pasuje, zależy od tego, czy wolisz podejście superwhisper z modelami i trybami, czy podejście Whisper z trzema ścieżkami do wyboru. Oba trzymają dźwięk na twoim urządzeniu. Wypróbuj ten, którego kształt bardziej ci odpowiada — żaden nie jest błędem.

A jeśli wysyłasz 30-słowowy tekst, nie instaluj niczego. Dyktowanie macOS jest wbudowane, konfigurowane w Ustawieniach systemowych w sekcji Klawiatura, a na Apple Silicon może przetwarzać ogólny tekst lokalnie. Na Windows wbudowany pasek Pisanie głosowe otwiera się kombinacją klawisz Windows + H tam, gdzie jest kursor — sam dodaje interpunkcję i sprawdza się przy krótkich wiadomościach, choć przesyła dane przez serwery Microsoft i wymaga internetu, więc nie jest opcją offline. (Jeśli Win+H kiedyś przestanie otwierać, typowe przyczyny znajdziesz w tym rozwiązaniu problemu z Win+H.) Po dedykowane narzędzie sięgnij, gdy wbudowane opcje zaczną cię ograniczać — długie notatki, prywatność offline albo chęć posiadania tego samego skrótu wszędzie.

Jeśli trafiłeś tu ze starej szkoły dyktowania, ta sama logika porównania dotyczy nowoczesnej alternatywy dla Dragon — lokalnej, bez etapu trenowania, zbudowanej pod to, jak ludzie naprawdę dyktują dziś.

„superwhisper dla Windows” kiedyś był ślepą uliczką. Już nią nie jest — aplikacja jest na Windows, jest dobra w tym, co robi, i jeśli o to właśnie ci chodziło, po prostu ją zainstaluj. Jedynym powodem, żeby czytać dalej poza przyciskiem instalacji, jest upewnienie się, że wybrałeś narzędzie pasujące do twojego sprzętu i twoich wymagań co do prywatności, a nie to, które trafiło pierwsze w wynikach. Większość tego porównania podyktowałem na laptopie z Windows, narzędziem, które wkleja tekst tam, gdzie akurat jest kursor, a potem wysłałem. Klawiatura stała nieruchomo — o to właśnie chodzi.

Wypróbuj lokalne dyktowanie na swoim komputerze z Windows

Przytrzymaj skrót, mów, puść. Transkrypcja trafia tam, gdzie jest kursor — w każdej aplikacji, w pełni na twoim urządzeniu.

Bezpłatny tryb lokalny dla każdego zalogowanego konta. Karta nie jest wymagana na start.

Zdjęcie Denysa Medvedjeva

Denys Medvediev

Jestem tą osobą, która czyta nasze e-maile wsparcia — najprawdopodobniej dyktując odpowiedzi.

Warto przeczytać