Porównanie
Najlepsza zamiana mowy na tekst w Windows, w rankingu
Najlepsza aplikacja do zamiany mowy na tekst w Windows zależy od tego, gdzie piszesz. Win+H jest darmowe i wbudowane, ale wymaga internetu i działa tylko w polu tekstowym. Whisper działa offline, działa w każdej aplikacji i wkleja tekst w miejscu kursora.
Ostatnia aktualizacja: czerwiec 2026

Najlepsza aplikacja do zamiany mowy na tekst w Windows zależy od tego, gdzie piszesz. Windows Voice Typing (Win+H) jest darmowe i wbudowane, ale wymaga internetu i działa tylko w polu tekstowym. Whisper by Remskill działa offline, działa w każdej aplikacji i wkleja tekst w miejscu kursora. To lepszy wybór do prawdziwego pisania.
W zeszły weekend moja młodsza córka podyktowała 90-wyrazowy e-mail do babci na Ukrainie w jakieś 90 sekund. Bez klawiatury. Ma siedem lat. Dwadzieścia pięć lat temu ta sama maszyna w tej samej rodzinie potrzebowała piętnastu minut, żeby kiepsko podyktować jeden akapit świątecznego listu. Zamiana mowy na tekst w Windows po cichu przestała być eksperymentem rodem z laboratorium. Szczera odpowiedź jest taka, że masz więcej dobrych opcji, niż ci się wydaje, i jedną czy dwie znane nazwy, które możesz pominąć.
Większość list "najlepsza zamiana mowy na tekst w Windows" porównuje dwanaście narzędzi i poleca to, które zapłaciło za odnośnik. To nie jest taka lista. Windows w 2026 roku ma darmową funkcję dyktowania, której większość ludzi nigdy nie znajduje, a płatny rynek podzielił się na narzędzia, które nagrywają spotkania, i narzędzia, które pomagają pisać. Ten przewodnik ustawia w rankingu aplikacje do zamiany mowy na tekst warte zainstalowania na Windows 10 lub nowszym, według czterech rzeczy, które mają znaczenie: dokładności, obsługi offline, miejsca działania i ceny. Potem mówi ci wprost, kiedy darmowa wbudowana opcja to wszystko, czego potrzebujesz. Pod koniec będziesz wiedzieć, którą zainstalować dzisiaj, a którą znaną nazwę zostawić na półce. Czytam e-maile pomocy technicznej dla aplikacji, którą tworzę, więc większość tego, co wiem o tym, gdzie te narzędzia zawodzą, pochodzi od ludzi, którzy piszą, żeby mi powiedzieć, że zawiodły.
Krótkie słowo o tym, jak czytać to, co następuje. Tworzę jedno z narzędzi na tej liście, więc nie udaję bezstronnego sędziego, ale wskażę przypadki, w których darmowa opcja lub konkurent to właściwy wybór, bo to jedyny uczciwy sposób, żeby to napisać. Ranking jest według zastosowania, a nie według jednego zwycięzcy, bo nie ma jednego zwycięzcy. Osoba, która wysyła trzy wiadomości na Slacku dziennie, i osoba, która głosem dyktuje raport na 3000 słów, chcą różnych narzędzi, a lista, która udaje, że jest inaczej, coś ci wciska.
Krótka odpowiedź: Win+H jest darmowe, ale tu się kończy
Windows · Win + H
Naciśnij klawisz z logo Windows i H w dowolnym polu tekstowym, a u góry ekranu pojawi się mały pasek narzędzi. Zacznij mówić. To jest Windows Voice Typing, darmowe i wbudowane w Windows 11. Do szybkiej wiadomości w oknie czatu trudno pobić coś darmowego i już zainstalowanego.
Zatrzymują je dwie rzeczy. Po pierwsze, wymaga internetu. Voice Typing korzysta z rozpoznawania mowy online opartego na usługach Azure Speech firmy Microsoft, więc bez połączenia nie ma dyktowania. Po drugie, kursor musi być w polu tekstowym, żeby cokolwiek w ogóle zadziałało. To wyklucza wiele miejsc, w których chcesz mówić: zmianę nazwy pliku, komórkę arkusza, która się stawia, aplikację na pulpicie, której Windows nie uznaje za "pole tekstowe".
Mniejsza, trzecia rzecz pojawia się dopiero po kilku tygodniach. Win+H to funkcja, a nie sposób pracy. Nie trzyma historii tego, co podyktowałeś, nie daje miejsca, żeby poprawić słowo, które zawsze wychodzi źle, i nie oferuje sposobu, żeby nagiąć interpunkcję do tego, jak mówisz. Dostajesz mikrofon i transkrypcję — i tyle. Do jednolinijkowej odpowiedzi jest dokładnie w sam raz. Przy czwartym e-mailu tego poranka zaczynasz chcieć czegoś więcej.
Więc prawdziwe pytanie nie brzmi "czy jest darmowa opcja". Jest, i powinieneś najpierw jej spróbować. Pytanie brzmi, po co sięgnąć, gdy darmowa się wyczerpie: w pociągu bez zasięgu, w aplikacji, do której Win+H nie chce wejść, albo gdy ta sama robota wraca po raz czterdziesty i chcesz, żeby ją zapamiętało.
Jak wybierałem: dokładność, offline, działanie wszędzie, cena

Oceniałem je według czterech rzeczy, w tej kolejności, bo w tej kolejności dają ci się we znaki.
Dokładność. Wszystko inne to szum, jeśli transkrypcja jest błędna. Haczyk w tym, że nikt nie publikuje uczciwej liczby z porównania bezpośredniego. Nuance reklamuje do 99% dokładności rozpoznawania dla Dragon od pierwszego użycia. W trybie lokalnym nasz własny opublikowany zakres dla Whisper to od 95% do 99%, przy czym większe modele wypadają lepiej. Obie liczby są podane przez producentów, więc traktuj je jako deklaracje, a nie ranking. Żadne pierwotne źródło nie publikuje weryfikowalnego procentu dokładności z porównania bezpośredniego dla Win+H, Google Docs Voice Typing ani Otter, więc każda lista, która podaje ci taką liczbę dla każdego narzędzia, ją zmyśla. Nudna prawda jest taka, że mikrofon USB za 20 dolarów poprawia twoją dokładność bardziej niż jakakolwiek zmiana modelu. Jeśli chcesz wydać pieniądze na lepszą transkrypcję, wydaj je najpierw na mikrofon, a oprogramowanie na drugim miejscu.
Offline. Czy działa z wyłączonym Wi-Fi. Win+H nie potrafi. Google Docs Voice Typing nie potrafi. Narzędzie, które działa na twojej własnej maszynie, potrafi, a to ma znaczenie przy arkuszu z pensjami, projekcie pisma prawnego albo e-mailu do szkoły twojego dziecka, który nie ma czego szukać w logach dostawcy. Ma to też znaczenie w głupi, codzienny sposób: pociągi, samoloty, piwnice, tylne siedzenie samochodu. Dyktowanie w chmurze jest tak niezawodne jak najgorszy słupek zasięgu, na jaki dziś trafisz.
Działa wszędzie. Czy pisze do każdej aplikacji, czy tylko do jednej. To linia, która dzieli całe pole. Skrót systemowy wkleja tam, gdzie jest twój kursor; funkcja przeglądarki działa tylko w tej karcie przeglądarki. Test, którego używam, jest przyziemny celowo. Czy potrafi zmienić nazwę pliku, wypełnić pole wyszukiwania w aplikacji na pulpicie albo napisać opis commita. Większość "darmowych" opcji oblewa ten test w chwili, gdy opuścisz przeglądarkę, a będziesz ją opuszczać częściej, niż myślisz.
Cena. Konkretne liczby, żadnego "już od". Darmowe tam, gdzie darmowe jest prawdziwe. Nie będę zapychać rankingu narzędziem, które kosztuje więcej niż licencja Windows, żeby brzmieć rzetelnie, i powiem ci, kiedy darmowa wbudowana opcja to wszystko, czego potrzebujesz — co, dla wielu osób, jest prawdą.
Aplikacje do zamiany mowy na tekst w Windows warte twojego czasu
Whisper by Remskill — najlepszy do pisania w każdej aplikacji
Pełna jawność: to ja je tworzę, więc weź to pod uwagę. To, co robi, czego nie robi wbudowana opcja: korzysta z systemowego skrótu globalnego, który działa w każdej aplikacji, w której można pisać, i wkleja przetranskrybowany tekst tam, gdzie jest kursor. Domyślny skrót w Windows to Ctrl+Space: przytrzymaj, mów, puść i tekst ląduje.
Działa offline. Cała lokalna transkrypcja jest napisana w czystym Rust i zostaje na twoim urządzeniu; nic nie opuszcza maszyny, gdy model zostanie pobrany. Sam decydujesz, jak ma działać. Nie ma jednego "zalecanego" modelu, który aplikacja ci narzuca, bo właściwy wybór zależy od twojej maszyny i twoich języków.
Lokalny Whisper dostarcza osiem modeli: cztery tylko dla angielskiego, od Base o rozmiarze około 140 MB do Medium o około 1,5 GB, oraz cztery wielojęzyczne, sięgające aż do Large v3 o około 3 GB. Wielojęzyczne obejmują 99 języków; wersje .en tylko dla angielskiego obsługują angielski i wyłącznie angielski. Mniejsze modele ładują się szybko i działają na skromnym sprzęcie; większe potrzebują więcej RAM i nagradzają cię czystszymi transkrypcjami. Drugi silnik, Parakeet od NVIDIA o rozmiarze około 600 MB, działa 5 do 10 razy szybciej niż Whisper na procesorze i obsługuje angielski oraz 24 języki europejskie, bez języków azjatyckich i bez tłumaczenia na angielski. Jeśli mówisz głównie po angielsku i chcesz szybkości, Parakeet to szybki pas. Jeśli potrzebujesz 99 języków, tłumaczenia albo dokładniejszej kontroli, to Whisper jest tym, który należy załadować.
Jeśli chcesz mieć najnowszą jakość OpenAI i odpowiedzi z sieci w jednym narzędziu, tryb Cloud korzysta z twojego własnego klucza OpenAI, więc płacisz OpenAI bezpośrednio, a my nie bierzemy żadnej prowizji. Możesz nawet poprosić go na głos, żeby coś sprawdził. Powiedz frazę aktywującą "Hey whisper", a wykona wyszukiwanie w sieci i wklei odpowiedź (nazwałem frazę aktywującą od produktu, co — jak zauważyła moja żona — jest tym rodzajem pomysłu, który tylko osoba tworząca oprogramowanie uzna za sprytny). Całość jest lekka: sama aplikacja waży około 25 MB, nie wymaga dedykowanej karty graficznej, bo lokalna transkrypcja działa na procesorze. Instaluje się na Windows 10 lub nowszym. Pierwsze uruchomienie omawiamy szczegółowo w naszym przewodniku zamiana głosu na tekst w Windows.
Najlepszy dla: każdego, kto pisze głosem w więcej niż jednej aplikacji i chce, żeby działało w samolocie.
Windows Voice Typing (Win+H) — najlepsze darmowe, wbudowane
Już na twoim komputerze, bez instalacji, bez konta. Naciśnij Win+H, mów do pola tekstowego. Kompromisem jest wymóg internetu i ograniczenie tylko do pola tekstowego. Do krótkich wiadomości, gdy i tak jesteś online, to właściwy pierwszy wybór właśnie dlatego, że nic nie kosztuje. Microsoft dodał automatyczną interpunkcję do Win+H i jest ona dostępna od ręki w każdej świeżej instalacji Windows 11. Większość ludzi, którzy "nie mają zamiany mowy na tekst", już ją mają i nigdy nie nacisnęli tej kombinacji klawiszy. Zacznij tutaj. Jeśli pokrywa twój dzień, to skończyłeś i nie wydałeś nic.
Najlepsze dla: szybkiego dyktowania w przeglądarce lub oknie czatu, online, bez konfiguracji.
Dragon Professional — najlepszy do specjalistycznego słownictwa
Stary król dyktowania w Windows. Nuance wciąż reklamuje do 99% dokładności od pierwszego użycia, zoptymalizowany pod Windows 11 i wstecznie zgodny z Windows 10. Jeśli cały dzień dyktujesz gęste terminy medyczne lub prawne, głębia niestandardowego słownictwa Dragona jest powodem jego istnienia, z dekadami pracy włożonej w obsługę żargonu, na którym potykają się modele ogólnego przeznaczenia. Jedno uczciwe zastrzeżenie: w chwili pisania tych słów sklep Nuance był w trakcie migracji i nie mogłem potwierdzić aktualnej ceny ani tego, czy obecna wersja to zakup jednorazowy, czy subskrypcja, z pierwotnego źródła. Historycznie Dragon był licencją jednorazową, ale nie wydrukuję liczby, za którą nie mogę ręczyć, więc sprawdź, zanim kupisz. Drugie zastrzeżenie to to, co do którego mam zdanie, i dojdę do niego niżej: era trenowania oprogramowania do dyktowania skończyła się dla niemal wszystkich poza tym wąskim przypadkiem zawodowym.
Najlepszy dla: specjalistów z dużą ilością branżowego żargonu i budżetem.
Wispr Flow — najlepsza dopracowana opcja w chmurze
Bezpośredni konkurent, i to elegancki. Wispr Flow reklamuje ponad 100 języków z automatycznym wykrywaniem i działa natywnie na Windows, Mac, iOS i Android. Automatyczne wykrywanie to funkcja na pierwszym planie. Mówią, że przechodzi między twoimi językami w środku zdania, tak jak ty. Z ich strony głównej nie mogłem potwierdzić, czy transkrypcja działa na urządzeniu, czy w chmurze, więc jeśli zależy ci na offline, zapytaj ich bezpośrednio, zanim się zdecydujesz. Dopracowany, wieloplatformowy, wart spojrzenia, jeśli chmura ci odpowiada i chcesz mieć to samo narzędzie na telefonie i laptopie. Porównanie bezpośrednie rozpisaliśmy w naszym artykule alternatywa dla Wispr Flow, jeśli wybierasz między tymi dwoma.
Najlepszy dla: ludzi, którzy chcą dopracowanego doświadczenia na wielu urządzeniach i nie potrzebują offline.
Otter.ai — najlepszy do spotkań, nie do dyktowania
Otter jest świetny w tym, co robi, a to nie jest to. To transkrybator spotkań, który dołącza do Zoom, Microsoft Teams i Google Meet, z darmowym poziomem Basic ograniczonym do 300 minut transkrypcji miesięcznie. Nie pisze do twoich aplikacji; nagrywa i transkrybuje rozmowy, a potem je streszcza. Zupełnie inna kategoria. Jeśli twój problem to "streść moje spotkania", Otter jest mocną odpowiedzią; jeśli to "pisz szybciej", to złe narzędzie, niezależnie od tego, jak dobre jest. Działa też jako własna aplikacja i usługa internetowa, a nie jako skrót systemowy, więc nie jest czymś, po co sięgasz, żeby wypełnić pole formularza. Wgłębiliśmy się w tę kwestię w naszym artykule alternatywa dla Otter.ai.
Najlepszy dla: rejestrowania i streszczania spotkań, a nie pisania głosem.
Szybkie porównanie: gdzie działa każde narzędzie
Celowo pominąłem dokładność w tej tabeli. Tylko Dragon i Whisper publikują liczbę, a obie pochodzą od producentów. Win+H, Google Docs Voice Typing i Otter nie publikują żadnej weryfikowalnej wartości. Każdy ranking typu "Narzędzie X jest dokładne w 96,3%" obejmujący całą piątkę to zgadywanka sformatowana jako fakt. Więc kolumny poniżej to te, które możesz sprawdzić: gdzie działa, czy działa offline, czy dociera do każdej aplikacji i do czego jest stworzone.
| Narzędzie | Model cenowy | Lokalnie/Chmura | Działa offline | Działa w każdej aplikacji | Języki | Najlepsze do |
|---|---|---|---|---|---|---|
| Whisper by Remskill | Lokalnie za darmo, chmura płatna (zobacz /pricing) | Lokalnie lub w chmurze | Tak, tryb lokalny | Tak, skrót systemowy | 99 w modelach wielojęzycznych | Pisanie głosem w każdej aplikacji |
| Win+H Voice Typing | Darmowe, wbudowane | Chmura (Azure) | Nie, wymaga internetu | Nie, tylko pole tekstowe | Wiele, ustawiane w Ustawieniach | Szybkie dyktowanie online |
| Dragon Professional | Płatne, sprawdź sklep Nuance | Sprawdź u producenta | Sprawdź u producenta | W obsługiwanych aplikacjach | Sprawdź u producenta | Specjalistyczne słownictwo |
| Wispr Flow | Płatne, zobacz u producenta | Niepotwierdzone | Niepotwierdzone | Systemowo na Win/Mac | Reklamowane ponad 100 | Dopracowane dyktowanie w chmurze |
| Otter.ai | Poziom darmowy, płatny wyżej (zobacz u producenta) | Chmura | Nie | Nie, własna aplikacja | Sprawdź u producenta | Transkrypcja spotkań |
Przeczytaj tabelę od lewej do prawej, a pole samo się posortuje. Jeśli "działa w każdej aplikacji" i "offline" muszą być oba na tak, lista jest krótka. Jeśli odpowiada ci praca online i wewnątrz jednej aplikacji, darmowe wbudowane opcje sobie z tym poradzą i możesz przestać czytać tutaj. Decyzja rzadko dotyczy tego, które narzędzie jest "najlepsze" w teorii. Chodzi o to, który wiersz pasuje do tego, jak pracujesz.
Inne narzędzia warte poznania
Pole w Windows jest szersze niż pięć nazw. Kilka takich, które zobaczysz na innych listach, z jedną uczciwą linijką na każde, żebyś mógł pominąć te, które nie pasują:
- Microsoft Word Dictate — wbudowane w Microsoft 365 Word, darmowe, jeśli już płacisz za Office, i dobre wewnątrz Worda. Uwięzione wewnątrz Worda. Jeśli większość twojego pisania i tak dzieje się tam, to dobra opcja bez dodatkowych kosztów. Jego kaprysy omówiliśmy w artykule zamiana mowy na tekst w Word.
- Google Docs Voice Typing — darmowe, ale tylko wewnątrz Dokumentów Google i Prezentacji w obsługiwanej przeglądarce, gdzie przeglądarka steruje usługą mowy. Nie systemowe, a w chwili, gdy przejdziesz z Dokumentów na inną kartę, przestaje działać.
- API zamiany mowy na tekst od OpenAI — whisper-1, gpt-4o-transcribe i gpt-4o-mini-transcribe, z limitem przesyłania 25 MB na plik. To klocek budulcowy dla programistów, a nie aplikacja, którą instalujesz. To z niego korzystają pod maską narzędzia takie jak tryb Cloud Whispera, a nie coś, na co wskazujesz i do czego zaczynasz mówić.
- Speechnotes — darmowy notatnik do dyktowania w przeglądarce. Dobry do robienia notatek, mieszka w karcie, nie opuszcza karty.
- Windows Voice Access — bezdotykowe sterowanie systemem operacyjnym od Microsoftu, stworzone z myślą o dostępności i pełnej obsłudze bez klawiatury, a nie o szybkim pisaniu. Warto wiedzieć, że istnieje, jeśli potrzebujesz w całości sterować Windowsem głosem.
- OpenAI Whisper — sam model open source, który możesz uruchomić lokalnie bez wiersza poleceń. Jeśli konkretnie chcesz mieć model Whisper na komputerze, zobacz nasz przewodnik OpenAI Whisper dla Windows, w którym pokazujemy sposób instalacji i użycia bez terminala.
Jeśli chcesz dłuższego przeglądu całej kategorii, łącznie z narzędziami do spotkań i usługami transkrypcji w chmurze, napisaliśmy pełny przewodnik oprogramowanie do transkrypcji. Krótka wersja na potrzeby tej strony: większość z nich jest albo przywiązana do przeglądarki, albo nie pasuje kategorią do zadania pisania do dowolnej aplikacji w Windows.
Kiedy pominąć płatną aplikację (i po prostu użyć Win+H)
Windows · Win + H
Oto część, którą większość tych list pomija, bo odesłanie cię do darmowego konkurenta nie opłaca nikomu bloga. Jeśli jesteś online i tylko od czasu do czasu dyktujesz krótką wiadomość do przeglądarki lub okna czatu, nie płać za nic, łącznie z nami. Naciśnij Win+H i jedź dalej. Jest darmowe, wbudowane w Windows 11 i dobrze radzi sobie z krótkimi zrywami. Jeśli mieszkasz w Dokumentach Google, ich Voice Typing jest darmowe i dostępne od ręki wewnątrz dokumentu. Jeśli twoja prawdziwa potrzeba to nagrywanie i streszczanie spotkań, a nie pisanie, darmowy poziom Otter daje ci 300 minut miesięcznie. Płatna aplikacja do dyktowania zaczyna zasługiwać na swoje miejsce w konkretnym momencie: gdy piszesz dłuższe teksty, pracujesz tam, gdzie nie ma zasięgu, albo musisz mówić do aplikacji, do których Win+H nie potrafi wejść. Poniżej tej linii wbudowana opcja jest właściwą odpowiedzią, i wolę, żebyś zatrzymał swoje pieniądze i wrócił, gdy z niej wyrośniesz.
Oto jedna mocna opinia, którą zasadzę w tym artykule: jeśli twoje narzędzie do dyktowania wymaga, żebyś je trenował, to jest rok 1999. Nowoczesne rozpoznawanie mowy działa od ręki na większości akcentów i języków. 45-minutowy rytuał kalibracji, który definiował starą erę Windowsa, był obejściem braku mocy obliczeniowej, a nie funkcją. Pod koniec lat 90. ktoś z mojej rodziny uruchamiał Dragon NaturallySpeaking na pulpicie z Windows 98 i 64 MB RAM. Proces trenowania trwał 45 minut. Czytałeś listę słów, żeby go skalibrować. Potem dyktowanie ledwo działało, może z 70% dokładnością i czterosekundowym opóźnieniem na zdanie. Jeden akapit świątecznego listu zajmował piętnaście minut. Słuchawki poleciały przez pokój. Słuchawki przeżyły; eksperyment nie. Dwadzieścia pięć lat później siedmiolatka z tej samej rodziny podyktowała cały e-mail w 90 sekund, bez trenowania, bez kalibracji. Jeśli narzędzie z 2026 roku wciąż prosi cię, żebyś je wytrenował, zanim zacznie słuchać, to pomysł z 1999 roku w nowej ikonce.
Ceny bez owijania w bawełnę
Cały lokalny proces Whispera jest darmowy dla każdego, kto ma konto: lokalny Whisper, Parakeet, ulepszanie AI na urządzeniu, historia dyktowania, własne skróty — wszystko, bez wymogu metody płatności przy rejestracji. To część, przy której warto się zatrzymać: dyktowanie offline, działające w każdej aplikacji, o którym jest cały ten artykuł, nic nie kosztuje, i nie podajesz karty, żeby je dostać. Whisper Pro dodaje powierzchnię Cloud do transkrypcji opartej na OpenAI, ulepszania AI w chmurze i wyszukiwania w sieci głosem, dla ludzi, którzy chcą najnowszych modeli i odpowiedzi z sieci w jednym narzędziu. Win+H i Google Docs Voice Typing też są darmowe. Otter ma darmowy poziom 300 minut miesięcznie i płatne plany powyżej. Dragon to produkt płatny, którego aktualnej ceny nie mogłem potwierdzić bezpośrednio u Nuance, więc sprawdź ich sklep. Dokładne liczby Whisper Pro znajdziesz na stronie z cennikiem — wprost, na piśmie, bez "już od", a my wysyłamy e-mail przed każdym odnowieniem, więc data i kwota nigdy nie są niespodzianką.
Otwórz teraz pole tekstowe i naciśnij Win+H. Jeśli ten szybki pasek narzędzi pokrywa wszystko, co robisz, to skończyłeś i zaoszczędziłeś sobie pobierania. W chwili, gdy znajdziesz się w pociągu bez zasięgu, albo będziesz mówić do aplikacji, która odmawia słuchania, albo będziesz pisać coś dłuższego niż SMS, to jest ta linia, w której narzędzie, które instalujesz, zaczyna mieć znaczenie. Moja siedmiolatka przekroczyła ją w dniu, w którym chciała napisać do babci z tylnego siedzenia samochodu, gdzie księżyc co chwilę znikał, a Wi-Fi w ogóle się nie pojawiło.
Chcesz zobaczyć to na swoim komputerze z Windows?
Pobierz Whisper, przytrzymaj Ctrl+Space i patrz, jak transkrypcja ląduje w dowolnej aplikacji. Proces lokalny jest darmowy, bez karty przy rejestracji.
Darmowe lokalne dyktowanie dla każdego zalogowanego użytkownika. Pro dodaje funkcje w chmurze w ramach osobnego okresu próbnego.



