Autor: Denys Medvediev

Porównanie

Win+H alternatywa

Win+H to Windows Voice Typing — darmowe, wbudowane i dobre do krótkich wstawek. Działa jednak w chmurze Microsoftu, wymaga internetu i nie ma własnego słownika. Alternatywa, której szuka większość ludzi, działa offline, ma skrót typu naciśnij-i-mów oraz przebieg czyszczenia tekstu przez AI.

Ostatnia aktualizacja: czerwiec 2026

Klawiatura Windows na ciemnym biurku z klawiszem Windows w centrum uwagi, nawiązująca do skrótu dyktowania głosowego Win+H

Najlepszą alternatywą dla Win+H jest narzędzie do dyktowania działające w całym systemie offline, takie jak Whisper by Remskill. Win+H (Windows Voice Typing) jest darmowe i wbudowane, ale korzysta z usługi rozpoznawania mowy Microsoftu działającej online i wymaga internetu. Lokalne narzędzie transkrybuje na urządzeniu, dodaje własny słownik i używa skrótu naciśnij-i-mów, który nie wyłącza się sam.

Win+H to darmowe dyktowanie, które masz już na swoim komputerze, i dla wielu osób jest go naprawdę wystarczająco. Naciskasz klawisz Windows + H, w miejscu kursora wyskakuje mały pasek, mówisz, a tekst się pojawia. Bez instalacji, bez konta, bez kosztów. Chcę to powiedzieć wprost na samym początku, bo internet jest pełen stron, które udają, że wbudowana opcja jest do niczego, żeby coś ci sprzedać. Nie jest do niczego. Jest w porządku.

Problem zaczyna się, gdy „w porządku do krótkich wstawek” zderza się z „robię to cały dzień”. Voice Typing wysyła twoją mowę do chmury Microsoftu, więc wymaga stałego połączenia z internetem. Nie ma własnego słownika, więc nigdy nie nauczy się nazw twoich produktów ani nazwisk twoich współpracowników. A sam skrót koliduje z innymi rzeczami — mnóstwo aplikacji przejęło już Win+H albo klawisze wokół niego. Jeśli trafiłeś na którąś z tych ścian, nie szukasz poprawki. Szukasz alternatywy.

Oto nudna prawda, którą większość tych stron pomija. Win+H to dobre darmowe narzędzie z trzema konkretnymi ograniczeniami: działa w chmurze, więc brak internetu oznacza brak dyktowania; nie ma sposobu, by nauczyć go twojego żargonu; i jest paskiem typu naciśnij-by-przełączyć, który słucha, dopóki coś go nie zatrzyma, zamiast klawiszem, który trzymasz, gdy mówisz. Żadne z tych nie są błędami. To decyzje projektowe i są właściwymi decyzjami dla zwykłego użytkownika, dla którego Microsoft to zbudował.

Więc prawdziwe pytanie nie brzmi „jak ulepszyć Win+H”. Przeważnie nie da się — ograniczenia są wpisane na stałe. Pytanie brzmi „co uruchomić zamiast tego, gdy te ograniczenia zaczynają boleć”, a uczciwa odpowiedź zależy od tego, czy chcesz prywatności offline, własnego słownika, skrótu, który nie wchodzi w drogę, czy przebiegu AI, który czyści potok słów, zanim trafi na ekran. Przejdę przez to wszystko, skonfiguruję jedno w dwie minuty i powiem ci wprost, kiedy Win+H wciąż jest dobrym wyborem.

Czym właściwie jest Win+H i dla kogo jest

Osoba korzystająca z laptopa Windows przy biurku, ilustrująca wbudowane dyktowanie głosowe

Win+H to skrót klawiszowy dla Windows Voice Typing. Naciśnij razem klawisz z logo Windows i H na dowolnym komputerze z Windows 11, pojawi się pasek mikrofonu, a wszystko, co powiesz, zostanie wpisane do pola tekstowego, w którym jest twój kursor. Własna strona pomocy Microsoftu jasno mówi, co go napędza: „Voice typing uses online speech recognition, which is powered by Azure Speech services.” Działa w mniej więcej 40 językach, może automatycznie wstawiać interpunkcję, jeśli włączysz to ustawienie, i nic nie kosztuje, bo jest dostarczane z Windowsem.

Należy oddać sprawiedliwość, bo bycie uczciwym ma tu znaczenie. Do krótkiego, swobodnego dyktowania Win+H jest naprawdę dobre. Dokładność na wyraźnym angielskim jest solidna. Konfiguracja jest zerowa — nie ma konta, nie ma pobierania, nie ma modelu, na który trzeba czekać. Jeśli chcesz wysłać dwuwierszową wiadomość na Teams albo szybkie zapytanie wyszukiwania głosem, naciskasz jeden skrót i już. Do tego zadania płacenie za cokolwiek innego byłoby niemądre, i powiem to ponownie później, prostszymi słowami.

Jest skierowane do osoby, która dyktuje od czasu do czasu, a nie do osoby, która dyktuje zawodowo. Ta perspektywa wyjaśnia każde ograniczenie, które nastąpi. Microsoft zbudował darmową, prostą, opartą na chmurze funkcję dla przeciętnego użytkownika, który chce od czasu do czasu mówić zamiast pisać. Nie zbudował narzędzia dla zaawansowanych i nigdy tego nie udawał. Rozdźwięk pojawia się tylko wtedy, gdy próbujesz użyć swobodnego narzędzia do ciężkiego zadania.

Win+H to też tylko jeden z kilku skrótów — skrót dyktowania głosowego każdego systemu jest zebrany w jednej tabeli.

Dlaczego ludzie szukają alternatywy dla Win+H

Trzy rzeczy wysyłają ludzi na poszukiwania. Po pierwsze, wymóg internetu. Dokumentacja pomocy Microsoftu mówi wprost: „To use voice typing, you'll need to be connected to the internet.” Voice Typing przetwarza twoją mowę w chmurze, a nie na twoim komputerze, więc w pociągu, w samolocie, w martwej strefie czy w zablokowanej sieci firmowej po prostu nie działa. Dla każdego, kto dyktuje coś, czego wolałby nie wysyłać na serwer — e-mail do klienta, notatkę medyczną, na wpół ukształtowany pomysł na biznes — to rundka do chmury jest przeszkodą nie do przejścia, a nie szybkość.

Po drugie, nie ma własnego słownika. Win+H nie nauczy się, że twój produkt pisze się „Remskill”, a nie „rem skill”, ani że twoja współpracowniczka to „Siân”, a nie „Shawn”. Każda sesja zaczyna się od zera. Po trzecie, skrót koliduje. Win+H to skrót globalny, a inne aplikacje przejmują go albo klawisze obok, więc to, co miało być jednym szybkim naciśnięciem, zamienia się w walkę o to, kto jest właścicielem tego akordu. Alternatywa naprawia wszystkie trzy naraz: działa na urządzeniu, przyjmuje własną listę słów i pozwala wybrać skrót, którego nic innego nie dotyka.

Ten ostatni punkt warto zobaczyć, a nie przeczytać. Alternatywą, na której ląduje większość ludzi, jest skrót typu naciśnij-i-mów: naciskasz i trzymasz klawisz, mówisz i puszczasz, a tekst wkleja się w miejscu kursora. Pozostaje włączony dokładnie tak długo, jak go trzymasz — bez automatycznego wyłączenia po pauzie, bez paska do zamknięcia. Mała kapsuła pojawia się, gdy mówisz, więc wiesz, że słucha:

Cancel
Nakładka nagrywania: mała kapsuła, która pojawia się, gdy trzymasz skrót, więc wiesz, że słucha.

Skonfiguruj alternatywę w dwie minuty

Alternatywą, której tu użyję, jest Whisper by Remskill, bo to ta, która zamyka wszystkie trzy luki Win+H — offline, własny słownik, twój własny skrót. Potrzebujesz komputera z Windows 10 lub nowszym (działa też na Macu), działającego mikrofonu i jakichś dwóch minut. Cały lokalny potok jest darmowy dla każdego zalogowanego konta, bez pytania o metodę płatności przy rejestracji. Oto kolejność.

Krok 1 — Zainstaluj Whisper i zaloguj się.

Pobierz ze strony pobierania, zainstaluj i załóż darmowe konto. Bez karty. Cały lokalny potok transkrypcji otwiera się od razu.

Poznasz, że zadziałało, gdy w zasobniku pojawi się ikona aplikacji, a kreator konfiguracji zaproponuje wybór modelu.

Krok 2 — Wybierz ścieżkę transkrypcji.

Aplikacja nie wybiera za ciebie. Masz trzy: Cloud (OpenAI, własny klucz), Local Parakeet albo Local Whisper. Aby pokonać ograniczenie chmury, które ma Win+H, wybierz lokalną — więcej o tym, którą, dwie sekcje niżej.

Poznasz, że zadziałało, gdy model skończy się pobierać i pokaże się jako gotowy.

Krok 3 — Ustaw skrót, którego nic innego nie używa.

Windows domyślnie ma Ctrl+Space, trzymany jako naciśnij-i-mów. Jeśli koliduje z czymś, co uruchamiasz, zmień go w Ustawieniach — cały sens odejścia od Win+H polega na tym, że to ty jesteś właścicielem tego klawisza, a nie walczysz o niego.

Poznasz, że zadziałało, gdy testowe nagranie wklei się do dowolnego pola tekstowego.

Krok 4 — Dodaj własne słowa, a potem mów.

Wrzuć nazwy swoich produktów, nazwiska i skróty do listy hotwords, żeby wychodziły napisane poprawnie. Następnie ustaw kursor gdziekolwiek, przytrzymaj skrót, powiedz zdanie, puść.

Poznasz, że zadziałało, gdy „Remskill” wyjdzie jako Remskill, a twoje zdanie znajdzie się w polu tekstowym.

Whisper
Prawdziwa aplikacja desktopowa Whisper na ekranie ustawień, z otwartymi panelami Transcription i AI.

Wolną częścią jest pobieranie modelu, a nie konfiguracja. Cała reszta to cztery powyższe kroki. Gdy już działa, dyktowanie przestaje być funkcją, którą przywołujesz, a staje się klawiszem, który trzymasz, w dowolnej aplikacji, online czy nie.

zamiana mowy na tekst w Windows · na Macu

Win+H kontra dedykowane narzędzie, uczciwie

Zacznijmy od tego, gdzie Win+H wygrywa, bo wygrywa w dwóch rzeczach i udawanie, że jest inaczej, byłoby nieuczciwe. Jest darmowe, kropka — nic do kupienia, nigdy. I jest już zainstalowane, więc nie ma pobierania i nie ma konta. Jeśli te dwie rzeczy są tym, na czym zależy ci najbardziej, porównanie może się tu zakończyć i Win+H bierze wszystko. Dedykowane narzędzie prosi, żebyś coś zainstalował i się zalogował; Win+H nie prosi o nic.

Teraz reszta tabeli. Co do prywatności, Win+H działa tylko w chmurze — dokumentacja Microsoftu sama wyznacza granicę: rozpoznawanie mowy online „uses Microsoft cloud-based services” i „Voice data is sent to Microsoft”, podczas gdy rozpoznawanie na urządzeniu „processes your voice locally on your device” i „No voice data is sent to Microsoft.” Voice Typing korzysta ze ścieżki online. Lokalna alternatywa trzyma wszystko na maszynie. Co do własnego słownika, Win+H nie ma żadnego; dedykowane narzędzie przyjmuje listę słów. Co do skrótu, Win+H to stały skrót globalny, który słucha, dopóki nie zostanie przerwany; narzędzie naciśnij-i-mów daje ci klawisz, który wybierasz i trzymasz. Co do czyszczenia, Win+H robi automatyczną interpunkcję na żywo; dedykowane narzędzie może uruchomić pełny przebieg AI, który naprawia słowa-wypełniacze i potoki słów, nie tylko przecinki.

I to automatyczne zatrzymanie. Win+H jest zbudowane tak, by odczytać pauzę jako „skończyłeś” i wyłączyć się po kilku sekundach ciszy — zachowanie, które rozłożyłem na czynniki osobno w dlaczego dyktowanie w Windows wciąż się zatrzymuje. Do krótkich wiadomości to w porządku. Do myślenia na głos, gdy zatrzymujesz się, żeby znaleźć słowo, jest doprowadzające do szału. Klawisz naciśnij-i-mów omija to wszystko: jest włączony, gdy go trzymasz, i wyłączony, gdy puszczasz, a cisza w środku niczego nie zmienia. Więc uczciwa tablica wyników: Win+H wygrywa darmowością i tym, że jest wstępnie zainstalowane; alternatywa wygrywa offline, słownikiem, kontrolą skrótu, czyszczeniem i tym, że nie wyłącza się przy tobie. Wybierz wiersz, który pasuje do twojego dnia.

Lokalnie czy w chmurze: który tryb zastępuje Win+H

Jeśli powodem, dla którego odchodzisz od Win+H, jest wymóg internetu albo prywatność, odpowiedzią jest tryb lokalny. Cały urok alternatywy polega na tym, że transkrypcja dzieje się na twojej maszynie, a nic nie jest wysyłane na serwer — odwrotnie niż rundka do chmury, która zatrzymuje Voice Typing w chwili, gdy twoje połączenie zaczyna szwankować. Jeśli twój komputer jest z ostatnich kilku lat, lokalny obsługuje codzienne dyktowanie bez narzekania, a chmura staje się opcją, po którą sięgasz, a nie zależnością, w której tkwisz.

Oto czym różnią się trzy ścieżki, bo aplikacja każe ci wybrać, a wolałbym, żebyś wybrał dobrze:

  • Local ParakeetSilnik TDT firmy NVIDIA, około 600 MB i najszybsza lokalna opcja — od 5 do 10 razy szybsza niż Whisper na CPU. Obejmuje angielski plus 24 inne języki europejskie, łącznie 25. Bez tłumaczenia na angielski. Jeśli dyktujesz po angielsku albo w innym języku europejskim, to szybki, w pełni offline wybór, który robi to, co Win+H, bez chmury.
  • Local Whisperwolniejszy niż Parakeet na tej samej maszynie, ale wielojęzyczne wersje obejmują 99 języków i potrafią tłumaczyć na angielski. Wersje tylko angielskie są tylko angielskie, nie 99. Wybierz to dla chińskiego, japońskiego, koreańskiego albo dowolnej pracy z tłumaczeniem, czego Parakeet nie potrafi. Domyślny model angielski ma około 480 MB.
  • Cloud (OpenAI, BYOK)najlepsza dokładność i dostęp do sieci, z użyciem twojego własnego klucza OpenAI rozliczanego bezpośrednio przez OpenAI. Transkrypcja domyślnie działa na gpt-4o-mini-transcribe. Wymaga internetu, tak jak Win+H, więc to jedyna ścieżka, która opuszcza twoją maszynę. Powierzchnia Cloud jest częścią Whisper Pro.

Nudna prawda jest taka, że dla rodzaju tekstu, który Win+H obsługuje dzisiaj — e-maile, wiadomości, notatki — każdy z lokalnych silników w zupełności wystarczy, a oba działają w pełni offline. To największa praktyczna różnica względem wbudowanej opcji: brak połączenia, a wciąż działa. Chmura zarabia na swoje miejsce, gdy chcesz najwyższej klasy dokładności na trudnym nagraniu albo potrzebujesz, żeby model wyciągnął fakt z sieci w połowie zdania. Jeśli przyszedłeś tu, żeby uciec od zależności od internetu, zacznij lokalnie i traktuj chmurę jako wyjście awaryjne, a nie domyślne.

Przebieg czyszczenia AI, którego Win+H nie robi

Surowe dyktowanie wychodzi jako potok słów. Mówisz „okej więc wyślij klientowi maila o wdrożeniu remskill przesuń to na czwartek i zapytaj o budżet”, i to jest pozbawiona interpunkcji ściana, którą wręcza ci każdy silnik mowy. Win+H wstawi przecinki i kropki, gdy mówisz, co jest prawdziwe i przydatne. Czego nie zrobi, to przepisanie tego bałaganu — usunięcie „yyy”, naprawienie połamanej gramatyki, zamienienie mówionego potoku w coś, co naprawdę byś wysłał.

To luka, którą wypełnia przebieg AI. Powiedz frazę aktywującą „Hey whisper”, a tekst zostanie ulepszony, zanim trafi na ekran: wypełniacze usunięte, potoki słów podzielone, twoje własne słowa napisane poprawnie, bo nauczyłeś ich narzędzie. Na modelu lokalnym działa to przez Ollama, więc czyszczenie też dzieje się na twojej maszynie; w trybie chmury domyślnie jest to gpt-5-mini. Win+H daje ci interpunkcję. To daje ci skończone zdanie.

Thinking...
Surowe

okej więc wyślij klientowi maila o wdrożeniu remskill przesuń to na czwartek i zapytaj o budżet yyy przed rozmową

Oczyszczone

Okej, więc wyślij klientowi maila o wdrożeniu Remskill, przesuń to na czwartek i zapytaj o budżet przed rozmową.

Element własnego słownika to ta część, której Win+H strukturalnie nie potrafi dorównać. Ponieważ alternatywa transkrybuje na twojej maszynie z twoją własną listą słów, wie, że „Remskill” to produkt, a „Siân” to imię, i trafia za każdym razem, zamiast co drugi raz. Dla każdego, kto dyktuje te same nazwy własne przez cały dzień — handlowca z CRM-em pełnym nazwisk, programisty nazywającego te same usługi — to różnica między tekstem, który zostawiasz, a tekstem, który poprawiasz. Win+H zaczyna każdą sesję jako obcy; narzędzie z hotwords pamięta.

Ten sam przepływ mów-a-potem-czyść jest całym powodem, dla którego głos bije klawiaturę przy dużej objętości — możesz pisać szybciej głosem w każdej aplikacji, więc długa wiadomość staje się kilkoma wypowiedzianymi zdaniami zamiast akapitem, który wystukujesz ręcznie.

Kiedy Win+H to wszystko, czego potrzebujesz

Zrelaksowana osoba przy laptopie wysyłająca szybką wiadomość, ilustrująca swobodne wbudowane dyktowanie

Skłamałbym, gdybym kazał wszystkim coś instalować. Dla sporej grupy ludzi Win+H jest właściwą odpowiedzią, a dedykowane narzędzie to przesada. Jeśli dyktujesz od czasu do czasu — szybka wiadomość, pole wyszukiwania, krótka notatka — i prawie zawsze jesteś online, wbudowana funkcja nic nie kosztuje i działa dobrze. Nie pobieraj aplikacji, żeby robić to, co skrót klawisz Windows + H robi już za darmo.

Konkretnie, zostań przy Win+H, jeśli jesteś zawsze połączony z internetem i nie przeszkadza ci, że twoja mowa przechodzi przez chmurę Microsoftu; jeśli dyktujesz krótkimi wstawkami, a nie długimi fragmentami, więc automatyczne wyłączenie po ciszy nigdy ci nie przeszkadza; jeśli nigdy nie potrzebujesz, żeby pisało własne nazwy czy żargon; i jeśli skrót Win+H nie koliduje z niczym, co uruchamiasz. To prawdziwy profil, a nie chochoł — opisuje wielu swobodnych użytkowników, a dla nich alternatywa dodaje tarcia bez dodawania wartości. Darmowe i wstępnie zainstalowane to mocne połączenie, gdy ograniczenia cię nie dotykają.

Granica do przekroczenia jest wtedy, gdy ograniczenia zaczynają kosztować cię czas. Sięgnij po narzędzie offline, działające w całym systemie, gdy dyktujesz tam, gdzie nie ma zasięgu, gdy chcesz, by twoje słowa zostały na twojej maszynie, gdy masz dość tego, że te same nazwy wychodzą źle, albo gdy chcesz skrótu, który trzymasz i który nigdy nie zatrzymuje się w połowie myśli. Poniżej tej granicy Win+H wygrywa ceną i zerową konfiguracją, i z przyjemnością powiem ci, żebyś go zatrzymał.

A jeśli twoja prawdziwa pretensja do Win+H to ciągłe urywanie się, a nie chmura, przewodnik najpierw-napraw w dlaczego dyktowanie w Windows wciąż się zatrzymuje obejmuje to, co naprawdę możesz ustabilizować, zanim w ogóle zdecydujesz się przesiąść.

Dalsza lektura

Win+H to rzadkie darmowe narzędzie, które jest naprawdę dobre, dlatego cały ten tekst spędziłem, odmawiając jego krytyki. Robi jedną rzecz dobrze: krótkie, online, swobodne dyktowanie, za nic. Alternatywa jest do tego drugiego zadania — całodziennego, offline, moje-własne-słowa, trzymaj-klawisz-i-myśl. To porównanie podyktowałem w większości skrótem, który sam wybrałem, w samolocie z wyłączonym wifi, podczas gdy Win+H siedziało i czekało na połączenie, którego nie miało dostać. Wybierz narzędzie pasujące do lotu, na którym jesteś.

Wypróbuj alternatywę offline dla Win+H

Przytrzymaj skrót, który sam wybrałeś, mów, puść. Tekst ląduje tam, gdzie jest twój kursor — online czy nie, w każdej aplikacji.

Darmowy tryb lokalny dla każdego zalogowanego konta. Bez karty na start.

Zdjęcie Denysa Medvedieva

Denys Medvediev

Jestem tym, który czyta nasz e-mail wsparcia, najpewniej dyktując odpowiedzi.