Rozwiązywanie problemów
Dyktowanie w Windows ciągle się zatrzymuje
Pisanie głosowe w Windows (Win+H) samo się wyłącza po kilku sekundach ciszy, gdy klikniesz w inne okno albo gdy zerwie się połączenie — a Microsoft potwierdza, że automatyczna pauza po ciszy działa zgodnie z założeniem. Mów dalej i zadbaj o stabilny internet, żeby to przetrwać, albo użyj narzędzia typu „trzymaj i mów”, które nigdy nie zatrzymuje się samo.
Ostatnia aktualizacja: czerwiec 2026

Dyktowanie w Windows ciągle się zatrzymuje, bo pisanie głosowe (Win+H) samo wstrzymuje się po kilku sekundach ciszy, przy zmianie aktywnego okna albo gdy zerwie się jego połączenie z chmurą — a Microsoft potwierdza, że pauza po ciszy działa zgodnie z założeniem. Rozwiązania: mów dalej, zadbaj o stabilny internet, sprawdź mikrofon. Narzędzie offline typu „trzymaj i mów” działa, dopóki trzymasz klawisz, i nigdy nie zatrzymuje się samo.
Naciskasz Win+H, pojawia się pasek, zaczynasz mówić i działa. Potem robisz sekundę przerwy, żeby pomyśleć. Może zerkasz na jakieś źródło albo klikasz w inne okno, żeby sprawdzić nazwisko. Wracasz, mówisz dalej — i nic się nie pojawia, bo dyktowanie po cichu wyłączyło się, gdy nie patrzyłeś. Widziałem, jak dzieje się to w środku zdania, więcej razy, niż jestem w stanie zliczyć, i przez pierwszych kilkanaście razy byłem przekonany, że padł mi mikrofon.
Nie padł. Oto krótka wersja przed długą: pisanie głosowe w Windows jest zaprojektowane tak, żeby zatrzymywać się samo. Zatrzymuje się, gdy milkniesz, zatrzymuje się, gdy zaczynasz pisać na klawiaturze, i opiera się na usłudze w chmurze, więc niestabilne połączenie albo zmiana aktywnego okna też może je przerwać. Część tego da się obejść. Ta część, w której wstrzymuje się po ciszy, słowami samego Microsoftu, działa zgodnie z założeniem — i tej akurat nie wyłączysz do końca.
To, co pierwszy wynik wyszukiwania zwykle pomija: większość z tego to celowe działanie, a nie błąd, który da się załatać. Win+H jest zaprojektowane tak, by odczytać pauzę jako „skończyłeś”, więc wstrzymuje się samo. Wstrzymuje się też w momencie, w którym zaczynasz pisać ręcznie. Do tego pisanie głosowe zamienia mowę na tekst przez internetową usługę rozpoznawania mowy Microsoftu, co oznacza, że potrzebuje stabilnego połączenia z internetem — a każde zacięcie czy zmiana okna z fokusem może je nagle zatrzymać.
Uczciwe pytania brzmią więc tak: jak utrzymać dyktowanie przez jeden długi ciąg, jak wyeliminować to, co naprawdę da się naprawić, i czy istnieje sposób dyktowania, który w ogóle się na mnie nie zatrzymuje. Zajmę się wszystkimi trzema, z dokładnymi krokami od Microsoftu, i powiem wprost, kiedy wbudowana funkcja naprawdę w zupełności ci wystarcza.
Dlaczego dyktowanie w Windows samo się zatrzymuje

Przyczyny są cztery i tylko część z nich możesz naprawić. Pierwsza to ta, na którą trafia najwięcej osób: pisanie głosowe wstrzymuje się samo po kilku sekundach ciszy. Zespół pomocy Microsoftu potwierdził, że jest to celowe. Jak ujął to specjalista pomocy społeczności Microsoftu na oficjalnym Q&A: „obecne narzędzie do dyktowania faktycznie jest tak zaprojektowane. Nie ma dodatkowego sposobu, by zapobiec wstrzymywaniu się narzędzia do dyktowania po okresie bezczynności”. Ten sam wątek zauważa, że „automatycznie wstrzymuje się również, gdy piszesz ręcznie na klawiaturze”. Tak więc pauza na zastanowienie albo jedno naciśnięcie klawisza kończy sesję.
Drugą przyczyną jest fokus. Windows nie daje ci stałego mikrofonu na ekranie tak, jak robi to telefon. Według tej samej oficjalnej wskazówki „każda sesja wymaga ponownego włączenia za pomocą Win+H”. Gdy klikniesz w inne okno, dyktowanie przypisane do poprzedniego pola może zniknąć i zostajesz z koniecznością ponownego naciśnięcia skrótu. Trzecią przyczyną jest sieć. Oficjalna strona Microsoftu mówi wprost, że „pisanie głosowe korzysta z rozpoznawania mowy online, opartego na usługach Azure Speech” — działa w chmurze, więc słabe lub zrywające się połączenie z internetem może je przerwać w środku zdania. Czwartą jest sam mikrofon: luźna wtyczka USB, usterka przy uśpieniu i wybudzeniu albo zbyt niski poziom sygnału odczytywane są jako cisza, co uruchamia właśnie tę automatyczną pauzę z przyczyny pierwszej.
Warto powiedzieć to na głos, bo oszczędzi ci pół popołudnia: jeśli twój mikrofon działa bez zarzutu podczas rozmów, to prawie nigdy nie chodzi o uszkodzony sprzęt. Zatrzymanie dzieje się wyżej, w tym, jak pisanie głosowe decyduje, że sesja się skończyła. To także powód, dla którego rozwiązania poniżej dzielą się na dwie grupy — te, które naprawdę pomagają (stabilne połączenie, dobry mikrofon, mów dalej), i jedno ograniczenie, którego po prostu nie usuniesz (zaprojektowana pauza po ciszy).
Szybkie rozwiązanie, które działa u większości
Nie usuniesz limitu czasu ciszy, ale możesz przestać go uruchamiać. Przy jednym długim fragmencie cel jest prosty: nie milknij, nie przełączaj okien i upewnij się, że nic innego cię nie odcina. Kroki, oparte na wskazówkach pomocy Microsoftu i na zachowaniu opisanym w ich wątkach:
Utrzymuj równy strumień mowy — jeśli potrzebujesz chwili na zastanowienie, mrucz albo powiedz słowo wypełniacz, zamiast zupełnie milknąć, bo to kilka sekund ciszy uruchamia pauzę. Nie dotykaj klawiatury w trakcie dyktowania, bo ręczne pisanie zatrzymuje sesję zgodnie z założeniem. Pozostań w jednym oknie przez cały ciąg i naciśnij ponownie Win+H, jeśli kliknąłeś gdzie indziej. Sprawdź połączenie, bo rozpoznawanie mowy online potrzebuje stabilnego internetu; jeśli twoje Wi-Fi się rwie, dyktowanie też będzie. I potwierdź mikrofon w Ustawienia, System, Dźwięk, Wejście, a następnie upewnij się, że dostęp do mikrofonu jest włączony w Ustawienia, Prywatność i zabezpieczenia, Mikrofon — mikrofon, który się zacina, odczytywany jest jako cisza i kończy sesję. Gdy to wszystko się zgra, jeden nieprzerwany ciąg zwykle się utrzymuje.
To naprawa, która pomoże ci przejść przez bieżące zadanie. Nakładka powyżej pochodzi z innego narzędzia — ogólnosystemowej aplikacji do dyktowania — i jest tu po to, by pokazać jeden kontrast. Rejestrator typu „trzymaj i mów” jest włączony dokładnie tak długo, jak długo trzymasz klawisz, niezależnie od ciszy. Nie ma odliczania, które startuje za każdym razem, gdy robisz przerwę na myślenie, bo nigdy samo nie uznało, że skończyłeś. Jeśli walczysz z cyklem start-stop każdego dnia, trwałą odpowiedzią z kolejnej sekcji jest użycie narzędzia, które w ogóle nie zatrzymuje się samo.
Trwałe rozwiązanie: dyktowanie, które nie zatrzymuje się samo
Jeśli dyktujesz długie fragmenty i masz dość paska, który rezygnuje co kilka sekund, trwałym rozwiązaniem jest narzędzie z innym modelem włączania i wyłączania. Skrót typu „trzymaj i mów” nagrywa tak długo, jak długo go trzymasz — przez pauzy, przez myślenie, przez sięganie po kawę — a lokalny silnik transkrybuje na twoim własnym komputerze, więc nie ma połączenia z chmurą, które mogłoby się zerwać, ani licznika ciszy, który mógłby zadziałać. Potrzebujesz komputera z Windows 10 lub nowszym i działającego mikrofonu. Oto czterokrokowa konfiguracja z Whisper.
Krok 1 — zainstaluj Whisper i zaloguj się.
Pobierz ze strony pobierania, zainstaluj i załóż darmowe konto. Bez karty. Cały lokalny proces transkrypcji otwiera się od razu.
Poznasz, że się udało, gdy w zasobniku systemowym pojawi się ikona aplikacji, a kreator konfiguracji zaproponuje wybór modelu.
Krok 2 — wybierz lokalną ścieżkę transkrypcji.
Aplikacja nie wybiera za ciebie. Żeby całkowicie uniknąć zrywania połączenia, wybierz Local Parakeet (najszybszy dla angielskiego) lub Local Whisper (wielojęzyczny, z tłumaczeniem). Oba działają w pełni na twoim komputerze. Chmura też jest dostępna, ale to jedyna ścieżka, która korzysta z sieci.
Poznasz, że się udało, gdy model zakończy pobieranie i pokaże się jako gotowy.
Krok 3 — ustaw skrót typu „trzymaj i mów”.
Domyślny w Windows to Ctrl+Space, trzymany jak push-to-talk — nagrywa, gdy trzymasz klawisz, i zatrzymuje się, gdy go puścisz, a nie wtedy, gdy robisz przerwę. Wybierz coś innego w Ustawieniach, jeśli Ctrl+Space koliduje z inną aplikacją.
Poznasz, że się udało, gdy będziesz mógł przytrzymać klawisz, zrobić kilkusekundową przerwę w środku zdania, mówić dalej i wciąż uchwycić całość.
Krok 4 — ustaw kursor gdziekolwiek i mów.
Kliknij w dowolne pole tekstowe — e-mail, dokument, pasek wyszukiwania — przytrzymaj skrót, powiedz kilka zdań z przerwami między nimi, puść. Transkrypcja wkleja się tam, gdzie jest twój kursor, przetworzona lokalnie, bez limitu czasu ciszy, który mógłby cię odciąć.
Poznasz, że się udało, gdy długi, pełen pauz fragment pojawi się jako jeden blok tekstu, bez konieczności ponownego naciskania.
Jedyną wolną częścią jest jednorazowe pobranie modelu. Potem nagrywanie pozostaje włączone, dopóki trzymasz klawisz, a transkrypcja dzieje się na twoim procesorze, więc dwie rzeczy, które ciągle zatrzymywały Win+H — licznik ciszy i uzgadnianie połączenia z chmurą — po prostu nie istnieją w tym projekcie. Przytrzymaj, mów, zrób przerwę, mów dalej, puść. To cała pętla.
Jeśli wolisz naprawić tę wbudowaną
Mnóstwo osób po prostu chce, żeby Win+H zachowywało się porządnie, i nie chce kolejnej aplikacji. Słusznie. Oto głębsze rozwiązywanie problemów po stronie Windows, w kolejności, w jakiej sam bym próbował, w całości oparte na własnych dokumentach pomocy i wątkach Microsoftu. Nic z tego nie dotyka rejestru, więc nie ma tu niczego, co mogłoby uszkodzić komputer — i zaznaczę tę jedną rzecz, której naprawdę nie da się naprawić.
Najpierw połączenie, bo zależność od chmury to najbardziej niedoceniana przyczyna. Pisanie głosowe przesyła dźwięk przez internetową usługę rozpoznawania mowy Microsoftu, więc potwierdź, że Rozpoznawanie mowy online jest włączone w Ustawienia, Prywatność i zabezpieczenia, Mowa, oraz że twój internet jest stabilny. Przy niestabilnym połączeniu zatrzyma się w środku zdania i będzie wyglądać jak błąd lokalny. Po drugie, mikrofon. Wybierz właściwe wejście w Ustawienia, System, Dźwięk, Wejście, podnieś poziom wejścia, jeśli jest niski, i potwierdź, że dostęp do mikrofonu jest włączony w Ustawienia, Prywatność i zabezpieczenia, Mikrofon. Własne porady Microsoftu sugerują też przejście na słuchawki z mikrofonem lub mikrofon zewnętrzny, jeśli wbudowany się zacina — mikrofon, który się zacina, odczytywany jest jako cisza uruchamiająca automatyczną pauzę.
Po trzecie, język. W Ustawienia, Czas i język, Mowa upewnij się, że język mowy odpowiada temu, co dyktujesz, i że jego pakiet rozpoznawania jest zainstalowany; niedopasowanie powoduje nieprzewidywalne zachowanie. Microsoft sugeruje też dyktowanie w cichszym pomieszczeniu, bo hałas w tle zaburza dźwięk. A teraz uczciwa część: żadne z tych działań nie usuwa automatycznej pauzy po ciszy. Ta jest celowa. Zespół pomocy Microsoftu potwierdził to wprost i skierował użytkowników do opcji Prześlij opinię wewnątrz narzędzia do dyktowania, by głosować za zmianą. Dopóki ten głos nie przyniesie efektu, najwięcej, co możesz zrobić, to unikać milknięcia — samej pauzy nie da się wyłączyć. Jeśli to jest dla ciebie dyskwalifikujące, narzędzie z klawiszem „trzymaj i mów” jest jedyną realną ucieczką, o co właśnie chodzi w sekcji powyżej.
Lokalnie czy w chmurze: który tryb naprawdę tego unika
Jeśli powodem, dla którego tu jesteś, jest funkcja, która rezygnuje w momencie, gdy zachwieje się połączenie, odpowiedź skłania się ku lokalnej. Oba lokalne silniki działają w całości na twoim komputerze i nic nie jest nigdzie wysyłane, więc zacięcie sieci nie może zatrzymać ich w środku zdania tak, jak zatrzymuje Win+H. Oto, czym trzy ścieżki, między którymi aplikacja każe ci wybierać, różnią się w tym konkretnym problemie.
Aplikacja każe ci wybrać, więc oto, jak bym o tym myślał, gdy zarzut brzmi „ciągle się zatrzymuje”:
- Local Parakeet — Silnik TDT od NVIDIA, około 600 MB, i najszybsza lokalna opcja — 5 do 10 razy szybsza niż Whisper na procesorze. Obsługuje angielski plus 24 inne języki europejskie, łącznie 25. Bez tłumaczenia na angielski. W pełni offline, więc nie ma połączenia, które mogłoby się zerwać. Jeśli mówisz po angielsku albo w jednym z języków europejskich, to najszybsza droga, by zejść z karuzeli uzgadniania połączenia z chmurą.
- Local Whisper — wolniejszy niż Parakeet na tym samym komputerze, ale wersje wielojęzyczne obsługują 99 języków i potrafią tłumaczyć na angielski. Wersje tylko po angielsku są wyłącznie angielskie, nie obejmują 99 języków. Wybierz to do chińskiego, japońskiego, koreańskiego albo dowolnej pracy z tłumaczeniem, czego Parakeet nie potrafi. Domyślny model angielski to około 480 MB. Również w pełni offline.
- Chmura (OpenAI, BYOK) — najlepsza dokładność i dostęp do sieci, z użyciem twojego własnego klucza OpenAI rozliczanego bezpośrednio przez OpenAI. Transkrypcja działa domyślnie na gpt-4o-mini-transcribe. Potrzebuje internetu — więc, tak jak Win+H, zależy od sieci, a jej zerwanie może ją przerwać. Powierzchnia Chmury jest częścią Whisper Pro.
Nudna prawda jest taka, że przy konkretnej frustracji, która cię tu przywiodła, lokalnie jest faktycznym lekarstwem. Zerwanie połączenia nie może zatrzymać transkrypcji, która nigdy nie dotyka sieci, a klawisz „trzymaj i mów” nie obchodzi, jak długo robisz przerwę. Chmura zasługuje na swoje miejsce, gdy chcesz najwyższej klasy dokładności na trudnym nagraniu albo faktu wyłowionego z sieci w środku zdania. Ale jeśli twój zarzut brzmi „zatrzymuje się, gdy mrugnie moje Wi-Fi”, wybór kolejnej ścieżki zależnej od sieci byłby chybieniem celu. Zacznij od lokalnego.
Czystszy tekst, gdy dyktowanie przestaje się rwać
Gdy dyktowanie naprawdę działa od początku do końca — wbudowane czy inne — trafiasz na kolejną rzeczywistość: surowa mowa wychodzi jako jeden ciąg bez końca. Mówisz „okej więc dokończ prezentację wyślij ją do marii i zarezerwuj jutro godzinę na próbę”, i to jest pozbawiona interpunkcji ściana, jaką wręcza ci każdy silnik mowy. To, jak się ją czyści, różni narzędzia.
Pisanie głosowe w Windows potrafi dodawać interpunkcję, gdy mówisz, w trakcie działania. Przy cięższym porządkowaniu — usuwaniu „yyy”, naprawianiu ciągów bez końca, zamianie wypowiedzianego akapitu w coś, co naprawdę byś wysłał — Whisper potrafi przepuścić tekst przez przebieg AI, zanim wyląduje. Powiedz frazę aktywującą „Hey whisper”, a tekst najpierw zostaje ulepszony. Na lokalnym modelu działa to przez Ollama; w trybie chmury jest to domyślnie gpt-5-mini.
okej więc dokończ prezentację wyślij ją do marii i zarezerwuj jutro godzinę na próbę yyy przed rozmową z klientem
Okej, więc dokończ prezentację, wyślij ją do Marii i zarezerwuj jutro godzinę na próbę przed rozmową z klientem.
Krok porządkowania to część powodu, dla którego dedykowane narzędzie zarabia na siebie czymś więcej niż tylko tym, że się na tobie nie zatrzymuje. Dostajesz nie tylko zapis, który pozostaje włączony przez twoje pauzy; dostajesz tekst, który jest bliższy gotowemu. Jeśli chcesz szerszej wersji tego, ten sam przepływ mów-potem-czyść jest tym, co pozwala ci pisać szybciej głosem w każdej aplikacji, którą otworzysz, a nie tylko w tym jednym oknie, w które akurat trafiło Win+H, zanim zrezygnowało.
A ponieważ wkleja przy kursorze w dowolnym polu i nigdy nie zatrzymuje się samo przy zmianie fokusu, ten sam przepływ utrzymuje się także w karcie przeglądarki — dyktowanie do Google Docs zachowuje się tak samo jak dyktowanie do edytora na pulpicie, nawet gdy klikasz między nimi, a to dokładnie miejsce, w którym Win+H zwykle gubi sesję.
Kiedy wbudowane w zupełności wystarcza

Oto część, w której odradzam ci instalowanie czegokolwiek. Jeśli dyktujesz krótkimi seriami i automatyczne zatrzymanie nigdy ci nie przeszkadza, nie potrzebujesz kolejnej aplikacji. Zdanie czy dwa, zanim wkroczy licznik ciszy, to dokładnie to, do czego stworzono Win+H. Jest darmowe, wbudowane w Windows, a do szybkich odpowiedzi naprawdę w porządku. Nie zamierzam mówić ci, żebyś instalował oprogramowanie po to, by podyktować dwuwierszową wiadomość.
Droga wbudowana jest właściwym wyborem, gdy spełnionych jest kilka rzeczy: dyktujesz głównie krótkie teksty, i tak zawsze jesteś online, nie przeszkadza ci ponowne naciskanie Win+H między polami i nie masz nic przeciwko temu, by twój głos trafiał do chmury Microsoftu, żeby został rozpoznany. Ten ostatni punkt to prawdziwy rozjazd. Pisanie głosowe z założenia przesyła twój dźwięk przez internetową usługę rozpoznawania mowy Microsoftu — w porządku przy liście zakupów, warte zastanowienia przy e-mailu do klienta albo czymkolwiek, co wolałbyś trzymać na własnym komputerze.
Sięgnij po narzędzie offline typu „trzymaj i mów”, gdy zatrzymywanie zaczyna boleć regularnie: dyktujesz długie fragmenty i ciągle trafiasz na pauzę po ciszy, nieustannie przełączasz okna i ciągle tracisz sesję, pracujesz na chwiejnym połączeniu albo wolałbyś, by twój głos nigdy nie opuszczał komputera. Poniżej tej granicy korzystaj z tego, co darmowe — obejścia z wcześniejszej części tego przewodnika są tam właśnie po to, żebyś mógł.
Jeśli problem jest większy niż zatrzymywanie — Win+H nie robi zupełnie nic, nie pojawia się żaden tekst albo wychodzi zły język — szersza lista kontrolna w zamiana mowy na tekst nie działa w Windows obejmuje pozostałe tryby awarii, które nie są ściśle automatycznym zatrzymaniem.
Dalsza lektura
Microsoft zbudował funkcję dyktowania, która uznaje, że skończyłeś, w momencie, w którym przestajesz mówić, by pomyśleć, a potem na własnym forum pomocy potwierdził, że jest to celowe i nie da się tego wyłączyć. Więc mówimy dalej przez każdą pauzę, jakbyśmy byli na rozmowie telefonicznej, której boimy się zerwać, i naciskamy te same dwa klawisze za każdym razem, gdy zerkniemy na inne okno. Przeważnie działa, przy krótkich seriach. Ale przy pierwszym razie, gdy funkcja rezygnuje w środku zdania, bo zaczerpnąłeś oddechu, zaczynasz chcieć takiej, która na ciebie poczeka. Większość tego przewodnika podyktowałem, trzymając jeden klawisz i robiąc przerwy, kiedy tylko miałem ochotę. Ani razu się na mnie nie poddała.
Dyktuj bez automatycznego zatrzymania
Przytrzymaj klawisz skrótu, mów, rób przerwy kiedy potrzebujesz, puść. Transkrypcja ląduje przy twoim kursorze w dowolnej aplikacji — przetworzona lokalnie, bez licznika ciszy i bez połączenia z chmurą, które mogłoby się zerwać.
Darmowy tryb lokalny dla każdego zalogowanego konta. Bez karty na start.



