Rozwiązywanie problemów
„Speech recognition could not start”: 6 rozwiązań dla Windows
Ten błąd pochodzi ze starszego mechanizmu Windows Speech Recognition — zwykle winny jest mikrofon niedostępny dla systemu, niezgodność języka albo zatrzymana usługa audio. Sposób naprawy zależy od tego, czy komunikat pojawia się raz czy przy każdym uruchomieniu.
Ostatnia aktualizacja: czerwiec 2026

„Speech recognition could not start” to błąd starszego mechanizmu Windows Speech Recognition — zazwyczaj spowodowany mikrofonem niedostępnym dla systemu, niezgodnością języka rozpoznawania z językiem wyświetlania Windows lub zatrzymaną usługą audio. Sposób naprawy zależy od tego, czy błąd pojawia się jednorazowo przy uruchomieniu, czy przy każdym starcie systemu.
Pamiętam, jak kuzyn zmagał się z Dragon NaturallySpeaking na komputerze z Windows 98 i 64 MB RAM. Trening trwał 45 minut — trzeba było czytać listę słów, żeby „skalibrować” program — a potem dyktowanie działało z dokładnością może 70% i cztery sekundy za każdym zdaniem. Słuchawki poleciały przez pokój. Słuchawki przeżyły. Eksperyment z dyktowaniem — nie.
Dwaścieś pięć lat później Windows nadal dostarcza funkcję mowy, która potrafi wyłożyć się na starcie, wyrzucając jeden suchy komunikat bez żadnego wyjaśnienia. Zanim poświęcisz temu godzinę, warto wiedzieć jedno: okno dialogowe pochodzi z Windows Speech Recognition (WSR) — starej funkcji z Panelu sterowania / Ułatwień dostępu, a nie z dyktowania Win+H ani z Voice Access. W Windows 11 w wersji 22H2 i nowszych Microsoft we wrześniu 2024 roku zastąpił WSR przez Voice Access; WSR nadal działa na starszych wersjach systemu. Część rozwiązania polega więc na zastanowieniu się, czy w ogóle potrzebujesz tego, co się psuje. Większość napraw zajmuje mniej niż pięć minut.
Co tak naprawdę oznacza błąd „could not start”

Ten błąd występuje w dwóch wariantach, z różnymi rozwiązaniami. Odrożnienie ich oszczędza najwięcej czasu.
Wariant pierwszy: komunikat pojawia się raz, gdy uruchamiasz Speech Recognition. Otworzyłeś go świadomie i okno dialogowe zatrzymało cię w progu. Najczęstsza przyczyna to mikrofon, język rozpoznawania lub zatrzymana usługa audio. Rozwiązania poniżej, w kolejności.
Wariant drugi: komunikat nęka cię przy każdym uruchomieniu systemu. Nikt cię o to nie prosił. Windows próbuje automatycznie uruchomić WSR przy każdym logowaniu, ponosi porażkę i wyrzuca okno dialogowe, zanim zdążysz otworzyć przeglądarkę. Ta grupa użytkowników nie chce, żeby Speech Recognition działał — chce, żeby przestat pytać. Inne rozwiązanie: wyłącz „Uruchamiaj Speech Recognition przy starcie”. Przejdź dalej.
Za tym jednym suchym komunikatem kryje się krótka lista najczęstszych winowajców, mniej więcej w kolejności, w jakiej warto je sprawdzać: wyciszony lub nieomyślny mikrofon, brak uprawnień aplikacji, niezgodność języka rozpoznawania, zatrzymana usługa audio, uszkodzone pliki systemowe.
Sprawdź mikrofon, którego faktycznie używa Windows

Mikrofon to najczęstsza przyczyna, więc zacznij tutaj. Speech Recognition nie uruchomi sesji, gdy nie ma nic do słuchania.
Najpierw uprawnienia. Przejdź do Start > Ustawienia > Prywatność i zabezpieczenia > Mikrofon i upewnij się, że zarówno „Dostęp do mikrofonu”, jak i „Zezwalaj aplikacjom na dostęp do mikrofonu” są włączone. Aktualizacja Windows może te opcje wyłączyć bez żadnego powiadomienia (u mnie zdarzyło się to dwa razy po tej samej aktualizacji zbiorczej).
Następnie samo urządzenie. Przejdź do Start > Ustawienia > System > Dźwięk > Wejście, wybierz swój mikrofon i kliknij „Rozpocznij test” — mów i obserwuj, czy pasek się porusza. Jeśli się nie rusza, Windows cię nie słyszy i nic w Speech Recognition nie pomoże, dopóki to się nie zmieni.
Starsza metoda też działa: otwórz klasyczny aplet Dźwięk, karta Nagrywanie, kliknij prawym przyciskiem mikrofon i wybierz „Ustaw jako urządzenie domyślne”. Jeśli słuchawki zostały odłączone i wbudowany mikrofon nie jest domyślny, to naprawa na dwa kliknięcia. Jeśli mikrofon w ogóle nie jest widoczny, sprawdź dlaczego Windows nie wykrywa mikrofonu do dyktowania.
Dopasuj język mowy do języka Windows

To najciszej brzmiąca przyczyna i najszybsza do naprawienia. WSR działa tylko wtedy, gdy język rozpoznawania zgadza się z językiem wyświetlania Windows. Zmień jeden, a nie drugi — i program odmówi uruchomienia.
Zdarza się częściej, niż myślisz. Zmieniasz język wyświetlania, żeby coś przetestować, albo zmiana regionu ciągnie za sobą nowy układ klawiatury, i silnik mowy ląduje ustawiony na język, którego system już nie używa. Silnik i system operacyjny nie zgadzają się co do tego, czym mówisz — silnik odmawia otwarcia.
Otwórz Panel sterowania > Speech Recognition (na starszych wersjach: Ułatwienia dostępu > Speech Recognition) i upewnij się, że język rozpoznawania odpowiada językowi ustawionemu w Windows. Wskazówki konfiguracyjne Microsoftu dotyczące rozpoznawania głosu zawierają listę obsługiwanych języków; w skrócie: oba ustawienia muszą być zgodne. Przy okazji sprawdź Ustawienia > Prywatność i zabezpieczenia > Mowa i włącz internetowe rozpoznawanie mowy, jeśli z niego korzystasz.
Uruchom ponownie usługi audio i mowy

WSR opiera się na kilku usługach audio Windows. Jeśli jedna z nich przestała działać, silnik mowy nie może uzyskać czystej Şcieżki audio i zatrzymuje się przy starcie. Ponowne uruchomienie tych usług jest bezpieczne i zajmuje około 30 sekund.
Naciśnij Win+R, wpisz services.msc, naciśnij Enter. Uruchom ponownie te trzy: Windows Audio, Windows Audio Endpoint Builder oraz Human Interface Device Service — kliknij każdą prawym przyciskiem i wybierz Uruchom ponownie (lub Uruchom, jeśli jest zatrzymana). Przy mikrofonie Bluetooth uruchom też Bluetooth Support Service i Bluetooth Audio Gateway Service; audio Bluetooth ma własny zwyczaj milczenia.
żeby być precyzyjnym: to krok wypróbowany przez społeczność, a nie oficjalna wskazówka Microsoftu dla tego konkretnego błędu. Jednak ponowne uruchomienie Windows Audio jest bezpieczne i powszechnie zalecane — i rozwiązuje zaskakującą liczbę problemów „po prostu się nie uruchamia”. Dlatego zasługuje na miejsce przed cięższymi narzędziami. Jeśli pasek testu dźwięku się poruszył, ale Speech Recognition nadal się nie otwiera, zatrzymana usługa jest prawdopodobnym winowajcą.
Gdy komunikat nęka cię przy każdym uruchomieniu: wyłącz go
Jeśli błąd wita cię przy każdym logowaniu, cel się zmienia. Nie chodzi o to, żeby Speech Recognition działał. Chodzi o to, żeby przestał próbować.
WSR ma opcję „Uruchamiaj Speech Recognition przy starcie”. Gdy jest włączona, Windows próbuje uruchomić starszą funkcję przy każdym rozruchu — a w systemie, gdzie coś pod spodem jest zepsute, ta próba kończy się niepowodzeniem i wyrzuca okno dialogowe, zanim cokolwiek zdążysz zrobić. Wyłącz to ustawienie, a monit przestanie się pojawiać. (Mój teść żył z tym oknem przez rok, bo zakładał, że jest ono niezbędne. Nie było.)
Otwórz Panel sterowania > Speech Recognition (lub Ułatwienia dostępu > Speech Recognition na starszych wersjach), znajdź opcję uruchamiania przy starcie i odznacz ją. Nazwy opcji różnią się między wersjami, więc jeśli nie ma jej na głównym ekranie, sprawdź zaawansowane opcje mowy. Niektórzy użytkownicy podają, że prawdziwym wyzwalaczem jest ctfmon.exe — komponent Text Services — który przestał automatycznie się uruchamiać; przywrócenie go do autostartu rozwiązało problem. To środek zaradczy społeczności, nie oficjalna poprawka Microsoftu — traktuj go jako krok „sprobój, jeśli wyłączenie autostartu nie pomógło”.
Kryje się tu uczciwe pytanie: jeśli starsza funkcja pojawia się tylko po to, żeby poinformować cię o swojej porażce, czy w ogóle chcesz, żeby działała? Na 22H2 i nowszych to nawet nie jest aktualna funkcja głosowa. Więcej o tym poniżej.
Głębsza naprawa: SFC, DISM i profil mowy

Jeśli mikrofon działa poprawnie, języki się zgadzają, a usługi działają, przyczyna leży prawdopodobnie głębiej — uszkodzone pliki systemowe lub uszkodzony profil mowy. Tu wchodzą oficjalne narzędzia naprawcze Microsoftu.
Otwórz wiersz poleceń z podwyższonymi uprawnieniami (kliknij prawym przyciskiem, „Uruchom jako administrator”). Uruchom najpierw DISM, a potem SFC — kolejność ma znaczenie, bo DISM dostarcza czystych plików, których SFC używa do łatania. Wpisz DISM.exe /Online /Cleanup-image /Restorehealth, poczekaj na komunikat „Operacja zakończona pomyślnie”, a następnie uruchom sfc /scannow. SFC skanuje chronione pliki systemowe i zastępuje uszkodzone ich kopią z pamięci podręcznej. Microsoft opisuje tę sekwencję w swoim przewodniku po System File Checker. Uruchom ponownie komputer po zakończeniu. (Za pierwszym razem trzy razy uruchomiłem samego SFC, zanim przeczytałem, że DISM musi być pierwszy. Dokumentacja miała rację. Ja zwykle nie.)
Nadal nic? Ponowne uruchomienie kreatora Speech Recognition to niskie ryzyko i dobry sposób na odbudowanie profilu rozpoznawania, który popsuł się po aktualizacji. Niektóre poradniki sugerują stworzenie nowego profilu i usunięcie starego — to rada społeczności bez oficjalnej strony Microsoftu w tle, więc zachowaj ją jako ostateczność. Jeśli dyktowanie jest zepsute szerzej niż tylko to jedno okno dialogowe — Win+H nic nie robi, tekst się nie pojawia — ogólny przewodnik rozwiązywania problemów z Windows Speech Recognition omawia więcej przypadków.
Kiedy przestać walczyć z Windows Speech Recognition
To jest ta część, której większość poradników nie powie wprost. Możesz spędzić popołudnie, próbując ożywić funkcję, którą Microsoft już porzucił. W Windows 11 22H2 i nowszych Voice Access zastąpił Windows Speech Recognition we wrześniu 2024 roku; WSR żyje tylko na starszych wersjach. Na aktualnym Windows 11 w ogóle nie naprawiasz WSR — używasz Voice Access albo naciskasz Win+H do dyktowania w dowolnym polu tekstowym, co jest inną, obsługiwaną funkcją. Przewodnik po dyktowaniu Win+H opisuje tę ścieżkę. Jedno zastrzeżenie przed przejściem: Voice Access wystartował po angielsku i od tamtej pory dodał kilka języków — sprawdź, czy twój jest wśród nich.
I oto moja jedyna opinia: jeśli twoje narzędzie do dyktowania wymaga, żeByś je najpierw „trenił”, to jest rok 1999. Ta 45-minutowa kalibracja Dragon miała sens, gdy moc obliczeniowa była rzadkością. W 2026 roku to błąd UX. Funkcja mowy, która zamiast po prostu słuchać wyrzuca enigmatyczny „could not start”, to ten sam błąd w nowszym oknie dialogowym. Dla niektórych to właśnie powód, żeby przestać walczyć z tym błędem — funkcja nie jest warta popołudnia.
Jeśli wolisz po prostu mówić do komputera, niektóre rozwiązania nie przechodzą przez usługę WSR wcale. Whisper by Remskill jej nie dotyka. Działa na własnym silniku, lokalnie, na twoim komputerze — więc cała klasa błędów „could not start” po prostu nie ma zastosowania. Nie ma sesji WSR do uruchomienia i zaliczenia porażki.
Na Windows domyślny skrót to Ctrl+Space — przytrzymaj, mów, puść, a tekst pojawia się w miejscu kursora w dowolnej aplikacji. Jeden dedykowany skrót, nie funkcja systemu operacyjnego, która musi się uruchomić i może tego nie zrobić. Transkrybuje ponad 90 języków lokalnie, co omija blokadę języka wyświetlania, na której potyka się WSR. Tryb lokalny jest bezpłatny po zalogowaniu — bez karty. To nie naprawia Windows Speech Recognition — ale jeśli trafiłeś tu dlatego, że Windows powiedział nie, to ścieżka bez linii startowej, na której można się przewrócić.
Słuchawki kuzyna przeżyły lot przez pokój ćwierć wieku temu — to więcej niż udało się eksperymentowi z dyktowaniem. Dobra wiadomość: nie musisz już nic rzucać. Jeśli starsza funkcja nie chce startować, a Microsoft ją już emeryturował, możesz ją spokojnie odpuścić.
Wolisz po prostu mówić do komputera?
Pobierz Whisper, przytrzymaj Ctrl+Space i patrz, jak transkrypcja pojawia się w miejscu kursora — bez sesji WSR, bez linii startowej, na której można się potknąć.



