Poradnik
Pisanie głosem w Wordzie: Win+H, Dyktowanie albo coś lepszego
Dwa wbudowane sposoby na dyktowanie w Wordzie i jedno usprawnienie działające w całym systemie. Gdzie ich szukać, jak je włączyć i gdzie kończą się ich możliwości.
Ostatnia aktualizacja: czerwiec 2026

Pisanie głosem w Wordzie działa od razu na dwa sposoby: naciśnij Win+H, aby otworzyć wpisywanie głosowe Windows w dowolnym polu tekstowym, albo kliknij przycisk Dyktowanie na karcie Narzędzia główne w Wordzie. Oba wymagają połączenia z internetem, żeby transkrybować mowę. Lokalne narzędzie, takie jak Whisper, dokłada dyktowanie offline, które działa w Wordzie i w każdej innej aplikacji.
Raport ze statusem na 700 słów zajął mi w zeszłym miesiącu 19 minut pisania na klawiaturze i niewiele poniżej 5 minut dyktowania w tempie 145 słów na minutę. Ten sam dokument, to samo okno Worda, ten sam autor. Zmieniło się tylko to, czego słuchała najsłynniejsza aplikacja Microsoftu. Word ma uszy od lat; większość ludzi po prostu nigdy nie znalazła dwóch przycisków, które je włączają. (Ja znalazłem je w żenujący sposób — naciskając Win+H, żeby wyciszyć rozmowę.)
Oto problem: użytkownik Worda znajduje jedno z dwóch wbudowanych narzędzi do dyktowania, zakłada, że to jedyne, i ocenia pisanie głosem po tym, na które trafił pierwsze. W tej chwili Windows 11 oferuje wpisywanie głosowe pod Win+H, a Microsoft 365 dokłada Dyktowanie w samym Wordzie — to dwa różne narzędzia o różnych wymaganiach. Ten przewodnik pokazuje, jak włączyć oba w Wordzie, gdzie kończą się możliwości każdego z nich i jak narzędzie działające w całym systemie nadrabia to, czego im brakuje.
Na koniec będziesz mieć pisanie głosem w Wordzie uruchomione w niespełna minutę, a do tego konfigurację offline, jeśli jej potrzebujesz. Większość pytań o dyktowanie, które trafiają na naszą skrzynkę wsparcia, sprowadza się do „którego z nich właściwie używam”. Czytam te maile, więc mogę to powiedzieć z całą powagą.
Word ma dwie ścieżki pisania głosem, nie jedną
Microsoft zbudował obie i dlatego nikt nie potrafi ich od siebie odróżnić. Wpisywanie głosowe Windows jest częścią systemu operacyjnego. Otwiera się skrótem Win+H, unosi się nad dowolną aktywną aplikacją i wpisuje tekst tam, gdzie stoi kursor. Działa w Wordzie tak samo, jak w Notatniku czy w formularzu w przeglądarce. Dyktowanie jest częścią Microsoft 365. Mieszka na karcie Narzędzia główne w Wordzie, istnieje wyłącznie w aplikacjach Office i wymaga aktywnej subskrypcji Microsoft 365.
Nudna prawda: przy zwykłym dyktowaniu akapitów w Wordzie dają niemal identyczne wyniki, bo oba przesyłają dźwięk przez usługi mowy online Microsoftu. Liczą się natomiast zasięg i wymagania. Win+H jest częścią Windowsa i towarzyszy ci w każdej aplikacji. Dyktowanie jest przypisane do twojego planu Microsoft 365 i zna sztuczki specyficzne dla Worda, jak komendy formatowania. Jeśli masz subskrypcję Microsoft 365 i całymi dniami siedzisz w Wordzie, zacznij od Dyktowania. Jeśli piszesz w Wordzie, Outlooku, Slacku i przeglądarce, zacznij od Win+H. Żadne z nich nie kosztuje nic ponad to, co już masz.
Win+H: pisanie głosem, które mieszka w Windowsie, a nie w Wordzie
Czego potrzebujesz przed krokiem 1: komputera z Windows 11 (Windows 10 ma na tym samym skrócie starszy pasek dyktowania), działającego mikrofonu i połączenia z internetem, bo wpisywanie głosowe Windows transkrybuje przez rozpoznawanie mowy online Microsoftu. Brak połączenia oznacza brak wpisywania. Cała konfiguracja zajmuje mniej niż minutę.
1. Otwórz dokument i kliknij tam, gdzie ma trafić tekst
Pisanie głosem potrzebuje kursora w polu tekstowym; jeśli nic nie jest aktywne, pigułka się otwiera, ale nic się nie wpisuje.
Sprawdź: kursor miga wewnątrz strony Worda.
2. Naciśnij Win+H
Pigułka wpisywania głosowego pojawia się przy górnej lub dolnej krawędzi ekranu.
Sprawdź: zanim zaczniesz mówić, pokazuje „Słucham…”.
3. Mów całymi frazami, nie pojedynczymi słowami
Pełne zdania wychodzą czyściej niż dyktowanie słowo po słowie.
4. Włącz automatyczną interpunkcję
Kliknij kółko zębate na pigułce i włącz automatyczną interpunkcję albo dyktuj ją na głos: „kropka”, „przecinek”, „znak zapytania”.
Sprawdź: zakończenie zdania i pauza stawiają kropkę, choć jej nie wypowiadasz.
5. Zatrzymaj głosem albo tym samym skrótem
Powiedz „przestań słuchać” albo naciśnij ponownie Win+H.
Win+H przyjmuje też komendy edycyjne: „usuń to”, „zaznacz to”, „naciśnij Enter”. Działają — z cierpliwością kogoś, kto negocjuje odrobienie lekcji: pewne trafienia przy prostych poleceniach, sporadyczne niespodzianki przy złożonych. Przy dłuższych poprawkach klawiatura i mysz pozostają niepokonane. Jeśli pigułka się otwiera, ale nic się nie dzieje, nasze rozwiązania, gdy Win+H nie działa obejmują najczęstszych podejrzanych, a dokumentacja wpisywania głosowego Microsoftu wymienia każdą komendę i ponad 40 obsługiwanych języków.
Jeszcze jeden niuans: na komputerach Copilot+ funkcja zwana płynnym dyktowaniem poprawia gramatykę i pisownię w trakcie mówienia, a w polach hasła sama się wyłącza.
Przycisk Dyktowanie, w skrócie
Dyktowanie to przycisk mikrofonu na karcie Narzędzia główne w Wordzie. Kliknij go, poczekaj, aż pokaże, że słucha, i mów. Wymaga subskrypcji Microsoft 365, mikrofonu i stabilnego połączenia z internetem, a działa w Wordzie dla Windows, Maca, w wersji webowej i mobilnej. Na Macu przełączasz je skrótem Option+F1. Jeśli całymi dniami piszesz w Wordzie na Macu, Dyktowanie plus ten jeden skrót mogą być całym pisaniem głosem, jakiego potrzebujesz.
Jego przewagą nad Win+H jest znajomość Worda. Automatyczna interpunkcja jest dostępna w większości obsługiwanych języków (przełącznik w ustawieniach), a narzędzie rozumie komendy formatowania: „pogrub to”, „utwórz listę punktowaną”, „usuń ostatnie słowo”. Jego słabością jest zasięg. W chwili, gdy opuszczasz Office, Dyktowanie zostaje w tyle. Tę część celowo trzymam krótką. Mamy pełny przewodnik po wbudowanej funkcji Dyktowanie w Wordzie omawiający każdą komendę, język i ustawienie, a dokumentacja Dyktowania Microsoftu jest źródłem rozstrzygającym. Jeśli Dyktowanie jest wyszarzone albo go nie ma, przewodnik rozwiązywania problemów z dyktowaniem w Wordzie przeprowadzi cię przez poprawki.
Gdzie oba wbudowane narzędzia trafiają na ścianę
W praktyce pojawiają się trzy ograniczenia, uszeregowane według tego, jak często dają się we znaki.
Po pierwsze, żadne nie działa offline. Win+H transkrybuje przez usługi online Microsoftu; Dyktowanie wprost wymaga stabilnego połączenia z internetem. W pociągu, w samolocie, na hotelowym Wi-Fi, które zrywa co 40 sekund, oba milkną. Między nami: dyktowanie, które nie potrafi działać offline, to także decyzja o prywatności, którą ktoś podjął za ciebie. Mail do szkoły twojego dziecka, ocena podwyżki, projekt umowy — wszystko to przechodzi przez serwery dostawcy, bo chciałeś pisać głosem. Lokalna transkrypcja nie wysyła niczego nigdzie, a przy niektórych dokumentach to nie kwestia preferencji, tylko wymóg.
Po drugie, różnią się limity językowe. Win+H obsługuje ponad 40 języków. Dyktowanie w pełni obsługuje około 15 języków i wariantów regionalnych, a kolejne mniej więcej 25 jest w wersji zapoznawczej, z niższą dokładnością. Dyktowanie po ukraińsku albo mieszanie języków w trakcie dokumentu szybko robi się nierówne.
Po trzecie, zasięg. Dyktowanie kończy się na granicach Office. Win+H działa wszędzie, ale pozostaje funkcją Windowsa; nie ma jego odpowiednika na Macu. I nigdy nie znalazłem miejsca, w którym mógłbym nauczyć któreś z tych narzędzi nazw projektów, nazwisk klientów czy branżowego żargonu, którego używam na co dzień — „Remskill” trafia jako „rem skill”, ile razy bym tego nie poprawiał.
Jeden skrót, który pisze w Wordzie i wszędzie indziej
Pod koniec lat 90. ktoś z mojej rodziny uruchomił Dragon NaturallySpeaking na pececie z Windows 98 i 64 MB RAM-u. Trening zajmował 45 minut czytania tekstu kalibracyjnego, dyktowanie pełzło z 4-sekundowym opóźnieniem na zdanie, a jeden akapit świątecznego listu zajmował 15 minut. Słuchawki poleciały przez pokój. Słuchawki przeżyły; eksperyment nie. Schowałem pisanie głosem do szuflady z napisem „pomysły, których czas jeszcze nie nadszedł” i nie zaglądałem do tego pliku przez dwadzieścia lat. Ta część to ponownie otwarty plik.
Whisper to aplikacja na komputer, która kładzie jeden skrót na całym systemie. Naciśnij Ctrl+Space w Wordzie (albo wszędzie indziej, gdzie można pisać), mów, puść klawisz, a tekst ląduje przy twoim kursorze. Ten sam klawisz działa w Outlooku, Slacku, przeglądarce, edytorze kodu. Nie ma paska narzędzi do szukania ani funkcji do włączania w każdej aplikacji osobno — to strukturalna różnica wobec obu wbudowanych narzędzi.
Konfiguracja zajmuje około dziesięciu minut, z czego większość to pobieranie:
1. Zainstaluj aplikację
Działa na Windows 10 lub nowszym i macOS 11 lub nowszym, a waży około 25 MB.
Sprawdź: okno Whisper otwiera się na Ustawieniach.
2. Zaloguj się
Lokalny mechanizm — modele, historia, ustawienia wstępne, skrót — potrzebuje wyłącznie konta.
3. Wybierz lokalny model i pobierz go
Domyślnie jest to wielojęzyczny Small o rozmiarze ~480 MB. Parakeet v3 (~600 MB) działa 5–10× szybciej na procesorze i obejmuje angielski oraz 24 języki europejskie; jego szczegóły znajdziesz na karcie modelu NVIDIA Parakeet. Rodzina modeli Whisper sięga aż do Large v3 (~3 GB) i w wariantach wielojęzycznych obejmuje ponad 90 języków (wersje wyłącznie angielskie są dokładnie tym, na co wskazuje nazwa).
Sprawdź: model pokazuje się w Ustawieniach jako pobrany.
4. Ustaw kursor w Wordzie, przytrzymaj Ctrl+Space, mów, puść
Transkrypcja wkleja się tam, gdzie stoi kursor.
Sprawdź: twoje słowa są w dokumencie, razem z interpunkcją.
Po pobraniu modelu transkrypcja odbywa się na twoim urządzeniu, bez żadnej aktywności sieciowej; to samo dyktowanie działa na wysokości 11 000 metrów z wyłączonym Wi-Fi. Dokładność w trybie lokalnym zwykle mieści się między 95% a 99%, zależnie od rozmiaru modelu, a własny słownik uczy go nazw, które wbudowane narzędzia uparcie przekręcają. Jest też tryb chmurowy, w którym podajesz własny klucz OpenAI do najnowszych modeli transkrypcji, ale przy dyktowaniu w Wordzie to z trybu lokalnego korzystam. Tę część wdyktowałem do szkicu, gdy czajnik negocjował z torebką herbaty; sekcja wymagała dwóch poprawek, herbata żadnej.
Kiedy wbudowane narzędzia wystarczają

Jeśli dyktujesz akapit na tydzień, przy biurku z dobrym internetem, wyłącznie w Wordzie i w jednym z ~15 języków, które Dyktowanie obsługuje w pełni, odpuść Whispera. Dyktowanie jest już w twoim planie Microsoft 365 i robi tę robotę dobrze. To samo dotyczy Win+H, jeśli twoje dyktowanie nigdy nie opuszcza Windowsa, a ponad 40 obsługiwanych języków pokrywa twój: jest o jeden skrót dalej i nie kosztuje nic dodatkowo. Zewnętrzne pisanie głosem zasługuje na swoje miejsce, gdy dyktujesz codziennie, pracujesz offline, potrzebujesz własnego słownika albo chcesz jednego narzędzia w każdej aplikacji — wcześniej nie.
Dwadzieścia pięć lat dzieli rzucone w kąt słuchawki Dragona od dokumentu Worda, który pisze się sam, gdy ty robisz herbatę. Narzędzia nadrobiły dystans. Pozostaje wybrać, który słuchacz pasuje do twojego tygodnia. Naciśnij dziś Win+H i wdyktuj jeden prawdziwy akapit — aktualizację statusu, odpowiedź, którą odkładasz. Jeśli się sprawdzi, masz nowe domyślne narzędzie. Jeśli trafisz na ścianę offline albo na limit słownika, wiesz, gdzie czeka usprawnienie.
Wypróbuj ten sam akapit z jednym skrótem
Pobierz Whispera, przytrzymaj Ctrl+Space w Wordzie i patrz, jak transkrypcja ląduje przy twoim kursorze.
Działa na Windows 10 lub nowszym i macOS 11 lub nowszym. Tryb lokalny działa offline.



