Poradnik
Mowa na tekst dla uczących się angielskiego
Jeśli angielski nie jest Twoim pierwszym językiem, możesz pisać w nim mówiąc. Naciśnij skrót klawiszowy, powiedz co chcesz, a czysty angielski tekst pojawi się przy kursorze w dowolnej aplikacji. Przebieg AI porządkuje gramatykę i wypełniacze. To narzędzie do pisania, nie korepetytor wymowy.
Ostatnia aktualizacja: czerwiec 2026

Mowa na tekst dla uczących się angielskiego pozwala osobom, dla których angielski nie jest pierwszym językiem, pisać po angielsku mówiąc zamiast pisać na klawiaturze. Narzędzie takie jak Whisper transkrybuje mówiony angielski przy kursorze w dowolnej aplikacji, a przebieg AI porządkuje gramatykę i wypełniacze. Rozpoznawanie akcentu jest dobre, ale nie idealne — to pomocnik do pisania, nie nauczyciel wymowy.
Angielski to mój trzeci język. Nauczyłem się go po ukraińskim i rosyjskim, głównie z dokumentacji technicznej i raportów o błędach — co brzmi dokładnie tak romantycznie, jak w rzeczywistości wygląda. Przez lata najwolniejszą częścią pisania po angielsku nie było myślenie. Było to pisanie na klawiaturze — szukanie właściwego słowa, gdy palce nie nadążały, powątpiewanie w pisownię, gubienie zdania, które miałem w głowie, gdzieś między klawiaturą a ekranem.
Mówienie jest szybsze niż pisanie w każdym języku — także w tym, którego się jeszcze uczysz. Mowa na tekst zamyka tę lukę: wypowiadasz angielskie zdanie, które potrafisz już powiedzieć na głos, a narzędzie zapisuje je za Ciebie. Haczyk, o którym nikt nie mówi, jest taki, że narzędzie słyszy Twój akcent, nie Twoją ocenę. Dziś faktycznie dobrze radzi sobie z akcentami. Ale nie jest nauczycielem — i będę z Tobą szczery w obu kwestiach.
Oto prosta wersja. Nowoczesna mowa na tekst działa na rodzinie modeli Whisper, wytrenowanych na ogromnym zbiorze prawdziwego audio z wieloma akcentami. Oznacza to, że osoba mówiąca po angielsku z obcym akcentem może dyktować i w większości przypadków uzyskać użyteczny tekst — nie idealny, ale solidny szkic do dalszej korekty.
Pytanie dla osoby uczącej się angielskiego nie brzmi więc "czy mnie rozumie". Zazwyczaj tak. Prawdziwe pytania to: który model najlepiej radzi sobie z akcentami i wieloma językami, czy uruchamiać go lokalnie czy w chmurze, i jak używać funkcji porządkowania AI, by mówiony szkic stał się czystym napisanym angielskim. Omówię to wszystko, pokażę jak skonfigurować w dwie minuty i powiem Ci, kiedy narzędzie do dyktowania nie jest właściwym rozwiązaniem.
Dlaczego pisanie po angielsku głosem pomaga, gdy to nie jest Twój pierwszy język

Najtrudniejsza część pisania w drugim języku rzadko polega na braku pomysłów. Chodzi o tarcie między myślą a stroną. Wiesz, co chcesz powiedzieć. Możesz to powiedzieć na głos. Ale pisanie na klawiaturze oznacza walkę z pisownią, szyk wyrazów i układ klawiatury — a zdanie, które miałeś w głowie, po cichu wyparowuje. Mówienie omija większość tej walki.
Dyktowanie pozwala osiągnąć około 145 słów na minutę, podczas gdy pisanie na klawiaturze — zaledwie 40. Dla rodzimego użytkownika to miłe przyspieszenie. Dla kogoś piszącego w drugim lub trzecim języku różnica jest jeszcze większa, bo samo pisanie w nienatywnym języku jest wolniejsze i bardziej podatne na błędy. Zaoszczędzoną energię możesz przeznaczyć na to, co ważne — powiedzenie tego dobrze — zamiast na mechanikę.
Jest też mniej oczywista korzyść. Kiedy wypowiadasz zdanie i widzisz je zapisane, od razu sprawdzasz, czy naprawdę ma sens. Niezgrabna fraza wygląda niezgrabnie na ekranie w sposób, w jaki nie zawsze brzmi niezgrabnie w głowie. Ta pętla informacji zwrotnej przydaje się uczącemu — tak samo jak pomaga studentowi zamieniającemu wykład w notatki. Samo narzędzie nie poprawi Twojej gramatyki — to robi przebieg AI, omówiony dwie sekcje dalej — ale widzenie własnych słów na stronie to mała lekcja sama w sobie.
Naciśnij skrót, powiedz zdanie, tekst pojawia się przy kursorze
Zasada działania jest prosta, co stanowi cały urok. Naciskasz skrót klawiszowy, mówisz, zwalniasz — a transkrypcja wkleja się przy kursorze w aktywnym polu tekstowym. Whisper zatrzymuje krótki ogon po zwolnieniu klawisza, żeby ostatnie słowo nie zostało ucięte — przydatne, gdy wciąż szukasz końca angielskiego zdania. Ponieważ wkleja przy kursorze systemu operacyjnego, działa tak samo w Twoim mailu, Google Doc, oknie czatu czy zadaniu domowym.
Nie trzeba nic konfigurować per aplikacja. Żadnego rozszerzenia do przeglądarki, wtyczki ani tokenu do wklejenia. Kursor jest w polu, mówisz — słowa się pojawiają. Podczas mówienia wyświetla się mała kapsuła, żebyś wiedział, że aplikacja słucha:
Skrót klawiszowy warto ustawić raz i zapomnieć. Na Windows to Ctrl+Space; na Macu to Command+Option — przycisk push-to-talk przytrzymywany podczas mówienia. Oba można zmienić w Ustawieniach, jeśli kolidują z innymi skrótami. Jeśli kiedykolwiek konfigurowałeś pisanie głosem w Google Docs, to ten sam pomysł — tyle że nie jest zamknięty w jednej aplikacji. Ten sam klawisz wypełnia każde pole na Twoim ekranie.
Konfiguracja w dwie minuty (Windows lub Mac)
Potrzebujesz Maca z Apple Silicon lub komputera z Windows 10 lub nowszym, działającego mikrofonu i dowolnej aplikacji, do której chcesz pisać. Cały lokalny potok jest bezpłatny dla każdego zalogowanego konta — bez podawania danych karty przy rejestracji. Oto kolejność kroków.
Krok 1 — Zainstaluj Whisper i zaloguj się.
Pobierz ze strony pobierania, zainstaluj i utwórz bezpłatne konto. Bez karty. Cały lokalny potok transkrypcji jest od razu dostępny.
Wiedz, że działa, gdy ikona aplikacji pojawi się w zasobniku systemowym i kreator konfiguracji zaproponuje wybór modelu.
Krok 2 — Wybierz ścieżkę transkrypcji.
Aplikacja nie wybiera za Ciebie. Masz trzy opcje: Chmura (OpenAI, własny klucz), lokalny Parakeet lub lokalny Whisper. Dla tolerancji akcentu i tłumaczenia najbardziej liczy się wielojęzyczny model Whisper — więcej na ten temat w następnej sekcji.
Wiedz, że działa, gdy model skończy się pobierać i zostanie oznaczony jako gotowy.
Krok 3 — Potwierdź swój skrót klawiszowy.
Windows domyślnie używa Ctrl+Space, Mac — Command+Option przytrzymywanego jako push-to-talk. Na Macu przyznaj uprawnienie Dostępu ułatwień, gdy zostaniesz poproszony; bez niego wklejanie przy kursorze nie dotrze do innych aplikacji.
Wiedz, że działa, gdy nagranie testowe wklei się w dowolnym polu tekstowym.
Krok 4 — Ustaw kursor w polu tekstowym i mów.
Otwórz maila, dokument lub czat, kliknij w pole, przytrzymaj skrót, powiedz zdanie po angielsku, zwolnij. Transkrypcja pojawia się tam, gdzie jest kursor.
Wiedz, że działa, gdy powiedziane po angielsku zdanie pojawi się w polu jako tekst.
Wolną częścią jest pobieranie modelu, nie sama konfiguracja. Reszta to cztery powyższe kroki. Gdy aplikacja już działa, pisanie angielskiego maila przestaje być zadaniem pisania na klawiaturze, a staje się zadaniem mówienia — co jest szczególnie ważne, gdy angielski to właśnie ta część, którą wciąż ćwiczysz.
Jak dobrze radzi sobie z akcentami i sztuczka z 99 językami
Powiem wprost o akcentach, bo tu liczy się uczciwa odpowiedź. Modele Whisper były trenowane na szerokim zakresie prawdziwego audio, w tym na dużej ilości nienatywnego angielskiego. W praktyce oznacza to, że silny, ale nienatywny akcent jest zazwyczaj transkrybowany poprawnie. Zazwyczaj. Mocniejsze akcenty, szybka mowa, hałas w tle albo imię własne i termin techniczny w jednym zdaniu — te kombinacje wciąż mogą sprawić kłopot. Narzędzie jest dobre. Nie jest magiczne, a ktokolwiek twierdzi, że rozpoznaje każdy akcent bezbłędnie, sprzedaje Ci demo, nie środę w biurze.
Dwie praktyczne dźwignie przesuwają igłę bardziej niż wybór modelu. Po pierwsze mikrofon — USB mic za 100 zł robi więcej dla dokładności niż jakikolwiek upgrade modelu, koniec. Mówienie wyraźnie i odrobinę wolniej też pomaga, co nie jest żadnym poświęceniem, skoro i tak ćwiczysz angielski. Po drugie rodzina modeli. Wielojęzyczne wersje Whisper obsługują 99 języków i lepiej radzą sobie z akcentowanym angielskim niż wersje tylko dla angielskiego, bo słyszały znacznie więcej świata. Lokalny Parakeet obsługuje angielski plus 24 inne języki europejskie — 25 łącznie — i jest najszybszą lokalną opcją, ale nie tłumaczy. Wersje .en działają wyłącznie po angielsku i nie mają tłumaczenia.
Ten ostatni punkt otwiera naprawdę przydatną sztuczkę dla uczących się. Wielojęzyczne modele Whisper mogą tłumaczyć na angielski w trakcie transkrypcji. Kiedy angielskie zdanie nie chce wyjść — słowo masz na końcu języka w pierwszym języku, ale po angielsku ucieka — możesz powiedzieć je w swoim języku ojczystym i dostać angielski szkic. To nie jest dopracowane tłumaczenie i nie wysłałbym go bez poprawek, ale jako sposób na szkicowanie w języku, który znasz najlepiej, a potem szlifowanie po angielsku — usuwa prawdziwą barierę. Mów w języku, w którym myślisz; poprawiaj w języku, którego się uczysz.
Lokalnie czy w chmurze: który tryb pasuje dla uczącego się języka
Dla większości pisania angielskiego — maile, zadania domowe, wiadomości, pierwszy szkic eseju — tryb lokalny w zupełności wystarczy i jest bezpłatny oraz offline. Chmura ma sens, gdy zależy Ci na najwyższej dokładności przy trudnym nagraniu lub musisz coś sprawdzić w środku zdania. Oto czym różnią się trzy ścieżki, bo aplikacja wymaga wyboru — wolę, żebyś wybrał dobrze.
Różnica sprowadza się do prędkości, zakresu językowego i tego, gdzie trafia Twój głos.
- Lokalny Parakeet — Silnik TDT firmy NVIDIA, około 600 MB, najszybsza lokalna opcja — 5 do 10 razy szybsza niż Whisper na CPU. Obsługuje angielski plus 24 inne języki europejskie, 25 łącznie. Bez tłumaczenia na angielski. Jeśli Twój pierwszy język jest europejski i piszesz po angielsku, to szybki, w pełni offline wybór.
- Lokalny Whisper — wolniejszy niż Parakeet na tym samym sprzęcie, ale wielojęzyczne wersje obsługują 99 języków, lepiej radzą sobie z akcentami i mogą tłumaczyć na angielski. Wybierz ten tryb dla chińskiego, japońskiego, koreańskiego, arabskiego lub każdego języka, którego Parakeet nie obsługuje, oraz dla sztuczki z pisaniem w swoim języku. Domyślny model angielski waży około 480 MB.
- Chmura (OpenAI, BYOK) — najwyższa dokładność i dostęp do internetu, z użyciem własnego klucza OpenAI rozliczanego bezpośrednio przez OpenAI. Transkrypcja domyślnie działa na gpt-4o-mini-transcribe. Wymaga internetu, więc to jedyna ścieżka, która przetwarza dane poza Twoim komputerem. Funkcja Chmury jest częścią Whisper Pro.
Nudna prawda jest taka, że do codziennego pisania po angielsku lokalny wielojęzyczny model Whisper dobrze obsługuje większość uczących się: 99 języków, przyzwoita tolerancja na akcenty, tłumaczenie na angielski gdy potrzeba i nic nie jest wysyłane na serwer. Oba lokalne silniki działają w całości na Twoim komputerze, co ma znaczenie, jeśli dyktując chcesz zachować prywatność — osobisty esej, podanie o pracę, wiadomość, przy której zależy Ci na precyzji. Zacznij lokalnie. Sięgnij po chmurę dopiero gdy lokalny tryb nie daje Ci wystarczającej dokładności.
Jak zmienić mówiony szkic w czysty angielski tekst
Surowe dyktando wychodzi jako jeden ciąg myśli, w każdym języku. Mówisz zdanie tak jak powiedziałbyś je na głos — z wypełniaczem, autockorektą, przecinkiem, którego nie zaznaczasz głosem — i to jest niepunktowana ściana, którą oddaje każdy silnik mowy. Dla uczącego się to właśnie tutaj mowa na tekst zarabia na swoje miejsce, bo etap porządkowania robi to, co jest najtrudniejsze w drugim języku.
Whisper może uruchomić przebieg AI na surowym tekście przed jego wklejeniem. Powiedz frazę aktywacyjną "Hey whisper", a mówiony szkic zostaje ulepszony — wypełniacze usunięte, interpunkcja dodana, ciąg zdań podzielony, oczywiste potknięcia wygładzone. Na modelu lokalnym działa przez Ollama; w trybie chmury domyślnie przez gpt-5-mini. Porządkuje gramatykę i strukturę zamiast przepisywać Twój sens, więc wynik wciąż brzmi jak Ty — tylko czysciej.
so um i want to ask about the the deadline for the assignment because i am not sure is it friday or next monday and also can i send it by email
I want to ask about the deadline for the assignment, because I'm not sure if it's Friday or next Monday. Also, can I send it by email?
Jedno uczciwe ograniczenie. Przebieg AI poprawia gramatykę i formę; nie wyjaśnia, dlaczego coś zmienił. Jeśli Twoim celem jest nauka zasady — czytaj wersję przed i po obok siebie, ta różnica to lekcja. Jeśli Twoim celem jest po prostu wysłanie czystej wiadomości przed terminem — pozwól jej posprzątać i idź dalej. Oba zastosowania są w porządku; to różne cele i tylko Ty wiesz, który jest Twój dzisiaj.
Ten sam przepływ mów-i-posprzątaj działa dla wszystkiego, co piszesz, nie tylko w jednej aplikacji — możesz pisać szybciej głosem w mailu, dokumentach i czacie, więc długi akapit zamienia się w kilka mówionych zdań zamiast ściany tekstu pisanej jedno ostrożne słowo po słowie.
Kiedy mowa na tekst nie jest właściwym narzędziem dla uczącego się angielskiego

Wolę stracić Twój klik, niż marnować Twój czas — dlatego powiem wprost, gdzie narzędzie do dyktowania to zła odpowiedź. Jeśli Twoim celem jest poprawa wymowy — to nie jest właściwe narzędzie. Mowa na tekst zamienia Twoją mowę na tekst; nie ocenia Twojego akcentu, nie poprawia tego, jak wymawiasz słowo, nie powie Ci, że "thirty" brzmiało jak "dirty". Do tego potrzebujesz aplikacji językowej stworzonej z myślą o wymowie, korepetytora lub partnera do rozmów. Narzędzie do transkrypcji to pomocnik do pisania, nie trener mowy — i udawanie inaczej byłoby nieuczciwe.
Jeszcze kilka uczciwych alternatyw. Jeśli potrzebujesz tylko podyktować krótką wiadomość, darmowe narzędzia już na Twoim komputerze dadzą radę — na Windows naciśnij klawisz Windows + H, żeby uruchomić wbudowany pasek Pisania głosem; na Macu włącz Dyktowanie w Ustawieniach systemowych w sekcji Klawiatura, a na Apple Silicon ogólny tekst może być przetwarzany na urządzeniu. Wersja Windows wymaga połączenia z internetem i przekierowuje przez serwery Microsoft, więc nie działa offline. A jeśli szukasz narzędzia, które naprawdę uczy zasad gramatyki z wyjaśnieniami i ćwiczeniami — to korektor gramatyki lub aplikacja do nauki języka; AI tu porządkuje tekst, nie prowadzi lekcji.
Sięgnij po dedykowane, ogólnosystemowe narzędzie do dyktowania, gdy pisanie samo w sobie jest wąskim gardłem: długie maile, eseje, podania, wszystko, co możesz powiedzieć szybciej niż napisać po angielsku, i chcesz jednego skrótu klawiszowego działającego tak samo w każdej aplikacji na Windows i Macu. Poniżej tego progu — używaj tego, co masz za darmo, albo właściwego narzędzia do zadania. Właściwy wybór czasem prowadzi od nas, i zawsze to powiem.
Jeśli zastanawiasz się, gdzie dyktować, przewodniki platformowe szczegółowo opisują konfigurację — mowa na tekst na Windows przeprowadza przez ten sam proces krok po kroku na komputerze.
Angielski to mój trzeci język i większość tego poradnika napisałem, mówiąc do pola tekstowego, a potem pozwalając przebiegowi porządkowania naprawić szwy, których nigdy nie usłyszałbym na głos. To uczciwa oferta: nie sprawi, że Twój angielski będzie idealny, nie nauczy Cię zasad, ale wyciągnie zdanie z głowy na stronę znacznie szybciej, niż zrobią to Twoje palce. Poprawianie nadal należy do Ciebie. Szybka część to właśnie ta pomoc.
Napisz następnego angielskiego maila, mówiąc
Przytrzymaj skrót, powiedz to po angielsku, zwolnij. Czysty tekst pojawia się tam, gdzie jest kursor — w mailu, dokumentach i każdej innej aplikacji.
Bezpłatny tryb lokalny dla każdego zalogowanego konta. Karta nie jest wymagana na start.



