Porównanie
Alternatywa dla pisania głosem Google: dyktuj wszędzie
Pisanie głosem Google działa tylko wewnątrz Dokumentów Google. Oto uczciwe porównanie z aplikacją do dyktowania na komputer, która wpisuje tekst tam, gdzie stoi kursor, oraz jasna odpowiedź na pytanie, kiedy darmowe, wbudowane narzędzie nadal jest właściwym wyborem.
Ostatnia aktualizacja: czerwiec 2026

Najlepsza alternatywa dla pisania głosem Google to aplikacja do dyktowania na komputer, która wpisuje tekst w każde pole tekstowe, nie tylko w Dokumentach Google. Whisper by Remskill działa na Windowsie i Macu, transkrybuje offline za pomocą darmowych, lokalnych modeli AI, automatycznie stawia znaki interpunkcyjne i wkleja tekst tam, gdzie jest kursor — w e-mailu, na Slacku, w Wordzie czy w dowolnej przeglądarce.
Wtorek rano, 80-słowny e-mail do nauczyciela do napisania przed odwiezieniem dziecka do szkoły. Miałem otwarte pisanie głosem w Dokumentach Google, podyktowałem trzy schludne akapity, przeskoczyłem do Gmaila, żeby napisać właściwą odpowiedź, i przyłapałem się na tym, jak mówię do okna edytora, które wcale mnie nie słuchało. Pisanie głosem Google ma jedną zasadę: nie wychodź z dokumentu. Mikrofon mieszka w menu Narzędzia w Dokumentach i nie idzie za tobą na zewnątrz.
Więc dyktujesz w jednej karcie, kopiujesz, przełączasz się, wklejasz, poprawiasz interpunkcję, której zapomniałeś wypowiedzieć na głos, i wysyłasz. Ten mały bieg sztafetowy to cała argumentacja za alternatywą. Decyzja na tej stronie jest prosta: zostać przy darmowym narzędziu zamkniętym w jednej aplikacji, albo przejść na dyktowanie, które podąża za kursorem wszędzie.
Oto luka: pisanie głosem Google wpisuje tekst do dokumentów Dokumentów Google i do notatek prelegenta w Prezentacjach, a twój dzień pracy nie kończy się w tym jednym miejscu. Tymczasem dyktowanie na komputer dojrzało: lokalne modele AI działają dziś na zwykłym laptopie, czyszczą sformułowania na bieżąco i nigdy nigdzie nie wysyłają dźwięku.
To porównanie stawia pisanie głosem Google obok Whisper by Remskill — aplikacji do dyktowania na komputer, którą tworzę — w pięciu wymiarach: gdzie wpisują tekst, interpunkcja, języki, prywatność i działanie offline. Pod koniec będziesz wiedzieć, które pasuje do twojego sposobu pisania. Jeśli uczciwą odpowiedzią jest „zostań przy Google”, sekcja przy dole mówi to wprost. Większość własnych tekstów dyktuję, w tym odpowiedzi na zgłoszenia od użytkowników, więc to wnioski z codziennego użycia, a nie ze strony z listą funkcji.
W czym pisanie głosem Google jest dobre i gdzie się zatrzymuje
Najpierw uczciwie. Pisanie głosem Google jest darmowe z kontem Google, nie wymaga żadnej instalacji i działa w najnowszych wersjach Chrome, Edge i Safari. Wewnątrz dokumentu Dokumentów, a także w notatkach prelegenta i napisach w Prezentacjach, rozpoznawanie mowy jest przyzwoite, a lista języków długa. Jeśli wszystko piszesz w Dokumentach, narzędzie zarabia na siebie, a nasz przewodnik po pisaniu głosem w Dokumentach Google opisuje konfigurację szczegółowo.
Ograniczenia są równie konkretne. Interpunkcję wstawia się ręcznie: mówisz „kropka”, „przecinek”, „znak zapytania”, „nowy akapit”. I nie w każdym języku interpunkcja jest dostępna. Polecenia edycji i formatowania działają tylko po angielsku i tylko wtedy, gdy zarówno język konta, jak i język dokumentu są ustawione na angielski. (Notatki prelegenta w Prezentacjach mają pisanie głosem, ale w ogóle nie obsługują poleceń głosowych. Też nie wiem dlaczego.)
I granica, od której zaczął się ten artykuł: funkcja istnieje wewnątrz dwóch powierzchni Google i nigdzie indziej. Gmail, Slack, twój CRM, edytor kodu, formularz w sieci — cisza. Nic z tego nie jest błędem. To darmowa funkcja, która robi dokładnie to, co opisuje jej własna strona pomocy, ani trochę więcej. Pytanie brzmi, czy twoje pisanie mieści się w tym pudełku. A kiedy przestaje słuchać w połowie zdania, zwykle winny jest mikrofon, a nie ty — nasze rozwiązania problemów z pisaniem głosem w Dokumentach Google omawiają najczęstsze przyczyny.
Alternatywa dla pisania głosem, która działa w każdej aplikacji
Whisper stawia na coś przeciwnego: dyktowanie należy do systemu operacyjnego, a nie do jednej strony internetowej. Naciskasz skrót: Ctrl+Space na Windowsie albo przytrzymujesz Command+Option na Macu jak przycisk „mów”. Mówisz. Puszczasz. Tekst ląduje tam, gdzie stoi kursor: w e-mailu, w oknie czatu, w komórce arkusza, w opisie commita. Nie ma kroku z kopiowaniem, bo nie ma żadnego „dokumentu źródłowego”, z którego trzeba by kopiować.
Argument o szybkości to prosta arytmetyka. Dyktowanie idzie z prędkością około 145 słów na minutę wobec mniej więcej 40 przy pisaniu na klawiaturze — nazwijmy to różnicą 3,6 raza. Na MacBooku Air M1 z małym modelem angielskim odstęp między puszczeniem klawisza a pojawieniem się tekstu to 1,4 sekundy.
Pod maską wybierasz jedną z trzech dróg, a aplikacja nie wybiera za ciebie. Tryb chmurowy łączy się z OpenAI za pomocą twojego własnego klucza API i korzysta z gpt-4o-mini-transcribe albo gpt-4o-transcribe. Parakeet, lokalny silnik NVIDIA, działa 5–10 razy szybciej niż modele Whisper na CPU i obsługuje angielski oraz 24 języki europejskie. A lokalne modele Whisper o otwartym kodzie sięgają od 140-megabajtowego modelu angielskiego po 3-gigabajtowy Large v3. Aplikacja jest dostępna na Windowsa oraz na Maki z Apple Silicon.
Pisanie głosem Google kontra Whisper, obok siebie
Kryteria, wybrane przed ułożeniem tabeli: gdzie narzędzie wpisuje tekst, w czym działa, interpunkcja, polecenia głosowe, zakres języków, działanie offline i kształt ceny. To te siedem rzeczy, które przesądziły sprawę dla mnie, gdy jeszcze używałem mikrofonu w Dokumentach. Kolumna Google pochodzi z własnej strony pomocy Google; kolumna Whisper z kodu źródłowego aplikacji, który widzę stąd.
| Pisanie głosem Google | Whisper | |
|---|---|---|
| Gdzie wpisuje tekst | Dokumenty Dokumentów, notatki prelegenta i napisy w Prezentacjach | Dowolne pole tekstowe na twoim komputerze |
| Działa w | Najnowsze Chrome, Edge, Safari | Aplikacja na komputer, Windows + macOS (Apple Silicon) |
| Interpunkcja | Wypowiadana na głos; niedostępna w każdym języku | Dodawana przez czyszczenie AI |
| Polecenia głosowe | Tylko po angielsku, język konta i dokumentu muszą być angielskie | Słowo kluczowe „Hey whisper” plus własne presety |
| Języki | Długa lista, z ograniczeniami interpunkcji zależnymi od języka | 90+ na wielojęzycznych modelach Whisper, 25 na Parakeet, wersje .en tylko angielskie |
| Offline | Funkcja przeglądarkowa; użycie offline nie jest udokumentowane | Tryb lokalny działa zupełnie bez internetu |
| Kształt ceny | Darmowe z kontem Google | Tryb lokalny darmowy; funkcje chmurowe płatne — zobacz cennik |
Werdykt zgadza się z pierwszym akapitem: Whisper jest wyborem w chwili, gdy twoje pisanie opuszcza Dokumenty Google. Pisanie głosem Google pozostaje właściwą odpowiedzią dla osób, których pisanie nigdy ich nie opuszcza. Ten przypadek dostaje własną sekcję poniżej i mówię to na poważnie.
Pisanie głosem online a pisanie głosem na komputerze

„Pisanie głosem online” najczęściej oznacza stronę internetową, którą otwierasz w karcie: darmową witrynę z przyciskiem mikrofonu, która transkrybuje do pola tekstowego. Te narzędzia opierają się na silniku rozpoznawania mowy przeglądarki, a dokumentacja Web Speech API od MDN mówi wprost, jak to działa: „Twoje audio jest wysyłane do usługi sieciowej w celu rozpoznania, więc nie zadziała offline”. Ta sama strona wymienia dwa koszty: prywatność, bo twoja mowa opuszcza komputer, oraz niezawodność, bo brak połączenia oznacza brak transkrypcji.
Do jednorazowej notatki strona do pisania głosem online jest w porządku. Podatek pojawia się przy powtarzaniu: każde dyktowanie kończy się zaznacz, skopiuj, przełącz, wklej. Kiedyś podyktowałem listę zakupów do niewłaściwej karty i wkleiłem ją do arkusza budżetowego. Przez jakieś dziesięć sekund prognozy na trzeci kwartał zawierały „jogurt te małe, nie te duże”. Narzędzie na komputer eliminuje całą tę klasę wpadek, bo tekst zaczyna się tam, gdzie się kończy — przy twoim kursorze. A kiedy mikrofon w przeglądarce zaczyna kaprysić, rozwiązanie tkwi w ustawieniach przeglądarki, co potrafi zająć całe popołudnie. Opisaliśmy rozwiązania problemów z dyktowaniem w Chrome, gdy zapytało o to wystarczająco wiele osób.
Interpunkcja i czyszczenie: podatek od edycji, którego nikt nie liczy
Nudna prawda jest taka, że transkrypcja nigdy nie była tą wolną częścią. Wolne jest czyszczenie. Przy pisaniu głosem Google wypowiadasz interpunkcję („kropka”, „nowy akapit”), co działa, ale zmienia cię w osobę, która recytuje przecinki. Testowałem te polecenia na potrzeby tego artykułu i w moim dokumencie testowym słowo „przecinek” pojawiło się jedenaście razy. Nawyk idzie potem za tobą do domu: zdarzyło mi się zakończyć wypowiedziane zdanie, w prawdziwej rozmowie, słowem „kropka”.
Whisper zamiast tego przepuszcza surową transkrypcję przez przebieg czyszczenia AI: poprawiona gramatyka, usunięte słowa-wypełniacze, interpunkcja postawiona tam, gdzie jej miejsce. W trybie lokalnym dzieje się to przez Ollama; w trybie chmurowym korzysta z modeli OpenAI, z gpt-5-mini jako domyślnym ulepszaczem. Zacznij zdanie od „Hey whisper”, a AI potraktuje to, co po nim następuje, jako polecenie, a nie tekst do wpisania: „Hey whisper, spraw, żeby ta odpowiedź była uprzejma, ale stanowcza” to prawdziwy sposób pracy, a nie pokaz. Różnicy w odczuciu trudno przecenić. Jedno narzędzie prosi cię, byś sam wykonał formatowanie. Drugie pozwala mówić jak człowiek i oddaje coś, co wyślesz bez zmian.
Prywatność: dokąd trafia twój głos
Oto opinia, której będę bronił: dyktowanie, które wysyła twój głos na serwer, nad którym nie masz kontroli, to problem z prywatnością, a przy niektórej pracy jest to dyskwalifikujące. Pisanie głosem oparte na przeglądarce działa, wysyłając dźwięk na zewnątrz do przetworzenia. To w porządku przy liście zakupów. To zupełnie inna rozmowa przy projekcie umowy, notatce z wizyty pacjenta albo e-mailu o sytuacji twojego dziecka w szkole.
Kosztową stronę tej lekcji obserwowałem z bliska. Zespół, z którym pracowałem, zlecił podwykonawcy zbudowanie wewnętrznego prototypu dyktowania AI, który dla każdej wypowiedzi wywoływał chmurowe API. Pod koniec kwartału menedżer otworzył panel kosztów: pięciocyfrowy rachunek, w większości jeden zespół transkrybujący nagrania ze stand-upów cztery razy, bo logika ponawiania prób była zbyt gorliwa. Podwykonawca zaproponował optymalizację promptu. Dyrektor finansowy zaproponował, by nie płacić serwerowi za słuchanie spotkań, które i tak miały już notatki. Obaj mieli w czymś rację.
Tryb lokalny Whisper zamyka tę kwestię, zamiast się o nią spierać: model działa na twoim komputerze, nic nie opuszcza urządzenia i internet w ogóle nie jest potrzebny. Ten sam skrót, ten sam przebieg, zero dźwięku w drodze.
Kiedy odpuścić Whisper i zostać przy Google
Jeśli każde dyktowane słowo ląduje w Dokumencie Google, zostań przy pisaniu głosem Google. Nic nie kosztuje, jest już w menu Narzędzia, a wewnątrz Dokumentów robi swoje — z taką kombinacją trudno polemizować i nie będę udawał, że jest inaczej. To samo dotyczy sytuacji, gdy dyktujesz dwa razy w miesiącu: instalowanie aplikacji na komputer, by zaoszczędzić dwa kopiuj-wklej, to przerost formy, i mówię to zawodowo. Whisper zarabia na swoje miejsce, gdy twoje pisanie regularnie opuszcza dokument (e-mail, czat, formularze, notatki), albo gdy liczy się dla ciebie interpunkcja od AI, użycie offline czy trzymanie dźwięku na własnym komputerze. Do tego czasu darmowe, wbudowane narzędzie jest właściwym narzędziem.
Źródła warte przeczytania
Tamten e-mail do nauczyciela z początku strony ostatecznie poszedł — podyktowany prosto w Gmailu, bez sztafety przez Dokument, z interpunkcją dołączoną bez wypowiadania choćby jednego słowa o niej. Karta z Dokumentami Google pozostała zamknięta. To całe porównanie w jednej chwili: darmowe narzędzie prosi, by twoje pisanie przyszło do niego, a alternatywa idzie tam, gdzie pisanie już jest. Wybierz kierunek, który pasuje do twojego dnia.
Wypróbuj skrót przy następnym e-mailu
Pobierz Whisper na Windowsa lub Maca, naciśnij raz, mów i patrz, jak tekst ląduje tam, gdzie już stoi twój kursor.
Tryb lokalny jest darmowy, działa offline i nigdy nigdzie nie wysyła dźwięku.



