Autor: Denys Medvediev

Pisanie głosem · Poradnik

Aplikacja do pisania głosem: co zainstalować na każdym urządzeniu

Na Androidzie i iPhonie korzystaj z dyktowania wbudowanego w klawiaturę. Jest darmowe i dobre. Na Windowsie i Macu wbudowane narzędzia sprawdzają się przy krótkich zrywach, ale przy prawdziwym pisaniu szybko się kończą. Aplikacja do pisania głosem na komputer, taka jak Whisper, dodaje globalny skrót klawiszowy, lokalne modele działające offline i tekst, który ląduje w dowolnej aplikacji.

Ostatnia aktualizacja: czerwiec 2026

Laptop i smartfon obok siebie na drewnianym biurku — dwa miejsca, w których może żyć aplikacja do pisania głosem

Aplikacja do pisania głosem zamienia mowę na tekst dokładnie tam, gdzie znajduje się kursor. Na telefonach robi to już wbudowana klawiatura: Gboard na Androidzie, klawisz mikrofonu na klawiaturze iPhone'a. Na komputerach z Windowsem i Macu wbudowane narzędzia mają więcej ograniczeń — i właśnie tu dedykowana aplikacja desktopowa, jak Whisper by Remskill, znajduje swoje miejsce.

Wpisz „aplikacja do pisania głosem” w dowolnym sklepie z aplikacjami, a dostaniesz strony pełne klawiatur — każda to ten sam przycisk mikrofonu w nowym opakowaniu. A liczby pod spodem ani drgnęły: większość ludzi pisze około 40 słów na minutę, a mówi około 145. Ta przepaść to cały powód istnienia tej kategorii.

Zbudowałem jedną z takich aplikacji i wciąż w zeszłym tygodniu przyłapałem się na wystukiwaniu kciukami 400-słownego maila. Nawyki przeżywają swoje przyczyny. Haczyk polega na tym, że właściwa odpowiedź zależy od tego, jakie urządzenie trzymasz w ręku — a dla jednego z nich właściwa odpowiedź nic nie kosztuje i była zainstalowana fabrycznie.

„Aplikacja do pisania głosem” opisuje dwie różne sytuacje noszące jedną nazwę, a większość zestawień nigdy tego nie mówi. Na telefonie dyktowanie to problem rozwiązany, który sklepy z aplikacjami wciąż odsprzedają; na komputerze, gdzie powstają dłuższe teksty, wbudowane narzędzia mają swoje warunki. Rozsądny sposób wyboru to wybór według urządzenia.

Pod koniec tej strony będziesz wiedzieć, co zostawić na telefonie, gdzie kończą się wbudowane narzędzia komputerowe i co zainstalować, gdy je przerośniesz. Zawodowo buduję aplikację do pisania głosem na komputer i pierwsze, co mówię ludziom, to: nie instaluj nic na telefonie.

Telefony mają aplikację do pisania głosem już w komplecie

Dłonie trzymające smartfon, w którym wbudowana klawiatura już dyktuje

Nudna prawda jest taka, że najlepsza aplikacja do pisania głosem na twój telefon to klawiatura, z którą przyszedł. Na Androidzie robi to Gboard: dotknij pola tekstowego, dotknij mikrofonu u góry klawiatury i mów, gdy pojawi się „Mów teraz”. Interpunkcję możesz dyktować na głos, na przykład „kropka”, „przecinek” czy „nowy akapit” — choć Google zaznacza, że interpunkcja i zamiana mowy na tekst nie są dostępne w każdym języku. Na iPhonie klawiatura ma klawisz mikrofonu, który robi dokładnie to samo.

To obejmuje SMS-y, maile, pola wyszukiwania i notatki — czyli większość tego, co ktokolwiek pisze na telefonie. Typowe dyktowanie na telefonie to odpowiedź na maila licząca 50–150 słów, około 30 sekund mówienia; wbudowany mikrofon radzi sobie z tym bez słowa skargi. Aplikacje z klawiaturami od innych firm, zatłaczające wyniki w sklepie, owijają ten sam mikrofon w inny branding, czasem z dołączoną subskrypcją. Zanim którąś zainstalujesz, wypróbuj przycisk, który już masz. To rzadka kategoria produktów, w której darmowa, fabrycznie zainstalowana opcja jest jednocześnie tą rozsądną.

Jedno szczere wyznanie, bo to moment, w którym dostawca przeszedłby płynnie do swojej aplikacji mobilnej: my jej nie mamy. Whisper by Remskill to aplikacja desktopowa na Windowsa i macOS, kropka. Jeśli twoje życie z dyktowaniem dzieje się na telefonie, polecam wbudowaną klawiaturę i z czystym sumieniem możesz zamknąć tę kartę.

Na komputerach wbudowane narzędzia się kończą

Oba komputerowe systemy operacyjne mają pisanie głosem i oba warto poznać, zanim cokolwiek zainstalujesz. Na Windowsie 11 naciśnij klawisz Windows + H, a pojawi się mały widżet pisania głosem. Potrzebuje trzech rzeczy: połączenia z internetem, działającego mikrofonu i kursora zaparkowanego w polu tekstowym. Obsługuje ponad 40 języków i może wstawiać za ciebie interpunkcję, jeśli włączysz to ustawienie. Wymóg internetu to granica, o której trzeba pamiętać. Win+H jest świetne dokładnie do momentu, gdy hotelowe Wi-Fi przestaje działać.

Pisanie głosem

Słucham…

Win + H
Uproszczony szkic widżetu pisania głosem w Windowsie — wbudowanego narzędzia stojącego za Win + H.

Na Macu Dyktowanie uruchamia się klawiszem mikrofonu w rzędzie klawiszy funkcyjnych, skrótem klawiszowym albo przez Edycja > Rozpocznij dyktowanie. Nie ma limitu długości, ale samo zatrzymuje się po 30 sekundach ciszy — co w praktyce oznacza, że poddaje się, gdy wpatrujesz się w sufit, szukając właściwego słowa. W obsługiwanych językach wstawia interpunkcję bez proszenia, a Apple zaznacza, że Dyktowanie nie jest dostępne we wszystkich językach i regionach.

Żadne z tych narzędzi nie jest złe i oba są w porządku do jednego czy trzech zdań. Granice ujawniają się, gdy pisanie robi się poważne. Własnego słownictwa na nazwy twoich produktów i klientów nie ma na żadnej z list funkcji — podobnie jak czyszczenia przez AI tej warstwy „yyy, no więc”, którą niesie twoja mowa. Na Macu możesz sprawdzić, czy dyktowanie działa na urządzeniu; na Windowsie narzędzie gaśnie w chwili, gdy jesteś offline. To właśnie te granice sprawiają, że komputerowe aplikacje do pisania głosem istnieją jako kategoria.

Co aplikacja do pisania głosem na komputer naprawdę powinna robić

Klawiatura mechaniczna z pomarańczowym klawiszem akcentowym na drewnianym stole

Mechanizm da się opisać prosto. Komputerowa aplikacja do pisania głosem siedzi w tle, pilnuje jednego globalnego skrótu, nagrywa, gdy go przytrzymujesz, przepuszcza dźwięk przez model rozpoznawania mowy i wkleja wynik tam, gdzie jest twój kursor. Każdy fragment tego zdania to rzecz do sprawdzenia, zanim zainstalujesz.

Skrót klawiszowy ma znaczenie, bo zamienia dyktowanie w odruch, a nie funkcję, którą się odwiedza. Część „tam, gdzie jest twój kursor” ma znaczenie, bo pisanie dzieje się w mailu, na Slacku, w CRM-ie, w edytorze kodu i w formularzu w przeglądarce; narzędzie, które pisze tylko we własnym oknie, to notatnik z mikrofonem. Model ma znaczenie podwójnie: raz dla dokładności, raz dla tego, dokąd trafia twój dźwięk. Lokalne modele działają na twoim komputerze i pracują offline. Modele w chmurze wysyłają dźwięk na serwer i często transkrybują lepiej. Dobra aplikacja desktopowa pozwala wybierać zależnie od sytuacji, zamiast decydować za ciebie.

Szybkość też należy na liście kontrolnej, w prostych liczbach. Na MacBooku Air z M1 z lokalnym, małym modelem angielskim Whisper przechodzi od puszczenia klawisza do wklejonego tekstu w około 1,4 sekundy; w trybie chmury na przyzwoitym łączu — w około 1,1 sekundy. Reakcja w tym przedziale utrzymuje dyktowanie w kategorii „odruch”. Jeśli narzędzie każe ci czekać, otwierać okno albo kopiować tekst z panelu, tarcie zjada przewagę szybkości, po którą przyszedłeś.

Oto moja jedna opinia na tę stronę: najlepszy trik na produktywność to mniej kroków, a nie szybsze kroki. Większość narzędzi próbuje przyspieszyć pisanie. Pisanie głosem je usuwa. Przepływ idzie od „stań, usiądź, pisz” do „powiedz, gotowe” — i właśnie tak mowa z prędkością 145 słów na minutę bije pisanie z prędkością 40, bez uczenia się nowej umiejętności. Aplikacja, która dokłada kroki z powrotem, przegapiła sens własnej kategorii.

Po głębszą wycieczkę po samej kategorii — silniki, dokładność, kompromis między lokalnym a chmurą — prowadzimy osobne wyjaśnienie o oprogramowaniu do pisania głosem. Ta strona trzyma się węższego pytania: co zainstalować, na każdym urządzeniu.

Jak Whisper radzi sobie z pisaniem głosem na Windowsie i Macu

Whisper by Remskill to nasza odpowiedź na komputerową połowę pytania. Przytrzymujesz jeden skrót (Ctrl+Space na Windowsie, Command+Option na Macu), mówisz, puszczasz — i tekst ląduje tam, gdzie jest twój kursor, w dowolnej aplikacji. Kiedy mówisz, na ekranie unosi się niewielka nakładka, dzięki której widzisz, że trwa nasłuchiwanie.

Cancel
Nakładka nagrywania Whisper, na żywo — to wdrożony interfejs, animowany, nie zrzut ekranu.

Pod maską wybierasz między trzema ścieżkami, a aplikacja nie wybiera za ciebie.

  • Lokalny WhisperRodziny modeli zoptymalizowanych pod angielski oraz wielojęzycznych, od modelu Base o rozmiarze ~140 MB aż po Large v3 o rozmiarze ~3 GB. Rodzina wielojęzyczna obejmuje ponad 90 języków, w tym automatyczne wykrywanie. Modele tylko angielskie są dokładnie tym, czym się wydają — wyłącznie angielski — więc jeśli zmieniasz języki w ciągu dnia, wybierz rodzinę wielojęzyczną.
  • Lokalny ParakeetDziała 5–10× szybciej niż Whisper na CPU i obejmuje angielski plus 24 języki europejskie. Szybki pas dla dyktowania głównie po angielsku.
  • Chmura (twój własny klucz OpenAI)Łączy się z OpenAI za pomocą twojego własnego klucza API, używając gpt-4o-mini-transcribe lub gpt-4o-transcribe do samej mowy oraz gpt-5-mini do opcjonalnego czyszczenia przez AI.

Wszystko, co lokalne, jest darmowe: modele działają na twoim urządzeniu, pracują offline, nic nigdzie nie wysyłają, a do rejestracji nie trzeba karty.

Jest jeszcze jeden trik warty poznania: słowo kluczowe dla AI. Zacznij nagranie od „Hey whisper”, a aplikacja uruchomi przetwarzanie transkrybowanego tekstu przez AI, zamiast wkleić go bez zmian. Dyktowanie do codziennych zdań, asystent na chwile, gdy chcesz, żeby tekst przerobić. Ten sam skrót w obu przypadkach.

Test, któremu ufam najbardziej, nie był benchmarkiem. Dałem Whisper mojej młodszej córce, pokazałem raz (naciśnij, mów, puść, wklej), a ona podyktowała 90-słownego maila do babci o utraconym zębie i o tym, po jakim kursie wymienia go wróżka zębuszka, bez ani jednego dodatkowego pytania. Dwa dni później zgłosiła, że „skrót nie działa w mojej aplikacji do rysowania” — i tak nauczyłem się, że zwykli użytkownicy nie wiedzą, czym jest konflikt skrótów. Wiedzą tylko, że nie działa. Ustawienia konfigurowalnego skrótu wyszły tej samej nocy. Jeśli siedmiolatka potrafi przejść tę pętlę, pętla jest dość prosta.

Whisper
Prawdziwa aplikacja desktopowa Whisper, osadzona na żywo — poklikaj po Ustawieniach i wyborze modelu.

Osadzona powyżej aplikacja to prawdziwy desktopowy frontend, nie zrzut ekranu; poklikaj po nim. I powtórzę wyznanie, bo zamiar instalacji zasługuje na prostą odpowiedź: Whisper działa na Windowsie i na Macach z Apple Silicon, i nigdzie indziej.

Krótka lista kontrolna, zanim cokolwiek zainstalujesz

Instalacja oprogramowania to zobowiązanie, nawet gdy oprogramowanie jest darmowe. Pięć pytań rozstrzyga to szybciej niż jakiekolwiek zestawienie recenzji:

  • Na jakim urządzeniu naprawdę piszesz? Głównie telefon: zostań przy wbudowanym dyktowaniu z klawiatury i nie wydawaj nic.
  • Czy pisze w każdej aplikacji? Szukaj globalnego skrótu, który wkleja w miejscu kursora, a nie osobnego okna, z którego musisz kopiować.
  • Czy działa offline? Pisanie głosem w Windowsie nie potrafi. Lokalne modele potrafią. Jeśli twoje pisanie obejmuje rzeczy, które nie powinny odwiedzać serwera, to pytanie idzie na początek.
  • Jakie języki, liczone na każdy silnik? Ponad 40 dla pisania głosem w Windowsie, ponad 90 dla wielojęzycznych modeli Whisper, 25 dla Parakeet, tylko angielski w modelach .en.
  • Czy najpierw zająłeś się mikrofonem? Mikrofon USB za $20 robi dla dokładności więcej niż jakikolwiek lepszy model. Buduję to oprogramowanie, a i tak mikrofon wygrywa. Nikt w tej branży nie lubi mówić tego na głos.

Jeśli trafiłeś tu od strony badawczej — liczby dokładności, jak silniki wypadają w porównaniu — to aplikacja do zamiany mowy na tekst omawia tamtą stronę. Plany i to, co w nich jest, znajdziesz na stronie z cennikiem; w skrócie: wszystko, co lokalne, nic nie kosztuje.

Kiedy odpuścić sobie Whisper

Jeśli twoje dyktowanie dzieje się na telefonie, odpuść nas sobie. Nie mamy aplikacji mobilnej, a dyktowanie z Gboarda albo z klawiatury iPhone'a jest darmowe i w pełni wystarczające. Jeśli na Macu piszesz zdanie albo dwa dziennie, Apple Dictation jest wbudowane, uruchamia się klawiszem mikrofonu i wstawia za ciebie interpunkcję.

Jeśli potrzebujesz transkrypcji spotkań z wieloma mówcami i podsumowaniami, to inna kategoria produktu niż pisanie głosem i warto rozejrzeć się właśnie w tamtej kategorii. A jeśli używasz Linuksa albo Maca z procesorem Intela, Whisper tam nie działa, więc wbudowane narzędzia i narzędzia przeglądarkowe to twoje uczciwe opcje.

Źródła

Dwadzieścia lat temu pisanie głosem oznaczało czytanie skryptów kalibracyjnych do komputera i nadzieję. Dziś uczciwe podsumowanie mieści się w dwóch linijkach: twój telefon już to robi, a twój komputer potrafi zrobić to porządnie po jednej instalacji. Mikrofon od dłuższego czasu jest najszybszym urządzeniem wejściowym na twoim biurku. Większość z nas po prostu jeszcze nie nacisnęła klawisza.

Zainstaluj aplikację do pisania głosem na komputerze

Pobierz Whisper, przytrzymaj jeden skrót i patrz, jak tekst ląduje tam, gdzie jest twój kursor.

Działa na Windowsie i Macach z Apple Silicon. Wszystko, co lokalne, jest darmowe. Twoja klawiatura wciąż tu będzie, gdy jej potrzebujesz.

Zdjęcie Denysa Medvedieva

Denys Medvediev

To ja czytam naszą pocztę wsparcia — najpewniej dyktując odpowiedzi.