Poradnik
Zamiana mowy na tekst do robienia notatek
Zapisuj notatki, mówiąc, zamiast pisać. Skrót działający w całym systemie wkleja Twoje słowa w miejscu kursora w dowolnej aplikacji do notatek — Notion, Obsidian, Apple Notes, OneNote, zwykły tekst. Bez przełączania aplikacji, bez wtyczek do każdej z osobna. Na koniec AI porządkuje to, co wyrzuciłeś z głowy.
Ostatnia aktualizacja: czerwiec 2026

Zamiana mowy na tekst do robienia notatek działa dzięki narzędziu obejmującemu cały system, a nie samej aplikacji do notatek. Naciskasz skrót, mówisz, a transkrypcja wkleja się w miejscu kursora w aplikacji, która ma fokus — Notion, Obsidian, Apple Notes, OneNote albo zwykłym pliku tekstowym. Działa offline i za darmo na lokalnych modelach, a AI czyści ten mówiony szkic.
Większość robienia notatek to po prostu pisanie z dodatkowymi krokami. Masz myśl, otwierasz aplikację, znajdujesz właściwą stronę, wpisujesz tę myśl, a zanim palce nadążą, połowa myśli już zdążyła wyparować. Najszybszy sposób na zatrzymanie myśli, jaki znalazłem, to powiedzieć ją na głos w sekundę, w której się pojawi — do dowolnego otwartego akurat okna — i pozwolić słowom wylądować jako tekst.
Ludzie wpisują w wyszukiwarkę „zamiana mowy na tekst do notatek”, licząc, że wybiorą tę jedną aplikację z najlepszym dyktowaniem. To złe pytanie. Prawie żadna aplikacja do notatek nie ma na komputerze porządnego wbudowanego dyktowania, a te nieliczne, które mają, działają tylko w obrębie siebie. To, co naprawdę działa tak samo wszędzie, nie jest funkcją żadnej aplikacji. To skrót, który wkleja w miejscu kursora, a kursorowi jest zupełnie obojętne, w której aplikacji do notatek akurat siedzi.
Oto rzecz, której większość stron krążących wokół tego hasła nie powie wprost. Notatka, w każdej aplikacji, to pole tekstowe. Edytor Notion to pole tekstowe. Notatka w Obsidianie to pole tekstowe. Apple Notes, OneNote, okno Stickies, plik .txt otwarty w dowolnym edytorze — wszystko to pola tekstowe. Dyktowaniu, które wkleja w miejscu kursora, jest wszystko jedno, które to z nich.
Więc prawdziwe pytanie nie brzmi „która aplikacja do notatek ma najlepsze pisanie głosem”. Brzmi: „które narzędzie do dyktowania uruchamiam ponad nimi wszystkimi”. Odpowiedź to takie, które działa w całym systemie, działa offline, jeśli tak chcesz, i porządkuje mówiony bałagan po fakcie. Pokażę dlaczego, jak, dwuminutową konfigurację, jak wchodzi do każdej aplikacji do notatek i — to, czego nikt inny nie pisze — kiedy dedykowane narzędzie w ogóle sobie odpuścić.
Dlaczego mówić notatki, zamiast je pisać

To, co aplikacja do notatek naprawdę robi, to łapanie pomysłów, zanim uciekną. Wąskim gardłem nie jest aplikacja. To przerwa między pojawieniem się myśli a jej zapisaniem. Pisanie to dla większości ludzi około 40 słów na minutę. Mówienie to około 145. To nie jest mała przewaga; to różnica między złapaniem całego pomysłu a złapaniem tej połowy, która przetrwała podróż do klawiatury.
Dyktowanie zamyka tę przerwę na dwa sposoby. Pierwszy to czysta szybkość — akapit notatek to piętnaście sekund mówienia zamiast minuty pisania. Drugi jest cichszy i znaczy więcej: pozwala łapać myśli, gdy masz zajęte ręce. Stojąc przy tablicy, spacerując z psem, zmywając naczynia po tym, jak dzieci poszły spać i wreszcie nadciągają jedyne dobre pomysły dnia. Nie siadasz, żeby zrobić notatkę. Po prostu ją mówisz.
Są też same ręce. Jeśli o trzeciej po południu nadgarstki masz już zmęczone, dyktowanie notatek to sposób na dalszą pracę bez dorzucania do stosu uderzeń w klawisze. Nie będę tego ubierać w nic medycznego — to kwestia produktywności. Mniej uderzeń w klawisze, te same notatki. Przy długiej sesji zapisywania to, że pod koniec ręce mają się dobrze, samo w sobie jest wystarczającym powodem.
Naciskasz skrót, mówisz, tekst ląduje w notatce
To cały mechanizm i jest nudny w najlepszym możliwym sensie. Naciskasz skrót, mówisz, puszczasz, a transkrypcja wkleja się w miejscu kursora, w polu tekstowym, które ma fokus. Whisper trzyma krótką końcówkę po tym, jak puścisz klawisz, więc ostatnie słowo się nie urywa. Ponieważ wkleja w miejscu kursora systemowego, blok w Notion, notatka w Obsidianie i kartka w Apple Notes są po prostu „jakimś polem tekstowym”. Ten sam klawisz, to samo zachowanie, każda aplikacja.
To właśnie tę część strony docelowe niepotrzebnie komplikują. Nie ma wtyczki do zainstalowania w aplikacji do notatek, nie ma tokenu API do wklejenia, nie ma zadania synchronizacji, które trzeba niańczyć. Kursor jest w notatce, mówisz, słowa pojawiają się w notatce. Mała kapsułka pokazuje się, gdy mówisz, więc wiesz, że narzędzie słucha:
Skrót to ta jedna rzecz, którą warto od razu dobrze ustawić. Na Windowsie to Ctrl+Space; na Macu to Command+Option, czyli „naciśnij i mów” na samych modyfikatorach, które przytrzymujesz podczas mówienia. Oba można zmienić w Ustawieniach, jeśli kolidują z czymś, czego już używasz. (Moja młodsza córka powiedziała mi kiedyś, że skrót „nie działa” w jej aplikacji do rysowania. To był konflikt, a nie błąd — i tak nauczyłem się, że przeciętna osoba nie ma pojęcia, czym w ogóle jest konflikt skrótów. Więc teraz każdy skrót da się dostosować.) Jeśli kiedykolwiek konfigurowałeś dyktowanie na Windowsie albo na Macu, to ta sama pamięć mięśniowa wycelowana naraz w każdą aplikację.
Skonfiguruj w dwie minuty (Windows lub Mac)
Potrzebujesz Maca na Apple Silicon albo komputera z Windowsem 10 lub nowszym, działającego mikrofonu i otwartej aplikacji do notatek — dowolnej. Cały lokalny proces jest darmowy dla każdego zalogowanego konta, bez podawania metody płatności przy rejestracji. Oto kolejność.
Krok 1 — Zainstaluj Whisper i zaloguj się.
Pobierz ze strony pobierania, zainstaluj i załóż darmowe konto. Bez karty. Cały lokalny proces transkrypcji otwiera się od razu.
Poznasz, że się udało, gdy w zasobniku systemowym pojawi się ikona aplikacji, a kreator konfiguracji zaproponuje wybór modelu.
Krok 2 — Wybierz ścieżkę transkrypcji.
Aplikacja nie wybiera za Ciebie. Masz trzy opcje: Chmura (OpenAI, podaj własny klucz), lokalny Parakeet albo lokalny Whisper. Przy prywatnych notatkach zacznij od lokalnej — więcej o tym dwie sekcje niżej.
Poznasz, że się udało, gdy model skończy się pobierać i pokaże jako gotowy.
Krok 3 — Potwierdź swój skrót.
Windows domyślnie ustawia Ctrl+Space, a Mac Command+Option przytrzymywane jak „naciśnij i mów”. Na Macu nadaj uprawnienie Dostępność, gdy pojawi się monit; bez niego wklejanie w miejscu kursora nie dosięgnie innych aplikacji.
Poznasz, że się udało, gdy testowe nagranie wklei się do dowolnego pola tekstowego.
Krok 4 — Ustaw kursor w notatce i mów.
Otwórz tę aplikację do notatek, której używasz, kliknij w notatkę, przytrzymaj skrót, powiedz zdanie, puść. Transkrypcja pojawia się tam, gdzie jest kursor.
Poznasz, że się udało, gdy wypowiedziane zdanie wyląduje w notatce jako tekst.
Powolną częścią jest pobieranie modelu, a nie konfiguracja. Cała reszta to te cztery kroki powyżej. Gdy już działa, zapisanie myśli w którejkolwiek z Twoich aplikacji do notatek przestaje być zadaniem na pisanie, a staje się zadaniem na mówienie.
Notion, Obsidian, Apple Notes, OneNote — ten sam skrót
Powód, dla którego skrót działający w całym systemie bije funkcję w pojedynczej aplikacji, jest taki, że przestajesz się uczyć od nowa. Te nieliczne aplikacje do notatek z własnym dyktowaniem działają tylko w obrębie siebie, a większość na komputerze w ogóle go nie ma. Z jednym skrótem, który wkleja w miejscu kursora, przebieg jest identyczny bez względu na to, którą aplikację otworzyłeś tego ranka.
W Notion kliknij w dowolny blok albo pole bazy danych, przytrzymaj klawisz, mów — tekst spada do bloku. W Obsidianie ustaw kursor w notatce, a słowa lądują w markdownie, tak samo jak gdybyś je wpisywał. Apple Notes i OneNote mają zwykłe pola tekstowe, więc kursor łapie transkrypcję i tam. Nawet zwykły plik .txt w dowolnym edytorze działa, bo dla narzędzia wklejającego w miejscu kursora plik tekstowy niczym się nie różni od wymyślnego edytora. Przewodniki dla konkretnych aplikacji opisują ten sam przebieg dla dyktowania do Notion oraz do Obsidiana.
Kryje się w tym darmowy ruch produktywnościowy. Notatki większości ludzi żyją w dwóch lub trzech aplikacjach — notatki służbowe w jednej, prywatne w drugiej, szybkie zapiski w trzeciej. Z narzędziem osobnym dla każdej aplikacji potrzebowałbyś, żeby każda z nich wspierała głos, i za każdym razem przełączałbyś przyciski. Ze skrótem ten sam gest wypełnia je wszystkie, a wypełnia też Twoją pocztę i komunikator, bo pisanie głosem tak naprawdę nie dotyczy aplikacji do notatek — chodzi o kursor. Przełączam aplikacje jakieś czterdzieści razy na godzinę i nie chcę zapamiętywać czterdziestu różnych przycisków do dyktowania.
Lokalnie czy w chmurze: który tryb do prywatnych notatek
Przy notatkach najpierw wypróbuj tryb lokalny. Wiele z tego, co trafia do aplikacji do notatek, to dokładnie te rzeczy, których nigdy nie chciałbyś trzymać na czyimś serwerze — niedopieczony pomysł, kwota wynagrodzenia, szkic trudnego maila, myśl o jakiejś osobie. Dziwnym wyborem byłoby trzymać to wszystko w lokalnym pliku notatek, a potem przeprowadzać swój głos przez chmurę, żeby tam to wpisać. Jeśli Twój Mac to Apple Silicon albo komputer masz z ostatnich kilku lat, lokalna ścieżka bez narzekania obsłuży codzienne łapanie notatek, a chmura staje się wyjściem awaryjnym, a nie domyślnym.
Oto czym różnią się te trzy ścieżki, bo aplikacja każe Ci wybierać, a wolę, żebyś wybrał dobrze:
- Lokalny Parakeet — Silnik TDT od NVIDIA, około 600 MB, i najszybsza opcja lokalna — od 5 do 10 razy szybsza niż Whisper na CPU. Obejmuje angielski plus 24 inne języki europejskie, czyli 25 łącznie. Bez tłumaczenia na angielski. Jeśli robisz notatki po angielsku albo w innym języku europejskim, to szybki, w pełni offline wybór.
- Lokalny Whisper — wolniejszy niż Parakeet na tej samej maszynie, ale wielojęzyczne wersje obejmują 99 języków i potrafią tłumaczyć na angielski. Wersje tylko angielskie są tylko angielskie, nie 99-językowe. Wybierz to dla chińskiego, japońskiego, koreańskiego albo jakiejkolwiek pracy z tłumaczeniem, czego Parakeet nie potrafi. Domyślny model angielski to około 480 MB.
- Chmura (OpenAI, własny klucz) — najlepsza dokładność i dostęp do sieci, z wykorzystaniem Twojego własnego klucza OpenAI rozliczanego bezpośrednio przez OpenAI. Transkrypcja domyślnie działa na gpt-4o-mini-transcribe. Wymaga internetu, więc to jedyna ścieżka, która opuszcza Twoją maszynę. Powierzchnia Chmury jest częścią Whisper Pro.
Nudna prawda jest taka, że dla rodzaju tekstu, który większość ludzi wrzuca do notatek, lokalna ścieżka w zupełności wystarcza. Oba lokalne silniki działają w pełni na Twojej maszynie, bez wysyłania czegokolwiek na serwer, o co przecież chodzi, jeśli Twoje notatki są prywatne. Chmura zasługuje na swoje miejsce, gdy chcesz najwyższej dokładności na trudnym nagraniu albo gdy potrzebujesz, by model wyciągnął fakt z sieci w połowie zdania. Przy codziennym nawyku notowania zacznij od lokalnej i sięgaj po chmurę dopiero, gdy lokalna pozostawia Cię z niedosytem.
Zamiana mówionego strumienia myśli w schludne notatki
Surowe dyktowanie wychodzi jako jedno wielkie zdanie bez przerwy. Mówisz „dobra więc trzy rzeczy na premierę po pierwsze strona z cennikiem po drugie napisać do listy beta po trzecie przypomnieć mi żeby zadzwonić do drukarni” i to jest ta nieinterpunkcyjna ściana, którą wręcza Ci każdy silnik mowy. Mówiony strumień myśli powstaje szybko, a czyta się go paskudnie. Doczyszczenie tego to miejsce, w którym ścieżki się rozchodzą.
Pisanie głosowe w Windowsie dodaje interpunkcję, gdy mówisz, a dyktowanie w macOS radzi sobie z podstawową interpunkcją, gdy powiesz „przecinek” albo „kropka”. Przy cięższym porządkowaniu — wycinaniu „yyy”, naprawianiu poskładanych zdań, zamianie mówionego akapitu w coś, co naprawdę chciałbyś zachować — Whisper potrafi uruchomić przebieg AI. Powiedz frazę aktywującą „Hey whisper”, a tekst zostaje ulepszony, zanim wyląduje. Na lokalnym modelu działa to przez Ollama; w trybie chmurowym to domyślnie gpt-5-mini.
dobra więc trzy rzeczy na premierę po pierwsze strona z cennikiem po drugie napisać do listy beta po trzecie przypomnieć mi żeby zadzwonić do drukarni yyy przed piątkiem
Trzy rzeczy na premierę: po pierwsze, strona z cennikiem; po drugie, napisać do listy beta; po trzecie, przypomnieć mi, żeby zadzwonić do drukarni przed piątkiem.
Teraz uczciwe ograniczenie. Dyktowanie daje Ci słowa — czyste, z interpunkcją. Nie daje Ci struktury Twojej aplikacji do notatek. Przebieg porządkujący zamieni poskładane zdanie w schludne, ale nie zbuduje sekcji rozwijanej w Notion, nie zrobi wcięcia punktu w Obsidianie, nie odhaczy pola w OneNote ani nie nada nagłówka. Robią to własne skróty każdej aplikacji. Podyktuj zdanie, potem naciśnij Tab, by zagnieździć, wpisz # albo - dla struktury, jakiej chcesz, tak jak zawsze. Każdy, kto obiecuje „powiedz zrób listę zadań i patrz, jak się formatuje”, sprzedaje Ci pokaz, a nie zwykły wtorek. Szybko zrzuć słowa głosem, a notatkę ukształtuj klawiszami, które już znasz.
Ten sam przebieg mów-potem-czyść opłaca się daleko poza robieniem notatek — możesz dyktować schludny tekst do dowolnej aplikacji jednym skrótem, więc długa notatka staje się kilkoma wypowiedzianymi zdaniami zamiast akapitem, który wystukujesz na klawiaturze.
Kiedy odpuścić sobie narzędzie do dyktowania notatek

Czasem dedykowane narzędzie do dyktowania to zła odpowiedź, a udawanie inaczej byłoby nieuczciwe. Często wracają dwa przypadki i w obu skierowałbym Cię gdzie indziej.
Pierwszy to nagrywanie spotkania albo wykładu, żeby później je przepisać. To inne zadanie. Dyktowanie wpisuje to, co mówisz, w czasie rzeczywistym w miejscu kursora; nie siedzi w rogu, nagrywając 90-minutową rozmowę kilku osób i wręczając Ci potem transkrypcję z podpisanymi mówcami. Do tego chcesz narzędzia do transkrypcji zbudowanego specjalnie pod to — wielu mówców, podsumowania po spotkaniu, cała reszta. Nie sięgaj po skrót do dyktowania, żeby nagrać salę; to zły kształt narzędzia. Drugi to szybkie łapanie myśli na telefonie. Whisper działa tylko na komputerze, na Windowsie i macOS, więc gdy stoisz w kolejce z jakąś myślą, wbudowany mikrofon klawiatury Twojego telefonu już dyktuje do dowolnej aplikacji do notatek, za darmo. Korzystaj z niego. Nie będę Ci kazać instalować narzędzia desktopowego do jednolinijkowego zapisku, który zrobiłeś na telefonie.
A do krótkich notatek na samym komputerze wbudowane rozwiązania są w porządku. Na Windowsie klawisz Windows + H otwiera pisanie głosowe tam, gdzie jest Twój kursor, i samo dodaje interpunkcję — haczyk jest taki, że przechodzi przez serwery Microsoftu i wymaga internetu, więc nie jest offline. Na Macu dyktowanie działa w dowolnym polu tekstowym, konfiguruje się je w Ustawieniach systemowych w sekcji Klawiatura, a na Apple Silicon zwykły tekst może być przetwarzany na urządzeniu. Sięgnij po narzędzie obejmujące cały system, gdy wbudowane zaczynają boleć: długie notatki, łapanie wielojęzyczne, prywatność offline na Windowsie albo chęć posiadania jednego skrótu, który zachowuje się tak samo w każdej aplikacji do notatek, jaką trzymasz. Poniżej tej granicy korzystaj z tego, co darmowe.
Jeśli większość Twojego dyktowania ląduje w jednej konkretnej aplikacji, ukierunkowany przewodnik po dyktowaniu do Obsidiana omawia tę samą logikę „kursor jest integracją” dla pojedynczej, lokalnej aplikacji markdown.
Więcej do przeczytania
Żadna aplikacja do notatek nie musi budować świetnego przycisku mikrofonu, bo to kursor jest integracją. Mów do notatki, dostań tekst, ukształtuj go skrótami, które już znasz. Większość tego poradnika podyktowałem do pola tekstowego, narzędziem, któremu jest wszystko jedno, co to za pole, a potem wkleiłem całość do własnych notatek. Jedyne, czego nie zrobiło, to napisanie notatek za mnie, co prawdopodobnie i tak wyszło na lepsze.
Zrób następną notatkę, mówiąc
Przytrzymaj skrót, mów, puść. Transkrypcja ląduje w tej notatce, w której jest Twój kursor — Notion, Obsidian, Apple Notes, OneNote, zwykły tekst i każda inna aplikacja też.
Darmowy tryb lokalny dla każdego zalogowanego konta. Bez karty na start.



