Poradnik
Zamiana głosu na tekst w Standard Notes
Standard Notes nie ma wbudowanego dyktowania na komputerze. Rozwiązaniem jest narzędzie działające w całym systemie: naciskasz skrót klawiszowy, mówisz, a transkrypcja wkleja się w miejscu kursora w dowolnej notatce. Trzymaj wszystko lokalnie, a Twój głos nigdy nie opuści komputera — to przecież cały sens aplikacji z szyfrowanymi notatkami.
Ostatnia aktualizacja: czerwiec 2026

Zamiana głosu na tekst w Standard Notes działa dzięki narzędziu obejmującemu cały system, a nie samej aplikacji. Edytor Standard Notes na komputerze nie ma wbudowanego dyktowania. Narzędzie takie jak Whisper to naprawia: naciskasz skrót klawiszowy, mówisz, a transkrypcja wkleja się w miejscu kursora w dowolnej notatce. Uruchom je lokalnie, a dźwięk nigdy nie opuści komputera.
Przeniosłem swoje prywatne notatki do Standard Notes z jednego powodu — aplikacja szyfruje wszystko, zanim cokolwiek opuści mojego laptopa, i nie muszę brać tego na wiarę. Jedyne, czego mi brakowało, to mówienie do notatki zamiast wpisywania jej z klawiatury. Zacząłem więc szukać ustawienia dyktowania. Nie ma takiego. Standard Notes z założenia daje Ci czysty edytor i niewiele więcej, a po sporej dawce grzebania jestem pewien, że nie ukrywa przede mną żadnego przycisku mikrofonu.
Ludzie wpisują w wyszukiwarkę „zamiana głosu na tekst w Standard Notes”, niczego nie znajdują w aplikacji i zakładają, że przeoczyli jakiś przełącznik. Wcale nie. Tego przełącznika nigdy nie zbudowano. Dobra wiadomość: rozwiązanie zajmuje około dwóch minut, może działać całkowicie offline i — jeśli ustawisz je tak, jak zaraz opiszę — utrzymuje Twój głos na tym samym komputerze, który już szyfruje Twoje notatki.
Oto coś, czego większość stron krążących wokół tego hasła nie powie wprost. Edytor Standard Notes to po prostu pole tekstowe, takie samo jak Gmail czy pasek wyszukiwania. Dyktowanie, które wkleja tekst w miejscu kursora, nie obchodzi, w której aplikacji ten kursor się znajduje.
Prawdziwe pytanie nie brzmi więc „jak włączyć pisanie głosem w Standard Notes”. Nie ma takiego przełącznika. Pytanie brzmi „jakie narzędzie do dyktowania uruchomić na wierzchu i czy to narzędzie po cichu wysyła mój głos na serwer”. W przypadku aplikacji z notatkami szyfrowanymi domyślnie ta druga część ma większe znaczenie niż zwykle. Omówię opcje, skonfiguruję jedną w dwie minuty i powiem Ci, kiedy w ogóle pominąć dedykowane rozwiązanie.
Czy Standard Notes ma wbudowane dyktowanie?

Nie. Aplikacja Standard Notes na komputer nie ma wbudowanej funkcji zamiany mowy na tekst, dyktowania ani pisania głosem do notatki. W edytorze nie ma przycisku mikrofonu, nie ma komendy głosowej, nie ma ukrytego ustawienia. To nie przeoczenie — Standard Notes celowo stawia na minimalizm, jest zwykłym szyfrowanym edytorem, a nie przeładowanym narzędziem do wszystkiego. Jeśli przeczesujesz ustawienia w poszukiwaniu przełącznika dyktowania, możesz przestać. Nie ma go tam.
Tu warto wiedzieć, wokół czego zbudowany jest Standard Notes. Tekst Twojej notatki jest szyfrowany od końca do końca, zanim w ogóle opuści Twoje urządzenie, i to jest cała idea. Każde dyktowanie, które do tego dokładasz, z definicji żyje poza tą granicą — to osobne narzędzie zamieniające Twoją mowę na znaki, a następnie przekazujące te znaki edytorowi, tak jak zrobiłaby to klawiatura. Pytanie, które naprawdę ma znaczenie, nie brzmi, czy edytor potrafi Cię usłyszeć. Brzmi: czy to, co Cię słyszy, zatrzymuje dźwięk na Twoim komputerze, czy wysyła go gdzieś dalej. Zapamiętaj to; ta myśl kształtuje całą resztę tego poradnika.
Jedna rzecz warta pojedynczego zdania, żebyś nie gonił jej na niewłaściwym urządzeniu: na telefonie nie potrzebujesz nic z tego. Dotknij mikrofonu na klawiaturze telefonu i dyktuj do notatki Standard Notes jak do każdego innego pola tekstowego. Whisper to narzędzie komputerowe dla Windows i macOS, więc tutaj praktycznym rozwiązaniem jest mikrofon na klawiaturze telefonu. W aplikacji komputerowej, w której większość ludzi naprawdę pisze, potrzebujesz narzędzia, które działa na wierzchu Standard Notes — i to narzędzie warto wybrać z myślą o prywatności.
Naciśnij skrót, mów, tekst ląduje w notatce
To cały mechanizm i jest nudny w najlepszym tego słowa znaczeniu. Naciskasz skrót klawiszowy, mówisz, puszczasz, a transkrypcja wkleja się w miejscu kursora, w dowolnym aktywnym polu tekstowym. Whisper trzyma krótki ogon po puszczeniu klawisza, więc Twoje ostatnie słowo nie zostaje obcięte. Ponieważ tekst wkleja się w miejscu kursora systemowego, edytor Standard Notes to po prostu „jakiekolwiek pole tekstowe”. Aplikacja komputerowa czy wersja przeglądarkowa — działa tak samo.
To właśnie tę część strony reklamowe niepotrzebnie komplikują. Nie ma żadnego rozszerzenia do zainstalowania w Standard Notes, żadnego tokenu API do wklejenia w aplikacji, żadnego zadania synchronizacji do pilnowania. Kursor jest w notatce, mówisz, słowa pojawiają się w notatce. Podczas mówienia pojawia się mała kapsułka, żebyś wiedział, że narzędzie nasłuchuje:
Skrót klawiszowy to jedna rzecz, którą warto od razu dobrze ustawić. W Windows to Ctrl+Space; na Macu Command+Option, czyli sam modyfikator wciskany i przytrzymywany podczas mówienia. Oba można zmienić w Ustawieniach, jeśli kolidują z czymś, czego już używasz. (Moja młodsza córka powiedziała mi kiedyś, że skrót „nie działa” w jej aplikacji do rysowania. To był konflikt, a nie błąd — i tak nauczyłem się, że przeciętna osoba nie ma pojęcia, co to w ogóle jest konflikt skrótów. Dlatego teraz każdy skrót można dostosować.) Jeśli kiedykolwiek konfigurowałeś dyktowanie w Windows, to ta sama pamięć mięśniowa skierowana na inną aplikację.
Skonfiguruj to w dwie minuty (Windows lub Mac)
Potrzebujesz Maca na Apple Silicon albo komputera z Windows 10 lub nowszym, działającego mikrofonu i otwartego Standard Notes — w aplikacji komputerowej albo w wersji przeglądarkowej. Cały lokalny proces jest darmowy dla każdego zalogowanego konta, bez podawania metody płatności przy rejestracji. Oto kolejność.
Krok 1 — Zainstaluj Whisper i zaloguj się.
Pobierz ze strony pobierania, zainstaluj i załóż darmowe konto. Bez karty. Cały lokalny proces transkrypcji otwiera się od razu.
Poznasz, że się udało, gdy w zasobniku systemowym pojawi się ikona aplikacji, a kreator konfiguracji zaproponuje wybór modelu.
Krok 2 — Wybierz lokalną ścieżkę transkrypcji.
Aplikacja nie wybiera za Ciebie. Masz trzy opcje: Chmura (OpenAI, własny klucz), lokalny Parakeet albo lokalny Whisper. Do prywatnych notatek wybierz jedną z dwóch ścieżek lokalnych — więcej o tym, dlaczego, kilka sekcji niżej.
Poznasz, że się udało, gdy model skończy się pobierać i pokaże się jako gotowy.
Krok 3 — Potwierdź skrót klawiszowy.
Windows domyślnie używa Ctrl+Space, Mac — Command+Option przytrzymywanego jak przycisk „naciśnij i mów”. Na Macu, gdy pojawi się prośba, przyznaj uprawnienie Dostępności; bez niego wklejanie w miejscu kursora nie sięgnie innych aplikacji.
Poznasz, że się udało, gdy testowe nagranie wklei się do dowolnego pola tekstowego.
Krok 4 — Ustaw kursor w notatce Standard Notes i mów.
Otwórz notatkę, kliknij w edytor, przytrzymaj skrót, powiedz zdanie, puść. Transkrypcja pojawi się tam, gdzie jest kursor, w notatce.
Poznasz, że się udało, gdy wypowiedziane zdanie znajdzie się w edytorze Standard Notes jako tekst.
Wolny etap to pobieranie modelu, a nie konfiguracja. Cała reszta to te cztery kroki powyżej. Gdy już działa, uchwycenie myśli w szyfrowanej notatce przestaje być pisaniem, a staje się mówieniem — a przy wybranym modelu lokalnym nic z tej myśli nie opuszcza Twojego laptopa.
Jak zachować głos równie prywatny jak notatki
To sekcja, która dla użytkownika Standard Notes ma największe znaczenie, więc powiem wprost. Jeśli wybrałeś aplikację z notatkami szyfrowanymi od końca do końca, przepuszczanie wypowiadanych słów przez chmurową usługę transkrypcji, żeby trafiły do tej aplikacji, jest sprzecznością. Tekst Twojej notatki zostaje zaszyfrowany, zanim opuści urządzenie; Twój głos w takiej konfiguracji już nie. To tak, jakby zamknąć drzwi wejściowe na klucz, a nagranie audio, jak je odmykasz, zostawić na cudzym serwerze.
Tryb lokalny zamyka tę lukę. Oba lokalne silniki — Parakeet i lokalny Whisper — działają w całości na Twoim komputerze, dzięki napisanemu w czystym Rust rdzeniowi transkrypcji. Żadnego wysyłania dźwięku, żadnego wywołania API, żadnej powiązanej z kontem transkrypcji leżącej w logach dostawcy. Możesz wyciągnąć kabel sieciowy, a dyktowanie nadal działa — i to jest test, któremu naprawdę ufam. Tekst ląduje w miejscu kursora w Standard Notes, które następnie szyfruje go tak, jak szyfruje wszystko inne. Głos i notatka zostają na tym samym komputerze, od początku do końca.
Nie jestem w tej kwestii neutralny i wolę pokazać konkretny przykład niż machać rękami. Zespół, z którym kiedyś pracowałem, pozwolił wykonawcy zbudować wewnętrzny prototyp „dyktowania z AI”, który dla każdej wypowiedzi wywoływał chmurowe API. Logika „inteligentnego ponawiania” była nieco zbyt agresywna, więc te same nagrania spotkań stand-up transkrybowała po cztery razy. Pod koniec kwartału menedżer otworzył panel kosztów chmury i zobaczył pięciocyfrowy rachunek, a wniosek dyrektora finansowego nie brzmiał „zoptymalizujmy prompt” — brzmiał „albo w ogóle nie płacimy za wysyłanie naszych spotkań na serwer”. W przypadku prywatnego nawyku robienia notatek ryzykiem nie jest rachunek; jest nim zasada. Jeśli cały sens istnienia aplikacji polega na tym, że Twoje dane pozostają Twoje, dyktowanie, które ją zasila, powinno trzymać tę samą linię.
Lokalnie czy w chmurze — który tryb do szyfrowanej notatki
W przypadku Standard Notes zacząłbym lokalnie i traktował chmurę jako wyjątek. Jesteś tu z powodu prywatności, a dwie ścieżki lokalne dają Ci dyktowanie, które nigdy nie dotyka serwera. Tryb chmurowy w kilku rzeczach jest naprawdę lepszy, ale to jedyna ścieżka, która opuszcza Twój komputer, więc sięgaj po nią świadomie, a nie domyślnie. Oto czym różnią się te trzy opcje, bo aplikacja każe Ci wybrać, a wolę, żebyś wybrał dobrze:
- Lokalny Parakeet — Silnik TDT od NVIDIA, około 600 MB, i najszybsza lokalna opcja — od 5 do 10 razy szybsza niż Whisper na CPU. Obsługuje angielski plus 24 inne języki europejskie, łącznie 25. Bez tłumaczenia na angielski. Jeśli piszesz notatki po angielsku lub w innym języku europejskim, to szybki, w pełni offline wybór.
- Lokalny Whisper — wolniejszy niż Parakeet na tym samym komputerze, ale wersje wielojęzyczne obsługują 99 języków i potrafią tłumaczyć na angielski. Wersje tylko angielskie obsługują tylko angielski, a nie 99 języków. Wybierz tę opcję do chińskiego, japońskiego, koreańskiego albo do jakiejkolwiek pracy z tłumaczeniem, czego Parakeet nie potrafi. Domyślny model angielski to około 480 MB. Nadal w pełni offline.
- Chmura (OpenAI, własny klucz) — najlepsza dokładność i dostęp do sieci, z użyciem Twojego własnego klucza OpenAI rozliczanego bezpośrednio przez OpenAI. Transkrypcja domyślnie działa na gpt-4o-mini-transcribe. Wymaga internetu, więc Twój dźwięk opuszcza komputer — to jedyna ścieżka, która łamie obietnicę pracy lokalnej. Funkcja Chmury jest częścią Whisper Pro.
Nudna prawda jest taka, że dla rodzaju tekstu, jaki większość ludzi wrzuca do szyfrowanej notatki — wpis do dziennika, niedokończony pomysł, podpowiedź do hasła, której nigdy nie wkleiłbyś do dokumentu w chmurze — tryb lokalny w zupełności wystarcza. Oba lokalne silniki działają w całości na Twoim komputerze, niczego nie wysyłając na serwer, co jest dokładnie tą umową, którą Standard Notes już zawiera w sprawie samej notatki. Chmura zasługuje na swoje miejsce, gdy chcesz najwyższej dokładności na trudnym nagraniu albo potrzebujesz, żeby model w połowie zdania wyciągnął fakt z sieci. W przypadku prywatnych notatek rzadko jest to kompromis, na który chcesz pójść.
Jeśli naprawdę potrzebujesz dokładności klasy chmurowej dla konkretnej notatki, uczciwym ruchem jest dokonać tego wyboru świadomie, wiedząc, że dla tego nagrania dźwięk opuszcza komputer, i wrócić do trybu lokalnego dla prywatnych spraw. Aplikacja trzyma ten przełącznik o jedno kliknięcie stąd właśnie po to, żebyś nigdy nie utknął. Przez większość dni, dla większości notatek, w ogóle go nie dotykam.
Interpunkcja i porządki bez opuszczania komputera
Surowe dyktowanie wychodzi jako jedno długie zdanie bez końca. Mówisz „okej więc przenieś kody odzyskiwania do szyfrowanej notatki oznacz ją bezpieczeństwo i przypomnij mi żeby je zmienić w przyszłym miesiącu”, i to jest ten pozbawiony interpunkcji mur, jaki podaje Ci każdy silnik mowy. Uporządkowanie tego to miejsce, w którym ścieżki się rozchodzą — a w aplikacji nastawionej na prywatność miejsce, gdzie odbywa się porządkowanie, też ma znaczenie.
Pisanie głosem w Windows dodaje interpunkcję na bieżąco, a Dyktowanie w macOS radzi sobie z podstawową interpunkcją, gdy powiesz „przecinek” albo „kropka”. Do cięższego porządkowania — usuwania „yyy”, naprawiania zdań bez końca, zamiany wypowiedzianego akapitu w coś, co naprawdę chciałbyś zostawić w notatce — Whisper może uruchomić przebieg AI. Powiedz frazę aktywującą „Hey whisper”, a tekst zostanie ulepszony, zanim wyląduje. W modelu lokalnym ten przebieg działa przez Ollama na Twoim własnym komputerze, więc nawet porządkowanie pozostaje offline; w trybie chmurowym to domyślnie gpt-5-mini, które jednak wysyła tekst na zewnątrz.
okej więc przenieś kody odzyskiwania do szyfrowanej notatki oznacz ją bezpieczeństwo i przypomnij mi żeby je zmienić w przyszłym miesiącu yyy przed odnowieniem
Okej, więc przenieś kody odzyskiwania do szyfrowanej notatki, oznacz ją „bezpieczeństwo” i przypomnij mi, żeby je zmienić w przyszłym miesiącu, przed odnowieniem.
Uczciwe oczekiwanie, jakie warto sobie ustawić: dyktowanie daje Ci słowa, ale nie własną strukturę Standard Notes. Tagi aplikacji, tytuły notatek, wybory edytora — to nadal ustawiasz klawiszami i kliknięciami, których już używasz. Podyktuj zdanie, a potem dodaj tag albo zmień nazwę notatki w zwykły sposób. Żadne narzędzie do dyktowania nie wyczaruje organizacji aplikacji na komendę; każdy, kto obiecuje „powiedz oznacz to bezpieczeństwo i patrz, jak samo się układa”, sprzedaje Ci pokaz, a nie zwykły wtorek. Szybko zapisz słowa głosem, a notatkę ukształtuj narzędziami, które już znasz.
Ten sam schemat „mów, potem porządkuj” sprawdza się daleko poza notatkami — możesz też dyktować czysty tekst do dowolnej aplikacji jednym skrótem klawiszowym, więc długi wpis staje się kilkoma wypowiedzianymi zdaniami zamiast akapitu, który wystukujesz z klawiatury.
Kiedy pominąć narzędzie do dyktowania w Standard Notes

Czasem właściwym narzędziem jest to darmowe, które już masz na komputerze, a udawanie, że jest inaczej, byłoby nieuczciwe. Jeśli wrzucasz do Standard Notes tylko krótkie zapiski — szybką linijkę, dwuwyrazowe przypomnienie — Twój system operacyjny załatwi to za darmo.
W Windows naciśnij klawisz Windows + H, a wbudowany pasek Pisania głosem otworzy się tam, gdzie jest kursor, włącznie z edytorem Standard Notes. Sam stawia interpunkcję i nadaje się do krótkich zrywów. Jeden haczyk warty zaznaczenia akurat dla tej grupy odbiorców: Win+H przesyła Twoją mowę przez serwery Microsoftu i wymaga połączenia z internetem, więc nie jest opcją offline. Dla aplikacji z notatkami, której całe założenie polega na tym, że Twoje dane zostają na urządzeniu, to realna sprzeczność — lokalny model Whisper jest bardziej spójnym wyborem, gdy chodzi właśnie o prywatność. Na Macu Dyktowanie pozwala mówić, by wpisywać tekst wszędzie tam, gdzie możesz pisać; konfigurujesz je w Ustawieniach systemowych w sekcji Klawiatura, a na Apple Silicon ogólny tekst może być przetwarzany na urządzeniu, co utrzymuje go lokalnie. Oba są naprawdę dobre do krótkich fragmentów.
Sięgnij po dedykowane narzędzie obejmujące cały system, gdy wbudowane zaczynają uwierać: długie notatki, praca wielojęzyczna, potrzeba porządkowania albo chęć posiadania jednego skrótu, który zachowuje się tak samo w Standard Notes, Twojej poczcie i Twoim edytorze — przy zachowaniu wszystkiego offline. Poniżej tego progu używaj tego, co darmowe, z jednym zastrzeżeniem, że w Windows „darmowe” znaczy „przepuszczone przez Microsoft”. Nie zamierzam mówić Ci, żebyś instalował aplikację dla jednolinijkowego przypomnienia.
Ten sam kompromis pojawia się, jeśli trzymasz notatki też gdzie indziej — logika w dyktowaniu do Notion jest identyczna, bo w obu aplikacjach prawdziwym punktem integracji jest kursor, a nie wbudowana funkcja.
Dalsza lektura
Standard Notes nigdy nie dostarczył przycisku mikrofonu i znając jego determinację w trzymaniu się minimalizmu i prywatności, wątpię, żeby kiedykolwiek to zrobił. Nie musi, bo to kursor jest integracją. Mów do notatki, dostawaj tekst, a jeśli trzymasz wszystko lokalnie, dźwięk zostaje na tym samym komputerze, który szyfruje. Większość tego poradnika podyktowałem do pola tekstowego, które nie było Standard Notes, narzędziem, które nie obchodzi, jakie to pole, i które nigdy nie wysłało ani sylaby na serwer, a potem wkleiłem całość do własnej szyfrowanej notatki. To cały trik.
Wypróbuj to w swojej następnej notatce Standard Notes
Przytrzymaj skrót, mów, puść. Transkrypcja ląduje w tej notatce, w której masz kursor — i zostaje na Twoim komputerze, jeśli trzymasz ją lokalnie.
Darmowy tryb lokalny dla każdego zalogowanego konta. Bez karty na start.



