Poradnik
Zamiana mowy na tekst w Joplin
Aplikacja desktopowa Joplin nie ma wbudowanego dyktowania — jego pisanie głosowe to funkcja dostępna tylko na Androidzie. Rozwiązaniem jest narzędzie działające w całym systemie: naciskasz skrót klawiszowy, mówisz, a transkrypcja wkleja się przy kursorze w dowolnej notatce Joplin. Dyktowanie systemowe też się sprawdzi przy krótkich zapiskach.
Ostatnia aktualizacja: czerwiec 2026

Zamiana mowy na tekst w Joplin na komputerze działa dzięki narzędziu obejmującemu cały system, a nie samemu Joplin. Wbudowane pisanie głosowe Joplin to funkcja wyłącznie na Androida; aplikacja desktopowa nie ma żadnej. Rozwiązaniem jest narzędzie takie jak Whisper: naciskasz skrót, mówisz, a transkrypcja wkleja się przy kursorze w dowolnej notatce Joplin. Do krótkich notatek nada się też dyktowanie wbudowane w system operacyjny.
Trzymam swoje notatki w Joplin, bo bardziej ufam folderowi zwykłych plików markdown synchronizowanych do pamięci, którą kontroluję, niż czyjejś chmurze. Jedyne, czego ciągle mi brakowało, to możliwość mówienia do notatki zamiast jej wpisywania. Poszedłem więc szukać tego ustawienia na swoim laptopie. Takiego ustawienia nie ma. Aplikacja desktopowa Joplin nie ma przycisku mikrofonu, a po sporym kopaniu jestem pewien, że go nigdzie nie ukrywa.
I tu właśnie ludzie się gubią. Joplin owszem ma wbudowane pisanie głosowe — tyle że na Androidzie. Jego własna dokumentacja deweloperska mówi to wprost. Ludzie słyszą „Joplin ma pisanie głosowe”, szukają go na komputerze, nic nie znajdują i zakładają, że przeoczyli jakiś przełącznik. Nie przeoczyli. Przełącznik jest w telefonie. Dobra wiadomość: rozwiązanie na komputerze zajmuje około dwóch minut, działa w pełni offline, jeśli chcesz, i w bonusie działa w każdej innej aplikacji, którą otworzysz.
Oto rzecz, której większość stron krążących wokół tego hasła nie powie wprost. Notatka w Joplin to po prostu pole tekstowe markdown, dokładnie takie samo jak Gmail czy pasek wyszukiwania. Dyktowanie, które wkleja się przy kursorze, nie obchodzi, w której aplikacji ten kursor się znajduje.
Prawdziwe pytanie nie brzmi więc „jak włączyć pisanie głosowe w Joplin na moim laptopie”. Na komputerze nie ma żadnego przełącznika. Pytanie brzmi „które narzędzie do dyktowania uruchomić na wierzchu Joplin”, a odpowiedź zależy od tego, czy chcesz coś darmowego i wbudowanego, na poziomie systemu, czy jeden skrót offline, który wszędzie zachowuje się tak samo. Przejdę przez to wszystko, skonfiguruję jedno narzędzie w dwie minuty i powiem, kiedy z dedykowanego rozwiązania można zrezygnować.
Czy Joplin ma wbudowane dyktowanie?

Na komputerze nie. Aplikacja desktopowa Joplin na Windows, Mac i Linux nie ma żadnej wbudowanej funkcji zamiany mowy na tekst, dyktowania ani pisania głosowego do tworzenia notatki głosem. Nie ma przycisku mikrofonu, nie ma komendy głosowej, nie ma ukrytej preferencji. Jeśli przeczesujesz Ustawienia w poszukiwaniu tego, możesz przestać. Tam tego nie ma.
To, co istnieje — i tu właśnie wszystkim się miesza — to pisanie głosowe w aplikacji Joplin na Androida. Własna dokumentacja deweloperska Joplin mówi to wprost: aplikacja mobilna na Androida obsługuje wbudowane, offline'owe pisanie głosowe, domyślnie przez Whisper. Zespół włożył w to sporo pracy, dodając automatyczną interpunkcję i własny słownik. To naprawdę dobra funkcja. Tyle że żyje w telefonie. Mylenie „Joplin ma pisanie głosowe” z „Joplin ma pisanie głosowe na moim laptopie” kosztuje stracone popołudnie, a wolałbym, żebyś to popołudnie sobie darował.
Sprawa mobilna jest więc jasna: na Androidzie masz to wbudowane, na iPhonie oparłbyś się na mikrofonie klawiatury, a tak czy inaczej jest to funkcja telefonu. Na notatce desktopowej, w której większość ludzi naprawdę żyje, potrzebujesz narzędzia, które usiądzie na wierzchu Joplin. Są dwie uczciwe drogi, a reszta tego poradnika je omawia.
Naciskasz skrót, mówisz, tekst ląduje w notatce
Na tym polega cały mechanizm i jest nudny w najlepszym tego słowa znaczeniu. Naciskasz skrót, mówisz, puszczasz, a transkrypcja wkleja się przy kursorze, w dowolnym polu tekstowym, które ma fokus. Whisper przytrzymuje krótki ogon po puszczeniu klawisza, więc ostatnie słowo nie zostaje ucięte. Ponieważ wkleja się przy kursorze systemu, notatka Joplin to po prostu „dowolne pole tekstowe”. Edytor markdown, edytor sformatowanego tekstu, pasek wyszukiwania — to samo zachowanie.
Tę część strony docelowe niepotrzebnie komplikują. Nie trzeba instalować żadnej wtyczki do Joplin, wklejać tokenu API ani niańczyć zadania synchronizacji. Kursor jest w notatce, mówisz, słowa pojawiają się w notatce. Mała kapsułka wyświetla się, gdy mówisz, żebyś wiedział, że nasłuchuje:
Skrót klawiszowy to jedyna rzecz, którą warto od razu dobrze ustawić. Na Windows to Ctrl+Space; na Macu Command+Option, naciskane samymi modyfikatorami push-to-talk, które przytrzymujesz podczas mówienia. Oba można zmienić w Ustawieniach, jeśli kolidują z czymś, czego już używasz. (Moja młodsza córka powiedziała mi kiedyś, że skrót „nie działa” w jej aplikacji do rysowania. To był konflikt, a nie błąd, i tak się nauczyłem, że przeciętna osoba nie ma pojęcia, czym w ogóle jest konflikt skrótów. Dlatego teraz każdy skrót da się dostosować.) Jeśli kiedykolwiek konfigurowałeś dyktowanie na Macu, to ta sama pamięć mięśniowa skierowana na inną aplikację.
Skonfiguruj to w dwie minuty (Windows lub Mac)
Potrzebujesz Maca na Apple Silicon albo komputera z Windows 10 lub nowszym, działającego mikrofonu i otwartego Joplin na pulpicie. Cały lokalny tok pracy jest darmowy dla każdego zalogowanego konta i nie wymaga podawania metody płatności przy rejestracji. Oto kolejność.
Krok 1 — zainstaluj Whisper i zaloguj się.
Pobierz ze strony pobierania, zainstaluj i załóż darmowe konto. Bez karty. Cały lokalny tok transkrypcji od razu się otwiera.
Poznasz, że się udało, gdy w zasobniku systemowym pojawi się ikona aplikacji, a kreator konfiguracji zaproponuje wybór modelu.
Krok 2 — wybierz ścieżkę transkrypcji.
Aplikacja nie wybiera za ciebie. Masz trzy opcje: Chmura (OpenAI, z własnym kluczem), lokalny Parakeet albo lokalny Whisper. Do prywatnych notatek, które trzymasz w zwykłym markdown, zacznij od lokalnej — więcej o tym dwie sekcje niżej.
Poznasz, że się udało, gdy model skończy się pobierać i pokaże się jako gotowy.
Krok 3 — potwierdź swój skrót klawiszowy.
Windows domyślnie ustawia Ctrl+Space, Mac — Command+Option przytrzymane jako push-to-talk. Na Macu nadaj uprawnienie Dostępności, gdy o nie poprosi; bez niego wklejanie przy kursorze nie dotrze do innych aplikacji.
Poznasz, że się udało, gdy testowe nagranie wklei się do dowolnego pola tekstowego.
Krok 4 — ustaw kursor w notatce Joplin i mów.
Otwórz Joplin, kliknij w treść notatki, przytrzymaj skrót, powiedz zdanie, puść. Transkrypcja pojawia się tam, gdzie jest kursor, w notatce.
Poznasz, że się udało, gdy wypowiedziane zdanie zasiądzie jako tekst w notatce Joplin.
Najwolniejszą częścią jest pobieranie modelu, a nie sama konfiguracja. Cała reszta to te cztery kroki powyżej. Gdy już działa, zapisanie myśli w notatce przestaje być zadaniem do wpisania, a staje się zadaniem do wypowiedzenia.
Komputer kontra telefon: gdzie naprawdę żyje pisanie głosowe Joplin
Warto to przypiąć na stałe, bo to źródło niemal każdego pytania „dlaczego nie mogę tego znaleźć”. Wbudowane pisanie głosowe Joplin to funkcja Androida. Dokumentacja mówi to jasno: aplikacja na Androida robi offline'owe pisanie głosowe przez Whisper, z interpunkcją i słownikiem. W aplikacji desktopowej ta funkcja nie istnieje. Ten sam produkt, te same notatki, dwie zupełnie różne możliwości w zależności od tego, na jakim urządzeniu otworzysz.
Jeśli więc głównie notujesz w telefonie, możesz nie potrzebować niczego dodatkowego — pisanie głosowe na Androidzie jest na miejscu, w edytorze notatek. Luka jest na laptopie, gdzie powstaje większość dłuższych tekstów i gdzie Joplin nie daje ci nic. Skrót działający w całym systemie tę lukę zamyka. Wkleja się przy kursorze systemu niezależnie od tego, które okno go posiada, więc ten sam klawisz, który wypełnia notatkę Joplin, wypełnia też okno tworzenia wiadomości w Gmailu, wiadomość w Slacku i treść commita. Jedno narzędzie, każde pole tekstowe, zarówno na Windows, jak i na Macu.
Jest też pewna schludność w utrzymywaniu tego samego przepływu na różnych urządzeniach. W telefonie używasz własnego pisania głosowego Joplin; na komputerze używasz skrótu. Oba wstawiają słowa do tej samej notatki markdown. Niczego się nie uczysz od nowa, gdy zmieniasz maszynę, a narzędzia desktopowego nie obchodzi, że to akurat Joplin — co oznacza, że obejmuje też każdy inny program, w którym piszesz. Sam sięgnąłbym po ten jeden skrót, bo przełączam aplikacje mniej więcej czterdzieści razy na godzinę i nie chcę pamiętać czterdziestu różnych przycisków do dyktowania.
Lokalnie czy w chmurze: który tryb do prywatnego sejfu
Do Joplin spróbuj najpierw trybu lokalnego. Cały powód, dla którego wielu z nas wybrało Joplin, jest taki, że to lokalny, zwykły markdown, który synchronizujesz do pamięci, którą kontrolujesz — podsumowanie spotkania, na wpół ukształtowany pomysł, wpis do dziennika, którego nigdy nie chciałbyś trzymać na czyimś serwerze. Dziwnym wyborem byłoby trzymać notatki w folderze, który należy do ciebie, a potem przepuszczać swój głos przez chmurę, żeby tam trafił. Jeśli twój Mac to Apple Silicon, a twój komputer pochodzi z ostatnich kilku lat, lokalnie poradzi sobie z codziennym dyktowaniem bez narzekania, a chmura staje się wyjściem awaryjnym, a nie domyślnym.
Oto czym różnią się te trzy ścieżki, bo aplikacja każe ci wybrać, a wolałbym, żebyś wybrał dobrze:
- Lokalny Parakeet — silnik TDT od NVIDIA, około 600 MB, i najszybsza opcja lokalna — 5 do 10 razy szybsza niż Whisper na CPU. Obejmuje angielski plus 24 inne języki europejskie, 25 łącznie. Brak tłumaczenia na angielski. Jeśli piszesz notatki po angielsku albo w innym języku europejskim, to szybki, w pełni offline'owy wybór.
- Lokalny Whisper — wolniejszy niż Parakeet na tej samej maszynie, ale wersje wielojęzyczne obejmują 99 języków i potrafią tłumaczyć na angielski. Wersje tylko po angielsku są tylko po angielsku, a nie na 99 języków. Wybierz tę opcję do chińskiego, japońskiego, koreańskiego lub jakiejkolwiek pracy tłumaczeniowej, której Parakeet nie zrobi. Domyślny model angielski ma około 480 MB.
- Chmura (OpenAI, własny klucz) — najlepsza dokładność i dostęp do sieci, z użyciem twojego własnego klucza OpenAI rozliczanego bezpośrednio przez OpenAI. Transkrypcja działa domyślnie na gpt-4o-mini-transcribe. Wymaga internetu, więc to jedyna ścieżka, która opuszcza twoją maszynę. Powierzchnia Chmury jest częścią Whisper Pro.
Nudna prawda jest taka, że do rodzaju tekstu, który większość ludzi wrzuca do Joplin, lokalnie w zupełności wystarcza. Oba lokalne silniki działają w całości na twojej maszynie, bez wysyłania czegokolwiek na serwer, co pasuje do ducha aplikacji do notatek, którą wybrałeś właśnie dlatego, że dane zostają twoje. Pokrywa się to też z własnym pisaniem głosowym Joplin na Androidzie, które zespół z tego samego powodu utrzymał w całości offline. Chmura zasługuje na swoje miejsce, gdy chcesz najwyższej klasy dokładności na trudnym nagraniu albo potrzebujesz, by model wyłowił fakt z sieci w połowie zdania. Do nawyku codziennych notatek zacznij lokalnie i sięgaj po chmurę tylko wtedy, gdy lokalne rozwiązanie cię zawiedzie.
Interpunkcja, markdown i porządkowanie głosem
Surowe dyktowanie wychodzi jako jeden ciąg bez przerwy. Mówisz „dobra więc spisz notatkę z przeglądu architektury otaguj ją project alpha i przypomnij mi w czwartek”, i to właśnie ta ściana bez interpunkcji, którą wręcza ci każdy silnik mowy. Posprzątanie tego to miejsce, w którym ścieżki się rozchodzą.
Pisanie głosowe Windows dodaje interpunkcję, gdy mówisz, a dyktowanie macOS radzi sobie z podstawową interpunkcją, gdy powiesz „przecinek” lub „kropka”. Do mocniejszego sprzątania — usunięcia „yyy”, naprawienia ciągów bez przerwy, zamienienia wypowiedzianego akapitu w coś, co naprawdę zostawiłbyś w notatce — Whisper może wykonać przebieg AI. Powiedz frazę aktywującą „Hey whisper”, a tekst zostaje ulepszony, zanim wyląduje. Na modelu lokalnym działa to przez Ollama; w trybie chmury jest to domyślnie gpt-5-mini.
dobra więc spisz notatkę z przeglądu architektury otaguj ją project alpha i przypomnij mi w czwartek yyy przed standupem
Dobra, więc spisz notatkę z przeglądu architektury, otaguj ją Project Alpha i przypomnij mi w czwartek przed standupem.
Co do własnego markdown Joplin — nagłówków, list punktowanych, pól wyboru, wewnętrznych linków [[notatka]] — uczciwa odpowiedź jest taka, że głos daje ci tekst, a skróty markdown Joplin dają ci strukturę. Podyktuj zdanie, a potem wpisz # do nagłówka, - do punktu albo - [ ] do pola wyboru, tak jak zawsze. Żadne narzędzie do dyktowania nie wyczaruje składni markdown na zawołanie; każdy, kto obiecuje „powiedz nagłówek project alpha i patrz, jak się formatuje”, sprzedaje ci demo, a nie zwykły wtorek. Szybko zrzuć słowa głosem, a markdown ukształtuj klawiszami, które już znasz.
Ten sam przepływ „mów, potem sprzątaj” opłaca się daleko poza twoimi notatkami — możesz też dyktować czysty tekst do dowolnej aplikacji jednym skrótem, więc długa notatka staje się kilkoma wypowiedzianymi zdaniami zamiast akapitu, który wystukujesz.
Kiedy zrezygnować z narzędzia do dyktowania na rzecz Joplin

Czasem właściwym narzędziem jest to darmowe, które już masz na maszynie, a udawanie inaczej byłoby nieuczciwe. Jeśli wrzucasz do Joplin tylko krótkie zapiski — szybką linijkę, dwuwyrazowe przypomnienie — i jesteś w telefonie, własne pisanie głosowe Joplin na Androidzie już to obsługuje za darmo. Na komputerze to samo robi twój system operacyjny.
Na Windows naciśnij klawisz Windows + H, a wbudowany pasek pisania głosowego otworzy się tam, gdzie jest twój kursor, łącznie z notatką Joplin. Sam wstawia interpunkcję i nadaje się do krótkich zrywów. Haczyk: przechodzi przez serwery Microsoftu i wymaga połączenia z internetem, więc nie jest opcją offline, co znaczy więcej niż zwykle, gdy całym sensem twoich notatek jest pozostanie lokalnym. Na Macu dyktowanie pozwala mówić, by wprowadzać tekst wszędzie tam, gdzie można pisać, konfigurujesz je w Ustawieniach systemu w sekcji Klawiatura, a na Apple Silicon ogólny tekst może być przetwarzany na urządzeniu.
Sięgnij po dedykowane narzędzie działające w całym systemie, gdy wbudowane zaczynają uwierać: długie notatki, praca wielojęzyczna, prywatność offline na Windows albo chęć posiadania jednego skrótu, który zachowuje się tak samo w Joplin, twojej poczcie i twoim edytorze. Poniżej tej granicy używaj tego, co darmowe — systemu na komputerze, własnego pisania głosowego Joplin na Androidzie. Nie zamierzam ci kazać instalować aplikacji dla jednolinijkowego przypomnienia.
Ten sam kompromis pojawia się, jeśli trzymasz notatki także gdzie indziej — logika z dyktowania do Obsidian jest identyczna, bo obie to lokalne aplikacje markdown, w których prawdziwą integracją jest kursor, a nie wtyczka.
Do dalszej lektury
Joplin wypuścił przycisk mikrofonu — na Androidzie, nie na moim laptopie, a po napisaniu tego wątpię, by ten desktopowy pojawił się wkrótce. I nie musi, bo na komputerze to kursor jest integracją. Mów do notatki, dostań tekst, ukształtuj go skrótami markdown, które już znasz. Większość tego poradnika podyktowałem do pola tekstowego, które nie było Joplin, narzędziem, którego nie obchodzi, jakie to pole, a potem wkleiłem całość do swojej notatki. Na tym polega cały trik.
Wypróbuj to w swojej następnej notatce Joplin
Przytrzymaj skrót, mów, puść. Transkrypcja ląduje w dowolnej notatce, w której masz kursor — i w każdej innej aplikacji też.
Darmowy tryb lokalny dla każdego zalogowanego konta. Bez karty, by zacząć.



