Poradnik
Zamiana mowy na tekst w Logseq
Logseq nie ma wbudowanego dyktowania na komputerze. Rozwiązaniem jest narzędzie działające w całym systemie: naciskasz skrót klawiszowy, mówisz, a transkrypcja wkleja się przy kursorze w dowolnym bloku Logseq. Dyktowanie systemowe też się sprawdzi, do krótkich notatek.
Ostatnia aktualizacja: czerwiec 2026

Zamiana mowy na tekst w Logseq działa dzięki narzędziu obejmującemu cały system, a nie samemu Logseq. Aplikacja desktopowa Logseq nie ma wbudowanego dyktowania. Rozwiązaniem jest narzędzie takie jak Whisper: naciskasz skrót klawiszowy, mówisz, a transkrypcja wkleja się przy kursorze w dowolnym bloku Logseq. Dyktowanie wbudowane w system też się sprawdzi, do krótkich notatek.
Codzienny dziennik prowadzę w Logseq, bo bardziej ufam folderowi ze zwykłym markdownem niż jakiejkolwiek chmurze. Jednej rzeczy zawsze mi brakowało: chciałem mówić do bloku, a nie wpisywać go z klawiatury. Poszukałem odpowiedniego ustawienia. Takiego ustawienia nie ma. Logseq nie ma przycisku mikrofonu i po sporym grzebaniu jestem przekonany, że wcale go przede mną nie ukrywa.
Ludzie szukają „zamiany mowy na tekst w Logseq”, nic nie znajdują w aplikacji i zakładają, że przeoczyli jakiś przełącznik. Nie przeoczyli. Tego przełącznika nigdy nie zbudowano. Dobra wiadomość jest taka, że rozwiązanie zajmuje około dwóch minut, działa w pełni offline, jeśli tego chcesz, a w bonusie działa też w każdej innej otwartej aplikacji.
Oto sedno, którego większość stron krążących wokół tej frazy nie powie wprost. Blok w Logseq to po prostu pole tekstowe, takie samo jak w Gmailu czy w pasku wyszukiwania. Dyktowanie wklejające tekst przy kursorze nie obchodzi, w której aplikacji ten kursor się znajduje.
Prawdziwe pytanie nie brzmi więc „jak włączyć pisanie głosowe w Logseq”. Nie ma żadnego przełącznika. Pytanie brzmi „które narzędzie do dyktowania uruchomić nad Logseq”, a odpowiedź zależy od tego, czy zależy ci na rozwiązaniu darmowym i wbudowanym, działającym tylko na Macu, czy na jednym skrócie offline, który zachowuje się tak samo wszędzie. Przejdę przez to wszystko, skonfiguruję jedno w dwie minuty i powiem ci, kiedy odpuścić sobie dedykowane narzędzie.
Czy Logseq ma wbudowane dyktowanie?

Nie. Aplikacja desktopowa Logseq nie ma wbudowanej zamiany mowy na tekst, dyktowania ani pisania głosowego pozwalającego mówić wprost do bloku. Nie ma przycisku mikrofonu przy bloku, nie ma komendy głosowej, nie ma ukrytego ustawienia. Jeśli przeczesujesz Ustawienia w poszukiwaniu tego, możesz przestać. Tego tam nie ma.
Istnieje za to zestaw wtyczek społecznościowych ze słowem „whisper” w nazwie i właśnie tu ludzie się gubią. Te wtyczki transkrybują plik audio albo link z YouTube na tekst po fakcie. Są przydatne, ale to nie jest dyktowanie na żywo. Nie ustawisz kursora w dzisiejszym dzienniku, nie powiesz czegoś i nie zobaczysz pojawiających się słów. One przetwarzają nagranie; nie piszą za ciebie, gdy myślisz. Pomylenie tych dwóch rzeczy kosztuje całe popołudnie, a wolałbym, żebyś tego popołudnia sobie oszczędził.
Sytuacja na telefonie to osobna historia, warta jednego zdania, żebyś nie gonił za tym na niewłaściwym urządzeniu: nowsza aplikacja mobilna Logseq dodała trochę transkrypcji głosowej, ale to funkcja telefonu, a na telefonie i tak po prostu użyjesz mikrofonu klawiatury. Na grafie desktopowym, w którym większość ludzi faktycznie żyje, potrzebujesz narzędzia działającego nad Logseq. Istnieją trzy uczciwe kategorie i reszta tego poradnika je omawia.
Naciskasz skrót, mówisz, tekst ląduje w bloku
To cały mechanizm i jest nudny w najlepszym możliwym sensie. Naciskasz skrót klawiszowy, mówisz, puszczasz, a transkrypcja wkleja się przy kursorze, w dowolnym aktywnym polu tekstowym. Whisper przytrzymuje krótki ogon po zwolnieniu klawisza, więc twoje ostatnie słowo nie zostaje ucięte. Ponieważ wkleja przy kursorze systemowym, blok Logseq to po prostu „dowolne pole tekstowe”. Aplikacja desktopowa czy wersja w przeglądarce — działa tak samo.
To właśnie część, którą strony docelowe niepotrzebnie komplikują. Nie ma żadnej wtyczki do zainstalowania w Logseq, żadnego tokenu API do wklejenia, żadnego zadania synchronizacji do pilnowania. Kursor jest w bloku, mówisz, słowa pojawiają się w bloku. Mała kapsułka pokazuje się, gdy mówisz, żebyś wiedział, że narzędzie słucha:
Skrót klawiszowy to jedyna rzecz, którą warto od razu dobrze ustawić. W Windows to Ctrl+Space; na Macu to Command+Option, modyfikator typu „naciśnij i mów”, który przytrzymujesz podczas mówienia. Oba można zmienić w Ustawieniach, jeśli kolidują z czymś, czego już używasz. (Moja młodsza córka powiedziała mi kiedyś, że skrót „nie działa” w jej programie do rysowania. To był konflikt, a nie błąd — tak nauczyłem się, że przeciętny człowiek nie ma pojęcia, czym w ogóle jest konflikt skrótów. Dlatego teraz każdy skrót można dostosować). Jeśli kiedykolwiek konfigurowałeś dyktowanie w Windows albo na Macu, to ta sama pamięć mięśniowa skierowana na inną aplikację.
Skonfiguruj to w dwie minuty (Windows lub Mac)
Potrzebujesz Maca z Apple Silicon albo komputera z Windows 10 lub nowszym, działającego mikrofonu i otwartego Logseq — w aplikacji desktopowej albo w przeglądarce. Cały lokalny tok pracy jest darmowy dla każdego zalogowanego konta, bez podawania metody płatności przy rejestracji. Oto kolejność.
Krok 1 — Zainstaluj Whisper i zaloguj się.
Pobierz ze strony pobierania, zainstaluj i załóż darmowe konto. Bez karty. Cały lokalny tok transkrypcji otwiera się od razu.
Poznasz, że się udało, gdy w zasobniku systemowym pojawi się ikona aplikacji, a kreator konfiguracji zaproponuje wybór modelu.
Krok 2 — Wybierz ścieżkę transkrypcji.
Aplikacja nie wybiera za ciebie. Masz trzy opcje: Chmura (OpenAI, własny klucz), lokalny Parakeet albo lokalny Whisper. Do prywatnych notatek w dzienniku zacznij od lokalnej — więcej o tym dwie sekcje niżej.
Poznasz, że się udało, gdy model skończy się pobierać i pokaże się jako gotowy.
Krok 3 — Potwierdź swój skrót klawiszowy.
Windows domyślnie używa Ctrl+Space, Mac — Command+Option przytrzymywanego jak „naciśnij i mów”. Na Macu przyznaj uprawnienie Dostępności, gdy pojawi się prośba; bez niego wklejanie przy kursorze nie dosięgnie innych aplikacji.
Poznasz, że się udało, gdy testowe nagranie wklei się do dowolnego pola tekstowego.
Krok 4 — Ustaw kursor w bloku Logseq i mów.
Otwórz swój graf, kliknij w blok, przytrzymaj skrót, powiedz zdanie, zwolnij. Transkrypcja pojawia się tam, gdzie jest kursor, w bloku.
Poznasz, że się udało, gdy wypowiedziane zdanie znajdzie się jako tekst w bloku Logseq.
Wolna część to pobieranie modelu, a nie konfiguracja. Cała reszta to te cztery kroki powyżej. Gdy już działa, zapisywanie myśli w grafie przestaje być zadaniem do wpisania, a staje się zadaniem do wypowiedzenia.
Wtyczka do Logseq kontra skrót działający w całym systemie
Większość stron rankujących na tę frazę kieruje cię do wtyczki Logseq albo do Blurt, dedykowanego narzędzia w pasku menu na Macu, które mówi prosto do twojej struktury notatek. To poprawne odpowiedzi, każda z jednym strukturalnym haczykiem. Wtyczki w stylu whisper transkrybują pliki audio, a nie mowę na żywo do edytowanego bloku. A Blurt, według własnego opisu, działa tylko na macOS — jeśli jesteś na Windows, w ogóle nie wchodzi w grę.
Skrót działający w całym systemie omija oba ograniczenia. Wkleja przy kursorze systemowym niezależnie od tego, do którego okna ten kursor należy, więc ten sam klawisz, który wypełnia blok Logseq, wypełnia też okno tworzenia wiadomości w Gmailu, wiadomość na Slacku i opis commita. Jedno narzędzie, każde pole tekstowe, na Windows i na Macu. Niczego nie uczysz się od nowa, przełączając aplikacje, i nie potrzebujesz innego rozwiązania w zależności od laptopa.
Jeśli jesteś na Macu i zapisujesz wyłącznie w Logseq, Blurt to schludny, skupiony wybór wart sprawdzenia. W chwili, gdy jesteś na Windows albo chcesz tego samego przebiegu we wszystkich otwieranych programach, wygrywa rozwiązanie systemowe. Sam sięgnąłbym po jeden skrót, bo przełączam aplikacje jakieś czterdzieści razy na godzinę i nie chcę zapamiętywać czterdziestu różnych przycisków dyktowania.
Lokalnie czy w chmurze: który tryb dla prywatnego grafu
W przypadku Logseq najpierw wypróbuj tryb lokalny. Wielu z nas wybrało Logseq właśnie dlatego, że to lokalny, zwykły tekst — podsumowanie spotkania, na wpół ukształtowany pomysł, wpis do dziennika, którego nigdy nie chciałbyś trzymać na czyimś serwerze. Dziwnym wyborem byłoby trzymać notatki na własnym dysku, a potem przepuszczać swój głos przez chmurę, żeby tam trafił. Jeśli twój Mac ma Apple Silicon albo twój komputer pochodzi z ostatnich kilku lat, tryb lokalny bez problemu obsłuży codzienne dyktowanie, a chmura staje się wyjściem awaryjnym, a nie domyślnym.
Oto czym różnią się te trzy ścieżki, bo aplikacja każe ci wybrać, a wolałbym, żebyś wybrał dobrze:
- Lokalny Parakeet — Silnik TDT od NVIDIA, około 600 MB, najszybsza opcja lokalna — od 5 do 10 razy szybsza niż Whisper na procesorze. Obsługuje angielski plus 24 inne języki europejskie, łącznie 25. Bez tłumaczenia na angielski. Jeśli prowadzisz dziennik po angielsku albo w innym języku europejskim, to szybki, w pełni offline wybór.
- Lokalny Whisper — wolniejszy niż Parakeet na tej samej maszynie, ale wersje wielojęzyczne obsługują 99 języków i potrafią tłumaczyć na angielski. Wersje tylko angielskie obsługują wyłącznie angielski, a nie 99 języków. Wybierz to do chińskiego, japońskiego, koreańskiego albo dowolnej pracy z tłumaczeniem, czego Parakeet nie potrafi. Domyślny model angielski ma około 480 MB.
- Chmura (OpenAI, własny klucz) — najlepsza dokładność i dostęp do sieci, z użyciem własnego klucza OpenAI rozliczanego bezpośrednio przez OpenAI. Transkrypcja działa domyślnie na gpt-4o-mini-transcribe. Wymaga internetu, więc to jedyna ścieżka, która opuszcza twoją maszynę. Powierzchnia Chmury jest częścią Whisper Pro.
Nudna prawda jest taka, że do rodzaju tekstu, który większość ludzi wrzuca do Logseq, tryb lokalny w zupełności wystarcza. Oba lokalne silniki działają w pełni na twojej maszynie, nic nie jest wysyłane na serwer, co jest całym sensem grafu opartego na lokalnym pliku. Chmura zasługuje na swoje miejsce, gdy chcesz najwyższej dokładności na trudnym nagraniu albo potrzebujesz, by model w połowie zdania wyciągnął fakt z sieci. Do nawyku codziennego dziennika zacznij od lokalnego i sięgaj po chmurę tylko wtedy, gdy lokalny zostawia cię z niedosytem.
Interpunkcja, bloki i markdown Logseq przez głos
Surowe dyktowanie wychodzi jako jeden ciąg. Mówisz „okej więc przejrzyj dokument architektury otaguj go projekt alfa i przypomnij mi w czwartek” i to jest pozbawiona interpunkcji ściana, którą podaje ci każdy silnik mowy. Uporządkowanie tego to miejsce, w którym ścieżki się rozchodzą.
Pisanie głosowe w Windows dodaje interpunkcję w trakcie mówienia, a Dyktowanie w macOS radzi sobie z podstawową interpunkcją, gdy powiesz „przecinek” lub „kropka”. Do cięższego porządkowania — usunięcia „yyy”, naprawienia ciągów, zamiany wypowiedzianego akapitu w coś, co naprawdę zostawiłbyś w grafie — Whisper może wykonać przejście z AI. Powiedz frazę aktywującą „Hej whisper”, a tekst zostaje ulepszony, zanim wyląduje. Na modelu lokalnym działa to przez Ollama; w trybie chmury domyślnie jest to gpt-5-mini.
okej więc przejrzyj dokument architektury otaguj go projekt alfa i przypomnij mi w czwartek yyy przed standupem
Okej, więc przejrzyj dokument architektury, otaguj go jako Projekt Alfa i przypomnij mi w czwartek przed standupem.
Jeśli chodzi o własną strukturę Logseq — zagnieżdżone bloki, linki #tag i [[strona]], znaczniki TODO — uczciwa odpowiedź jest taka, że głos daje ci tekst, a własna składnia Logseq daje ci strukturę. Podyktuj zdanie, a potem wpisz Tab, żeby wciąć, # do taga albo [[ do linku do strony, tak jak zawsze. Żadne narzędzie do dyktowania nie wyczaruje na zawołanie składni struktury Logseq; każdy, kto obiecuje „powiedz taguj projekt alfa i patrz, jak się linkuje”, sprzedaje ci demo, a nie zwykły wtorek. Szybko zapisz słowa głosem, a bloki uformuj klawiszami, które już znasz.
Ten sam przepływ mów-a-potem-porządkuj opłaca się daleko poza twoim grafem — możesz też dyktować schludną prozę do dowolnej aplikacji jednym skrótem, więc długi blok zamienia się w kilka wypowiedzianych zdań zamiast akapitu, który wpisujesz z klawiatury.
Kiedy odpuścić narzędzie do dyktowania w Logseq

Czasem właściwym narzędziem jest to darmowe, które już masz na maszynie, a udawanie, że jest inaczej, byłoby nieuczciwe. Jeśli wrzucasz do Logseq tylko krótkie notatki — szybką linijkę dziennika, dwuwyrazowe przypomnienie — twój system operacyjny obsłuży to za darmo.
W Windows naciśnij klawisz Windows + H, a wbudowany pasek Pisania głosowego otworzy się tam, gdzie jest twój kursor, łącznie z blokiem Logseq. Sam dodaje interpunkcję i nadaje się do krótkich zrywów. Haczyk: przechodzi przez serwery Microsoftu i wymaga połączenia z internetem, więc to nie jest opcja offline, co ma większe znaczenie niż zwykle, gdy całym sensem twojego grafu jest pozostawanie lokalnym. Na Macu Dyktowanie pozwala mówić, by wprowadzać tekst wszędzie tam, gdzie możesz pisać; konfigurujesz je w Ustawieniach systemowych w sekcji Klawiatura, a na Apple Silicon ogólny tekst może być przetwarzany na urządzeniu. A jeśli jesteś użytkownikiem Maca, który żyje w całości w Logseq, Blurt to skupiony, natywny wybór zbudowany dokładnie do tego.
Sięgaj po dedykowane narzędzie działające w całym systemie, gdy wbudowane zaczynają boleć: długie notatki, praca wielojęzyczna, prywatność offline na Windows albo chęć posiadania jednego skrótu, który zachowuje się tak samo w Logseq, w twojej poczcie i w twoim edytorze. Poniżej tej granicy korzystaj z tego, co darmowe. Nie będę ci kazał instalować aplikacji do jednolinijkowego przypomnienia.
Ten sam kompromis pojawia się, jeśli prowadzisz notatki także gdzie indziej — logika z dyktowania do Obsidian jest identyczna, bo obie to aplikacje markdown oparte na lokalnym pliku, w których prawdziwą integracją jest kursor, a nie wtyczka.
Do dalszej lektury
Logseq nigdy nie wprowadził przycisku mikrofonu i po napisaniu tego jestem dość pewien, że nigdy tego nie zrobi. Nie musi, bo integracją jest kursor. Mów do bloku, dostań tekst, uformuj go składnią, którą już znasz. Większość tego poradnika podyktowałem do pola tekstowego, które nie było Logseq, narzędziem, którego nie obchodzi, jakie to pole, a potem wkleiłem całość do własnego grafu. To cała sztuczka.
Wypróbuj to w swoim następnym bloku Logseq
Przytrzymaj skrót, mów, zwolnij. Transkrypcja ląduje w dowolnym bloku, w którym jest twój kursor — i w każdej innej aplikacji też.
Darmowy tryb lokalny dla każdego zalogowanego konta. Bez karty na start.



