Autor: Denys Medvediev

Poradnik

Zamiana mowy na tekst w edytorze Substack

Edytor wpisów Substack nie ma wbudowanego dyktowania. Jego funkcje audio czytają na głos gotowy wpis; nie pomogą ci go napisać. Rozwiązaniem jest narzędzie działające w całym systemie: naciskasz skrót, mówisz, a twoje słowa pojawiają się w miejscu kursora w edytorze.

Ostatnia aktualizacja: czerwiec 2026

Autor przy laptopie na ciemnym biurku z kawą, szkicujący wpis za pomocą głosu

Zamiana mowy na tekst w edytorze Substack działa dzięki narzędziu obejmującemu cały system, a nie samemu Substackowi. Edytor wpisów Substack nie ma funkcji dyktowania; jego opcje audio jedynie czytają na głos gotowy tekst. Narzędzie takie jak Whisper to naprawia: naciskasz skrót, mówisz, a transkrypcja wkleja się w miejscu kursora w edytorze, po czym przejście AI porządkuje gadaninę.

Prowadzę mały newsletter, a większość moich najlepszych akapitów rodzi się, kiedy wyprowadzam psa, a nie kiedy siedzę przy klawiaturze. Zacząłem więc szukać sposobu, żeby wmówić szkic prosto do edytora Substack. Znalazłem mnóstwo stron o funkcji lektora w Substacku. Żadna z nich nie dotyczyła tego, czego naprawdę chciałem, czyli odwrotności.

Oto pomyłka, na którą wpada niemal każdy wynik wyszukiwania. Substack z chęcią zamieni twój gotowy wpis w nagranie audio. Nie zamieni twojego nagrania w wpis. To przeciwne kierunki, a ten drugi — dyktowanie szkicu — nie ma w edytorze żadnego przycisku. Rozwiązanie żyje poza Substackiem, zajmuje około dwóch minut konfiguracji i działa też w każdej innej aplikacji, w której piszesz.

Oto rzecz, którą artykuły o lektorze przemilczają. Edytor wpisów Substack to przeglądarkowe pole tekstowe z formatowaniem, takie samo jak okno tworzenia wiadomości w Gmailu czy dokument w Google Docs. Dyktowanie, które wkleja w miejscu kursora, nie obchodzi, do którego pola pisze.

Prawdziwe pytanie nie brzmi więc „jak włączyć dyktowanie w Substacku”. Nie ma żadnego przełącznika, a menu audio, na które wciąż trafiasz, robi coś przeciwnego. Pytanie brzmi „które narzędzie do dyktowania uruchomić nad edytorem Substack”, a odpowiedź zależy od tego, czy chcesz czegoś darmowego i wbudowanego, czy jednego skrótu działającego offline, który zachowuje się tak samo wszędzie. Przejdę przez to wszystko, skonfiguruję jedno narzędzie w dwie minuty i powiem ci, kiedy darować sobie osobne rozwiązanie.

Czy edytor Substack ma dyktowanie?

Osoba mówiąca z namysłem przy laptopie, ilustrująca szkicowanie głosem zamiast pisania

Nie. Edytor wpisów Substack nie ma wbudowanej zamiany mowy na tekst, dyktowania ani pisania głosowego do tworzenia szkicu głosem. Nie ma przycisku mikrofonu, który pisze za ciebie, nie ma polecenia głosowego, nie ma ukrytego ustawienia. Jeśli przeszukiwałeś pasek narzędzi edytora w jego poszukiwaniu, możesz przestać. Tego tam nie ma.

Jest za to — i to właśnie podsuwa ci każdy wynik wyszukiwania — menu audio pod ikoną słuchawek. To lektor i synteza mowy. Lektor pozwala nagrać samego siebie czytającego już napisany wpis albo wgrać plik audio, żeby subskrybenci mogli posłuchać. Synteza mowy, dostępna w niektórych publikacjach, każe syntetycznemu głosowi przeczytać na głos twój gotowy wpis. Oba biorą tekst i tworzą audio. Dyktowanie robi dokładnie odwrotnie: bierze twój głos i tworzy tekst. Ludzie mylą jedno z drugim, bo w obu chodzi o mikrofon i słowo „głos”, a ta pomyłka kosztuje popołudnie szukania. Wolę, żebyś to popołudnie sobie darował.

To rozróżnienie ma znaczenie, bo mówi ci, gdzie szukać. Nie znajdziesz dyktowania w Substacku, choćbyś nie wiem jak długo wpatrywał się w panel audio, bo nigdy go tam nie zbudowano. Edytor to pole tekstowe, które oczekuje pisania. Żeby wprowadzić do niego głos, potrzebujesz narzędzia, które siedzi nad przeglądarką i podaje tekst tam, gdzie jest kursor. Są dwie uczciwe drogi i reszta tego poradnika opisuje obie.

Naciśnij skrót, mów, słowa pojawiają się w edytorze

Na tym polega cały mechanizm i jest nudny w najlepszym tego słowa znaczeniu. Naciskasz skrót, mówisz, puszczasz, a transkrypcja wkleja się w miejscu kursora, w polu tekstowym, które ma fokus. Whisper przytrzymuje krótki ogon po tym, jak puścisz klawisz, żeby nie urwać twojego ostatniego słowa. Ponieważ wkleja w miejscu kursora systemu, edytor Substack jest po prostu „dowolnym polem tekstowym”. Edytor webowy bez API do integracji, bez gniazda na wtyczkę — i to nie ma znaczenia, bo dyktowanie w ogóle nie dotyka kodu Substacka. Pisze tam, gdzie już piszesz.

To właśnie ten element strony reklamowe niepotrzebnie komplikują. Nie ma nic do zainstalowania w Substacku, nie ma tokena do wklejenia w ustawieniach publikacji, nie ma integracji do zatwierdzenia. Kursor jest w edytorze, mówisz, słowa pojawiają się w edytorze. Mała kapsułka pojawia się, kiedy mówisz, żebyś wiedział, że narzędzie słucha:

Cancel
Nakładka nagrywania: mała kapsułka, która pojawia się, kiedy mówisz, żebyś wiedział, że Whisper słucha.

Skrót klawiszowy to jedyna rzecz, którą warto od razu dobrze ustawić. W systemie Windows to Ctrl+Space; na Macu to Command+Option, klawisz modyfikujący jako tryb push-to-talk, który przytrzymujesz podczas mówienia. Oba można zmienić w Ustawieniach, jeśli kolidują z czymś, czego już używasz. (Moja młodsza córka powiedziała mi kiedyś, że skrót „nie działa” w jej programie do rysowania. To był konflikt, a nie błąd, i tak nauczyłem się, że przeciętny człowiek nie ma pojęcia, czym w ogóle jest konflikt skrótów. Dlatego teraz każdy skrót da się dostosować). Jeśli kiedykolwiek konfigurowałeś dyktowanie w systemie Windows lub na Macu, to ta sama pamięć mięśniowa skierowana na twój newsletter.

Skonfiguruj to w dwie minuty (Windows lub Mac)

Potrzebujesz Maca na Apple Silicon albo komputera z systemem Windows 10 lub nowszym, działającego mikrofonu i otwartego w przeglądarce Substacka ze szkicem wpisu na ekranie. Cały lokalny proces jest darmowy dla każdego zalogowanego konta, bez pytania o metodę płatności przy rejestracji. Oto kolejność.

Krok 1 — Zainstaluj Whisper i zaloguj się.

Pobierz ze strony pobierania, zainstaluj i załóż darmowe konto. Bez karty. Cały lokalny proces transkrypcji otwiera się od razu.

Poznasz, że się udało, gdy w zasobniku systemowym pojawi się ikona aplikacji, a kreator konfiguracji zaproponuje wybór modelu.

Krok 2 — Wybierz ścieżkę transkrypcji.

Aplikacja nie wybiera za ciebie. Masz trzy opcje: Chmura (OpenAI, własny klucz), lokalny Parakeet albo lokalny Whisper. Do szkicowania wpisów na własnym komputerze zacznij lokalnie — więcej o tym dwie sekcje niżej.

Poznasz, że się udało, gdy model skończy się pobierać i pokaże się jako gotowy.

Krok 3 — Potwierdź swój skrót.

Windows domyślnie ustawia Ctrl+Space, Mac — Command+Option przytrzymywane jak push-to-talk. Na Macu udziel uprawnienia Dostępność, gdy pojawi się prośba; bez niego wklejanie w miejscu kursora nie dotrze do twojej przeglądarki.

Poznasz, że się udało, gdy testowe nagranie wklei się do dowolnego pola tekstowego.

Krok 4 — Ustaw kursor w edytorze Substack i mów.

Otwórz szkic, kliknij w treść, przytrzymaj skrót, powiedz zdanie, puść. Transkrypcja pojawia się tam, gdzie jest kursor, wewnątrz edytora.

Poznasz, że się udało, gdy wypowiedziane zdanie usiądzie w szkicu Substacka jako tekst.

Whisper
Prawdziwa aplikacja desktopowa Whisper na ekranie ustawień, z otwartymi panelami Transkrypcja i AI.

Najwolniejsza część to pobieranie modelu, a nie konfiguracja. Cała reszta to powyższe cztery kroki. Kiedy już działa, samo doprowadzenie szkicu na stronę przestaje być zadaniem pisania, a staje się zadaniem mówienia — co przy newsletterze stanowi większość roboty.

zamiana mowy na tekst w systemie Windows · na Macu

Dlaczego edytor w przeglądarce potrzebuje narzędzia obejmującego cały system

Edytor Substack działa w twojej przeglądarce, a to wyznacza granice tego, co w ogóle możliwe. Większość aplikacji, do których chciałbyś dyktować, ma wersję desktopową z głębokimi zaczepami; webowy edytor tekstu z formatowaniem nie ma nic z tego. Nie ma sklepu z wtyczkami, nie ma punktu rozszerzeń, który Substack udostępniałby do pisania w wpisie. Integracja nie może więc przyjść z wnętrza Substacka. Musi przyjść z warstwy nad przeglądarką.

Skrót obejmujący cały system to dokładnie ta warstwa. Wkleja w miejscu kursora systemu niezależnie od tego, które okno jest aktywne, więc ten sam klawisz, który wypełnia twój szkic w Substacku, wypełnia też twoje okno tworzenia wiadomości w Gmailu, wiadomość na Slacku oraz opis commita. Jedno narzędzie, każde pole tekstowe, zarówno w Windows, jak i na Macu. Nie uczysz się niczego od nowa, gdy przechodzisz od szkicowania wpisu do odpowiadania na e-mail czytelnika — to wszędzie ten sam naciśnij-mów-puść.

To także powód, dla którego rozszerzenie przeglądarki działające tylko w Substacku byłoby złym kształtem dla tego problemu. Autorzy nie żyją w jednej karcie. Szkicujesz w Substacku, szukasz w innym oknie, odpisujesz na komentarze w aplikacji, zapisujesz kolejny pomysł, gdziekolwiek się pojawi. Narzędzie ograniczone do jednej witryny rozwiązuje wycinek; narzędzie ograniczone do kursora rozwiązuje całość. Przełączam aplikacje jakieś czterdzieści razy na godzinę i nie chcę pamiętać czterdziestu różnych przycisków do dyktowania.

Lokalnie czy w chmurze: który tryb do szkicowania wpisów

Do szkicu newslettera najpierw spróbuj trybu lokalnego. Niedokończony wpis to twoje własne surowe myślenie — opinie, których jeszcze do końca nie sformułowałeś, akapit, który może wytniesz, rzecz, co do której nie masz pewności, czy chcesz ją już publikować. Dziwnym wyborem byłoby przepuszczać każde nieoszlifowane zdanie przez czyjąś chmurę tylko po to, żeby pojawiło się na twoim własnym ekranie. Jeśli twój Mac to Apple Silicon, a twój komputer jest z ostatnich kilku lat, tryb lokalny obsługuje codzienne dyktowanie bez narzekania, a chmura staje się wyjściem awaryjnym, a nie domyślnym.

Oto czym różnią się te trzy ścieżki, bo aplikacja każe ci wybrać, a wolę, żebyś wybrał dobrze:

  • Lokalny ParakeetSilnik TDT od NVIDII, około 600 MB, i najszybsza lokalna opcja — od 5 do 10 razy szybsza niż Whisper na CPU. Obsługuje angielski plus 24 inne języki europejskie, łącznie 25. Bez tłumaczenia na angielski. Jeśli piszesz newsletter po angielsku albo w innym języku europejskim, to szybki, w pełni offline wybór.
  • Lokalny Whisperwolniejszy niż Parakeet na tym samym sprzęcie, ale wersje wielojęzyczne obsługują 99 języków i potrafią tłumaczyć na angielski. Wersje tylko angielskie są tylko angielskie, a nie 99-języczne. Wybierz to do chińskiego, japońskiego, koreańskiego albo dowolnej pracy z tłumaczeniem, której Parakeet nie potrafi. Domyślny model angielski to około 480 MB.
  • Chmura (OpenAI, własny klucz)najlepsza dokładność i dostęp do sieci, z użyciem twojego własnego klucza OpenAI rozliczanego bezpośrednio przez OpenAI. Transkrypcja domyślnie działa na gpt-4o-mini-transcribe. Wymaga internetu, więc to jedyna ścieżka, która opuszcza twój komputer. Powierzchnia Chmury jest częścią Whisper Pro.

Nudna prawda jest taka, że dla rodzaju prozy, jaką większość autorów newsletterów umieszcza na stronie, tryb lokalny w zupełności wystarcza. Oba lokalne silniki działają w całości na twoim komputerze, bez wysyłania czegokolwiek na serwer. Chmura zasługuje na swoje miejsce, gdy chcesz najwyższej dokładności na niewyraźnym nagraniu albo gdy chcesz, żeby model wyciągnął fakt z sieci podczas szkicowania. Przy regularnym nawyku pisania zacznij lokalnie i sięgaj po chmurę tylko wtedy, gdy tryb lokalny pozostawia cię z niedosytem.

Zamień wypowiedzianą gadaninę w czysty akapit

Surowe dyktowanie wychodzi jako jedno długie zdanie bez końca. Mówisz tak, jak myślisz, jednym długim oddechem bez interpunkcji, i to właśnie ten mur tekstu podsuwa ci każdy silnik mowy. Przy gotowym e-mailu jest irytujący. Przy wpisie, który zamierzasz opublikować pod własnym nazwiskiem, to problem — nikt nie chce wypuścić akapitu, który czyta się jak transkrypcja. Uporządkowanie go to miejsce, w którym ujawnia się prawdziwa wartość szkicowania głosem.

Pisanie głosowe w Windows dodaje interpunkcję, gdy mówisz, a Dyktowanie w macOS obsługuje podstawową interpunkcję, gdy powiesz „przecinek” albo „kropka”. Do cięższego sprzątania — usuwania „yyy”, naprawiania zdań bez końca, zamieniania wypowiedzianej gadaniny w akapit, który naprawdę byś opublikował — Whisper może uruchomić przejście AI. Powiedz frazę aktywującą „Hey whisper”, a tekst zostanie ulepszony, zanim wyląduje. Na modelu lokalnym działa to przez Ollama; w trybie chmurowym domyślnie używa gpt-5-mini. Porównanie przed i po to cała istota:

Thinking...
Surowe

no więc to co chciałem powiedzieć w tym tygodniu to że większość porad o produktywności to tak naprawdę porady o pisaniu w przebraniu yyy no bo nie potrzebujesz lepszej apki tylko musisz przestać tyle pisać

Uporządkowane

Rzecz, którą chciałem powiedzieć w tym tygodniu, jest taka, że większość porad o produktywności to tak naprawdę porady o pisaniu w przebraniu. Nie potrzebujesz lepszej aplikacji. Musisz przestać tyle pisać.

Warto wprost wskazać uczciwe ograniczenie, bo dema tego nie zrobią. Głos daje ci słowa; nie daje ci formatowania. Nagłówki Substacka, pogrubienie, cytaty blokowe, linki i ta mała linia oddzielająca — wszystko to bierze się z własnego paska narzędzi i skrótów edytora. Podyktuj zdanie, a potem sięgnij po pasek narzędzi, żeby zrobić H2 albo wstawić link tak, jak zawsze. Żadne narzędzie do dyktowania nie wyczaruje na zawołanie cytatu wyróżnionego w Substacku. Szybko spisz prozę głosem, a potem ukształtuj wpis w edytorze, który już znasz.

Ten sam przepływ mów-potem-sprzątaj opłaca się daleko poza twoim newsletterem — możesz też dyktować czystą prozę do dowolnej aplikacji jednym skrótem, więc długi blok staje się kilkoma wypowiedzianymi zdaniami zamiast akapitem, który mozolnie wystukujesz ręcznie.

Kiedy darować sobie narzędzie do dyktowania dla Substacka

Dwie strzałki narysowane kredą na chodniku, wskazujące różne kierunki, ilustrujące wybór narzędzia

Czasami właściwym narzędziem jest to darmowe, które masz już na komputerze, a udawanie inaczej byłoby nieuczciwe. Jeśli tylko od czasu do czasu wrzucasz do edytora krótką linijkę — jednozdaniową notatkę, szybką odpowiedź w komentarzach — twój system operacyjny ogarnia to za darmo.

W systemie Windows naciśnij klawisz Windows + H, a wbudowany pasek Pisania głosowego otworzy się tam, gdzie jest kursor, włącznie z edytorem Substack. Sam dodaje interpunkcję i nadaje się do krótkich serii. Haczyk: przechodzi przez serwery Microsoftu i wymaga połączenia z internetem, więc nie jest opcją offline. Na Macu Dyktowanie pozwala mówić, by wprowadzać tekst wszędzie tam, gdzie możesz pisać, konfigurowane w Ustawieniach systemowych w sekcji Klawiatura, a na Apple Silicon ogólny tekst może być przetwarzany na urządzeniu. Do szybkiego zdania w szkicu każde z nich jest naprawdę w porządku i nie zamierzam odwodzić cię od darmowego.

Sięgnij po dedykowane narzędzie obejmujące cały system, gdy wbudowane zaczynają boleć: pełnej długości wpisy, przejście AI, które zamienia gadaninę w prozę gotową do publikacji, pisanie wielojęzyczne, szkicowanie offline albo chęć jednego skrótu, który zachowuje się tak samo w Substacku, twoim e-mailu i twojej aplikacji do notatek. Newsletter to przypadek długiej formy, więc większość autorów szybko przekracza tę granicę — ale poniżej niej korzystaj z tego, co darmowe. Nie zamierzam ci mówić, żebyś instalował aplikację dla jednolinijkowej odpowiedzi w komentarzu.

Ten sam kompromis pojawia się wszędzie tam, gdzie piszesz — logika dyktowania do Gmaila jest identyczna, bo oba to przeglądarkowe pola tekstowe, w których to kursor, a nie wtyczka, jest prawdziwą integracją.

Do dalszej lektury

Substack przeczyta twój gotowy wpis na głos i robi to dobrze. Po prostu nie pomoże ci go najpierw napisać, a po napisaniu tego tekstu jestem dość pewien, że nigdy nie miał tego w planach. I dobrze, bo to kursor jest integracją. Mów do edytora, dostań tekst, uporządkuj go jednym przejściem AI, ukształtuj wpis paskiem narzędzi, który już znasz. Większość tego poradnika podyktowałem głosem do pola, które nie było Substackiem, narzędziem, którego nie obchodzi, jakie to pole, a potem wkleiłem całość do szkicu. To cała sztuczka.

Wypróbuj to w swoim następnym szkicu na Substacku

Przytrzymaj skrót, mów, puść. Transkrypcja ląduje w edytorze tam, gdzie jest kursor — a potem jedno przejście AI zamienia gadaninę w akapit, który byś opublikował.

Darmowy tryb lokalny dla każdego zalogowanego konta. Bez karty na start.

Zdjęcie Denysa Medvedieva

Denys Medvediev

To ja czytam nasz e-mail wsparcia, najprawdopodobniej dyktując odpowiedzi.