Autor: Denys Medvediev

Poradnik

Oprogramowanie do dyktowania dla dziennikarzy

Reporterzy piszą szybciej, mówiąc zamiast stukać w klawiaturę. Naciśnij skrót, powiedz zdanie, a słowa trafią dokładnie tam, gdzie jest kursor — w CMS, dokumencie czy notatniku. To narzędzie do redagowania własnych tekstów i notatek terenowych, nie do transkrypcji wywiadów.

Ostatnia aktualizacja: czerwiec 2026

Otwarty notes reportera i długopis obok laptopa na ciemnym biurku redakcyjnym — atmosfera szybkich notatek i redagowania

Oprogramowanie do dyktowania dla dziennikarzy zamienia wypowiedzi reportera w tekst wstawiany w miejsce kursora w dowolnej aplikacji. Skrót klawiszowy uruchamia dyktowanie, a szkic, lid czy notatka terenowa ląduje dokładnie tam, gdzie kursor. Służy do redagowania własnej treści głosem i działa offline przy poufnych materiałach. Nie transkrybuje wywiadów — to osobna sprawa.

Dzień reportera to w dużej mierze wpisywanie tych samych rzeczy dwukrotnie. Zapisujesz cytat w notesie na schodach sądu, a potem przepisujesz go przy biurku. Leada układasz w głowie w drodze powrotnej, a połowę gubisz, zanim laptop się uruchomi. Klawiatura jest wąskim gardłem i nie obchodzi jej, że jesteś przed deadlinem.

Ludzie szukają „oprogramowania do dyktowania dla dziennikarzy” z nadzieją na jedno narzędzie, które zrobi wszystko — redagowanie, notatki i nagranie sesji rady miasta. Czegoś takiego nie ma, i wolę to powiedzieć na początku, niż marnować twoje popołudnie. Dyktowanie to słowa, które sam wypowiadasz. Nagrywanie rozmówcy i zamiana tego nagrania na dosłowny transkrypt to zupełnie inne zadanie. Ten poradnik dotyczy pierwszego zastosowania, a kiedy sięgnąć po drugie — powiem wprost.

Oto różnica, którą większość stron celowo zaciera. Dyktowanie polega na tym, że mówisz, a komputer wpisuje twoje słowa w aktywne pole tekstowe. Transkrypcja to nagrywanie kogoś innego — rozmówcy, panelistów, rozmowy telefonicznej — i otrzymanie dokładnego zapisu tekstu po fakcie. Ten sam pomysł u podstaw, ale zupełnie inne narzędzie i zupełnie inne stawki.

Właściwe pytanie to nie „jaka aplikacja do dyktowania jest najlepsza dla dziennikarzy”. Pytanie brzmi: „co pasuje do której części pracy”. Narzędzie sterowane skrótem, jak Whisper, świetnie sprawdza się przy redagowaniu własnych tekstów, robieniu notatek terenowych i chwytaniu myśli, zanim wyparuje. Do samego wywiadu — kilku rozmówców, cytatów, za które odpowiadasz — potrzebujesz dedykowanej usługi transkrypcji. Szczegółowo omówię stronę dyktowania, pokażę, jak je skonfigurować w dwie minuty, i wyraźnie zaznaczę granicę, żebyś nie powierzał złemu narzędziu cudzego cytatu.

Dlaczego reporterzy sięgają po dyktowanie

Notes reportera, długopis i kawa na drewnianym biurku — szybkie notatki w terenie

Najważniejszy powód to szybkość, zanim myśl ostygnie. Reporter ma w głowie gotowego leada, wychodząc z konferencji prasowej, ma kąt artykułu, idąc do samochodu, i idealne sformułowanie pierwszego zdania pod prysznicem — a potem siada przy klawiaturze i patrzy, jak jedna trzecia z tego wycieka mu przez palce. Mówimy mniej więcej 145 słów na minutę. Piszemy około 40. W tej różnicy giną dobre pierwsze szkice.

Do tego dochodzą nadgarstki. Ludzie, którzy piszą zawodowo, piszą dużo — i ręce to pamiętają. Dyktowanie nie jest medycznym remedium i nie będę tego udawać, ale wyjmuje klawiaturę z obiegu na jakiś czas, co w dzień ciężkiego składania tekstu jest realną ulgą. Ręce odpoczywają, szkic powstaje, a redakcja nigdy się nie dowie. Taki jest cały atut — nie terapia, tylko mniej kliknięć między głową a stroną.

I składają się małe rzeczy. Jeden cytat, który chcesz zalogować, zanim zapomnisz dokładnego brzmienia. Przypomnienie, żeby oddzwonić do drugiego rozmówcy. Trzylinijkowa notatka o atmosferze w sali, której nigdy byś nie wpisał jedną ręką w drodze, ale chętnie powiesz na głos. Żadna z nich nie jest artykułem. Wszystkie razem są tkaniną łączną reportażu — i wszystkie szybciej powiedzieć niż napisać.

Naciśnij skrót, mów, słowa lądują w szkicu

Mechanizm jest nudny — i dokładnie o to chodzi przy deadlinie. Naciskasz skrót, mówisz, puszczasz i transkrypt wkleja się w miejscu kursora w tej aplikacji, która ma fokus. Whisper trzyma krótki ogon po puszczeniu klawisza, żeby ostatnie słowo się nie urwało. Ponieważ wklejanie odbywa się na poziomie systemowego kursora, pole wersji roboczej w CMS, dokument Worda, Google Docs w przeglądarce, zwykły plik notatek czy wiadomość do redaktora w Slacku — wszystko to po prostu „pole tekstowe”. Ten sam klawisz, to samo działanie, wszędzie.

I to jest część, którą strony produktowe niepotrzebnie komplikują. Żadnej wtyczki do podpięcia pod system publikacji, żadnej integracji do czekania na dział IT, żadnego kroku eksportu. Kursor jest w szkicu, mówisz, słowa pojawiają się w szkicu. Podczas mówienia wyświetla się mała kapsułka — wiesz, że aplikacja słucha i nagrywa:

Cancel
Nakładka nagrywania: mała kapsułka wyświetlana podczas mówienia, sygnalizująca, że Whisper słucha.

Skrót klawiszowy to jedyna rzecz, którą warto dobrze ustawić od razu. Na Windows to Ctrl+Space, na Macu — Command+Option trzymane jako push-to-talk podczas mówienia. Oba można zmienić w Ustawieniach, jeśli kolidują ze skrótem twojego narzędzia do edycji. Pewien użytkownik napisał do mnie o 2:14 w nocy — skrót kolidował z jego oprogramowaniem audio, a wiadomość kończyła się słowem „bezużyteczne”. Osiem minut później wypuściłem panel do zmiany skrótu i wróciłem spać. Teraz każdy skrót można przypisać dowolnie. Jeśli wcześniej konfigurowałeś dyktowanie na Windows lub na Macu, to ten sam odruch mięśniowy skierowany na narzędzia redakcyjne.

Konfiguracja w dwie minuty (Windows lub Mac)

Potrzebujesz Maca na Apple Silicon albo komputera z Windows 10 lub nowszym, działającego mikrofonu i tego, w czym piszesz — otwartego w aplikacji desktopowej lub w przeglądarce. Cały lokalny pipeline jest darmowy dla każdego zalogowanego konta, bez podawania karty przy rejestracji. Oto sekwencja.

Krok 1 — Zainstaluj Whisper i zaloguj się.

Pobierz ze strony pobierania, zainstaluj i utwórz darmowe konto. Bez karty. Cały lokalny pipeline transkrypcji jest dostępny od razu.

Będziesz wiedział, że zadziałało, gdy w zasobniku systemowym pojawi się ikona aplikacji, a kreator konfiguracji zaproponuje wybór modelu.

Krok 2 — Wybierz ścieżkę transkrypcji.

Aplikacja nie wybiera za ciebie. Masz trzy opcje: Cloud (OpenAI, własny klucz), lokalny Parakeet lub lokalny Whisper. Do poufnych notatek i materiałów źródłowych zacznij od lokalnego — więcej o tym dwie sekcje dalej.

Będziesz wiedział, że zadziałało, gdy model skończy się pobierać i pokaże status „gotowy”.

Krok 3 — Potwierdź skrót klawiszowy.

Na Windows domyślnie Ctrl+Space, na Macu Command+Option trzymane jako push-to-talk. Na Macu przyznaj uprawnienie Accessibility po wyświetleniu monitu — bez niego wklejanie w miejscu kursora nie dotrze do innych aplikacji.

Będziesz wiedział, że zadziałało, gdy testowe nagranie wklei się w dowolnym polu tekstowym.

Krok 4 — Ustaw kursor w szkicu i mów.

Otwórz CMS, dokument lub plik notatek, kliknij w tekst, przytrzymaj skrót, powiedz zdanie, puść. Transkrypt pojawia się tam, gdzie jest kursor.

Będziesz wiedział, że zadziałało, gdy wypowiedziane zdanie pojawi się w szkicu jako tekst.

Whisper
Prawdziwa desktopowa aplikacja Whisper na ekranie ustawień z otwartymi panelami Transkrypcji i AI.

Najwolniejszą częścią jest pobieranie modelu, nie sama konfiguracja. Reszta to cztery kroki powyżej. Gdy aplikacja już działa, wyciągnięcie myśli z głowy i wpisanie jej w szkic przestaje być zadaniem typowania i staje się zadaniem mówienia.

Redagowanie tekstu i notatki terenowe głosem

W praktyce dzielę to na dwa tryby, które czuje się inaczej. Pierwszy to redagowanie przy biurku: kursor w CMS lub dokumencie, mówisz lid, nutgraf, sekcję, którą już masz opracowaną. Nie podyktujemy w ten sposób szlifowanej wersji finalnej — nikt tak nie robi — ale w ułamku czasu pojawi się na ekranie szybki, nieokrzesany pierwszy szkic, a edytowanie istniejącego tekstu jest lepsze niż wpatrywanie się w puste pole. Funkcje niestandardowego słownictwa i hotwords w lokalnym Whisperze też tu pomagają, jeśli twój temat roi się od nazwisk i żargonu, z którymi generyczny model sobie nie radzi.

Drugi tryb to przechwytywanie w terenie — i tu skrót klawiszowy naprawdę zarabia na siebie. Wychodzisz z przesłuchania i mówisz trzy rzeczy, których nie chcesz stracić, wprost do pliku notatek. Logujesz numer telefonu, follow-up, dokładne brzmienie wypowiedzi z protokołu zapisanej w skrócie. To nie jest materiał gotowy do publikacji — to twój surowiec, rzeczy, które inaczej przepisywałbyś później z bazgrołów, których nie możesz odczytać. Powiedz to raz, wyraźnie, kiedy jest świeże.

Jedna naprawdę przydatna funkcja w trybie Cloud, i będę szczery co do jej zakresu: możesz powiedzieć frazę aktywacyjną „Hey whisper”, żeby w trakcie pisania błyskawicznie sprawdzić jedną rzecz w sieci — datę, pisownię, tytuł — i odpowiedź wróci po kilku sekundach. To wygoda do szybkich sprawdzeń w trakcie redagowania, nie silnik do badań, a dziennikarz i tak weryfikuje każdą ważną informację w prawdziwym źródle. Przydatne do „czy to był budżet z 2019 czy 2020” bez wychodzenia ze szkicu. Nie zastąpi reportażu.

Lokalnie czy w chmurze: który tryb dla poufnych notatek

Jako dziennikarz zacznij od trybu lokalnego — i powodem jest ochrona źródeł, nie szybkość. Notatka o poufnym źródle, nieopublikowany szkic wrażliwego artykułu, plik roboczy, który nigdy nie trafiłby do dostawcy — tryb lokalny działa w całości na twoim komputerze, nic nie wysyłając na serwer. To właściwy domyślny wybór, gdy materiał mógłby narazić źródło na ryzyko. Cloud staje się wyjściem awaryjnym dla rzadkich trudnych nagrań, nie codziennym narzędziem. Jeśli twój Mac jest na Apple Silicon albo twój komputer pochodzi z ostatnich kilku lat, lokalny tryb poradzi sobie z codziennym dyktowaniem bez zarzutu.

Oto jak różnią się te trzy ścieżki, bo aplikacja każe ci wybrać — wolę, żebyś wybrał świadomie:

  • Lokalny ParakeetSilnik TDT NVIDIA, około 600 MB, najszybsza opcja lokalna — 5 do 10 razy szybsza od Whispera na CPU. Obsługuje angielski plus 24 inne języki europejskie, łącznie 25. Bez tłumaczenia na angielski. Jeśli piszesz po angielsku lub w innym europejskim języku, to szybki, w pełni offline wybór.
  • Lokalny Whisperwolniejszy od Parakeet na tym samym komputerze, ale wielojęzyczne modele obsługują 99 języków i potrafią tłumaczyć na angielski. Angielskie buildy są tylko po angielsku, nie 99 języków. Wybierz go do chińskiego, japońskiego, koreańskiego, pracy z tłumaczeniami albo gdy potrzebujesz niestandardowego słownika i hotwords na temat pełen nazw własnych. Domyślny model angielski ma około 480 MB.
  • Cloud (OpenAI, BYOK)najlepsza dokładność i szybkie wyszukiwanie w sieci — z własnym kluczem OpenAI rozliczanym bezpośrednio przez OpenAI. Transkrypcja działa domyślnie przez gpt-4o-mini-transcribe. Wymaga internetu, więc to jedyna ścieżka, która opuszcza twój komputer — nie używaj jej do niczego, co dotyczy źródeł. Powierzchnia Cloud jest częścią Whisper Pro.

Nudna prawda jest taka, że do rodzaju redagowania i notowania, jaki zajmuje większość czasu reportera, tryb lokalny w zupełności wystarcza. Oba lokalne silniki działają w całości na twoim komputerze, co jest sednem sprawy, gdy plik może ujawniać źródło. Cloud sprawdza się, gdy chcesz najwyższej dokładności dla trudnego fragmentu nagrania albo szybkiego sprawdzenia w trakcie pisania. Do codziennego składania tekstu zacznij lokalnie i sięgaj po chmurę tylko wtedy, gdy lokalne rozwiązanie czegoś ci odmawia.

Zamiana mówionego szkicu w czysty tekst

Surowe dyktowanie wychodzi jako jeden ciąg. Mówisz „dobra rada głosowała cztery do trzech za przekształceniem gruntów ee Henderson przeciw cytat to tworzy zły precedens koniec cytatu follow up z biurem planowania jutro” — i dostajesz nieprzerwany blok bez interpunkcji, który każdy silnik mowy ci zwróci. Porządkowanie tego to miejsce, w którym tryby się rozchodzą.

Windows Voice Typing dodaje interpunkcję podczas mówienia, a macOS Dictation radzi sobie z podstawami, gdy mówisz „przecinek” lub „kropka”. Do głębszego czyszczenia — usuwania wypełniaczy, poprawiania zdań złożonych, zamiany mówionego akapitu w coś, co rzeczywiście trafiłoby do szkicu — Whisper może wykonać przebieg AI. Powiedz „Hey whisper”, a tekst zostanie ulepszony przed wklejeniem. Na modelu lokalnym działa przez Ollama; w trybie cloud domyślnie przez gpt-5-mini.

Thinking...
Surowe

dobra rada głosowała cztery do trzech za przekształceniem gruntów ee henderson przeciw cytat to tworzy zły precedens koniec cytatu follow up z biurem planowania jutro

Po czyszczeniu

Rada głosowała 4–3 za przekształceniem gruntów. Henderson przeciw: „To tworzy zły precedens.” Follow up z biurem planowania jutro.

Jedno wyraźne zastrzeżenie — bo to dziennikarstwo i dokładność jest istotą zawodu. Przebieg czyszczenia AI służy twoim własnym szkicom i notatkom — porządkuje słowa, które ty wypowiedziałeś. Nie polegaj na nim, żeby uzyskać dosłowny cytat, który opublikujesz i za którym się podpiszesz. Jeśli cytat musi być dokładny na stronie, sprawdzasz go względem nagrania źródłowego lub własnych notatek — za każdym razem. Dyktowanie pozwala szybko napisać szkic; nie certyfikuje cytatu. Kto twierdzi, że silnik mowy daje gotowe do publikacji, słowo w słowo cytaty, sprzedaje ci demo, nie narzędzie na co dzień.

Ten sam schemat mów-potem-czyść procentuje też daleko poza reportażem — możesz też dyktować czysty tekst do dowolnej aplikacji do pisania jednym skrótem, zamieniając długi fragment w kilka wypowiedzianych zdań.

Kiedy pominąć dyktowanie i użyć narzędzia do transkrypcji

Ręczny dyktafon i mikrofon na stole przygotowanym do wywiadu

To kluczowa linia całego poradnika, więc będę bezpośredni. W chwili, gdy nagrywasz inną osobę — rozmówcę, źródło przez telefon, panel, briefing prasowy z kilkoma głosami — dyktowanie to złe narzędzie. Dyktowanie jest zbudowane do wpisywania twoich słów w kursor, jeden mówca, na żywo. Nie rozdziela rozmówców, nie jest dostrojone do tworzenia dosłownego zapisu cudzego nagrania, a cytat, który chcesz opublikować, to ostatnie miejsce, żeby się o tym przekonać.

Do tego zadania sięgnij po dedykowaną usługę transkrypcji — kategorię zbudowaną wokół nagrań z wieloma rozmówcami, etykiet głosów, znaczników czasu i zapisu tekstu, względem którego można sprawdzić cytat. To genuinowanie inny produkt, i dobry jest wart swojej ceny, gdy dokładność cudzych słów jest tym, co dostarczasz. Jeśli potrzebujesz certyfikowanego lub urzędowej klasy transkryptu — to kolejna specjalistyczna usługa, i nie będę udawać, że skrót klawiszowy do dyktowania ją zastąpi.

Czasem właściwe narzędzie masz już za darmo na swoim komputerze. Jeśli wpisujesz tylko dwulinijkową notatkę albo szybkie przypomnienie, system operacyjny wystarczy. Na Windows naciśnij klawisz Windows + H — wbudowany pasek Voice Typing otworzy się przy kursorze; sam dodaje interpunkcję i radzi sobie z krótkimi fragmentami, choć przesyła dane przez serwery Microsoftu i wymaga internetu, więc nie jest opcją offline — co ma znaczenie, gdy notatka wymienia źródło. Na Macu Dictation pozwala mówić, żeby wpisywać tekst wszędzie tam, gdzie możesz pisać — skonfiguruj w Ustawieniach systemowych w sekcji Klawiatura; na Apple Silicon ogólny tekst może być przetwarzany na urządzeniu. Sięgnij po dedykowane narzędzie systemowe, gdy wbudowane zaczynają boleć: długie szkice, praca wielojęzyczna, prywatność offline albo jeden skrót, który działa tak samo w CMS, dokumencie i notatniku.

Jeśli większość tego, co przechwycujesz, to krótkie notatki, a nie pełne szkice, logika opisana w notatkach głosowych najbardziej pasuje do twoich potrzeb — kładzie większy nacisk na szybkie przechwytywanie niż na długą kompozycję.

Dyktowanie nie napisze za ciebie artykułu i nie ztranskrybuje wywiadu — nigdy nie było do tego stworzone. Co robi: wyjmuje klawiaturę z obiegu, gdy redagujesz własny tekst i zapisujesz własne notatki — szybko, offline, jeśli materiał jest wrażliwy. Większość tego poradnika podyktowałem do zwykłego pliku notatek skrótem, który nie przejmuje się, w jakim oknie jest — a potem wyczyściłem i przeniosłem do szkicu. Wywiad, który przeprowadziłem na potrzeby tego tekstu, wysłałem do usługi transkrypcji. Właściwe narzędzie, właściwe zadanie. To cała sztuczka.

Wypróbuj przy następnym szkicu

Przytrzymaj skrót, mów, puść. Pierwszy szkic ląduje w tej aplikacji, gdzie jest kursor — w CMS, dokumencie lub pliku notatek. Wywiad nadal trafia do narzędzia do transkrypcji.

Darmowy tryb lokalny dla każdego zalogowanego konta. Karta nie jest wymagana na start.

Zdjęcie Denysa Medvedieva

Denys Medvediev

To ja czytam naszą skrzynkę wsparcia — najprawdopodobniej dyktując odpowiedzi.

Dalsze czytanie