Poradnik
Oprogramowanie do dyktowania dla lekarzy
To jest dyktowanie na własne potrzeby lekarza — e-maile, skierowania, notatki osobiste, administracja, wstępne wersje artykułów — głosem, w dowolnej aplikacji desktopowej. To nie jest narzędzie do dokumentacji klinicznej, EHR ani transkrypcji medycznej i nie daje żadnych gwarancji zgodności z przepisami.
Ostatnia aktualizacja: czerwiec 2026

Oprogramowanie do dyktowania dla lekarzy, w znaczeniu opisanym w tym artykule, to narzędzie ogólnego przeznaczenia, którego lekarz używa do własnych tekstów — e-maili, skierowań, notatek osobistych, spraw administracyjnych, wstępnych wersji artykułów — głosem, w dowolnej aplikacji desktopowej. Skrót klawiszowy transkrybuje mowę w miejscu kursora. Działa offline w trybie lokalnym i nie jest narzędziem do dokumentacji klinicznej ani narzędziem zgodności z przepisami.
Zacznę od tego, czym to nie jest — bo fraza "oprogramowanie do dyktowania dla lekarzy" otwiera dwa zupełnie różne światy, a ich mylenie tylko traci twój czas. Jeden świat to dokumentacja kliniczna — dyktowanie notatek o pacjencie do elektronicznej dokumentacji medycznej, z całą precyzją, integracją i mechanizmami zgodności, jakich to wymaga. To oddzielna kategoria produktów i Whisper do niej nie należy. Powiem to jeszcze raz później i wskażę właściwe narzędzie, jeśli to właśnie tego potrzebujesz.
Drugi świat to wszystko, co lekarz pisze w ciągu dnia poza dokumentacją pacjenta. Skierowanie do kolegi. Odpowiedź na wiadomość. Notatka do koordynatora przychodni w sprawie grafiku. Pierwszy, chaotyczny szkic artykułu. E-mail do organizatora konferencji. To jest po prostu pisanie, takie samo jak u każdego innego, i właśnie o tym jest ten poradnik. Możesz to mówić zamiast pisać — w dowolnej aplikacji na swoim komputerze, jednym skrótem klawiszowym.
Chcę tu wyraźnie postawić granicę i jej nie zatrzeć. Whisper to narzędzie do dyktowania zwiększające produktywność. Zamienia twoją mowę na tekst w miejscu kursora, w dowolnej aktywnej aplikacji. Nie jest to narzędzie kliniczne ani do dokumentacji medycznej, nie służy do przetwarzania chronionych informacji zdrowotnych i nie daje żadnych gwarancji zgodności z HIPAA, EHR ani innymi regulacjami. Nie używaj go do dyktowania notatek o pacjentach. Używaj go do własnych tekstów nieklinicznych.
W tej granicy jest dużo miejsca. Dwie cechy sprawiają, że narzędzie to szczególnie dobrze pasuje do własnych tekstów lekarza. Tryb lokalny działa w całości na twoim komputerze — treść e-maila czy szkicu nie opuszcza laptopa. To realna właściwość dotycząca miejsca przetwarzania danych, a nie certyfikat zgodności. A lokalny Whisper obsługuje niestandardowy słownik, dzięki czemu terminologia, której używasz na co dzień, przestaje pojawiać się jako nonsens. Pokażę, jak go skonfigurować, do jakiego pisania służy i kiedy wprost powiedzieć: odejdź i kup dedykowany produkt medyczny.
Czym to jest, a czym nie jest

Czym to jest: narzędziem do dyktowania ogólnego przeznaczenia, które wpisuje twoje wypowiadane słowa w dowolnej aplikacji desktopowej. Lekarz może w ten sposób tworzyć własne e-maile, skierowania, notatki osobiste, wiadomości administracyjne i teksty naukowe — mówiąc zamiast pisać. Działa tak samo w kliencie poczty, edytorze tekstu i przeglądarce, bo wkleja tekst w miejscu kursora, nie interesując się tym, w której aplikacji kursor się znajduje.
Czym to nie jest, powiedziane wprost, żeby nie było wątpliwości: nie jest narzędziem do dokumentacji klinicznej, nie jest rozszerzeniem EHR ani EMR, nie jest transkrypcją medyczną i nie służy do dokumentacji pacjentów, diagnozowania ani leczenia. Nie daje żadnych gwarancji zgodności z HIPAA, RODO ani żadnymi innymi przepisami. Uczciwy powód, dla którego lekarz może po nie sięgnąć, jest prozaiczny i prawdziwy — długie listy i szkice są męczące do pisania, a dyktowanie własnej korespondencji jest szybsze od wpisywania. To cały zakres zastosowania. Żadne twierdzenie zdrowotne się do tego nie odnosi.
Trzymam tę granicę widoczną, bo oba światy są sprzedawane obok siebie, a różnica jest istotna. Produkt kliniczny jest zbudowany wokół dokumentacji pacjenta, z integracją i mechanizmami zgodności, które to pociąga. Narzędzie do produktywności, takie jak to, zbudowane jest wokół twojego kursora i twoich własnych słów. To samo słowo — dyktowanie — a zupełnie inna odpowiedzialność. Jeśli twój tekst to notatka o pacjencie przeznaczona do historii choroby, ten poradnik się tutaj kończy i powinieneś przejść do sekcji "kiedy potrzebujesz narzędzia klinicznego".
Naciśnij skrót, mów, tekst pojawia się przy kursorze
Mechanizm jest prosty. Naciskasz skrót klawiszowy, mówisz, puszczasz — transkrypcja pojawia się przy kursorze w aktywnym polu tekstowym. Whisper chwilę po puszczeniu klawisza nadal nasłuchuje, żeby ostatnie słowo nie zostało ucięte. Ponieważ wkleja tekst w miejscu systemowego kursora, aplikacja pod spodem to po prostu "jakiekolwiek pole tekstowe" — okno nowego e-maila, dokument Word, szablon skierowania trzymany w pliku, treść szkicu artykułu. Podczas mówienia pojawia się mała kapsułka, żebyś wiedział, że aplikacja słucha.
Nie ma nic do konfigurowania w konkretnych programach. Żadna wtyczka, żaden token do wklejenia, żadne zadanie synchronizacji. Kursor jest w e-mailu, mówisz, słowa pojawiają się w e-mailu. Ten sam skrót wypełnia kolejne zdanie szkicu artykułu, wiadomość do koordynatora przychodni albo notatkę do siebie między zadaniami. Jedno narzędzie, każde pole tekstowe, w którym i tak byś pisał.
Skrót klawiszowy to jedyna rzecz, którą warto ustawić świadomie. Na Windows to Ctrl+Space; na Macu to Command+Option — modyfikator push-to-talk, który trzymasz podczas mówienia i puszczasz, żeby zatrzymać. Oba można zmienić w Ustawieniach, jeśli kolidują z czymś, czego już używasz. (Konflikt skrótów to najczęstszy zgłaszany przez nas błąd "nie działa" — i prawie nigdy nie jest to bug, lecz dwie aplikacje walczące o ten sam klawisz, dlatego każdy skrót jest tu konfigurowalny.) Jeśli ustawiałeś już zamianę głosu na tekst w Windows lub na Macu — to ta sama nawykowa pamięć mięśniowa, teraz skierowana na twoje własne teksty.
Konfiguracja w dwie minuty (Windows lub Mac)
Potrzebujesz Maca na Apple Silicon lub komputera z Windows 10 lub nowszym, działającego mikrofonu oraz otwartej aplikacji, w której będziesz pisać — klienta poczty, edytora tekstu, przeglądarki. Cały lokalny potok jest bezpłatny dla każdego zalogowanego konta, bez podawania metody płatności przy rejestracji. Oto kolejność kroków.
Krok 1 — Zainstaluj Whisper i zaloguj się.
Pobierz ze strony pobierania, zainstaluj i utwórz bezpłatne konto. Karta nie jest wymagana. Cały lokalny potok transkrypcji jest dostępny od razu.
Będziesz wiedzieć, że zadziałało, gdy ikona aplikacji pojawi się w zasobniku systemowym i kreator konfiguracji zaproponuje wybór modelu.
Krok 2 — Wybierz ścieżkę transkrypcji.
Aplikacja nie wybiera za ciebie. Masz trzy opcje: Cloud (OpenAI, własny klucz API), lokalny Parakeet lub lokalny Whisper. Jeśli chcesz, żeby korespondencja i szkice zostały na komputerze, zacznij od trybu lokalnego — więcej o wyborze między nimi dwie sekcje dalej.
Będziesz wiedzieć, że zadziałało, gdy model zakończy pobieranie i pojawi się jako gotowy.
Krok 3 — Potwierdź skrót klawiszowy.
Windows domyślnie używa Ctrl+Space, Mac — Command+Option trzymanego jako push-to-talk. Na Macu nadaj uprawnienie Dostępności gdy zostaniesz o to poproszony; bez niego wklejanie w miejscu kursora nie sięgnie do innych aplikacji.
Będziesz wiedzieć, że zadziałało, gdy nagranie testowe pojawi się w dowolnym polu tekstowym.
Krok 4 — Ustaw kursor w e-mailu lub dokumencie i mów.
Otwórz klienta poczty lub edytor tekstu, kliknij tam, gdzie chcesz pisać, przytrzymaj skrót, powiedz zdanie, puść. Transkrypcja pojawi się w miejscu kursora.
Będziesz wiedzieć, że zadziałało, gdy wypowiedziane zdanie pojawi się w e-mailu lub dokumencie jako tekst.
Najwolniejsza część to pobieranie modelu, nie sama konfiguracja. Reszta to powyższe cztery kroki. Gdy już działa, napisanie długiego skierowania czy odpowiedzi, którą odkładałeś na później, przestaje być zadaniem do wpisania, a staje się zadaniem do powiedzenia — co po długim dniu jest zupełnie innym rodzajem zmęczenia.
Codzienne, niekliniczne teksty, do których służy
Pomyśl o tekstach, które piszesz w ciągu dnia, a które nie są dokumentacją pacjenta. Skierowanie do kolegi — to w większości proza, którą i tak samodzielnie układasz. Zaległe e-maile — odpowiedź z konferencji, wiadomość do koordynatora przychodni, odpowiedź na zapytanie administracyjne. Notatka do siebie o wizycie kontrolnej czy artykule, który chciałeś sprawdzić. Pierwszy, surowy szkic artykułu, streszczenie posteru, tekst na slajd wykładu. Żaden z tych tekstów nie jest dokumentacją kliniczną, a każdy mówi się szybciej, niż się go pisze.
Długi list to miejsce, gdzie dyktowanie udowadnia swoją wartość. Stałe tempo pisania u większości ludzi to około czterdziestu słów na minutę; mówienie — bliżej stu czterdziestu pięciu. Nie wyprodukujesz gotowego listu w tempie mowy — nikt tak nie robi — ale treść powstanie w mniej więcej jednej trzeciej czasu, a potem ją poprawisz. Chodzi nie o pominięcie redakcji, lecz o przeniesienie powolnego pierwszego przejścia z prędkości pisania na prędkość mówienia — żeby to, co piszesz klawiaturą, było korektą, nie tworzeniem.
Uczciwa opinia kryjąca się za całym tym poradnikiem jest taka, że większość narzędzi do produktywności to zamaskowane problemy z pisaniem. Szybszy klient poczty, lepszy szablon, porządniejsza skrzynka — to wszystko rusztowanie wokół aktu pisania. Prawdziwe rozwiązanie problemu "spędzam wieczory, odpowiadając na korespondencję" to nie lepsza aplikacja. To niepisanie. Powiedz odpowiedź, popraw dwa słowa, wyślij, wróć do domu. To jest systemowa wygrana — i nie ma nic wspólnego z żadnym pacjentem.
Lokalnie czy w chmurze: jak trzymać własne teksty na komputerze
Dla własnych tekstów lekarza kluczową właściwością jest to, gdzie audio jest przetwarzane. Tryb lokalny działa w całości na twoim komputerze — słowa e-maila czy szkicu są transkrybowane na laptopie i nigdzie nie są wysyłane. To twierdzenie o architekturze, nie gwarancja zgodności z przepisami — i nie będę tego upiększał. Ale to realna i użyteczna właściwość, gdy to, co dyktuje, to twoja własna korespondencja i wolisz, żeby została twoja. Tryb Cloud wysyła audio do OpenAI w celu transkrypcji, co jest odwrotnym kompromisem. Oto jak różnią się trzy ścieżki — aplikacja wymaga wyboru.
Wybór zależy od tego, co piszesz i co jest dla ciebie ważne:
- Lokalny Parakeet — Silnik TDT firmy NVIDIA, około 600 MB, najszybsza opcja lokalna — od 5 do 10 razy szybsza niż Whisper na CPU. Obsługuje angielski plus 24 inne języki europejskie, 25 łącznie. Brak tłumaczenia na angielski i brak niestandardowego słownika. Jeśli piszesz po angielsku i chcesz szybkiego, w pełni offline dyktowania do codziennych listów i e-maili, to prosty wybór.
- Lokalny Whisper — Wolniejszy od Parakeet na tym samym komputerze, ale wersje wielojęzyczne obsługują 99 języków, mogą tłumaczyć na angielski i — co tu najważniejsze — przyjmują niestandardowy słownik. To właśnie dzięki niemu twoja terminologia przestaje wychodzić jako nonsens. Wybierz tę opcję, jeśli twoje szkice są pełne specjalistycznych terminów albo piszesz w języku innym niż angielski. Domyślny model angielski to około 480 MB. Nadal w całości na twoim komputerze.
- Cloud (OpenAI, BYOK) — Najlepsza surowa dokładność i dostęp do sieci, z własnym kluczem OpenAI rozliczanym bezpośrednio przez OpenAI. Transkrypcja domyślnie działa na gpt-4o-mini-transcribe. Wymaga internetu i wysyła audio poza komputer — to jedyna ścieżka opuszczająca twój laptop. Interfejs Cloud jest częścią Whisper Pro. Dla korespondencji, którą wolisz trzymać lokalnie, to ścieżka, którą bym pominął.
Nudna prawda jest taka, że do większości własnych tekstów lekarza — listów, e-maili, notatek, szkiców — tryb lokalny w zupełności wystarcza. Oba lokalne silniki działają w całości na twoim komputerze, bez wysyłania czegokolwiek na serwer. Cloud wchodzi w grę, gdy chcesz najwyższej dokładności przy trudnym nagraniu lub potrzebujesz faktu z internetu w trakcie dyktowania. Jeśli trzymanie własnych tekstów na własnym dysku jest częścią tego, dlaczego tu jesteś — zacznij od trybu lokalnego i zostaw chmurę jako wyjątek. Żadne z tych wyborów nie zmienia granicy: to nadal nie jest narzędzie do dokumentacji pacjentów, niezależnie od wybranej ścieżki.
Terminologia, niekończące się zdania i porządkowanie podyktowanego tekstu
Surowe dyktowanie wychodzi jako jeden długi ciąg. Mówisz "dziękuję za skierowanie przejrzałem dokumentację i sugeruję umówienie kontroli za sześć tygodni z kopią do koordynatora przychodni" i właśnie to dostarcza ci każdy silnik mowy — jeden blok tekstu bez znaków interpunkcyjnych. Dwie rzeczy zamieniają to w list, który wyślesz: poprawna terminologia i porządkowanie mechaniki tekstu.
Terminologia to miejsce, w którym ogólne dyktowanie zazwyczaj zawodzi, bo model mowy zgaduje słowa, których się nie spodziewa. Lokalny Whisper przyjmuje niestandardowy słownik — własną listę specjalistycznych terminów, nazw leków, skrótów, nazw własnych — i faworyzuje je, dzięki czemu słowa, których używasz na co dzień, przestają być źle rozpoznawane. Parakeet i transkrypcja w chmurze nie przyjmują takiej listy, więc jeśli twoje szkice są pełne terminologii, lokalny Whisper to ścieżka, która ją chroni. Do porządkowania mechaniki — usuwania "yyy", poprawiania ciągów bez interpunkcji, dzielenia monologu na zdania — Whisper może uruchomić przejście czyszczące AI. Powiedz frazę aktywacyjną "Hey whisper" i tekst zostanie poprawiony przed wklejeniem. W trybie lokalnym działa przez Ollama; w trybie cloud domyślnie przez gpt-5-mini.
dziękuję za skierowanie przejrzałem dokumentację i sugeruję umówienie kontroli za sześć tygodni z kopią do koordynatora przychodni
Dziękuję za skierowanie. Przejrzałem dokumentację i sugeruję umówienie kontroli za sześć tygodni, z kopią do koordynatora przychodni.
Słowo o tym, do czego służy to przejście czyszczące, a do czego nie służy. To przejście mechaniczne — interpunkcja, słowa-wypełniacze, podziały na zdania. Nie ocenia treści i z pewnością nie jest żadną weryfikacją kliniczną. Traktuj je jako wstępne porządki w swojej prozie i przeczytaj wynik przed wysłaniem — tak samo jak przeczytałbyś cokolwiek, co sam napisałeś. Model poprawia ciągi bez interpunkcji; ty pozostajesz odpowiedzialny za każde słowo, które wychodzi.
Ten sam schemat "mów, potem porządkuj" opłaca się przy całym pisaniu — możesz też prowadzić własne szybkie notatki głosem w ten sam sposób, wrzucając linijkę do dowolnej aplikacji do notatek między zadaniami, zamiast ją wpisywać.
Kiedy zamiast tego potrzebujesz narzędzia klinicznego

To jest sekcja, która ma największe znaczenie, więc będę bezpośredni. Jeśli to, co dyktuje, to dokumentacja kliniczna — notatka o pacjencie, cokolwiek trafiającego do elektronicznej dokumentacji medycznej, cokolwiek będącego chronionymi informacjami zdrowotnymi lub jakakolwiek transkrypcja medyczna objęta wymogami zgodności — Whisper jest złym narzędziem i powinieneś przestać czytać i kupić dedykowany produkt do dyktowania medycznego. Klasa oprogramowania Dragon Medical istnieje dokładnie do tego: zbudowana wokół dokumentacji pacjenta, zintegrowana z systemami EHR i sprzedawana z mechanizmami zgodności, których wymaga praca kliniczna. Whisper nie ma żadnego z tych elementów i żadnego z nich nie obiecuje.
Powodem nie jest skromność. Chodzi o to, że narzędzie do dyktowania zwiększające produktywność i produkt do dokumentacji klinicznej odpowiadają na zupełnie inne pytania. Jedno wrzuca twoje własne słowa do twojego własnego e-maila. Drugie jest odpowiedzialne za dokładność, integrację i zgodność z przepisami w regulowanej dokumentacji dotyczącej pacjenta. Nie będę zacierał tej granicy, żeby zatrzymać cię na tej stronie. Jeśli twoje zadanie żyje w historii choroby — skieruj się do produktu medycznego zaprojektowanego do tego celu. To uczciwa odpowiedź i taka, jaką dałbym każdemu koledze, który by zapytał.
Dla bardzo krótkich, nieklinicznych fragmentów właściwe narzędzie może być już bezpłatne na twoim komputerze. Na Windows klawisz Windows + H otwiera wbudowany pasek Pisanie głosowe tam, gdzie jest kursor; sam interpunktuje, ale kieruje ruch przez serwery Microsoft i wymaga internetu, więc nie jest opcją offline. Na Macu Dyktowanie pozwala mówić, żeby wpisywać tekst wszędzie tam, gdzie można pisać, a na Apple Silicon ogólny tekst może być przetwarzany na urządzeniu. Poniżej progu "długi list albo prawdziwy szkic" — używaj tego, co bezpłatne. Sięgaj po dedykowane narzędzie, gdy tekst robi się długi, terminologia gęsta albo chcesz jednego skrótu, który działa tak samo wszędzie — i sięgaj po produkt kliniczny, gdy tylko pojawia się dokumentacja pacjenta.
Jeśli powodem, dla którego zależy ci na lokalnym przetwarzaniu, jest trzymanie własnych tekstów z dala od cudzych serwerów, szerszy przypadek za prywatnym, lokalnym zamianą mowy na tekst omawia, co "lokalne" naprawdę oznacza i gdzie są jego granice.
Cały poradnik to jedna granica i dużo miejsca za nią. Granica: to nie jest narzędzie kliniczne, nie służy do dokumentacji pacjentów, żadnych gwarancji zgodności. Miejsce za nią: każdy e-mail, list, notatka i szkic, który lekarz pisze niezwiązany z historią choroby — mówiony zamiast pisanego, w dowolnej aplikacji, offline jeśli chcesz. Większość tego tekstu podyktowałem głosem do pola tekstowego, które nie było EHR, za pomocą narzędzia, które nie wie, czym jest EHR. O to chodzi.
Wypróbuj przy następnym liście lub e-mailu
Przytrzymaj skrót, mów, puść. Transkrypcja pojawia się tam, gdzie jest kursor — w e-mailu, szkicu lub dowolnej innej aplikacji, w której piszesz. Nie w dokumentacji pacjenta.
Bezpłatny tryb lokalny dla każdego zalogowanego konta. Karta nie jest wymagana na start.



