Autor: Denys Medvediev

Poradnik

Jak dodawać własne słowa do dyktowania

Dyktowanie przekręca imiona, żargon i nazwy marek, bo ich nie zna. Rozwiązanie: naucz je. Windows ma Słownik mowy, do którego wpisujesz słowa, a lista hotwordów w Whisper nakłania lokalny model, żeby transkrybował twoje terminy poprawnie.

Ostatnia aktualizacja: czerwiec 2026

Otwarta książka słownikowa na biurku obok klawiatury — skojarzenie ze słowami i słownictwem

Żeby dodać własne słowa do dyktowania, naucz narzędzie swojego słownictwa. Na Windows Słownik mowy w Rozpoznawaniu mowy ma kreator „Dodaj nowe słowo”. W Whisper by Remskill lista hotwordów nakłania lokalny model Whisper ku nazwom, żargonowi i markom. macOS Dictation samo w sobie nie ma ustawienia własnych słów — to funkcja Voice Control.

Każde narzędzie do dyktowania, którego używałem, radzi sobie z potocznym angielskim, a potem masakruje właśnie to jedno słowo, które naprawdę się liczy. Bezbłędnie transkrybuje „zaplanuj przegląd na czwartek”, ale moje imię kolegi Csaba zamienia w „czaba”, nazwę produktu w „projekt alfa”, a „Kubernetes” w „kupernetis”. Słowa, z którymi transkryber się szarpie, to dokładnie te, których nie naprawisz głośniejszym mówieniem — imiona, żargon i marki, na które model nigdy nie był szkolony.

Dlatego ludzie szukają, jak dodawać własne słowa do dyktowania, spodziewając się schludnej strony ustawień. Szczera odpowiedź brzmi: to zależy od narzędzia. Windows ma prawdziwy, edytowalny słownik, do którego możesz wpisywać słowa. macOS chowa tę funkcję w miejscu, gdzie większość użytkowników nigdy nie zagląda. A lokalny model Whisper można nakierować na twoje terminy listą hotwordów. Przejdę przez wszystkie trzy opcje, pokażę, jak skonfigurować Whisper, i powiem, kiedy wbudowane rozwiązanie w zupełności wystarcza.

Oto część, którą większość stron pomija. Transkryber nie „literuje” słowa tak jak ty — zgaduje najbardziej prawdopodobne słowa dla usłyszanych dźwięków. „Csaba” przegrywa z „czaba”, bo model słyszał dźwięki brzmiące jak „czaba” milion razy, a imię twojego kolegi niemal nigdy. Dodanie własnego słowa nie uczy modelu nowych liter. Przechyla szalę.

To przechylenie jest inaczej zbudowane w każdym narzędziu. Windows przechowuje je w Słowniku mowy, który edytujesz ręcznie. Lokalne modele Whisper przyjmują listę hotwordów i w trakcie transkrypcji ważą ku nim. I tu jest haczyk, który wpędza ludzi w kłopoty: biasowanie hotwordami działa tylko w lokalnym Whisper. Parakeet nie obsługuje hotwordów, a tryb chmurowy też nie. Będę konkretny, co z czym chodzi — pomylenie ich kosztuje cię popołudnie.

Dlaczego dyktowanie przekręca imiona i żargon

Ręcznie pisane karteczki z imionami i terminami przyklejone do ściany, jak osobisty słownik

Dyktowanie to maszyna do stawiania zakładów. Słucha fragmentu dźwięku i wybiera słowa, które z największym prawdopodobieństwem ten dźwięk wygenerowały — na podstawie milionów godzin materiału treningowego. Codzienna mowa wygrywa te zakłady bez trudu. Problem zaczyna się przy słowach rzadkich: współpracownik o imieniu Csaba, wewnętrzny projekt o nazwie Helios, nazwa leku, kancelaria prawna, twoje własne nazwisko, jeśli nie jest typowo angielskie.

Model rzadko słyszał te słowa, więc sięga po coś pospolitego, co brzmi podobnie. „Helios” staje się „hilius”. „Remskill” staje się „rem skill” albo „rim skill”. Kończysz poprawiając te same pięć słów za każdym razem — to dokładnie ta cena, która sprawia, że ludzie rezygnują z dyktowania i wracają do klawiatury. Lekarstwo to nie lepszy mikrofon ani wolniejsze mówienie. To powiedzenie narzędziu z góry, że te konkretne dziwne słowa w ogóle istnieją.

To właśnie robi własne słowo. W większości narzędzi nie uczysz wymowy — dodajesz słowo do listy rzeczy, których transkryber może się spodziewać. Gdy dźwięki są niejednoznaczne, twój termin wygrywa zakład zamiast pospolitego słowa, które dotychczas zawsze zwyciężało. Nuda prawda jest taka, że krótka lista dziesięciu, piętnastu terminów eliminuje większość bólu dla większości ludzi. Nie musisz karmić go słownikiem. Musisz karmić go garstką słów, które stale zamieniał w coś innego.

Wbudowana opcja na Windows i Macu

Zacznij od tego, co już masz na komputerze, bo dla niektórych to wystarczy. Na Windows są dwa oddzielne narzędzia wbudowane, które obsługują własne słowa bardzo różnie. Rozpoznawanie mowy Windows — starsza funkcja desktopowa — ma prawdziwy, edytowalny Słownik mowy. Otwierasz Rozpoznawanie mowy, mówisz lub klikasz „otwórz Słownik mowy”, wybierasz „Dodaj nowe słowo” i postępujesz zgodnie z kreatorem. To słowo jest odtąd czymś, co dyktowanie rozpozna. Nowszy Windows 11 Voice Access ma swoją wersję: polecenie „Dodaj do słownika” (i opcję w menu Pomoc), które nakierowuje rozpoznawanie na dodane przez ciebie słowa.

Prosta belka dyktowania Win+H, z której korzysta większość ludzi na co dzień, jest przypadkiem pośrednim. Nie daje ci słownika do ręcznej edycji; uczy się z korekt, które wprowadzasz, i z twojego pisanego tekstu — nie z listy, którą edytujesz. Jeśli więc chcesz dziś ręcznie redagować listę własnych słów na Windows, szukaj jej w Słowniku mowy Rozpoznawania mowy lub w słowniku Voice Access — nie w belce Win+H.

Cancel
Nakładka nagrywania: mała kapsułka, która pojawia się podczas mówienia, żebyś wiedział, że aplikacja słucha.

Na macOS trzeba uważać, bo oczywista funkcja tego nie ma. Standardowe macOS Dictation — to, co uruchamiasz, żeby podyktować tekst w dowolnym polu — nie ma żadnego ustawienia własnych słów ani słownika. Dosłownie żadnego. Istnieje natomiast osobna funkcja dostępności, Voice Control, która ma panel Słownictwo w Ustawieniach systemowych > Dostępność > Voice Control. Możesz tam dodać do 1000 terminów, a nawet nagrać, jak każdy z nich się wymawia. To naprawdę działa i działa dobrze, ale to inne narzędzie niż Dictation, które większość użytkowników Maca ma na myśli. Jeśli jakaś strona mówi „po prostu dodaj własne słowa w macOS Dictation”, cicho myli te dwa narzędzia.

Konfiguracja własnych słów w Whisper (Windows i Mac)

Jeśli chcesz jednego spójnego sposobu dodawania własnych słów, który działa tak samo na Windows i Macu, właśnie tu dedykowane narzędzie zaczyna mieć sens. Potrzebujesz Maca na Apple Silicon lub PC z Windows 10 lub nowszym, działającego mikrofonu i lokalnego modelu Whisper — hotwordy są funkcją lokalnego Whisper, więc ta ścieżka wymaga tego modelu, nie Parakeet i nie chmury. Cały lokalny potok jest bezpłatny dla każdego zalogowanego konta, bez podawania karty przy rejestracji. Oto kolejność kroków.

Krok 1 — Zainstaluj Whisper i zaloguj się.

Pobierz z strony pobierania, zainstaluj i utwórz bezpłatne konto. Bez karty. Lokalny potok transkrypcji otwiera się od razu.

Wiedz, że zadziałało, gdy ikona aplikacji w zasobniku systemowym się pojawi, a kreator konfiguracji zaproponuje wybór modelu.

Krok 2 — Wybierz lokalny model Whisper.

Aplikacja prezentuje trzy ścieżki — Chmura, Lokalny Parakeet, Lokalny Whisper. Dla własnych słów wybierz Lokalny Whisper, bo lista hotwordów działa z modelami Whisper. Parakeet jest szybszy, ale nie obsługuje hotwordów; chmura też nie.

Wiedz, że zadziałało, gdy model Whisper skończy się pobierać i pojawi się jako gotowy.

Krok 3 — Dodaj terminy do listy hotwordów.

W ustawieniach modelu Whisper dodaj imiona, żargon i marki, które aplikacja stale przekręca — jeden termin na wpis. Trzymaj listę krótką i konkretną: słowa, które rzeczywiście sprawiają kłopot, nie cały twój słownik.

Wiedz, że zadziałało, gdy zapisane terminy pojawią się na liście i pozostaną tam między nagraniami.

Krok 4 — Podyktuj i sprawdź trudne słowa.

Ustaw kursor w dowolnym polu tekstowym, przytrzymaj skrót klawiszowy, powiedz zdanie zawierające jeden ze swoich terminów i puść. Transkrypt wklei się w miejscu kursora z twoim słowem zapisanym tak, jak je zachowałeś.

Wiedz, że zadziałało, gdy termin, który wychodził źle, zaczyna wychodzić poprawnie.

Whisper
Prawdziwa desktopowa aplikacja Whisper na ekranie ustawień z otwartymi panelami Transkrypcja i AI.

Pierwszą listę trzymałbym celowo małą. Dodaj pięć lub sześć słów, które najbardziej irytowały cię w tym tygodniu, dyktuj przez dzień i dodawaj więcej dopiero gdy coś innego zacznie sprawiać problem. Lista hotwordów napęczniała do dwustu terminów może zacząć podpychać model ku słowom, których nie miałeś na myśli. Krótko i konkretnie bije długo i z nadzieją.

zamiana mowy na tekst na Windows · na Macu

Co lista hotwordów właściwie robi

Lista hotwordów to zestaw terminów, które przekazujesz modelowi przed transkrypcją, żeby wiedział, że ma się ich spodziewać. Pod spodem to ten sam pomysł co Słownik mowy w Windows, tylko inaczej podłączony: zamiast wpisu w zapisanym słowniku, słowa jadą razem z każdym nagraniem jako biasowanie. Gdy audio jest niejednoznaczne między twoim terminem a popularnym odpowiednikiem, biasowanie przechyla decyzję ku twojemu terminowi. „Csaba” przestaje przegrywać z „czaba”, bo powiedziałeś modelowi, że Csaba to słowo, które tu należy.

Warto uczciwie przyznać dwa ograniczenia. Po pierwsze, hotwordy zachęcają, nie wymuszają — termin brzmiący zupełnie inaczej niż to, co powiedziałeś, i tak się nie pojawi, a bardzo krótkie lub wyjątkowo rzadkie słowo może nadal się wyślizgnąć. Po drugie, i tu ludzie najczęściej się mylą: hotwordy to funkcja wyłącznie lokalnego Whisper. Parakeet, szybki lokalny silnik, nie ma listy hotwordów. Ścieżka chmurowa też jej nie udostępnia. Jeśli więc własne słowa są powodem, dla którego tu trafiłeś, lokalny model Whisper jest jedyną ścieżką, która je ma.

Lokalne modele Whisper dają ci też lepszą kontrolę niż większość wbudowanych rozwiązań — rzeczy takie jak rozmiar belki i własne słownictwo, których przeciętne okno dyktowania nie udostępnia. Do dodania kilku imion nie potrzebujesz niczego z tego. Ale jest, jeśli przejdziesz od „popraw pięć słów” do „transkrybuj terminologię kliniki medycznej przez cały dzień”, co jest prawdziwym powodem, dla którego niektórzy wybierają Whisper zamiast szybszego silnika Parakeet. Jeśli rozważasz lokalne modele jeden do drugiego, który model Whisper wybrać przeprowadza przez kompromisy.

Lokalnie czy w chmurze, gdy celem są własne słowa

Aplikacja każe ci wybrać ścieżkę, a przy własnych słowach ten wybór ma większe znaczenie niż zwykle, bo tylko jedna z trzech opcji obsługuje listę hotwordów. Oto uczciwy opis każdej, żebyś wybrał świadomie — nie odkrywał ograniczenia po zainstalowaniu złego silnika.

Trzy ścieżki i co każda z nich robi z twoim słownictwem:

  • Lokalny ParakeetSilnik TDT firmy NVIDIA, około 600 MB, najszybsza opcja lokalna — od 5 do 10 razy szybsza od Whisper na CPU. Angielski plus 24 inne języki europejskie, 25 łącznie. Brak tłumaczenia na angielski, i to co tu ważne: brak hotwordów. Świetny do szybkiego codziennego dyktowania po angielsku, zły wybór, jeśli przyszedłeś po własne słowa.
  • Lokalny Whisperwolniejszy od Parakeet na tym samym komputerze, ale to ta ścieżka z listą hotwordów i kontrolą własnego słownictwa. Wersje wielojęzyczne obsługują 99 języków i potrafią tłumaczyć na angielski; wersje tylko angielskie są tylko angielskie. Domyślny model angielski zajmuje około 480 MB. Jeśli potrzebujesz poprawnej transkrypcji imion i żargonu, to jest ta opcja.
  • Chmura (OpenAI, BYOK)najlepsza ogólna dokładność i dostęp do sieci, przy użyciu własnego klucza OpenAI rozliczanego bezpośrednio przez OpenAI. Transkrypcja domyślnie korzysta z gpt-4o-mini-transcribe. Często radzi sobie z rzadkimi słowami dzięki surowej sile, ale nie udostępnia listy hotwordów. Wymaga internetu. Opcja Chmura jest częścią Whisper Pro.

Prosta zasada brzmi tak. Jeśli własne słowa są twoim głównym problemem i chcesz listy, którą kontrolujesz, użyj lokalnego modelu Whisper. Jeśli mówisz głównie potocznym angielskim i zależy ci na surowej szybkości, Parakeet jest lepszym codziennym wyborem — tylko nie licz na pole hotwordów. Chmura to tylne wyjście, gdy chcesz najwyższej dokładności dla trudnego nagrania i nie przeszkadza ci, że dane opuszczają twój komputer. Jeśli zastanawiasz się nad konfiguracją lokalną w ogóle, jak uruchomić Whisper lokalnie i opis modelu Parakeet omawiają oba silniki dogłębnie.

Poprawianie tego, co się wyślizgnie

Żadna konfiguracja własnych słów nie wyłapie wszystkiego, a surowe dyktowanie zawsze wypada nieco jak potok słów. Mówisz „spotkaj się z csaba w sprawie wdrożenia helios ym oznacz jako projekt alfa”, i nawet przy włączonych hotwordach interpunkcja i wtrącenia nadal czekają na twoją korektę. Tu rozchodzą się dwie połowy pracy: hotwordy naprawiają pisownię trudnych słów, a przejście czyszczące naprawia kształt zdania.

Windows Voice Typing dodaje interpunkcję podczas mówienia, a macOS Dictation radzi sobie z podstawową interpunkcją, gdy mówisz „przecinek” lub „kropka”. Do głębszego czyszczenia — wyrzucania „ym”, naprawiania potoków zdań, układania mówionych akapitów w coś, co chciałbyś wysłać — Whisper może uruchomić przejście AI. Powiedz frazę aktywacyjną „Hey whisper”, a tekst zostaje wzbogacony zanim trafi na ekran. W trybie lokalnym dzieje się to przez Ollama; w trybie chmurowym domyślnie przez gpt-5-mini. Przejście czyszczące zostawia pisownię twoich własnych słów nietkniętą, poprawiając wszystko dokoła.

Thinking...
Surowe

meet csaba about the helios rollout um tag it project alpha before the standup thursday

Wyczyszczone

Meet Csaba about the Helios rollout, tag it Project Alpha, before the standup Thursday.

Dla słów, które nadal wymykają się zarówno liście hotwordów, jak i przejściu czyszczącemu, stara metoda nadal działa: popraw raz i na Windows dodaj do Słownika mowy, żeby nie był problemem następnym razem. Nic wstydliwego w ręcznej korekcie od czasu do czasu. Celem nie jest narzędzie, które nigdy się nie myli; celem jest narzędzie, które myli się w tych samych pięciu słowach raz zamiast czterdziestu razy. Własne słowa doprowadzają cię przez większość drogi; szybka edycja pokrywa resztę.

Ten sam rytm mów-potem-czyść warto wyrobić sobie wszędzie, bo gdy raz zaskoczy, możesz dyktować czysto na Windows w każdej aplikacji, którą otwierasz, nie tylko w tej, którą chciałeś poprawić.

Kiedy wbudowane rozwiązanie wystarcza

Pojedyncza karteczka na czystym biurku — sugestia małego, wystarczającego rozwiązania

Czasem w ogóle nie potrzebujesz dedykowanego narzędzia, a udawanie inaczej byłoby nieuczciwe. Jeśli twój problem z własnym słowem jest mały — kilka imion na Windows, które możesz dodać raz i zapomnieć — Słownik mowy Rozpoznawania mowy Windows robi to dokładnie tak, za darmo. Dodaj słowa i jedź dalej. Instalowanie czegokolwiek więcej w tym przypadku to gruba przesada.

Na Macu obraz jest uczciwie bardziej mieszany i warto powiedzieć to wprost. Standardowe macOS Dictation nie ma listy własnych słów, więc jeśli to wszystko, czego używasz, twoje wbudowane opcje dodawania terminów są naprawdę ograniczone. Panel Słownictwo w Voice Control wykonuje tę pracę i mieści do 1000 terminów, ale to funkcja dostępności, którą włączałbyś specjalnie w tym celu — w porządku, jeśli czujesz się tam komfortowo, ale objazd, jeśli nie. Na Macu wybór jest więc realny: żyć z błędami Dictation, nauczyć się Voice Control albo korzystać z narzędzia z własną listą hotwordów.

Po dedykowane, systemowe narzędzie sięgnij, gdy wbudowane rozwiązania zaczynają boleć: długa lista imion i żargonu, te same własne słowa potrzebne zarówno na Windows, jak i Macu, prywatność offline, albo gdy chcesz jednego skrótu klawiszowego i jednego słownika działającego tak samo w każdej aplikacji. Poniżej tego progu używaj tego, co bezpłatne. Nie zamierzam mówić ci, żebyś instalował oprogramowanie, żeby nauczyć komputer jednego nazwiska.

Ten sam kompromis pojawia się, jeśli twoje dyktowanie odbywa się głównie na Macu — wbudowane ograniczenia i uczciwe obejścia w zamiana mowy na tekst na Macu to pełniejsza wersja tej sekcji.

Dodawanie własnych słów to najmniej efektowna funkcja dyktowania i zarazem ta, która decyduje, czy w ogóle z niego nie zrezygnujesz. Wrzuć pięć słów, które aplikacja ciągle przekręca, na listę — Słownik mowy na Windows, lista hotwordów w Whisper — a codzienny zgrzyt po cichu znika. Dodałem własne nazwisko do listy hotwordów dwa lata temu i od tamtej pory nie oglądałem, jak żaden transkryber je rzeźbi. Poprzeczka niska, ale właśnie taką poprzeczkę chcę mieć skoczoną przed śniadaniem.

Naucz go słów, które ciągle opuszcza

Dodaj swoje imiona, żargon i marki do listy hotwordów lokalnego modelu Whisper i zacznij dyktować. Terminy, które wychodziły przekręcone, lądują zapisane tak, jak je zachowałeś — w każdej otwartej aplikacji.

Bezpłatny tryb lokalny dla każdego zalogowanego konta. Karta nie jest wymagana na start.

Zdjęcie Denysa Medvedeva

Denys Medvediev

To ja czytam naszą skrzynkę wsparcia — najprawdopodobniej dyktując odpowiedzi.

Dalsza lektura