Автор: Денис Медведєв

Інструкція

Як додати власні слова до диктування

Диктування спотворює імена, терміни та бренди, бо їх немає у словнику програми. Рішення — навчити її: у Windows є словник мовлення, куди додають слова, а список ключових слів у Whisper підштовхує локальну модель до ваших термінів, щоб вони транскрибувались правильно.

Останнє оновлення: червень 2026

Відкритий словник на столі поряд із клавіатурою, що символізує слова й лексику

Щоб додати власні слова до диктування, навчіть програму своїй лексиці. У Windows у словнику мовлення Speech Recognition є майстер «Додати нове слово». У Whisper by Remskill список ключових слів підштовхує локальну модель Whisper до потрібних імен, термінів і брендів. У macOS Dictation немає налаштування власних слів — воно є в окремому застосунку Voice Control.

Кожен інструмент диктування, яким я користувався, чудово справляється зі звичайними фразами — і щоразу спотворює саме те слово, яке найважливіше. Він правильно розпізнає «запланувати перевірку на четвер», але потім перетворює мого колегу Csaba на «chubba», мій продукт на «project alfalfa», а «Kubernetes» — на «cooper netties». Слова, з якими транскрайбер бореться, — це саме ті, які не виправити гучнішим голосом: імена, терміни та бренди, яким він ніколи не навчався.

Тому люди шукають, як додати власні слова до диктування, очікуючи акуратну сторінку налаштувань. Чесна відповідь: це залежить від програми. У Windows є справжній словник, куди можна вписати слова. macOS приховала цю функцію там, де більшість користувачів ніколи не шукає. А локальна модель Whisper може бути налаштована на ваші терміни за допомогою списку ключових слів. Я розберу всі три варіанти, покажу, як налаштувати Whisper, і скажу, коли вбудованого інструменту цілком достатньо.

Ось те, що більшість статей оминає. Транскрайбер не «розбирає» слово так, як ви, — він вгадує найімовірніші слова для почутих звуків. «Csaba» програє «chubba», бо модель чула звуки, схожі на «chubba», мільйони разів, а ім'я вашого колеги — майже ніколи. Додавання власного слова не вчить модель новим буквам. Воно зміщує здогад.

Це зміщення реалізоване по-різному в кожному інструменті. Windows зберігає його у словнику мовлення, який ви редагуєте вручну. Локальні моделі Whisper беруть список ключових слів і надають їм перевагу під час транскрипції. І — один нюанс, який збиває людей з пантелику, — ця система ключових слів є функцією виключно локального Whisper. Parakeet ключових слів не приймає, хмарний шлях — теж. Я уточнюватиму, що є що, бо помилка тут коштує вам цілого вечора.

Чому диктування спотворює імена та терміни

Рукописні стікери з іменами та термінами на стіні — наче особистий глосарій

Диктування — це машина ставок. Вона слухає відрізок звуку й вибирає слова, які найімовірніше могли створити такий звук, спираючись на мільйони годин навчання. Повсякденне мовлення легко виграє ці ставки. Проблеми починаються з усього рідкісного: колега на ім'я Csaba, внутрішній проєкт Helios, назва ліків, юридична фірма, ваше прізвище, якщо воно нетипове для англійської.

Модель майже не чула цих слів, тому шукає загальне слово, яке звучить схоже. «Helios» стає «healy us». «Remskill» стає «rem skill» або «rim skill». Ви виправляєте одні й ті самі п'ять слів щоразу — і саме це змушує людей кинути диктування й повернутися до клавіатури. Рішення — не кращий мікрофон і не повільніше мовлення. Це завчасне попередження програми про те, що ці конкретні незвичайні слова є у вашому словнику.

Саме це й робить власне слово. У більшості програм ви не навчаєте вимові — ви додаєте слово до списку того, що транскрайбер може очікувати. Тоді, коли звуки неоднозначні, ваш термін виграє ставку замість загальнопоширеного слова, яке досі перемагало. Проста правда: короткий список із десяти-п'ятнадцяти термінів усуває більшість болю для більшості людей. Вам не потрібно завантажувати цілий словник. Потрібно лише внести кілька слів, які програма постійно калічить.

Вбудований спосіб — у Windows і на Mac

Почніть із того, що вже є на вашому комп'ютері, бо для деяких людей цього вистачить цілком. У Windows є два окремих вбудованих інструменти, і вони по-різному обробляють власні слова. Windows Speech Recognition — старіша функція робочого стола — має справжній словник мовлення, який можна редагувати. Відкрийте Speech Recognition, скажіть або клацніть «open Speech Dictionary», виберіть «Add a new word» і дотримуйтесь інструкцій майстра. Тепер це слово розпізнаватиметься при диктуванні. Новіший Windows 11 Voice Access має власний варіант: команду «Add to Vocabulary» (і пункт у меню Help), яка налаштовує розпізнавання на додані вами слова.

Проста панель голосового введення Win+H, якою більшість людей користується щодня, — це проміжний варіант. Вона не дає вам словника для прямого редагування; натомість вчиться з ваших виправлень і надрукованих текстів з часом, а не зі списку, який ви редагуєте. Тож якщо вам потрібен власноруч складений список слів на Windows сьогодні — він живе у словнику Speech Recognition або у словнику Voice Access, але не в панелі Win+H.

Cancel
Накладка для запису: маленька капсула, яка з'являється поки ви говорите, щоб ви знали, що програма вас чує.

На macOS потрібно бути уважним, бо очевидна функція цього не вміє. Стандартне macOS Dictation — те, що ви вмикаєте, щоб говорити в будь-яке текстове поле, — не має налаштування власних слів або власного словника. Взагалі. Натомість існує окрема функція доступності — Voice Control, яка має панель Vocabulary у Системних налаштуваннях у розділі «Доступність → Voice Control», де можна додати до 1000 термінів і навіть записати, як кожен вимовляється. Це справжній інструмент, і він непоганий, але це інша програма, не та Dictation, яку мають на увазі більшість користувачів Mac. Якщо стаття каже вам «просто додайте власні слова в macOS Dictation» — вона тихенько плутає ці два інструменти.

Налаштування власних слів у Whisper (Windows або Mac)

Якщо вам потрібен один уніфікований спосіб додавання власних слів, який однаково працює на Windows і Mac, — саме тут спеціалізований інструмент виправдовує своє місце. Вам потрібен Mac на Apple Silicon або ПК з Windows 10 чи новіше, робочий мікрофон і локальна модель Whisper — ключові слова є функцією локального Whisper, тож цей шлях потребує саме її, а не Parakeet і не хмару. Весь локальний конвеєр безплатний для будь-якого авторизованого облікового запису, без необхідності вводити платіжні дані при реєстрації. Ось послідовність кроків.

Крок 1 — Встановіть Whisper і увійдіть в обліковий запис.

Завантажте зі сторінки завантаження, встановіть і створіть безплатний обліковий запис. Картка не потрібна. Локальний конвеєр транскрипції запускається одразу.

Ви зрозумієте, що все вийшло, коли у системному треї з'явиться значок застосунку, а майстер налаштування запропонує вибрати модель.

Крок 2 — Виберіть локальну модель Whisper.

Застосунок пропонує три шляхи: Cloud, Local Parakeet, Local Whisper. Для власних слів виберіть Local Whisper, бо список ключових слів працює саме з моделями Whisper. Parakeet швидший, але ключових слів не підтримує; хмара — теж.

Ви зрозумієте, що все вийшло, коли модель Whisper завершить завантаження й відображатиметься як готова.

Крок 3 — Додайте терміни до списку ключових слів.

У налаштуваннях моделі Whisper додайте імена, терміни та бренди, які вона постійно спотворює, — по одному терміну на рядок. Тримайте список коротким і конкретним: лише ті слова, які справді спотикаються, а не весь ваш глосарій.

Ви зрозумієте, що все вийшло, коли збережені терміни з'являться у списку й залишатимуться там між записами.

Крок 4 — Диктуйте й перевірте складні слова.

Поставте курсор у будь-яке текстове поле, утримуйте гарячу клавішу, скажіть речення з одним зі своїх термінів і відпустіть. Транскрипт вставиться у місці курсору з правильним написанням вашого слова.

Ви зрозумієте, що все вийшло, коли термін, який раніше виходив неправильно, нарешті виходить правильно.

Whisper
Справжній десктопний застосунок Whisper на екрані налаштувань із відкритими панелями Транскрипція та ШІ.

Я б свідомо тримав перший список невеликим. Додайте п'ять-шість слів, які найбільше дратували вас цього тижня, диктуйте день і додавайте більше лише тоді, коли щось ще спотикнеться. Список ключових слів, роздутий двома сотнями термінів, може почати підштовхувати модель до слів, яких ви не мали на увазі. Коротко і конкретно — краще, ніж довго і з надією.

голос у текст на Windows · на Mac

Що насправді робить список ключових слів

Список ключових слів — це набір термінів, який ви передаєте моделі перед транскрипцією, щоб вона знала, чого очікувати. Під капотом це та сама ідея, що й словник мовлення Windows, тільки реалізована інакше: замість запису у збереженому словнику слова передаються з кожним записом як зміщення. Коли аудіо неоднозначне між вашим терміном і схожим загальним словом, це зміщення схиляє рішення на користь вашого терміну. «Csaba» перестає програвати «chubba», бо ви сказали моделі, що Csaba — це слово, яке тут доречне.

Варто чесно назвати дві обмеження. По-перше, ключові слова підштовхують, а не примушують — термін, який зовсім не схожий на сказане, все одно не з'явиться, а дуже коротке або незвичне слово може й далі вислизати. По-друге — і саме тут люди помиляються: ключові слова є функцією виключно локального Whisper. Parakeet, швидкий локальний двигун, списку ключових слів не приймає. Хмарний шлях також не надає до нього доступу. Тож якщо власні слова — ваша головна мета, локальна модель Whisper — єдиний шлях, де вони є.

Локальні моделі Whisper також дають тонший контроль, ніж більшість вбудованих інструментів — наприклад, розмір пучка і власний словник, яких стандартне поле диктування не відкриває. Для додавання кількох імен нічого з цього не потрібно. Але це є, якщо ви переходите від «виправити п'ять слів» до «транскрибувати термінологію медичної клініки цілий день» — а це реальна причина, чому деякі люди обирають Whisper замість швидшого Parakeet. Якщо ви зважуєте локальні моделі між собою, яку модель Whisper вибрати розбирає компроміси детально.

Локально чи хмара, коли мета — власні слова

Застосунок змушує вас обрати шлях, і для власних слів цей вибір важливіший, ніж зазвичай, бо лише один із трьох варіантів підтримує список ключових слів. Ось чесний огляд, щоб ви обирали усвідомлено, а не виявляли обмеження після встановлення не того двигуна.

Три шляхи і те, що кожен робить з вашим словником:

  • Local ParakeetДвигун TDT від NVIDIA, близько 600 МБ, найшвидший локальний варіант — у 5–10 разів швидший за Whisper на процесорі. Англійська плюс 24 інші європейські мови, 25 загалом. Немає перекладу на англійську, і найважливіше тут: немає ключових слів. Чудово підходить для швидкого повсякденного диктування англійською, але не той вибір, якщо вам потрібні власні слова.
  • Local Whisperповільніший за Parakeet на тій самій машині, але це шлях зі списком ключових слів і контролем власного словника. Багатомовні версії охоплюють 99 мов і можуть перекладати на англійську; версії лише для англійської — тільки англійська. Типова англійська модель важить близько 480 МБ. Якщо вам потрібно, щоб імена та терміни транскрибувались правильно, — це ваш варіант.
  • Cloud (OpenAI, BYOK)найвища загальна точність і доступ до вебу, з використанням вашого власного ключа OpenAI, що виставляє рахунок напряму від OpenAI. Транскрипція стандартно виконується через gpt-4o-mini-transcribe. Часто правильно розпізнає рідкісні слова завдяки грубій силі, але не надає доступу до списку ключових слів. Потребує інтернету. Хмарна функція є частиною Whisper Pro.

Тож правило просте. Якщо власні слова — ваша головна проблема і ви хочете список, яким керуєте самі, — використовуйте локальну модель Whisper. Якщо ви переважно говорите звичайною англійською і хочете максимальну швидкість, Parakeet — кращий щоденний варіант, тільки не очікуйте поля для ключових слів. Хмара — рятівний люк, коли потрібна висока точність для складного запису і ви не проти, щоб він покинув ваш комп'ютер. Якщо ви вирішуєте щодо локального налаштування загалом, як запустити Whisper локально та модель Parakeet детально розбирають обидва двигуни.

Виправляємо те, що прослизнуло, — після факту

Жодне налаштування власних слів не вловлює все, а сире диктування завжди виходить трохи суцільним потоком. Ви кажете «зустрітись з csaba щодо розгортання helios ну позначити це project alpha», і навіть при ввімкнених ключових словах розділові знаки та слова-заповнювачі все одно залишаються вашим клопотом. Тут робота ділиться на дві частини: ключові слова виправляють написання складних слів, а прохід очищення виправляє форму речення.

Windows Voice Typing додає розділові знаки під час мовлення, а macOS Dictation обробляє базову пунктуацію, коли ви говорите «кома» або «крапка». Для серйознішого очищення — прибрати «ну», виправити суцільний потік, перетворити усну репліку на щось, що можна відправити — Whisper може виконати прохід ШІ. Скажіть активаційну фразу «Hey whisper», і текст покращується перед вставкою. На локальній моделі це відбувається через Ollama; у хмарному режимі стандартно використовується gpt-5-mini. Прохід очищення зберігає написання ваших власних слів і виправляє все навколо них.

Thinking...
Сире

meet csaba about the helios rollout um tag it project alpha before the standup thursday

Очищене

Meet Csaba about the Helios rollout, tag it Project Alpha, before the standup Thursday.

Для слів, які все одно вислизають і від списку ключових слів, і від проходу очищення, старий добрий спосіб залишається в силі: виправте один раз, а на Windows додайте до словника мовлення, щоб це більше не було проблемою. У ручному виправленні час від часу немає нічого ганебного. Мета — не інструмент, який ніколи не помиляється; мета — інструмент, який помиляється з тими самими п'ятьма словами один раз, а не сорок. Власні слова вирішують більшу частину; швидке редагування закриває хвіст.

Той самий ритм «говориш — очищаєш» варто освоїти повсюдно, бо як тільки він клацне, ви зможете диктувати чисто на Windows у будь-якому застосунку, а не лише в тому, який ви спочатку хотіли налагодити.

Коли вбудованого достатньо

Один стікер на чистому столі — натяк на просте і достатнє рішення

Іноді спеціалізований інструмент зовсім не потрібен, і вдавати інакше було б нечесно. Якщо ваша проблема з власними словами невелика — кілька імен на Windows, які можна додати один раз і забути — словник мовлення Windows Speech Recognition вже робить це безплатно. Додайте слова і рухайтеся далі. Встановлювати щось додаткове заради цього — надмірність.

На Mac картина чесно кажучи неоднозначніша, і про це варто сказати прямо. Стандартне macOS Dictation не має списку власних слів, тому, якщо ви користуєтесь лише ним, вбудовані можливості додавання термінів справді обмежені. Панель Vocabulary у Voice Control справляється з цим і вміщує до 1000 термінів, але це функція доступності, яку ви вмикаєте спеціально для цього — нормально, якщо вам це підходить, і крюк, якщо ні. Тому на Mac компроміс реальний: миритися з помилками Dictation, вивчити Voice Control або запустити інструмент зі власним списком ключових слів.

Беріться за спеціалізований системний інструмент, коли вбудований починає боліти: довгий список імен і термінів, ті самі власні слова потрібні на обох Windows і Mac, офлайн-приватність, або ж ви хочете одну гарячу клавішу й один словник, які однаково поводяться у кожному застосунку. Нижче цієї межі — користуйтеся тим, що безплатно. Я не буду казати вам встановлювати програму, щоб навчити комп'ютер одному прізвищу.

Той самий компроміс виникає, якщо ваше диктування переважно на Mac — вбудовані обмеження й чесні рішення у статті голос у текст на Mac є розгорнутою версією цього розділу.

Додавання власних слів — найменш ефектна функція диктування і саме та, що вирішує, чи будете ви ним користуватися далі. Внесіть п'ять слів, які постійно спотикаються, до списку — словника мовлення на Windows чи списку ключових слів у Whisper — і щоденне тертя тихо зникне. Я додав власне прізвище до списку ключових слів два роки тому і з тих пір жодного разу не спостерігав, як транскрайбер його калічить. Низька планка — і саме такі планки я хочу долати до сніданку.

Навчіть його словам, які він постійно пропускає

Додайте імена, терміни та бренди до списку ключових слів локальної моделі Whisper, а потім диктуйте. Слова, які раніше спотворювались, вставляться саме так, як ви їх зберегли, — у кожному застосунку.

Локальний режим безплатний для будь-якого авторизованого облікового запису. Картка для початку не потрібна.

Фото Denys Medvediev

Denys Medvediev

Це я читаю нашу електронну пошту підтримки, найімовірніше диктуючи відповіді.

Додаткове читання