Інструкція
Мовлення в текст у Windows 11
Натисніть Windows key + H на фізичній клавіатурі, поставте курсор у будь-яке текстове поле та починайте говорити — вбудований голосовий набір працює онлайн через Azure. Для офлайн-диктування в будь-якій програмі встановіть спеціалізований інструмент. Цей посібник налаштовує обидва варіанти — від початку до кінця.
Останнє оновлення: червень 2026

Натисніть Windows key + H на фізичній клавіатурі, поставте курсор у будь-яке текстове поле та починайте говорити. Слова з'являються там, де стоїть курсор. Вбудований голосовий набір працює на онлайн-розпізнаванні мовлення Azure і потребує інтернету. Для офлайн-диктування в будь-якій програмі встановіть спеціалізований інструмент. Цей посібник налаштовує обидва варіанти — від початку до кінця.
Якось моя старша донька запитала, чому я так довго пишу листи. Чесна відповідь: я друкую приблизно 40 слів на хвилину і мене переривають десь раз на дев'яносто секунд. Голосовий набір вирішив половину цієї проблеми. Хитрість у Windows 11 — одне поєднання клавіш, яке більшість людей ніколи не знаходить: утримайте Windows key + H, і над полем, у якому ви пишете, з'явиться маленька панель мікрофона.
Після цього ви говорите, а слова опиняються там, де стоїть курсор. Моя думка, яку захищатиму нижче: для всього, що довше короткої нотатки, вбудований інструмент — не найкращий вибір.
Є два шляхи налаштування мовлення в текст у Windows 11, і різниця між ними — де відбувається обробка. Шлях 1 — це вбудований голосовий набір: він надсилає аудіо на сервери Azure від Microsoft, розпізнає там і повертає текст. Для повідомлення в Teams це нормально; для таблиці зарплат у літаку без Wi-Fi — уже проблема.
Шлях 2 — це настільна програма, яка розпізнає мовлення прямо на вашому комп'ютері, офлайн, у будь-якому вікні. До кінця посібника ви матимете обидва варіанти запущеними й знатимете, який залишити. Більшість листів у підтримку, які я читаю, приходять від людей, що обрали хибний шлях з першого дня. Ці листи читаю особисто я.
Шлях 1: натисніть Win+H і починайте говорити
Windows 11 · Win + H
Що потрібно: Windows 11, інтернет-з'єднання, робочий мікрофон і курсор у текстовому полі. Нічого завантажувати й реєструватись не треба. Час: менше хвилини.
Відкрийте будь-яке текстове поле. Документ Word, листування, рядок пошуку в браузері — будь-де, де можна набирати текст.
Натисніть Windows key + H на фізичній клавіатурі. З'явиться маленька плаваюча панель із кнопкою мікрофона.
Дочекайтесь мітки «Слухаю» та говоріть. Слова з'являються там, де стоїть курсор.
Скажіть «зупинити прослуховування» або торкніться мікрофона, щоб зупинитись. Панель закриється, а продиктований текст залишиться на місці курсора.
Очікуваний результат: на панелі з'явиться мітка «Слухаю», а слова, які ви вимовляєте, відображатимуться в місці курсора в режимі реального часу. Якщо увімкнути автоматичну пунктуацію (значок шестерні на панелі), програма сама додаватиме коми і крапки на основі почутого.
Якщо нічого не відбувається: голосовий набір використовує онлайн-розпізнавання мовлення на базі Azure, тому потребує інтернет-з'єднання, робочого мікрофона і курсора всередині текстового поля. Немає з'єднання — немає розпізнавання. Повний список виправлень — через два розділи нижче.
Натрапили на старий посібник, що згадує Windows Speech Recognition? У вересні 2024 року цю функцію замінив Voice Access для Windows 11 22H2 і новіших версій. Стара панель управління WSR збереглась лише в старіших версіях Windows. Тому якщо інструкція пропонує відкрити майстер «Розпізнавання мовлення», а ви його не знаходите — застарів посібник, а не ваш ПК.
Коли вбудованого голосового набору достатньо

Я не збираюся радити вам встановлювати програму, яка вам не потрібна. Для багатьох завдань Win+H — правильна відповідь, і коштує це нічого.
Використовуйте вбудований інструмент, коли диктування коротке, є інтернет і ставки невисокі. Відповідь колезі в Teams. Швидка нотатка в OneNote. Пошуковий запит, який зручніше вимовити, ніж набирати. Він справляється з автоматичною пунктуацією і працює в будь-якому стандартному текстовому полі в Windows 11. Якщо ви все одно онлайн і вам треба диктувати короткі фрази по 30 слів — відкривати ще одну програму повільніше, ніж просто говорити.
Є ще одна вбудована функція, яка плутає людей — давайте розберемось. Voice Access — це не те саме, що голосовий набір. Voice Access дозволяє керувати всім ПК і вводити текст голосом, і, на відміну від Win+H, він працює офлайн завдяки локальному розпізнаванню мовлення після одноразового завантаження мовного пакету. Потрібна Windows 11 версії 22H2 або новіша. Тобто, якщо вам потрібне повне керування ПК руками вільно (клік, прокрутка, відкриття програм голосом) — вбудований інструмент для вас це Voice Access, а не голосовий набір. Різні задачі.
Де Win+H не справляється (офлайн, точність, мови)
Вбудований інструмент має три реальних обмеження. Жодне з них не є критичним для короткої нотатки. Але всі три починають заважати, щойно ви переходите до довших або серйозніших завдань.
Офлайн
Голосовий набір потребує інтернету, бо розпізнавання відбувається на серверах Azure, а не на вашому ноутбуці. У літаку, у поїзді крізь тунель або в будівлі з поганим Wi-Fi він перестає працювати.
Точність
Microsoft не публікує цифр точності для голосового набору, і я не стану стверджувати щось на основі нейтральних тестів. Можу сказати одне: нестабільне з'єднання, вбудований мікрофон ноутбука і сильний акцент — це три окремих способи отримати транскрипт, який доведеться виправляти вручну.
Мови
Голосовий набір підтримує фіксований список, що підтримується Microsoft, — близько сорока мов, і кожну треба встановити перед переключенням. Для більшості цього достатньо, але для тих, хто працює з мовою, якої Microsoft ще не додала, — це стіна.
Питання конфіденційності — те, про що я думаю найбільше. Ваше диктування — лист до школи дитини, чернетка контракту, ідея, яку ви б ніколи не висловили вголос на нараді — залишає ваш пристрій і вирушає на сервер. Для запізнілого повідомлення в Teams це дрібниця. Для речей, що мають значення, варто знати, куди йде аудіо.
Win+H не працює? Три найпоширеніші причини
Коли Win+H нічого не робить, причина майже завжди одна з трьох. Перевіряйте їх у цьому порядку — саме так часто кожна з них є причиною.
1. Немає інтернету або не працює мікрофон.
Голосовий набір потребує з'єднання і мікрофона, який Windows може почути. Відкрийте «Параметри → Система → Звук» і переконайтесь, що ваш пристрій введення реагує, коли ви говорите.
Перевірка: панель має перейти в стан «Слухаю», а не зависнути.
2. Курсор не в текстовому полі.
Win+H спрацьовує лише тоді, коли курсор стоїть у полі, в якому можна щось ввести. Спершу клацніть у документ Word або в тіло листа, а тоді натискайте поєднання клавіш.
Перевірка: панель мікрофона з'являється щойно ви натискаєте клавіші.
3. Функціональний шар клавіатури ноутбука перехоплює H.
На деяких ноутбуках верхній ряд клавіш або мультимедійні клавіші перепризначені, і утиліта клавіатури може перехоплювати поєднання.
Перевірка: натомість спробуйте кнопку мікрофона на сенсорній клавіатурі. Якщо диктування там працює, проблема в апаратному скороченні — перепризначте клавішу в утиліті клавіатури від виробника.
Якщо жодне з цього не допомогло, глибша причина зазвичай у мовному пакеті, що не завершив встановлення, або у Windows-оновленні, що не завершилось. Саме в цей момент я перестаю боротись із вбудованим інструментом і налаштовую те, над чим маю повний контроль, — Шлях 2 нижче. Якщо проблема не зникає навіть після цього, ми написали окремий посібник про те, що робити, коли голосовий набір не працює у Windows з повним списком кроків.
Шлях 2: встановіть спеціалізований додаток для диктування
Whisper — це настільний додаток, який я розробляю, і він робить три речі, які Win+H не вміє: розпізнає офлайн прямо на вашому процесорі, працює через одне системне гарячe поєднання клавіш у будь-якій програмі і дозволяє самому обрати рушій під ваше залізо та мови — замість одної фіксованої хмарної моделі. Ось повне налаштування від початку до кінця.
Що потрібно: Windows 11, близько 1 ГБ вільного місця на диску для моделі середнього розміру, мікрофон і безкоштовний обліковий запис (платіжна картка не потрібна). Інтернет потрібен лише для одноразового завантаження; далі розпізнавання — офлайн. Час: 5–10 хвилин, більшість з яких — завантаження моделі.
Завантажте і встановіть Whisper. Візьміть інсталятор зі сторінки завантаження і запустіть його. Очікуваний результат: програма відкривається у головному вікні.
Увійдіть в обліковий запис. Коли програма запропонує — створіть безкоштовний обліковий запис; картку вводити не потрібно. Очікуваний результат: ви потрапляєте на головний екран із доступними «Налаштуваннями».
Оберіть локальний рушій і завантажте модель. Виберіть модель Whisper під ваш ПК або Parakeet для найшвидшого локального варіанту. Очікуваний результат: прогрес-бар завершується і модель відображається як готова.
Підтвердіть гарячe поєднання клавіш. Стандартне поєднання для Windows — Ctrl+Space: утримуйте, говоріть, відпустіть. Змініть у «Налаштуваннях», якщо воно конфліктує з чимось іншим.
Перевірте в будь-якій програмі. Клацніть у будь-яке текстове поле (браузер, редактор коду, чат), утримайте Ctrl+Space, скажіть речення, відпустіть. Текст з'явиться там, де стоїть курсор.
Очікуваний результат: після завантаження моделі ви утримуєте Ctrl+Space у будь-якій програмі, говорите, відпускаєте — і слова вставляються в місце курсора без інтернету. Якщо ввімкнено відповідну функцію, фраза «Hey whisper» запускає AI-коригування тексту перед вставкою.
Якщо поєднання клавіш спрацьовує неправильно: перепризначте його в «Налаштуваннях». Я навчився цього на власному досвіді. Перша версія обробника гарячих клавіш під Windows викликала зворотний виклик зупинки запису шість разів при кожному реальному натисканні — бо фреймворк введення Windows генерує фантомні події відпускання Ctrl+Space у непередбачуваний момент. На чистому комп'ютері це працювало, а на будь-якому ноутбуці з другою мовою введення — ламалось. Знадобились телеметрія, захист у 50 мс, якого не вистачало, і врешті 300 мс debounce, який спрацював. Вирок моєї доньки залишається в силі: ось чому тато так довго пише листи.
Щодо охоплення мов: локальний рушій Whisper підтримує 99 мов на багатомовних моделях, а збірки .en орієнтовані лише на англійську і трохи швидші для цього одного завдання. Рушій Parakeet працює в 5–10 разів швидше за Whisper на ЦП і охоплює англійську плюс 24 європейські мови (25 разом), але не підтримує азійські мови та переклад в англійську. Якщо для вас головне — офлайн, наш детальніший посібник з офлайн-розпізнавання мовлення докладно розглядає всі рушії.
Win+H проти Voice Access проти спеціалізованого додатку
Три способи перетворити мовлення в текст у Windows 11 — поруч. Таблиця охоплює лише те, що задокументовано для кожного інструменту. Жодних вигаданих показників точності чи швидкості.
| Інструмент | Тип | Офлайн | Ціноутворення | Мови | Найкраще для |
|---|---|---|---|---|---|
| Win+H голосовий набір | Вбудовано у Windows 11 | Ні (Azure онлайн) | Безкоштовно з Windows | ~40, фіксований список | Короткі онлайн-нотатки в будь-якому текстовому полі |
| Voice Access | Вбудовано у Windows 11 (22H2+) | Так (на пристрої) | Безкоштовно з Windows | Обмежений набір | Повне керування ПК без рук |
| Whisper (спеціалізований додаток) | Встановлюється на Windows + macOS | Так (локальний ЦП) | Безкоштовний локальний режим; платний хмарний модуль | 99 на багатомовних моделях Whisper | Офлайн-диктування в будь-якій програмі |
Якщо вам потрібна лише швидка відповідь у Teams, поки ви онлайн — Шлях 1 виграє простотою: він уже є на вашому ПК. Щойно в картину входять офлайн, охоплення будь-яких програм або відсутня мова — Шлях 2 заслуговує встановлення.
Локально або хмара: який режим Whisper підходить вашому ПК
Whisper працює у двох режимах, і вибір залежить від вашого заліза та того, чи потрібен вам доступ до мережі.
Локальний режим робить все на вашому комп'ютері. Виберіть модель Whisper під ваш ПК: Base — близько 140 МБ і запускається майже на будь-чому, Small — близько 480 МБ, Medium — близько 1,5 ГБ, а багатомовна Large v3 — близько 3 ГБ для найкращої точності, якщо вистачає оперативної пам'яті. Або оберіть Parakeet — близько 600 МБ — для найшвидшого локального варіанту, якщо ви переважно працюєте з англійською чи європейськими мовами. Після завантаження жодна з них не звертається до інтернету.
Хмарний режим — це запасний варіант. Він використовує ваш власний ключ OpenAI: розпізнавання через gpt-4o-mini-transcribe або gpt-4o-transcribe і веб-пошук, коли потрібна жива відповідь прямо в місці курсора. Ключ ваш — ми нічого не беремо.
Моя думка, за яку буду стояти: спочатку спробуйте локальний режим. Якщо вашому Windows-ПК не більше чотирьох років, хмара для повсякденного диктування вам не потрібна — а локальний режим тримає аудіо на вашому комп'ютері, де йому й місце. Хмара — запасний варіант на випадок, коли натрапите на стіну, а не стандарт. Whisper безкоштовний для всього локального ланцюжка після входу в систему — платіжна картка для початку не потрібна. Хмарний модуль — це платний рівень Pro. Деталі на сторінці цін. Для повного локального налаштування перегляньте посібник з голосового набору у Windows — там усе крок за кроком.
Коли спеціалізований додаток не потрібен
Краще, щоб ви залишились із Win+H, ніж встановили щось, чим не користуватиметесь. Пропустіть спеціалізований додаток і залишайтесь на вбудованому голосовому наборі, якщо виконуються всі ці умови:
- Ви диктуєте короткими фрагментами, а не довгими документами.
- Ви онлайн щоразу, коли диктуєте.
- Ви працюєте тільки з мовою, яку вже підтримує голосовий набір Microsoft.
- Ваше аудіо не несе ризиків і вам байдуже, чи воно залишає пристрій.
Win+H безкоштовний, уже встановлений і чудово справляється саме з цим завданням. Спеціалізований додаток виправдовує себе щойно ви перетинаєте хоча б одну з цих ліній — літак, чернетка контракту, мова, яку Microsoft пропустила, або будь-яка програма, що не є стандартним текстовим полем.
Прозоро про ціни
Локальний режим Whisper безкоштовний для всіх, хто увійшов в систему: розпізнавання Whisper і Parakeet, AI-покращення, історія, пресети, власні гарячі слова, апаратне прискорення, завантаження моделей і глобальне поєднання клавіш — усе це без картки. Whisper Pro додає хмарні функції: хмарне розпізнавання OpenAI, хмарне AI-покращення і голосовий веб-пошук. Вбудований голосовий набір Windows також безкоштовний, бо він частина Windows. Повний опис тарифів — на сторінці цін. Краще перечитайте точні цифри там, ніж покладайтесь на цифру в блозі, яка може застаріти.
Два шляхи — одне рішення. Якщо ви онлайн, нотатка коротка і ставки невисокі — натискайте Windows key + H і говоріть: це безкоштовно і вже є на вашому ПК. Щойно вам знадобиться це в літаку, у будь-якій програмі, на мові, яку Microsoft пропустила, або щоб аудіо залишалось на вашому пристрої — встановіть спеціалізований додаток. Я переступив цю межу десь на третій нотатці з наради, яку диктував однією рукою, поки пакував дітям сніданок, — і відтоді не набирав довгих листів.
Спробуйте офлайн на своєму ПК
Завантажте Whisper, утримайте Ctrl+Space, говоріть, відпустіть — слова вставляться в місце курсора в будь-якій програмі без інтернету.
Безкоштовний локальний режим для будь-якого авторизованого акаунту. Картка не потрібна. Якщо Win+H вже робить усе, що вам потрібно — залишайте це поєднання клавіш, воно хороше.



