Автор: Денис Медведєв

Інструкція

Як користуватися голосовим введенням у Windows

У Windows є вбудоване голосове введення. Натисніть Windows + H у будь-якому текстовому полі, зачекайте на «Слухаю», і говоріть. Потрібен інтернет і робочий мікрофон. Для інтенсивної роботи, офлайн-режиму або роботи в кількох програмах спеціальний інструмент з одним хоткеєм справляється з усім скрізь.

Останнє оновлення: червень 2026

Ноутбук і клавіатура на робочому столі — готові до безрукого введення голосом

Щоб скористатися голосовим введенням у Windows, поставте курсор у будь-яке текстове поле і натисніть Windows + H. Відкриється панель голосового введення з написом «Слухаю», і вона передруковуватиме те, що ви кажете. Потрібен робочий мікрофон, підключення до інтернету і ввімкнене онлайн-розпізнавання мовлення в Параметрах, у розділі Конфіденційність і безпека → Мовлення.

Більшість людей так і не дізнаються, що Windows вміє друкувати за них. Ця функція є в Windows 10 і 11, не потребує налаштування і захована за комбінацією клавіш, про яку ніхто не говорить: Windows + H. Клацніть у текстове поле, утримайте клавішу Windows, натисніть H — і вгорі екрана відкриється невелика панель, яка почне слухати.

І от, власне, і все — для коротких вставок цього цілком достатньо. Але є одна деталь, яку Microsoft сама не приховує, а більшість статей у блогах обходить стороною: голосове введення Windows передає ваше мовлення через хмару Microsoft, тобто без інтернету воно не зробить нічого. Саме це і вирішує, чи вистачає вам вбудованої функції, чи варто шукати щось інше. Спочатку чесно розберемося з вбудованою, а тоді поговоримо про її межі.

Ось що ховають усі ці статті-списки з порадами. Голосове введення Windows — справжня, безплатна, вбудована функція, і вона працює в будь-якому текстовому полі з курсором: у браузері, Word, повідомленні Slack, рядку пошуку. Нічого встановлювати не потрібно. Комбінація клавіш — Windows + H, і як тільки ви дізнаєтеся про неї, будете користуватися нею весь час.

Тому чесна відповідь складається з двох частин. Перша: як увімкнути вбудовану функцію і використовувати її ефективно — саме це потрібно більшості тих, хто шукає відповідь. Друга: де Win+H упирається в стіну — без інтернету, на тривалих диктовках, із словами, які він постійно розпізнає неправильно — і що з цим може зробити спеціальний інструмент. Розберемо обидві частини, за дві хвилини налаштуємо альтернативу і чесно скажемо, коли Win+H уже достатній.

Що таке голосове введення Windows насправді

Людина говорить біля відкритого ноутбука — ілюстрація до мовлення замість набору тексту

Голосове введення Windows — це вбудована функція, яка дозволяє вводити текст голосом замість клавіатури. Вона входить до складу Windows 10 і Windows 11, нічого не коштує і працює в будь-якому текстовому полі з курсором. Опис від самого Microsoft варто процитувати, бо він одразу окреслює межі: голосове введення «використовує онлайн-розпізнавання мовлення на основі Azure Speech services». З цього одного речення випливають три висновки.

По-перше, потрібен інтернет. Ваше мовлення передається на сервери Microsoft, де перетворюється на текст, — тому без підключення голосове введення не зробить нічого. По-друге, потрібен робочий мікрофон — вбудований у ноутбук підійде для початку. По-третє, оскільки розпізнавання відбувається в хмарі, точність загалом хороша, і процесор майже не навантажується. Ось і весь баланс: безплатно і точно, але тільки онлайн і без конфіденційності.

Люди часто плутають це зі старим Windows Speech Recognition, з новішим Voice Access або з диктуванням усередині однієї програми. Для повсякденного «хочу говорити і бачити слова там, де пишу» — потрібна саме ця функція, яка відкривається через Windows + H. Наступний розділ — конкретна інструкція.

Вмикаємо через Windows + H

Жодних програм запускати і жодних майстрів налаштування проходити не потрібно. Ставите курсор туди, де хочете бачити текст, і викликаєте голосове введення комбінацією клавіш. Ось вся послідовність — і єдиний можливий відступ у налаштування.

Клацніть у будь-яке текстове поле — документ, лист, чат, адресний рядок — щоб там блимав курсор. Натисніть Windows + H. Вгорі екрана з'явиться невелика панель голосового введення. Зачекайте, доки вона не скаже «Слухаю», і тільки тоді починайте говорити — якщо почнете раніше, вона обріже початок. Говоріть звично, текст з'явиться там, де курсор. Щоб зупинити, натисніть кнопку мікрофона на панелі або ще раз ту саму комбінацію.

Якщо нічого не відбувається, зазвичай причин дві. Мікрофон не налаштований або не має дозволу — голосове введення потребує робочого мікрофона. Або вимкнено онлайн-розпізнавання мовлення — тобто хмарна частина функції заблокована. Увімкніть її через Пуск → Параметри → Конфіденційність і безпека → Мовлення і переведіть онлайн-розпізнавання мовлення в положення «Увімкнено». Якщо панель відкривається, але так і не показує «Слухаю», майже завжди справа в інтернет-з'єднанні — розпізнавання відбувається на серверах Microsoft, а не на вашому комп'ютері. (Якщо Win+H поводиться вперто і не хоче починати, я написав окрему статтю про те, чому Win+H перестає працювати і як це виправити.)

Кращий варіант для інтенсивної роботи: один хоткей скрізь

Вбудована функція чудова, доки ви не наткнетеся на одну з її стін: немає інтернету в поїзді, довгий блок диктування або слово, яке вона постійно розпізнає неправильно. Рішення — системний інструмент, який робить те саме, але працює на вашому комп'ютері, зберігає кінець фрази щоб не обрізати останнє слово, і використовує один хоткей у будь-якій програмі. Потрібен ПК з Windows 10 або новішою, робочий мікрофон і обліковий запис. Весь локальний пайплайн безплатний для будь-якого авторизованого користувача — карту при реєстрації не питають. Ось послідовність дій.

Крок 1 — Встановіть Whisper і увійдіть у систему.

Завантажте зі сторінки завантаження, встановіть і створіть безплатний обліковий запис. Без картки. Локальний пайплайн транскрипції відразу готовий до роботи.

Ви зрозумієте, що все вийшло, коли в треї з'явиться іконка програми, а майстер налаштування запропонує вибрати модель.

Крок 2 — Оберіть спосіб транскрипції.

Програма не обирає за вас. Доступні три варіанти: Cloud (OpenAI, свій ключ), Local Parakeet або Local Whisper. Щоб замінити онлайн-режим Win+H чимось офлайновим, оберіть локальний рушій — детальніше про це за два розділи.

Ви зрозумієте, що все вийшло, коли модель завантажиться і відображатиметься як готова.

Крок 3 — Перевірте хоткей.

У Windows за замовчуванням це Ctrl+Space, утримуйте для активації. Змініть у Параметрах, якщо він конфліктує з чимось, що ви вже використовуєте. На відміну від Win+H, утримання клавіші продовжує запис стільки, скільки ви тримаєте.

Ви зрозумієте, що все вийшло, коли тестовий запис вставиться в будь-яке текстове поле.

Крок 4 — Поставте курсор будь-де і говоріть.

Клацніть у документ, лист або чат, утримайте хоткей, скажіть речення, відпустіть. Транскрипція вставиться туди, де курсор, у будь-якій активній програмі.

Ви зрозумієте, що все вийшло, коли вимовлене речення опиниться в текстовому полі як текст.

Whisper
Справжній десктопний застосунок Whisper на екрані налаштувань із відкритими панелями Транскрипція та AI.

Найповільніше тут — одноразове завантаження моделі, а не саме налаштування. Після цього написання тексту в будь-якій програмі перестає бути задачею для пальців і стає задачею для голосу — і продовжує працювати, навіть коли Wi-Fi пропадає.

Якщо ви вже користувалися розпізнаванням мовлення в Windows 11 — це та сама ідея, але хоткей не зупиняється сам по собі.

Пунктуація: команди чи автоматична

Живе мовлення не містить ком. Кожен інструмент диктування вирішує це одним із двох способів, і голосове введення Windows насправді підтримує обидва. Є автоматична пунктуація — коми і крапки ставляться самі, залежно від того, як ви говорите, і перемикається вона через шестерню на панелі голосового введення. І є голосові команди: скажіть «крапка» або «крапку», «кома», «новий рядок», «відкрити лапки» і «закрити лапки» — і знак вставляється замість слова.

Меню шестерні на цій панелі варто відкрити хоч раз. Крім автоматичної пунктуації, там є фільтр нецензурної лексики і вибір мікрофона за замовчуванням. Нічого захованого — один клік від панелі, яка відкривається через Win+H. Поки ви говорите, невеликий індикатор показує, що функція слухає, — та сама ідея, яку використовує кожен хороший інструмент диктування, щоб ви ніколи не гадали, чи вас чують:

Cancel
Індикатор запису: маленька капсула, що з'являється під час мовлення, — щоб ви знали, що інструмент слухає.

Обмеження командної пунктуації в тому, що вам доводиться проговорювати форматування вголос: «кома», «новий рядок», «крапка» — для короткого тексту терпимо, але на довгому абзаці стомлює. Автоматична пунктуація допомагає, але все одно видає буквальну транскрипцію того, що ви сказали, разом із «ем», «ну» та незакінченими реченнями. Очистити це до чогось придатного для відправки — окремий крок, і саме тут спеціалізований інструмент виходить уперед. Більше про це нижче.

Локально чи хмара: вибір, якого Win+H не дає

Голосове введення Windows зробило вибір за вас: тільки хмара, і без варіантів. Ваше мовлення щоразу йде на сервери Microsoft. Для списку покупок це нормально, але для нотатки в таблиці з зарплатами або листа клієнту, який ви б не хотіли транскрибувати десь на стороні, — вже проблема. Спеціалізований інструмент дає вибір, якого вбудований пропускає. Ось чим відрізняються три шляхи — програма змушує вас обрати, тому краще обирати свідомо:

  • Local ParakeetРушій TDT від NVIDIA, близько 600 МБ — найшвидший локальний варіант: у 5–10 разів швидший за Whisper на CPU. Підтримує англійську і ще 24 європейські мови, 25 загалом. Без перекладу на англійську. Якщо ви диктуєте англійською або іншою європейською мовою і хочете швидкості без виходу даних із комп'ютера — це найпростіший вибір.
  • Local WhisperПовільніший за Parakeet на тому самому залізі, зате багатомовні збірки охоплюють 99 мов і можуть перекладати на англійську. Збірки тільки для англійської — саме для неї, а не для 99. Обирайте цей варіант для китайської, японської, корейської або будь-якої роботи з перекладом, з якою Parakeet не впорається. Стандартна англійська модель — близько 480 МБ.
  • Cloud (OpenAI, BYOK)Найвища точність і доступ до мережі — на вашому ключі OpenAI, який оплачується напряму OpenAI. Транскрипція за замовчуванням працює через gpt-4o-mini-transcribe. Потребує інтернету, як і Win+H, але ключ ваш і рішення ваше. Хмарний режим є частиною Whisper Pro.

Суха правда полягає в тому, що для більшості повсякденного письма локального рушія цілком достатньо — і це саме те, чого Win+H не може запропонувати. Обидва локальні варіанти працюють повністю на вашому комп'ютері, без відправки нічого на сервер. Хмара виправдовує себе, коли потрібна максимальна точність для складного запису або модель має знайти факт у мережі посеред речення. Починайте з локального, а до хмари тягніться лише тоді, коли локального не вистачає.

Чистіший текст без проговорювання кожної коми

І Win+H, і спеціалізований інструмент дають одну й ту саму стартову точку: суцільний потік слів. Ви кажете «ну тобто пересуньте дедлайн на п'ятницю скажіть клієнту і забронюйте кімнату на двох», — і це і є той непунктуйований монолог, який видає будь-який мовний рушій. Win+H вміє пунктуювати в процесі або приймати голосові команди. Але жоден із варіантів не прибирає «ну», «тобто» і речення, розпочаті з середини.

Ось де AI-обробка доводить свою цінність. Скажіть фразу-активатор «Hey whisper» — і транскрибований текст покращується ще до того, як потрапляє на місце: слова-паразити видаляються, перераховані думки розбиваються на речення, великі літери ставляться де треба. На локальній моделі це відбувається через Ollama на вашому комп'ютері; у хмарному режимі за замовчуванням — gpt-5-mini. Ви вимовляєте «брудний» варіант один раз і отримуєте той, який не соромно надіслати.

Thinking...
Вихідно

okay so move the deadline to friday tell the client and book the room for two um before lunch

Після обробки

Okay, so move the deadline to Friday, tell the client, and book the room for two before lunch.

Є ще слова, які типовий рушій постійно перекручує: назва продукту, прізвище колеги, галузевий жаргон. Win+H не дає жодного способу навчити його цього. Спеціалізований інструмент дозволяє задати власний словник, щоб слова, які ви вживаєте щодня, нарешті розпізнавалися правильно. Він не вигадуватиме форматування, про яке ви не просили, і той, хто обіцяє «скажіть «заголовок» — і він сам застилізується», продає демо, а не реальний інструмент для вівторка. Наговоріть текст швидко і чисто голосом; розташуйте на сторінці клавішами, які ви вже знаєте.

Саме цей потік «говоримо — очищаємо» і є головною причиною, чому люди переходять: можна набирати текст голосом у будь-якій програмі замість того, щоб проговорювати коми у вбудовану панель, яка працює тільки онлайн.

Коли Win+H вже достатній

Ноутбук відкритий на кухонній стільниці — натяк на швидку побутову нотатку

Іноді безплатне рішення, вже наявне на комп'ютері, і є правильною відповіддю — і вдавати, що це не так, було б нечесно. Голосове введення Windows справді добре підходить для великої частини того, що люди хочуть від нього, і встановлювати щось додаткове — зайве.

Залишайтеся з Win+H, якщо ви здебільшого онлайн, диктуєте короткими фразами і не проти того, що мовлення проходить через хмару Microsoft. Дворядкова відповідь у Slack, пошуковий запит, швидка нотатка в документі — натисніть Windows + H, зачекайте на «Слухаю», говоріть, готово. Безплатно, вбудовано, пунктуація сама. Для однорядкового нагадування я не буду говорити вам встановлювати окремий застосунок.

Тягніться до спеціалізованого системного інструменту, коли вбудований починає заважати: немає інтернету в літаку або поїзді, тривалі диктування, де утримання клавіші зручніше за панель із таймаутом, конфіденційність тексту, який не повинен покидати ваш комп'ютер, слова, які постійно розпізнаються неправильно, або потреба в одному хоткеї, який поводиться однаково в кожній програмі. Нижче цієї межі Win+H виграє за ціною і нульовим налаштуванням. Вище — різниця відчутна.

Якщо ви ще визначаєтесь, по який бік цієї межі знаходитеся, детальне порівняння в посібнику з альтернатив Win+H розкладає по поличках, де кожен варіант підходить, — без маркетингового лиску.

Windows додав голосове введення роки тому і сховав його за комбінацією клавіш, про яку ніхто не говорить вголос. Тепер ви знаєте: Windows + H, зачекайте «Слухаю», говоріть. Для більшості швидких задач — це вся відповідь, і вона безплатна. У той день, коли ви будете офлайн, або диктуватимете щось довше за SMS, або слово знову прийде неправильним — ви точно знатимете, на яку стіну наткнулися, і який інструмент допоможе її подолати. Чималу частину цього тексту я продиктував голосом, у застосунку, якому байдуже, в якому текстовому полі знаходиться курсор. Інтернет зникав двічі, поки я це робив. Диктування цього не помітило.

Спробуйте голосове введення, яке працює і офлайн

Утримайте один хоткей, говоріть, відпустіть. Транскрипція потрапляє в будь-яке текстове поле, де стоїть курсор, — у поїзді, в літаку або коли Wi-Fi не працює.

Локальний режим безплатний для будь-якого авторизованого облікового запису. Картка для початку не потрібна.

Фото Дениса Медведєва

Denys Medvediev

Я той, хто читає нашу листування з підтримки — швидше за все, диктуючи відповіді.

Додаткові матеріали