Усунення проблем
Мікрофон працює, диктування — ні
Тест мікрофона показує рух рівнів, але голосовий набір не виводить жодного тексту. Майже завжди справа не в мікрофоні, а в шарі розпізнавання мовлення: вимкнений перемикач онлайн-розпізнавання, невідповідна мова або неправильне поле у фокусі. Нижче — виправлення для кожної ОС, без зайвого.
Останнє оновлення: червень 2026

Якщо мікрофон працює, а диктування — ні, проблема не в мікрофоні, а в шарі розпізнавання. На Windows увімкніть онлайн-розпізнавання мовлення та перевірте мову введення. На Mac перевірте мову диктування та дозвіл на мікрофон. Окремий офлайн-інструмент повністю обходить цю точку відмови.
Першого разу, коли це сталося зі мною, я витратив двадцять хвилин, звинувачуючи цілком справний мікрофон. Індикатор рівня стрибав, лампочка на гарнітурі горіла, тестовий запис відтворювався чудово — а диктування видавало лише курсор, що блимає, і нічого більше. Мікрофон ніколи не був проблемою. Проблема була в шарі між мікрофоном і текстом, і цей шар відмовляє тихо, без жодного повідомлення про помилку.
Це найпоширеніша плутанина з диктуванням: тест мікрофона лише підтверджує, що звук досягає операційної системи. Диктуванню потрібна ще одна річ — служба розпізнавання мовлення, яка увімкнена, налаштована на вашу мову та вказує на той самий мікрофон, а курсор стоїть у полі, що приймає текст. Якщо бодай один елемент не на місці — ви отримаєте саме те, що бачите: мікрофон працює, тексту немає.
Ось що більшість сторінок із порадами пропускає. Ваш мікрофон і ваше диктування — це дві окремі системи. Мікрофон захоплює звук. Розпізнавач мовлення перетворює цей звук на текст. Тест мікрофона перевіряє першу систему і нічого не говорить про другу.
Тож питання не в тому, «чи зламався мікрофон» — ви вже відповіли на нього. Питання в тому, «яка ланка ланцюга мовлення не працює». Відповідь зазвичай одна з п'яти: служба онлайн-розпізнавання вимкнена, мова диктування не збігається з тим, що ви говорите, поле не у фокусі, для служби розпізнавання вибрано не той мікрофон, або мовний пакет на пристрої ще не завантажений. Нижче — швидке виправлення, постійне рішення і покрокова інструкція для кожної ОС, якщо хочете залишити вбудований інструмент.
Чому мікрофон проходить тест, але тексту немає

Справний мікрофон і справне диктування — це не одне й те саме. Коли ви відкриваєте налаштування звуку і бачите, як рухається індикатор рівня входу, ви підтвердили лише одне: звук досягає операційної системи. Диктування знаходиться на рівень вище: воно бере цей звук і пропускає через службу розпізнавання мовлення. Якщо служба вимкнена, неправильно налаштована або слухає інший пристрій — індикатор все одно рухається, а тексту немає. Ця прогалина і є вся проблема.
У Windows 11 голосовий набір — панель із клавішею логотипу Windows + H — перетворює мовлення за допомогою онлайн-розпізнавання Microsoft, яке працює в хмарі й потребує підключення до інтернету. Власна сторінка підтримки Microsoft прямо вказує: голосовий набір вимагає справного мікрофона, текстового поля для курсора та підключення до інтернету. Якщо параметр конфіденційності «онлайн-розпізнавання мовлення» вимкнено або ви офлайн — панель відкривається, лампочка мікрофона загоряється, і нічого не відбувається. Це найпоширеніша версія ситуації «мікрофон працює, диктування — ні» на Windows.
На macOS режими відмови інші, але схожі за суттю. Диктування має бути ввімкнено в налаштуваннях клавіатури, встановлено на мову, якою ви говорите, та отримати дозвіл на мікрофон. На Apple Silicon багато мов працюють локально після одноразового завантаження — і якщо завантаження ще не завершилося, диктування просто сидить і нічого не робить. Посібник із усунення несправностей Apple також вказує на очевидні, але часті причини: вибрано не те джерело введення, мова не відповідає вашому мовленню, мікрофон заблокований. Жодна з них не виявляється в тесті індикатора рівня — саме тому індикатор вас і ввів в оману.
Швидке виправлення, яке допомагає більшості
Більшість випадків зводиться до двох-трьох перевірок для кожної операційної системи. Виконуйте їх по порядку і зупиніться, щойно з'явиться текст. Вони взяті зі сторінок підтримки Microsoft і Apple, а не з припущень — неправильна інструкція тут коштує вам цілого вечора.
На Windows зробіть ці три кроки. По-перше, увімкніть онлайн-розпізнавання мовлення: Параметри > Конфіденційність і безпека > Мовлення, увімкніть перемикач. По-друге, переконайтеся, що є підключення до інтернету — голосовий набір не транскрибує офлайн. По-третє, перевірте мову введення: натисніть клавішу логотипу Windows + Пробіл і виберіть мову, якою говорите. Потім поставте курсор у справжнє текстове поле, натисніть клавішу логотипу Windows + H і говоріть. Якщо все одно нічого не відбувається, переконайтеся, що в Параметри > Система > Звук > Введення вибрано правильний мікрофон, і що доступ до мікрофона відкрито в Параметри > Конфіденційність і безпека > Мікрофон.
На Mac зробіть ці три кроки. По-перше, переконайтеся, що Диктування ввімкнено: Системні налаштування > Клавіатура > Диктування, увімкніть. По-друге, встановіть мову диктування відповідно до тієї, якою говорите — в тій самій панелі Диктування відредагуйте список мов. По-третє, перевірте, що в Системних налаштуваннях > Звук > Введення вибрано правильний вхід, і що програма, яку ви використовуєте, має дозвіл на мікрофон. Клацніть у текстове поле, активуйте Диктування комбінацією клавіш і говоріть. Накладка нижче — від інструменту іншого типу, спеціального застосунку для диктування, який повністю оминає онлайн-службу — але ідея та сама: маленький індикатор підтверджує, що він справді слухає, і вам більше не доводиться гадати.
Постійне рішення: диктування без цих проблем
Якщо не хочете раз на кілька тижнів знову битися з перемикачем онлайн-розпізнавання — надійний вихід — це інструмент для диктування, що взагалі не залежить від служби мовлення операційної системи. Whisper запускає власний рушій локально, використовує ваш мікрофон напряму і вставляє текст у курсор. Немає хмарного з'єднання, що може завершитися з таймаутом, і немає перемикача конфіденційності, з яким треба боротися — тому справний мікрофон справді означає справне диктування. Потрібен Mac на Apple Silicon або ПК з Windows 10 або новішою, справний мікрофон і кілька хвилин. Локальний конвеєр безкоштовний для будь-якого авторизованого акаунта — без платіжних даних при реєстрації.
Крок 1 — Встановіть Whisper і увійдіть.
Завантажте зі сторінки завантаження, встановіть і створіть безкоштовний акаунт. Картка не потрібна. Локальний конвеєр транскрипції відкривається одразу.
Все вдалося, коли в треї з'явиться іконка застосунку і налаштування запропонують вибрати модель.
Крок 2 — Виберіть шлях транскрипції і дайте моделі завантажитися.
Застосунок не вибирає за вас. Доступно три варіанти: Cloud (OpenAI, свій ключ), Local Parakeet або Local Whisper. Для повністю офлайн-рішення починайте з локального — детальніше про вибір через два розділи.
Все вдалося, коли модель завершить завантаження і відобразиться як готова.
Крок 3 — Підтвердьте гарячу клавішу і мікрофон.
За замовчуванням на Windows — Ctrl+Space, на Mac — Command+Option утримується як кнопка розмови. Вкажіть той самий мікрофон, що пройшов тест. На Mac надайте дозвіл на Доступність, коли буде запит, інакше вставка в курсор не зможе дотягнутися до інших програм.
Все вдалося, коли тестовий запис вставляється в будь-яке текстове поле.
Крок 4 — Поставте курсор у будь-яке місце і говоріть.
Клацніть у будь-яке текстове поле, утримуйте гарячу клавішу, промовте речення, відпустіть. Транскрипт з'являється там, де стоїть курсор — жодної онлайн-служби в ланцюгу.
Все вдалося, коли ваше речення опиниться в полі у вигляді тексту.
Найповільніша частина — одноразове завантаження моделі, а не саме налаштування. Як тільки локальна модель встановлена, рушій мовлення живе на вашій машині — жодного перемикача в налаштуваннях конфіденційності, який може тихо вимкнути його, і жодного збою інтернету, що змушує його замовкнути. Саме тому цей клас помилок тут більше не повторюється.
Якщо хочете відремонтувати вбудований інструмент
Залишитися на диктуванні ОС — цілком нормальний вибір, і глибші виправлення варто знати. На Windows звичайний винуватець — вимкнене онлайн-розпізнавання мовлення після оновлення або зачистки конфіденційності: Параметри > Конфіденційність і безпека > Мовлення, увімкніть знову. Якщо ввімкнено, але все одно не працює, Microsoft рекомендує: перевірте пристрій введення в Параметри > Система > Звук > Введення, підтвердьте доступ до мікрофона в Параметри > Конфіденційність і безпека > Мікрофон, і перевірте мову через клавішу логотипу Windows + Пробіл. Оскільки Win+H маршрутизується через хмару, також переконайтеся, що є інтернет — інакше коректно налаштована система не видає жодного тексту в момент розриву з'єднання.
На Mac починайте з Системних налаштувань > Клавіатура > Диктування і переконайтеся, що воно ввімкнено. Дві «тихі» причини відмови — мова і завантаження. Якщо мова диктування не збігається з тією, якою ви говорите, ви отримаєте або нічого, або нісенітницю — відредагуйте список мов у тій самій панелі. На Apple Silicon багато мов обробляються локально лише після завершення завантаження мовної моделі, тому при першому запуску дайте їй час і з'єднання. Потім перевірте введення в Системних налаштуваннях > Звук > Введення і переконайтеся, що програма, в яку ви диктуєте, має дозвіл на мікрофон. Список Apple також включає прозаїчні, але реальні причини: заблокований мікрофон, неправильне джерело введення, надто багато фонового шуму.
Дві міжплатформні пастки підловлюють людей незалежно від ОС. Перша — фокус: диктування вводить текст у поле з курсором, тому якщо сповіщення перехопило фокус або ви у елементі, що не приймає текст, словам нікуди потрапляти. Клацніть прямо в текстове поле і спробуйте знову. Друга — не той мікрофон: якщо служба мовлення прив'язана до вбудованого мікрофона ноутбука, а ви говорите в USB-гарнітуру (або навпаки), індикатор, який ви тестували, може рухатися, поки розпізнавач чує тишу. Зробіть пристрій, у який говорите, вибраним входом — а не просто тим, що пройшов тест.
Локально чи в хмарі: який режим вибрати
Якщо переходите на спеціальний інструмент, питання в тому, який рушій обробляє ваше диктування. Застосунок змушує вас вибирати, а не вгадує за вас — і правильний вибір залежить від мови та від того, наскільки важливо залишатися офлайн. Для тих, хто зіткнувся з ситуацією «мікрофон працює, диктування — ні», локальний режим — це правильна відповідь, бо вся ваша проблема прийшла з онлайн-служби мовлення, а локальний режим прибирає цю службу з рівняння.
Ось чим відрізняються три шляхи:
- Local Parakeet — Рушій NVIDIA TDT, близько 600 МБ — найшвидший локальний варіант: у 5–10 разів швидший за Whisper на CPU. Охоплює англійську та ще 24 європейські мови, 25 загалом. Без перекладу на англійську. Якщо ви диктуєте англійською або іншою європейською мовою — це швидкий, повністю офлайн-вибір.
- Local Whisper — Повільніший за Parakeet на тій самій машині, але багатомовні збірки охоплюють 99 мов і можуть перекладати на англійську. Збірки тільки для англійської — лише для англійської, а не для 99. Вибирайте для китайської, японської, корейської або будь-якої перекладацької роботи, яку Parakeet не може виконати. Стандартна модель для англійської займає близько 480 МБ.
- Cloud (OpenAI, BYOK) — Найвища точність і доступ до мережі — з вашим власним ключем OpenAI, що оплачується напряму OpenAI. Транскрипція за замовчуванням працює на gpt-4o-mini-transcribe. Потребує інтернету, тому це єдиний шлях, що виходить за межі вашої машини — та сама залежність, що й спричинила вашу проблему. Cloud-режим є частиною Whisper Pro.
Нудна правда: для повсякденного диктування локального режиму цілком достатньо, і саме він структурно уникає того, що ви щойно налагоджували. Обидва локальних рушії працюють повністю на вашій машині, нічого не надсилаючи на сервер. Cloud виправдовує себе, коли потрібна максимальна точність для складного запису або коли модель має в середині речення підтягнути факт з мережі. Якщо ви читаєте це, бо «онлайн-штука перестала працювати», — локальний режим і є відповіддю, яка не має онлайн-штуки, котра може зупинитися.
Чистіший текст після того, як диктування запрацювало
Коли слова нарешті з'являються, наступна незручність — сирий диктований текст виходить суцільним потоком. Ви кажете «ну от відповідай на шкільний лист підтвердь четвер і нагадай мені надіслати форму», і саме цей безпунктуаційний монолит видає будь-який рушій мовлення. Тут і починаються відмінності між інструментами.
Windows Voice Typing додає пунктуацію під час мовлення, а macOS Dictation обробляє базову пунктуацію, коли ви говорите «кома» або «крапка». Для серйознішого очищення — прибрати «ем», виправити речення-потоки, перетворити усний абзац на щось, що можна справді надіслати — Whisper може запустити AI-обробку. Скажіть фразу активації «Hey whisper», і текст буде покращено до того, як він з'явиться. На локальній моделі це відбувається через Ollama; у хмарному режимі за замовчуванням — gpt-5-mini.
okay so reply to the school email confirm thursday and remind me to send the form um before friday
Okay, so reply to the school email, confirm Thursday, and remind me to send the form before Friday.
Прохід очищення — це також момент виправити дрібні помилки, які робить кожен розпізнавач: ім'я, написане фонетично, число, почуте як слово. Локальна модель обробляє це на вашій машині; хмара справляється краще зі складнішим аудіо. Але сенс однаковий: промовляєте слова, прохід їх упорядковує — і ви більше не передруковуєте те, що вже сказали.
Цей цикл «сказав — очистив» окупається скрізь, а не лише в одному застосунку — ви зможете набирати текст голосом у будь-якій програмі швидше, щойно шлях від мікрофона до тексту стабілізується: довге повідомлення перетворюється на кілька вимовлених речень замість абзацу, що пишеться по одній літері.
Коли вбудованого інструменту достатньо

Іноді це була разова ситуація, і вдавати, що вам потрібен новий застосунок, було б нечесно. Якщо повернення перемикача онлайн-розпізнавання або підбір правильної мови диктування виправили проблему — і вбудований інструмент тепер робить те, що потрібно — ви вже все зробили. Нічого не встановлюйте. Безкоштовне диктування, вже наявне на вашій машині, цілком годиться для коротких фраз.
На Windows: якщо голосовий набір знову працює після увімкнення онлайн-розпізнавання мовлення, і ви зазвичай онлайн — клавіша логотипу Windows + H є, безкоштовна. На Mac: якщо Диктування повернулося після налаштування мови та дозволів, Системні налаштування > Клавіатура > Диктування — це все, що потрібно; на Apple Silicon воно може працювати локально після завантаження мови. Для швидкої відповіді чи двох рядків — це правильний інструмент, і він нічого не коштує.
Переходьте на спеціальний офлайн-інструмент, коли вбудований постійно «відкочується»: перемикач, що не хоче залишатися увімкненим, диктування, яке відмирає щоразу при нестабільному з'єднанні, тривала робота, де онлайн-обмеження або затримка хмари заважають, або коли потрібна одна гаряча клавіша, що однаково поводиться скрізь. Якщо нижче цієї планки — користуйтеся безкоштовним. Я не збираюся радити встановлювати застосунок, щоб виправити налаштування, яке можна перемкнути за десять секунд.
Якщо проблема специфічна для Windows і ви хочете повний покроковий розбір для кожної версії, детальний посібник про голос у текст не працює на Windows охоплює поломки після оновлень і сучасні альтернативи докладніше.
Мікрофон весь цей час був невинний. Зазвичай так і є. Диктування — це дві системи в одному плащі: мікрофон, що захоплює звук, і розпізнавач, що перетворює його на текст. А індикатор рівня ручається лише за першу. Перемкніть правильний перемикач, підберіть мову, клацніть у правильне поле — і слова з'являться. Більшу частину цього тексту я написав інструментом, що повністю оминає рукостискання з розпізнавачем — саме так гарантуєш, що плащ не розлетиться просто посеред речення.
Диктування, що просто слухає
Вкажіть на мікрофон, який вже пройшов тест, утримуйте гарячу клавішу і говоріть. Текст з'являється в курсорі — без онлайн-служби мовлення в ланцюгу, яку можна неправильно налаштувати.
Безкоштовний локальний режим для будь-якого авторизованого акаунта. Картка не потрібна для початку.



