Автор: Денис Медведєв

Порівняння

Найкраще перетворення голосу в текст для Windows, за рейтингом

Найкращий застосунок для перетворення голосу в текст у Windows залежить від того, де ви друкуєте. Win+H безкоштовний і вбудований, але потребує інтернету і працює лише в текстовому полі. Whisper працює офлайн, у будь-якому застосунку і вставляє текст там, де стоїть курсор.

Останнє оновлення: червень 2026

Сріблястий ноутбук, відкритий на чистому офісному столі біля світлого вікна, типове робоче місце для диктування у Windows

Найкращий застосунок для перетворення голосу в текст у Windows залежить від того, де ви друкуєте. Голосове введення Windows (Win+H) безкоштовне і вбудоване, але потребує інтернету і працює лише в текстовому полі. Whisper by Remskill працює офлайн, у будь-якому застосунку і вставляє текст там, де стоїть курсор. Це сильніший вибір для справжнього письма.

Минулих вихідних моя молодша донька продиктувала бабусі в Україну лист на 90 слів приблизно за 90 секунд. Без клавіатури. Їй сім років. Двадцять п'ять років тому та сама машина в тій самій родині диктувала один абзац святкового листа п'ятнадцять хвилин, та й то погано. Перетворення голосу в текст у Windows тихцем перестало бути науковим експериментом. Чесна відповідь така: хороших варіантів у вас більше, ніж здається, а одне-два гучні імена можна сміливо пропустити.

Більшість списків «найкраще перетворення голосу в текст для Windows» ранжують дванадцять інструментів і радять той, хто заплатив за посилання. Це не той випадок. Windows у 2026 році постачається з безкоштовною функцією диктування, яку більшість людей так і не знаходить, а платний ринок розділився на інструменти, що записують зустрічі, та інструменти, що допомагають писати. Цей гайд ранжує застосунки для перетворення голосу в текст, які варто встановити на Windows 10 або новіший, за чотирма речами, що мають значення: точність, офлайн-підтримка, де воно працює і ціна. А далі простими словами пояснює, коли безкоштовного вбудованого варіанта цілком достатньо. До кінця читання ви знатимете, який варіант встановити сьогодні, а яке гучне ім'я залишити на полиці. Я особисто читаю листи підтримки застосунку, який створюю, тож більшість того, що я знаю про те, де ці інструменти ламаються, я дізнався від людей, які написали мені, що в них щось зламалося.

Кілька слів про те, як читати все наступне. Я створюю один з інструментів у цьому списку, тож не вдаю з себе неупередженого судді, але я назву випадки, коли безкоштовний варіант чи конкурент — правильний вибір, бо це єдиний чесний спосіб написати такий текст. Рейтинг побудований за сценаріями використання, а не за єдиним переможцем, бо єдиного переможця тут немає. Людина, яка пише три повідомлення в Slack на день, і людина, яка диктує звіт на 3000 слів, хочуть різних інструментів, а список, який вдає інакше, щось вам продає.

Коротка відповідь: Win+H безкоштовний, але ось де він зупиняється

Windows · Win + H

Listening…
Голосове введення Windows (Win+H), відтворене — невелика плаваюча панель угорі екрана. Безкоштовне і вбудоване, але потребує інтернету і працює лише всередині текстового поля.

Натисніть клавішу з логотипом Windows і H у будь-якому текстовому полі — і вгорі екрана з'явиться маленька панель інструментів. Починайте говорити. Це Голосове введення Windows, воно безкоштовне і вбудоване у Windows 11. Для швидкого повідомлення у вікні чату важко перемогти те, що безкоштовне і вже встановлене.

Дві речі його зупиняють. По-перше, йому потрібен інтернет. Голосове введення використовує онлайн-розпізнавання мовлення на базі служб Azure Speech від Microsoft, тож без з'єднання немає й диктування. По-друге, щоб воно взагалі працювало, ваш курсор має стояти в текстовому полі. Це виключає чимало місць, де хочеться говорити: перейменування файлу, клітинка таблиці, що пручається, застосунок для робочого столу, який Windows не вважає «текстовим полем».

Третя, менша річ проявляється лише за кілька тижнів. Win+H — це функція, а не робочий процес. Вона не зберігає історію того, що ви продиктували, не дає місця, де виправити слово, яке завжди виходить неправильно, і не пропонує способу підлаштувати пунктуацію під вашу манеру говорити. Ви отримуєте мікрофон і транскрипцію — і це вся угода. Для однорядкової відповіді це саме те, що треба. Але вже на четвертому ранковому листі починаєш хотіти більшого.

Тож справжнє питання не в тому, «чи є безкоштовний варіант». Він є, і спробувати його варто першим. Питання в тому, до чого тягнутися, коли безкоштовного забракне: у потягу без сигналу, у застосунку, куди Win+H відмовляється заходити, або коли та сама робота приходить уже всорокове і хочеться, щоб вона запам'яталася.

Як я обирав: точність, офлайн, працює всюди, ціна

Стіл з ноутбуком, блокнотами і чеклистами, що ілюструє критерії ранжування застосунків для диктування

Я ранжував їх за чотирма речами, саме в такому порядку, бо саме в такому порядку вони вас кусають.

Точність. Усе решта — шум, якщо транскрипція неправильна. Заковика в тому, що ніхто не публікує чесного прямого порівняння. Nuance рекламує до 99% точності розпізнавання для Dragon з першого використання. У локальному режимі наш власний опублікований діапазон для Whisper становить від 95% до 99%, причому більші моделі дають вищі показники. Обидві цифри — самозвітні, тож сприймайте їх як заяви, а не як таблицю лідерів. Жодне першоджерело взагалі не публікує перевірюваного прямого відсотка точності для Win+H, Голосового введення Google Docs чи Otter, тож будь-який список, який видає вам таку цифру для кожного інструмента, її просто вигадує. Нудна правда в тому, що USB-мікрофон за $20 покращить вашу точність більше, ніж будь-яка заміна моделі. Якщо хочете витратити гроші на кращу транскрипцію, спершу витратьте їх на мікрофон, а на програму — потім.

Офлайн. Чи працює воно з вимкненим Wi-Fi. Win+H не може. Голосове введення Google Docs не може. Інструмент, що працює на вашій власній машині, може, і це важливо для таблиці із зарплатами, юридичного проєкту чи листа до школи вашої дитини, яким зовсім нема чого лежати в логах вендора. Це важливо й у звичайному, буденному сенсі: потяги, літаки, підвали, заднє сидіння автівки. Хмарне диктування надійне рівно настільки, наскільки надійна найгірша смужка сигналу, яку ви сьогодні впіймаєте.

Працює всюди. Чи друкує воно в кожному застосунку, чи лише в одному. Саме ця межа розділяє все поле. Системна гаряча клавіша вставляє текст там, де стоїть ваш курсор; функція браузера працює лише на тій вкладці браузера. Тест, яким я користуюся, навмисно буденний. Чи може воно перейменувати файл, заповнити поле пошуку в застосунку для робочого столу або написати повідомлення коміту. Більшість «безкоштовних» варіантів провалюють цей тест тієї ж миті, коли ви виходите за межі браузера, а виходитимете ви з нього частіше, ніж думаєте.

Ціна. Конкретні цифри, без «від». Безкоштовно там, де безкоштовно по-справжньому. Я не розбавлятиму рейтинг інструментом, що коштує дорожче за ліцензію Windows, аби справити враження ґрунтовності, і я скажу вам, коли безкоштовного вбудованого варіанта цілком достатньо, — а для багатьох людей його достатньо.

Застосунки для перетворення голосу в текст у Windows, які варті вашого часу

Whisper
Справжній застосунок Whisper, запущений наживо — відкрийте Налаштування й оберіть рушій транскрипції. У локальному режимі ніщо з цього не залишає вашу машину.

Whisper by Remskill — найкращий для письма в будь-якому застосунку

Чесно зізнаюся: я створюю саме його, тож зважте на це. Що він робить такого, чого не робить вбудований варіант: він використовує системну глобальну гарячу клавішу, яка працює в будь-якому застосунку, де можна друкувати, і вставляє ваш транскрибований текст там, де стоїть курсор. Стандартна гаряча клавіша Windows — Ctrl+Space: затисніть її, говоріть, відпустіть, і текст з'явиться.

Він працює офлайн. Уся локальна транскрипція написана чистою Rust і залишається на вашому пристрої; після завантаження моделі ніщо не залишає машину. Ви самі обираєте, як воно працює. Немає єдиної «рекомендованої» моделі, яку застосунок вам нав'язує, бо правильний вибір залежить від вашої машини й ваших мов.

Локальний Whisper постачається з вісьмома моделями: чотири лише англійські, від Base приблизно на 140 МБ до Medium приблизно на 1.5 ГБ, і чотири багатомовні, що сягають Large v3 приблизно на 3 ГБ. Багатомовні охоплюють 99 мов; англомовні збірки .en роблять англійську і лише англійську. Менші моделі завантажуються швидко й працюють на скромному залізі; більші потребують більше RAM і винагороджують вас чистішими транскрипціями. Другий рушій, Parakeet від NVIDIA приблизно на 600 МБ, працює у 5–10 разів швидше за Whisper на CPU й обробляє англійську плюс 24 європейські мови, без азійських мов і без перекладу англійською. Якщо ви здебільшого говорите англійською й хочете швидкості, Parakeet — це швидкісна смуга. Якщо вам потрібні 99 мов, переклад чи тонший контроль, вантажте Whisper.

Якщо ви хочете найновішу якість OpenAI і відповіді з вебу в одному інструменті, Хмарний режим використовує ваш власний ключ OpenAI, тож ви платите OpenAI напряму, а ми не беремо жодної комісії. Ви навіть можете попросити його щось знайти вголос. Скажіть фразу активації «Hey whisper», і він виконає пошук у вебі та вставить відповідь (я назвав фразу активації на честь продукту, що, як зауважила моя дружина, цікавим вважає лише людина, яка створює програми). Усе це легке: сам застосунок займає приблизно 25 МБ, окрема відеокарта не потрібна, бо локальна транскрипція працює на CPU. Він встановлюється на Windows 10 або новіший. Ми детально проходимо першу настройку в нашому гайді голос у текст на Windows.

Найкраще для: усіх, хто пише голосом у більш ніж одному застосунку й хоче, щоб це працювало під час перельоту.

Голосове введення Windows (Win+H) — найкраще безкоштовне, вбудоване

Уже на вашому ПК, без встановлення, без облікового запису. Натисніть Win+H, говоріть у текстове поле. Компроміс — вимога інтернету й обмеження лише текстовим полем. Для коротких повідомлень, коли ви все одно онлайн, це правильний перший вибір саме тому, що нічого не коштує. Microsoft додала автоматичну пунктуацію до Win+H, і вона прямо там, у кожній свіжій інсталяції Windows 11. Більшість людей, які «не мають перетворення голосу в текст», насправді вже мають його й ніколи не натискали цю комбінацію клавіш. Почніть звідси. Якщо це покриває ваш день, ви закінчили й не витратили нічого.

Найкраще для: швидкого диктування в браузері чи вікні чату, онлайн, без налаштувань.

Dragon Professional — найкращий для спеціалізованої лексики

Старий король диктування у Windows. Nuance досі рекламує до 99% точності з першого використання, оптимізовано для Windows 11 і зі зворотною сумісністю з Windows 10. Якщо ви цілий день диктуєте щільні медичні чи юридичні терміни, глибина власного словника Dragon — це причина його існування, за якою десятиліття роботи над обробкою жаргону, що збиває з пантелику універсальні моделі. Одне чесне застереження: на момент написання магазин Nuance перебував посеред міграції, і я не зміг підтвердити поточну ціну з першоджерела, як і те, чи поточна версія — це разова покупка, чи підписка. Історично Dragon був разовою ліцензією, але я не друкуватиму цифру, за яку не можу поручитися, тож перевірте перед покупкою. Інше застереження — те, щодо якого я маю думку, і я повернуся до нього нижче: епоха тренування вашого диктувального ПЗ скінчилася для майже всіх, окрім цього вузького професійного випадку.

Найкраще для: професіоналів із важким галузевим жаргоном і бюджетом.

Wispr Flow — найкращий відшліфований хмарний варіант

Прямий конкурент, і до того ж елегантний. Wispr Flow рекламує 100+ мов з автоматичним визначенням і працює нативно на Windows, Mac, iOS та Android. Автовизначення — головна фішка. Кажуть, що воно переходить між вашими мовами посеред речення так само, як це робите ви. Я не зміг підтвердити з його домашньої сторінки, чи транскрипція виконується на пристрої, чи в хмарі, тож якщо офлайн для вас важливий, запитайте їх напряму, перш ніж зважитися. Відшліфований, мультиплатформний, вартий уваги, якщо хмара вас влаштовує і ви хочете той самий інструмент на телефоні й ноутбуці. Ми розклали пряме порівняння в нашому матеріалі альтернатива Wispr Flow, якщо ви обираєте між цими двома.

Найкраще для: людей, які хочуть витончений досвід на різних пристроях і яким не потрібен офлайн.

Otter.ai — найкращий для зустрічей, а не для диктування

Otter чудово справляється з тим, що робить, а це — не те. Це транскрайбер зустрічей, який приєднується до Zoom, Microsoft Teams і Google Meet, з безкоштовним рівнем Basic, обмеженим 300 хвилинами транскрипції на місяць. Він не друкує у ваші застосунки; він записує й транскрибує розмови, а тоді їх підсумовує. Зовсім інша категорія. Якщо ваша проблема — «підсумувати мої зустрічі», Otter — сильна відповідь; якщо ж вона — «писати швидше», це не той інструмент, хоч би яким хорошим він був. До того ж він працює як власний застосунок і вебсервіс, а не як системна гаряча клавіша, тож це не те, до чого тягнешся, щоб заповнити поле форми. Ми заглибилися в цю різницю в нашому матеріалі альтернатива Otter.ai.

Найкраще для: запису й підсумовування зустрічей, а не письма голосом.

Швидке порівняння: де працює кожен інструмент

Я навмисно не вніс точність у цю таблицю. Лише Dragon і Whisper публікують цифру, і обидві — самозвітні. Win+H, Голосове введення Google Docs і Otter взагалі не публікують жодного перевірюваного показника. Будь-яка таблиця лідерів на кшталт «Інструмент X точний на 96.3%» по всіх п'яти — це здогад, оформлений як факт. Тож стовпці нижче — це ті, які ви можете перевірити: де воно працює, чи працює офлайн, чи дотягується до кожного застосунку і для чого створене.

ІнструментМодель оплатиЛокально/ХмараПрацює офлайнПрацює в кожному застосункуМовиНайкраще для
Whisper by RemskillБезкоштовно локально, платно в хмарі (див. /pricing)Локально або в хмаріТак, локальний режимТак, системна гаряча клавіша99 на багатомовних моделяхПисьмо голосом у будь-якому застосунку
Голосове введення Win+HБезкоштовно, вбудованеХмара (Azure)Ні, потрібен інтернетНі, лише текстове полеКілька, задаються в НалаштуванняхШвидке онлайн-диктування
Dragon ProfessionalПлатно, перевірте магазин NuanceПеревірте у вендораПеревірте у вендораУ межах підтримуваних застосунківПеревірте у вендораСпеціалізована лексика
Wispr FlowПлатно, див. у вендораНе підтвердженоНе підтвердженоСистемно на Win/Mac100+ заявленоВідшліфоване хмарне диктування
Otter.aiБезкоштовний рівень, платно вище (див. у вендора)ХмараНіНі, власний застосунокПеревірте у вендораТранскрипція зустрічей

Прочитайте таблицю зліва направо — і поле саме впорядкується. Якщо «працює в кожному застосунку» й «офлайн» обидва мають бути «так», список короткий. Якщо вас влаштовує онлайн і всередині одного застосунку, безкоштовні вбудовані варіанти впораються, і тут можна припинити читати. Рішення рідко полягає в тому, який інструмент «найкращий» абстрактно. Воно про те, який рядок збігається з тим, як ви працюєте.

Інші інструменти, про які варто знати

Поле Windows ширше за п'ять імен. Кілька з них ви побачите в інших списках, з одним чесним рядком про кожен, щоб ви могли пропустити ті, що не підходять:

  • Microsoft Word Dictate — вбудований у Microsoft 365 Word, безкоштовний, якщо ви вже платите за Office, і хороший усередині Word. Застряг усередині Word. Якщо більшість вашого письма все одно відбувається там, це непоганий варіант без додаткових витрат. Ми розглянули його особливості в матеріалі перетворення голосу в текст у Word.
  • Голосове введення Google Docs — безкоштовне, але лише всередині Google Docs і Slides у підтримуваному браузері, де браузер контролює службу мовлення. Не системне, і тієї ж миті, коли ви перемикаєтеся з Docs, воно зупиняється.
  • API перетворення голосу в текст від OpenAI — whisper-1, gpt-4o-transcribe і gpt-4o-mini-transcribe, з обмеженням завантаження 25 МБ на файл. Це будівельний блок для розробників, а не застосунок, який ви встановлюєте. Це те, що під капотом викликають інструменти на кшталт Хмарного режиму Whisper, а не те, на що ви наводите курсор і починаєте говорити.
  • Speechnotes — безкоштовний браузерний блокнот для диктування. Підходить для нотаток, живе у вкладці, з вкладки не виходить.
  • Windows Voice Access — керування ОС без рук від Microsoft, створене для доступності й повної роботи без клавіатури, а не для швидкого письма. Варто знати, що воно існує, якщо вам потрібно повністю керувати Windows голосом.
  • OpenAI Whisper — сама опенсорсна модель, яку можна запустити локально без командного рядка. Якщо ви хочете саме модель Whisper на ПК, дивіться наш покроковий розбір OpenAI Whisper для Windows про те, як встановити й користуватися без термінала.

Якщо вам потрібен довший огляд усієї категорії, разом з інструментами для зустрічей і хмарними сервісами транскрипції, ми написали повний гайд програмне забезпечення для транскрипції. Коротка версія для цієї сторінки: більшість із них або прив'язані до браузера, або не з тієї категорії для завдання писати в будь-який застосунок Windows.

Коли пропустити платний застосунок (і просто скористатися Win+H)

Windows · Win + H

Listening…
Win+H знову — для коротких онлайн-диктувань у браузері чи вікні чату безкоштовна вбудована панель і справді є правильною відповіддю. Не платіть за те, що Windows вам уже дає.

Ось частина, яку більшість цих списків опускає, бо відправити вас до безкоштовного конкурента нічийого блогу не оплачує. Якщо ви онлайн і лише зрідка диктуєте коротке повідомлення в браузер чи вікно чату, не платіть ні за що, зокрема й за нас. Натисніть Win+H і рухайтеся далі. Це безкоштовно, вбудовано у Windows 11 і чудово справляється з короткими сплесками. Якщо ви живете в Google Docs, його Голосове введення безкоштовне і прямо там, усередині документа. Якщо ваша справжня потреба — записувати й підсумовувати зустрічі, а не писати, безкоштовний рівень Otter дає вам 300 хвилин на місяць. Платний застосунок для диктування починає виправдовувати своє місце на конкретній межі: коли ви пишете довші тексти, працюєте десь без сигналу або вам треба говорити в застосунки, куди Win+H не може зайти. Нижче за цю межу вбудований варіант — правильна відповідь, і я б радше, щоб ви залишили свої гроші собі й повернулися, коли переростете його.

Ось одна сильна думка, яку я закладу в цю статтю: якщо ваш інструмент диктування вимагає, щоб ви його тренували, на дворі 1999-й. Сучасне розпізнавання мовлення працює одразу з коробки для більшості акцентів і мов. 45-хвилинний ритуал калібрування, що визначав стару еру Windows, був обхідним шляхом для дефіцитних обчислень, а не функцією. Наприкінці 1990-х мій родич запускав Dragon NaturallySpeaking на десктопі з Windows 98 і 64 МБ RAM. Процес тренування тривав 45 хвилин. Ви зачитували список слів, щоб його відкалібрувати. Тоді диктування працювало, ледь-ледь, із точністю десь 70% і затримкою чотири секунди на речення. Один абзац святкового листа займав п'ятнадцять хвилин. Гарнітуру жбурнули через кімнату. Гарнітура вціліла; експеримент — ні. Через двадцять п'ять років семирічна дитина в тій самій родині продиктувала цілий лист за 90 секунд, без тренування, без калібрування. Якщо інструмент 2026 року досі просить вас його натренувати, перш ніж почне слухати, це ідея 1999 року в новій іконці.

Ціни без манівців

Увесь локальний конвеєр Whisper безкоштовний для будь-кого з обліковим записом: локальний Whisper, Parakeet, AI-покращення на пристрої, історія диктувань, власні гарячі клавіші — усе, без жодного способу оплати для реєстрації. Це та частина, на якій варто затриматися: офлайн-диктування, що працює в кожному застосунку, про яке вся ця стаття, не коштує нічого, і ви не віддаєте картку, щоб його отримати. Whisper Pro додає Хмарну поверхню для транскрипції на базі OpenAI, хмарного AI-покращення й голосового пошуку в вебі — для людей, які хочуть найновіші моделі й відповіді з вебу в одному інструменті. Win+H і Голосове введення Google Docs теж безкоштовні. Otter має безкоштовний рівень на 300 хвилин на місяць і платні плани вище. Dragon — платний продукт, поточну ціну якого я не зміг підтвердити напряму в Nuance, тож перевірте їхній магазин. Точні цифри Whisper Pro є на сторінці цін — конкретні, чорним по білому, без «від», і ми надсилаємо листа перед будь-яким поновленням, тож дата й сума ніколи не стануть несподіванкою.

Відкрийте текстове поле прямо зараз і натисніть Win+H. Якщо ця швидка панель покриває все, що ви робите, ви готові й заощадили завантаження. Тієї миті, коли ви опинитеся в потягу без сигналу, чи говоритимете до застосунку, що відмовляється слухати, чи писатимете щось довше за текстове повідомлення, — це й буде межа, де інструмент, який ви встановлюєте, починає мати значення. Моя семирічна донька перетнула її того дня, коли захотіла написати бабусі із заднього сидіння автівки, де місяць раз у раз зникав, а Wi-Fi так ніколи й не з'явився.

Хочете побачити це на своєму ПК з Windows?

Завантажте Whisper, затисніть Ctrl+Space і спостерігайте, як транскрипція з'являється в будь-якому застосунку. Локальний конвеєр безкоштовний, без картки під час реєстрації.

Безкоштовне локальне диктування для кожного авторизованого користувача. Pro додає хмарні функції в окремому пробному періоді.

Фото Denys Medvediev

Denys Medvediev

Я той, хто читає наші листи підтримки, найімовірніше — диктуючи відповіді.

Додаткове читання