Гід
Сучасний застосунок диктування
Застосунок диктування перетворює вимовлені слова на набраний текст. На десктопі хороші з них роблять це наживо: натискаєш гарячу клавішу, говориш — і слова з'являються там, де блимає курсор, у будь-якому відкритому застосунку. Без завантажень, без копіювання, без зайвих вікон. Говориш — текст з'являється.
Останнє оновлення: червень 2026

Застосунок диктування перетворює мовлення на текст прямо там, де стоїть курсор. Цей гід розповідає, як працює механіка «натиснув — сказав — текст з'явився», які безкоштовні інструменти вже є у вашій операційній системі, коли варто встановити окремий застосунок, чесний огляд кожного з популярних рішень — і коли спеціалізований застосунок вам узагалі не потрібен.
Це вся категорія в одному реченні. Решта статті — те, про що зазвичай мовчать. Як це працює насправді, чому вбудований у ваш комп'ютер інструмент іноді цілком достатній і коли окремий застосунок справді заробляє своє місце.
Одразу скажу: я сам розробляю один такий застосунок. Він називається Whisper by Remskill. Буду чесним щодо того, де він підходить, а де — ні, включно з тим моментом, коли я пораджу вам скористатися безкоштовним інструментом, що вже є у вашій операційній системі.
Починаймо.
Натиснув гарячу клавішу, сказав — і слова з'явилися там, де курсор
Ось механіка, що визначає десктопний застосунок диктування. Натискаєш клавішу — за замовчуванням Ctrl+Space на Windows, перевизначувана кнопка «говори, доки тримаєш». Вимовляєш речення. Відпускаєш. За секунду-дві текст з'являється рівно там, де блимав курсор.
Саме «там, де курсор, у будь-якому застосунку» відрізняє справжній інструмент диктування від сайту транскрипції. Сайт транскрипції бере записаний файл і повертає суцільний текст, який ще треба кудись скопіювати. Застосунок диктування минає файл повністю. Текст з'являється прямо там, куди ви пишете. Це різниця між тим, щоб продиктувати листа, і тим, щоб розшифрувати запис себе, що читає його вголос.
Швидкість важливіша, ніж здається. Більшість із нас друкує зі швидкістю близько 40 слів на хвилину. Мовлення — близько 145. Це приблизно в три з половиною рази швидше — тому одна секунда натиснутої кнопки може зекономити справжній шматок дня. Купа листів, нотатки з нарад, дванадцять варіантів холодного листа до обіду.
У вашому комп'ютері вже є один такий інструмент — і іноді цього достатньо
Перш ніж щось встановлювати, знайте: ви майже напевно вже маєте інструмент диктування. Обидві основні операційні системи постачаються з ним безкоштовно.
На Windows 11 натисніть клавішу Windows + H — з'явиться панель голосового введення. Вона працює, але є одне «але»: розпізнавання мовлення відбувається онлайн через Azure, тому без інтернету нічого не вийде. Немає з'єднання — немає диктування. Знаки пунктуації можна вставляти автоматично, якщо увімкнути цю опцію.
На Mac Apple Dictation знаходиться в «Системних параметрах» у розділі «Клавіатура» і запускається клавішею мікрофона або обраним вами скороченням. Версія Apple може працювати повністю на пристрої після завантаження мовної моделі — тобто офлайн, і ваш голос нікуди не передається. Підтримується кілька десятків мов: Apple вказує 54 онлайн-мови та 43 доступних офлайн на сторінці доступності функцій. Чого вона не вміє — це власного словника, автоматичного покращення формулювань штучним інтелектом або вибору моделі транскрипції.
Проста правда: для короткого, невимушеного диктування — 30-слівне повідомлення, швидкий пошук, одна коротка відповідь — вбудований інструмент цілком підходить. Він безкоштовний, він уже є, і вам не потрібна ще одна іконка в рядку меню, щоб написати мамі повідомлення. Якщо це все, що вам потрібно — закрийте цю вкладку й натисніть Win+H або клавішу диктування на Mac. Серйозно.
Якщо ви також диктуєте на телефоні чи планшеті, порівняння застосунків голосового введення для кожного пристрою розбирає вибір платформа за платформою.
Де окремий застосунок диктування дійсно заробляє своє місце
Отже, коли ж вбудованого стає недостатньо? Зазвичай три речі. Перше — офлайн, який насправді є приватним. Голосове введення Windows вимагає хмари. Окремий застосунок може запускати весь процес на вашому власному процесорі, тож лист до школи дитини чи юридичний документ, який ви складаєте, нікуди не потрапляє. Друге — точність і контроль: вибір більшої моделі, додавання слів, які система постійно спотворює, автоматичне покращення формулювань. Третє — те, що вбудовані рішення тихо ігнорують: однакова поведінка в будь-якому застосунку, щоразу, без сюрпризів.
Саме цю нішу займає Whisper by Remskill. Це десктопний застосунок для Windows і macOS на Apple Silicon. Весь локальний ланцюжок безкоштовний для всіх, хто входить в акаунт, — картка при реєстрації не потрібна. Це включає локальні движки транскрипції, покращення за допомогою ШІ, історію, власний словник і реєстрацію до трьох ваших пристроїв.
Щодо движка — вам не нав'язують один варіант і не кажуть змиритися. Ви обираєте. Локальний Parakeet — найшвидший варіант: близько 600 МБ, у 5–10 разів швидший за Whisper на процесорі, підтримує англійську плюс 24 інші європейські мови. Локальний Whisper повільніший, але підтримує 99 мов, може перекладати мовлення англійською і дає більше контролю: власний словник, точніше налаштування; найбільша модель важить близько 3 ГБ. А якщо вам потрібні найновіші хмарні моделі OpenAI та відповіді з інтернету в реальному часі — є необов'язкова Pro-хмарна поверхня, де ви вводите власний API-ключ, а Remskill не бере відсоток. Три шляхи — ви обираєте залежно від того, що для вас важливіше: швидкість, мови чи найсвіжіша хмарна якість.
Чесна думка: більшість «AI-застосунків диктування» — це накрутка на модель, а не власна модель
Ось моя єдина тверда позиція, і я підкріплю її цифрою. Багато застосунків диктування, що з'явилися за останні два роки, — це по суті те саме: мовна модель, яку ви могли б запустити самі, гарний інтерфейс поверх — і щомісячний рахунок, який мало пов'язаний із реальною вартістю обчислень. Ціна таких рішень сягає приблизно тридцяти доларів на місяць у найдорожчих варіантах.
У презентації написано «на основі ШІ». Так само, як і моя заявка на іпотеку. Ця фраза вже нічого не означає. Насправді в хмарному застосунку ви платите за зручність того, що хтось інший запускає модель замість вас, плюс за приватну ціну — ваш аудіозапис покидає ваш ноутбук. Якщо робота чутлива — це не зручність, а ризик.
Саме тому я непохитно вважаю, що безкоштовний локальний режим має бути базою, а не апселом. У вашого ноутбука є мікрофон і процесор. Для одного абзацу диктування сервер у ланцюжку не потрібен.
Швидкий чесний огляд інших застосунків диктування
Перш ніж обирати, варто знати, що є на ринку. Ось ті, про яких варто говорити, — по одному рядку на кожен, де є за що хвалити.
superwhisper — зрілий і кросплатформений (Mac, Windows, iOS), підтримує живе диктування та транскрипцію файлів, працює офлайн з локальними моделями. Справді сильний варіант; якщо ви задоволений платний користувач — немає жодної причини переходити.
Apple Dictation — безкоштовне, вбудоване в macOS, працює на пристрої та офлайн після завантаження моделі. Без власного словника і без покращення формулювань ШІ — але для коротких фрагментів більшості цього вистачає.
Windows Voice Typing (Win+H) — безкоштовне, вбудоване в Windows 11, запускається через Win+H, але вимагає підключення до інтернету через Azure. Ок, коли онлайн — марне в літаку.
Dragon (Nuance) — ветеран ринку, тепер лише для Windows як професійний продукт (Dragon Professional v16) з ціноутворенням через відділ продажів. Досі лідирує у voice-командах без рук і заявляє точність до 99%. Якщо вам потрібно керувати всім комп'ютером голосом — він в окремій категорії.
Wispr Flow — стильний, хмарний і з ціною в тому самому рівні «приблизно тридцять доларів на місяць», про який я щойно скаржився. Гарний маркетинговий сайт.
Кілька я пропустив. Справа не в тому, щоб вивчити список. «Застосунок диктування» — широке поняття, що охоплює безкоштовні вбудовані рішення, відкриті проєкти, полірований підписний сервіс і корпоративні голосові комплекси. Обирайте за тим, що ви реально робите, а не за тим, чию сторінку побачили першою.
Чому «просто натисни одну клавішу» складніше, ніж здається
Коротка історія — бо саме вона пояснює, чому мене хвилюють нудні деталі. Я дав застосунок своїй молодшій доньці — їй сім — у суботу. Одна демонстрація: натисни, скажи, відпусти, вставлено. Вона написала листа бабусі на 90 слів про випалий зуб, обмінний курс зубної феї і танцювальний гурток — і не поставила жодного питання.
Через два дні вона повернулася: «гаряча клавіша не працює в моєму застосунку для малювання». Звичайна людина не знає, що таке конфлікт гарячих клавіш. Вона просто знає, що «перестало працювати». Тієї ночі я відправив оновлення з налаштуваннями власної гарячої клавіші. Застосунок диктування живе або помирає через дрібниці: конфлікт, якого ви не передбачили; фантомне відпускання клавіші на Windows, через яке мій обробник спрацьовував шість разів за одне натискання і на виправлення якого пішло кілька днів і дебаунс у 300 мс. У мене є ступінь магістра. Цей дебаунс таки мене приголомшив.
Коли застосунок диктування вам не потрібен
Ось частина, яку більшість статей пропускає — тому скажу прямо. Спеціалізований застосунок диктування вам не потрібен, якщо виконується хоча б одна з цих умов.
- Ви диктуєте тільки короткі, невимушені речі. Повідомлення, пошук, одна коротка відповідь. Вбудований інструмент упорається з цим безкоштовно.
- Ви завжди онлайн і ніколи не торкаєтесь нічого чутливого. Тоді хмарні вбудовані рішення або хмарний платний застосунок цілком підходять — локальний варіант мало що додасть.
- Ви диктуєте лише в одному місці — наприклад, у єдиній вкладці браузера. Розширення браузера впорається без системного застосунку. Voice In, наприклад, це розширення Chrome, що працює виключно в браузері.
- Вам потрібне керування всім комп'ютером без рук, а не просто введення тексту. Це вже голосові команди, і Dragon справляється з цим краще за будь-який інструмент, орієнтований насамперед на диктування.
Окремий застосунок починає окупатися на довгому, частому, більш приватному, більш багатомовному кінці — приблизно тоді, коли ви диктуєте справжні абзаци щодня і волієте, щоб вони не покидали вашу машину. Нижче цієї межі — заощаджуйте гроші. Для повнішого порівняння безкоштовних варіантів є гід з безкоштовного програмного забезпечення для диктування, ширший огляд програм голосового введення, а якщо ви потрапили сюди з якогось конкретного застосунку, порівняння альтернатив superwhisper стане в пригоді.
Якщо запам'ятаєте лише одне
Застосунок диктування — це просто «натисни клавішу, скажи — слова з'являться там, де ти пишеш». Вбудований інструмент на вашому комп'ютері вже виконує просту версію безкоштовно. Окремий застосунок вартий уваги тоді, коли вам потрібна офлайн-приватність, справжня багатомовна точність або однакова поведінка в будь-якому застосунку — і не вартий, коли цього немає.
Whisper by Remskill саме тому тримає весь локальний ланцюжок безкоштовним: ви повинні мати змогу знайти свою межу, не платячи наперед. Ціни на необов'язковий хмарний Pro-рівень — на сторінці цін. Моя семирічна донька знайшла свою межу за одну суботу. Ви, мабуть, впораєтесь швидше.
Спробуйте продиктувати наступний абзац замість того, щоб набирати його
Завантажте Whisper by Remskill, створіть акаунт без картки, натисніть гарячу клавішу і говоріть. Весь локальний ланцюжок безкоштовний — ви знайдете свою межу, перш ніж платити.
Безкоштовне локальне диктування, картка при реєстрації не потрібна.



