Посібник
Програми для диктування для письменників
Говорити чорновик швидше, ніж його набирати. Рішення — системний інструмент: натиснути гарячу клавішу, сказати вголос, і слова з'являться там, де стоїть курсор — у Scrivener, Word, Google Docs або будь-якому редакторі. А потім привести чорновик до ладу за допомогою AI.
Останнє оновлення: червень 2026

Програма для диктування перетворює усний чорновик на текст у будь-якому редакторі. Системний інструмент на кшталт Whisper вставляє текст за курсором у Scrivener, Word або Google Docs після однієї гарячої клавіші, працює безкоштовно й офлайн на Windows або Mac, а необов'язковий AI-прохід перетворює потік мовлення на читабельну прозу.
Набір тексту — найповільніша частина письма. Слова вже є у вас у голові, складені в речення, але потім ви пропускаєте їх через десять пальців зі швидкістю десь сорок слів на хвилину. Я говорю приблизно втричі швидше — і ви теж. Вузьким місцем ніколи не були ідеї. Ним була клавіатура.
Письменники шукають «програму для диктування» і згадують Dragon NaturallySpeaking, ліцензію за $699 і сорокап'ятихвилинне навчання системи. Той світ минув. Те, що потрібно романісту чи блогеру в 2026 році, — це гаряча клавіша, яка вставляє усний текст у будь-який редактор, яким вони вже користуються, а потім AI-прохід, щоб привести його до ладу. Без ліцензії. Без плагіна під кожен застосунок. Все це працює на ноутбуці, який у вас уже є.
Ось те, що більшість сторінок про диктування для письменників обходять стороною. Вашому редактору не потрібна функція диктування. Документ у Scrivener, сторінка у Word, вікно Google Docs — усе це просто текстові поля з курсором. Інструменту, який вставляє текст за курсором, байдуже, яке з них відкрите.
Тому справжнє питання не в тому, «у якому текстовому застосунку найкраще розпізнавання голосу». Жоден із них не створений для диктування довгих текстів, та й прив'язуватися до одного — не варіант. Питання в тому, «який інструмент для диктування працює поверх усіх них», і чесна відповідь — одна офлайнова гаряча клавіша, яка однаково поводиться в кожній програмі. Я покажу робочий процес, налаштую його за дві хвилини і скажу, коли диктування взагалі не потрібне.
Чому письменники беруться за диктування

Чорновик — це саме те завдання, для якого диктування й придумане. Чорновик має бути швидким і сирим — схопити форму, а виправляти потім. Набір тексту цьому заважає, бо набір за своєю природою акуратний: дивишся, як з'являються слова, і вже правиш. Коли говориш — правити нема коли. Сказав речення, воно вийшло, рухаєшся далі. Для романіста, який продирається крізь розділ, або блогера, який хоче закрити пост на 1 500 слів до того, як прокинуться діти, саме ця інерція вперед і є головним.
Різниця у швидкості — реальна і відчутна. Стійкий темп набору для більшості людей — близько сорока слів на хвилину. Розмовна мова — ближче до ста сорока п'яти. Готовий відшліфований розділ за такою швидкістю не написати — ніхто не пише, — але сирий матеріал ви отримаєте за третину часу, а редагувати є що краще, ніж дивитися на порожній аркуш. Найдорожча частина письма — початок. Диктування робить початок дешевим.
Є й тихіша причина, і я скажу чесно: диктування дає рукам відпочити. Якщо ви пишете на заробіток, клавіатура накопичується, і можливість надиктувати великий уривок, відкинувшись від столу, знімає навантаження з зап'ясть. Це зауваження про продуктивність, а не медична порада — але саме через це письменники, яких я чув, і потягнулися до диктування, і ця ж логіка стоїть за переходом на голос, щоб зменшити втому від клавіатури. Менше натискань для тієї ж кількості слів — просто вигідний обмін.
Натисни гарячу клавішу, говори — чорновик з'явиться в редакторі
Механіка нудна — саме тому вона працює скрізь. Натискаєш гарячу клавішу, промовляєш абзац, відпускаєш — і транскрипт вставляється там, де стоїть курсор, у будь-яке текстове поле, яке зараз активне. Whisper тримає коротку паузу після того, як ви відпускаєте клавішу, тож останнє слово речення не обрізається. Оскільки текст вставляється за курсором, ваш редактор у Scrivener, сторінка у Word і вікно Google Docs — усе це просто «будь-яке текстове поле». Одна клавіша, одна поведінка, кожного разу.
Саме цього старі інструменти для диктування ніколи не могли зробити правильно. Жодного плагіна для Scrivener, жодного окремого режиму диктування у Word, жодного розширення для Docs. Курсор стоїть у розділі, ви говорите — слова з'являються в розділі. Поки ви говорите, з'являється маленька капсула, щоб ви знали, що система слухає:
Гаряча клавіша — єдине, що варто налаштувати одразу. На Windows — Ctrl+Space; на Mac — Command+Option, утримувані під час мовлення в режимі «натисни й говори». Обидві можна змінити в налаштуваннях, якщо вони конфліктують із чимось, що ви вже використовуєте, — наприклад, із власними скороченнями текстового застосунку. (У першій версії гаряча клавіша була жорстко прошита в код — і так тривало рівно до тієї ночі, коли один користувач виявив, що вона конфліктує з його музичним софтом о другій ранку. Тепер усе налаштовується.) Якщо ви вже налаштовували голосовий ввід на Windows або на Mac, це та сама м'язова пам'ять, просто спрямована на ваш рукопис.
Налаштування за дві хвилини (Windows або Mac)
Вам потрібні Mac на Apple Silicon або ПК з Windows 10 і новіші, робочий мікрофон і відкритий редактор на вибір. Увесь локальний пайплайн безкоштовний для будь-якого авторизованого акаунту — і жодного способу оплати при реєстрації не вимагається. Ось послідовність.
Крок 1 — Встановіть Whisper і увійдіть.
Завантажте зі сторінки завантаження, встановіть і створіть безкоштовний акаунт. Без картки. Весь локальний пайплайн транскрипції відразу доступний.
Ви зрозумієте, що все вийшло, коли в треї з'явиться іконка застосунку і майстер налаштування запропонує вибрати модель.
Крок 2 — Оберіть спосіб транскрипції.
Застосунок не вибирає за вас. Варіантів три: Cloud (OpenAI, власний ключ), Local Parakeet або Local Whisper. Для рукописів, які ви не хочете відправляти на чужі сервери, починайте локально — детальніше про це через два розділи.
Ви зрозумієте, що все вийшло, коли модель завантажиться і відображатиметься як готова.
Крок 3 — Перевірте гарячу клавішу.
На Windows за замовчуванням Ctrl+Space, на Mac — Command+Option, утримувані як «натисни й говори». На Mac надайте дозвіл на доступ до спеціальних можливостей, коли з'явиться запит; без нього вставка за курсором не зможе дістатися до інших застосунків.
Ви зрозумієте, що все вийшло, коли тестовий запис вставиться в будь-яке текстове поле.
Крок 4 — Поставте курсор у чорновик і говоріть.
Відкрийте Scrivener, Word або документ у браузері, клацніть на сторінці, утримуйте гарячу клавішу, скажіть речення, відпустіть. Транскрипт з'явиться там, де стоїть курсор.
Ви зрозумієте, що все вийшло, коли ваше усне речення стане текстом у рукописі.
Найповільніша частина — завантаження моделі, а не налаштування. Все інше — це чотири кроки вище. Коли все запрацює, отримання абзацу на сторінці перестає бути завданням набору і стає завданням мовлення — а це єдина зміна, яка вам і була потрібна.
Робочий процес, що витримує справжній розділ
Диктувати цілий розділ — не те саме, що диктувати листа, і ті, хто цього не розуміє, кидають диктування на першому тижні. Фокус у тому, щоб розділити дві роботи, які письменники зазвичай роблять одночасно. Написання чорновика — це одна робота: вивалити слова в потрібному порядку, швидко, не оцінюючи їх. Редагування — інша: розділові знаки, абзаци, речення, яке ви сказали двічі. Диктування блискуче справляється з першою і незграбно — з другою. Тож розділіть їх. Надиктуйте чорновик від початку до кінця, а потім поверніться і правте з клавіатурою, від якої ніколи повністю не відмовляєтеся.
Кілька звичок, які закріплюють результат. Говоріть повними реченнями, а не уривками — транскрипція точніша, коли має завершену думку. Вимовляйте «новий абзац» уголос як маркер, який знайдете під час редагування, навіть якщо інструмент на це не реагує, — бо стіна усного тексту без ніяких орієнтирів погано читається. Тримайте під рукою глосарій власних імен: імена персонажів, вигадані місця та технічний жаргон — саме там будь-який мовний рушій починає вгадувати, а локальний Whisper дозволяє налаштувати пріоритет власної лексики, щоб «Аельвін» не перетворювався на «Оленку». Нічого екзотичного. Просто ставтеся до чорновика як до чорновика.
Чесні очікування: надиктований уривок на 2 000 слів вийде як читабельна, трохи розтягнута й надто розмовна проза з потрібними кістками на місці. Це перемога. Ви витратили п'ятнадцять хвилин на розмову замість години набору, і тепер є що редагувати — а не курсор, що блимає на вас. Я так і пишу довгі речі, а потім доробляю точні правки вручну — голос для обсягу, клавіші для шліфування. Вони не суперники.
Локально чи хмара: який режим для рукопису
Для власного письма спочатку спробуйте локальний режим. Рукопис — це щось особисте, поки ви самі не вирішите інакше, і немає жодного сенсу гнати неопублікований розділ через чийсь сервер, щоб перетворити голос на текст. Якщо ваш Mac на Apple Silicon або ваш ПК куплений протягом останніх кількох років, локальний режим упорається із щоденним написанням чорновиків без нарікань, а хмара стане запасним виходом, а не налаштуванням за замовчуванням.
Ось чим відрізняються три варіанти — застосунок змушує вибирати, і краще, щоб ви вибирали свідомо:
- Local Parakeet — TDT-рушій NVIDIA, приблизно 600 МБ, найшвидший локальний варіант — у 5–10 разів швидший за Whisper на CPU. Підтримує англійську та ще 24 європейські мови, 25 загалом. Без перекладу на англійську, без користувацької лексики. Якщо ви пишете англійською і хочете швидкість — це простий, повністю офлайновий вибір.
- Local Whisper — повільніший за Parakeet на тому самому комп'ютері, але багатомовні збірки підтримують 99 мов, можуть перекладати на англійську і підтримують користувацьку лексику — саме завдяки їй імена ваших персонажів залишаються цілими. Збірки лише для англійської — лише для англійської, не 99 мов. Вибирайте цей варіант для глосаріїв персонажів, багатомовної роботи або перекладу. Модель для англійської за замовчуванням — близько 480 МБ.
- Cloud (OpenAI, BYOK) — найкраща точність і доступ до мережі. Використовує ваш власний ключ OpenAI, що тарифікується безпосередньо OpenAI. Транскрипція за замовчуванням на gpt-4o-mini-transcribe. Потребує інтернету, тому це єдиний варіант, що виходить за межі вашого комп'ютера. Хмарна функція є частиною Whisper Pro.
Нудна правда: для робочого чорновика локального варіанту цілком достатньо. Обидва локальні рушії працюють повністю на вашому комп'ютері і нічого не відправляють на сервер, що важливо, коли файл — це книга, яку ще ніхто не читав. Хмара виправдовує себе, коли потрібна найвища точність для складного запису або коли модель має підтягнути факт із мережі прямо під час речення. Для щоденної роботи над розділами починайте локально і звертайтеся до хмари лише тоді, коли локальний варіант перестає задовольняти.
Від усного чорновика до чистої прози
Сирий диктант виходить як суцільний потік — і це нормально. Ви кажете «ну от детектив заходить вона поки нічого не каже е просто дивиться на тіло і тут вимикається світло», і саме цей непунктуований потік повертає будь-який мовний рушій. Чорновик є цілком — ком немає. Розбіжності починаються на етапі очищення.
Голосовий ввід Windows додає розділові знаки під час мовлення, а macOS Dictation обробляє базову пунктуацію, коли ви говорите «кома» або «крапка». Для більш глибокого очищення — прибирання «е» і «ну», виправлення суцільного тексту, розбивки усного монологу на речення, які варто залишити, — Whisper може запустити AI-прохід. Скажіть активаційну фразу «Hey whisper» — і текст покращиться перед вставкою. На локальній моделі це відбувається через Ollama; у хмарному режимі за замовчуванням — gpt-5-mini.
ну от детектив заходить вона поки нічого не каже е просто дивиться на тіло і тут вимикається світло
Детектив заходить. Вона поки нічого не каже — просто дивиться на тіло. А потім вимикається світло.
Одне застереження, яке письменникам варто почути прямо: AI-прохід — для механіки, а не для стилю. Він виправляє пунктуацію та заповнювачі; він не повинен переписувати ваші речення на щось бляклішее, ніж те, що ви сказали. Використовуйте його, щоб зробити чорновик читабельним, а потім редагуйте самі — бо ритм рядка не належить жодній моделі. Чесний розподіл праці: голос вкладає слова, AI-прохід робить їх читабельними, а ви робите їх своїми.
Той самий підхід «сказав — очистив» працює далеко за межами рукопису — ви можете також вести голосовий щоденник, диктуючи в будь-який застосунок, і денні нотатки перетворяться на кілька усних речень замість сторінки, яку набиваєте опівночі.
Коли диктування не підходить і що взяти натомість

Диктування — правильний інструмент для написання власних слів. Воно — неправильний інструмент для двох завдань, які письменники часто з ним плутають, і сказати це вголос заощадить вам один розчарований вечір.
Якщо ваше завдання — перетворити записане інтерв'ю, подкаст або файл наради на транскрипт, це транскрипція, а не диктування — інша категорія. Вам потрібен сервіс транскрипції, який приймає аудіофайл і повертає документ із позначками часу та мітками мовців. Гаряча клавіша «натисни й говори» призначена для живого мовлення безпосередньо в курсор, а не для обробки файлу, записаного раніше. І якщо вам просто потрібно занотувати одне речення на телефоні — рядок діалогу, що прийшов у черзі в магазині, — вбудований мікрофон клавіатури телефону вже це робить, а Whisper узагалі є лише десктопним застосунком для Windows і macOS. Не встановлюйте десктопний застосунок, щоб зловити один рядок.
На вашому комп'ютері вже є безкоштовний варіант для коротких уривків. На Windows натисніть Windows key + H — і вбудована панель голосового вводу відкриється прямо біля курсора; вона сама розставляє розділові знаки і добре підходить для одного-двох речень, хоча й відправляє дані через сервери Microsoft та потребує інтернету, тож офлайн не вийде. На Mac Dictation дозволяє говорити в будь-яке текстове поле — налаштовується в системних параметрах у розділі «Клавіатура», а на Apple Silicon загальний текст може оброблятися прямо на пристрої. Беріться за спеціалізований системний інструмент, коли ці варіанти починають не влаштовувати: довгі чорновики, офлайн-конфіденційність для рукопису, користувацька лексика для імен персонажів або потреба в одній гарячій клавіші, яка однаково поводиться в Scrivener, поштовому клієнті й редакторі блогу. Якщо ваші потреби нижчі за цю межу — користуйтеся безкоштовним. Я не буду радити встановлювати застосунок, щоб зловити один випадковий рядок діалогу.
А якщо причина, через яку ви взагалі звернулися до голосу, — це втома від довгих днів за клавіатурою, компроміс розкладено по поличках у матеріалі про перехід на диктування, щоб розвантажити руки — та сама логіка продуктивності, менше натискань для тієї ж кількості сторінок.
Я виріс поруч із родичем, у якого на комп'ютері з Windows 98 і 64 мегабайтами оперативної пам'яті стояв Dragon NaturallySpeaking. Навчання тривало сорок п'ять хвилин — ви читали список слів, щоб система відкалібрувалася, — а потім диктування давало відсотків сімдесят точності з чотирисекундною затримкою на кожне речення. На один абзац святкового листа йшло п'ятнадцять хвилин, а гарнітура врешті полетіла в стіну. Двадцять п'ять років потому чорновик розділу з'являється за курсором приблизно за півтори секунди, офлайн, безкоштовно. До речі, гарнітура вижила. Більшу частину цього посібника я надиктував у текстове поле, а потім відредагував із клавіатурою — саме такий робочий процес я і рекомендую. Спробуйте на наступному тексті, який вам потрібно написати.
Надиктуйте наступний розділ на сторінку
Утримуйте гарячу клавішу, надиктуйте абзац уголос, відпустіть. Текст з'явиться у вашому редакторі — і в кожному іншому застосунку, де ви пишете.
Локальний режим безкоштовний для будь-якого авторизованого акаунту. Картка для початку не потрібна.



