Автор: Денис Медведєв

Гід

Диктування для журналістів

Репортери пишуть швидше, коли говорять, а не друкують. Натисніть гарячу клавішу, продиктуйте — і слова з'являться там, де курсор, у будь-якій програмі: у CMS, документі, нотатках. Це для того, щоб складати власні тексти та польові нотатки, а не для транскрибування інтерв'ю.

Останнє оновлення: червень 2026

Відкритий репортерський блокнот і ручка поруч із ноутбуком на темному столі в редакції, що викликає асоціації із занотовуванням і написанням матеріалів

Програма диктування для журналістів перетворює сказані слова репортера на текст там, де знаходиться курсор, у будь-якій програмі. Запуск — однією гарячою клавішею; чернетка, лід або польова нотатка з'являються саме там. Вона створена для того, щоб голосом складати власні тексти, і працює офлайн для конфіденційних матеріалів. Вона не транскрибує інтерв'ю — це вже інша задача.

День репортера — це здебільшого введення одного й того самого двічі. Ви занотовуєте цитату в блокнот на сходах суду, а потім передруковуєте її за столом. Ви набираєте лід у голові дорогою назад, але до того як відкриється ноутбук, половина вже зникає. Клавіатура — це вузьке місце, і їй байдуже, що у вас дедлайн.

Люди шукають «програму диктування для журналістів», сподіваючись знайти один інструмент, який робить усе: пише чернетки, веде нотатки і записує засідання міської ради. Такого інструменту немає, і краще сказати це в другому абзаці, ніж витрачати ваш вечір даремно. Диктування — для слів, які ви складаєте самі. Запис чужого голосу і перетворення аудіо на дослівну стенограму — це зовсім інший пристрій. Цей гід — про перше завдання, і він чітко вказує, коли братися за друге.

Ось відмінність, яку більшість сторінок за цим ключовим словом навмисно розмивають. Диктування — це коли ви говорите, а комп'ютер вводить текст туди, де знаходиться курсор. Транскрибування — це запис чиєїсь мови: джерела, учасників панелі, телефонної розмови, — і отримання точного текстового запису після. Одна й та сама груба ідея — абсолютно різні інструменти, абсолютно різні ставки.

Тому справжнє питання не «яка найкраща програма диктування для журналістів». Питання в тому: «що підходить для якої частини роботи». Інструмент диктування на гарячих клавішах на кшталт Whisper чудово підходить для написання власних текстів, швидких польових нотаток і фіксації думки, поки вона не випарувалась. Для самого інтерв'ю — кілька мовців, цитати, які ви надрукуєте і за які відповідатимете, — потрібна окрема служба транскрибування. Я детально розберу сторону диктування, налаштую його за дві хвилини і чітко проведу межу, щоб ви не довіряли неправильному інструменту чужу цитату.

Чому репортери вдаються до диктування

Репортерський блокнот на спіралі, ручка і кава на дерев'яному столі — образ швидкої фіксації думок

Головне завдання тут просте: встигнути, поки думка не охолола. Репортер виходить із прес-конференції з напівготовим лідом у голові, бачить кут матеріалу по дорозі до машини, ідеально формулює перше речення в душі — а потім сідає за клавіатуру і дивиться, як третина цього витікає крізь пальці. Говорити — приблизно 145 слів на хвилину. Друкувати — близько 40. У цьому проміжку й гинуть хороші чернетки.

Ще є руки. Ті, хто пише на життя, пишуть багато, і зап'ястя все пам'ятають. Диктування — не медична процедура, і я не буду вдавати, що воно нею є, але воно на якийсь час прибирає клавіатуру з ланцюжка, що є реальним порятунком у важкий день здачі матеріалів. Руки відпочивають, чернетка все одно пишеться, а відповідальний редактор нічого не помічає. Ось і весь аргумент — не терапія, просто менше натискань між головою і сторінкою.

І дрібниці накопичуються. Одна цитата, яку хочеться зафіксувати, поки не забувся точний формулювання. Нагадування передзвонити другому джерелу. Три рядки про те, яка атмосфера була в залі, — ніхто б не друкував це однією рукою на ходу, але проговорити вголос — будь ласка. Це не матеріали. Але все це — сполучна тканина журналістики, і все це швидше проговорити, ніж набрати.

Натисніть клавішу, скажіть — і слова в чернетці

Механіка нудна — саме те, що потрібно в умовах дедлайну. Ви натискаєте гарячу клавішу, говорите, відпускаєте — і стенограма вставляється туди, де курсор, у будь-якій активній програмі. Whisper витримує коротку паузу після відпускання, щоб останнє слово не обрізалося. Оскільки вставлення відбувається на рівні системного курсора, поле чернетки у CMS, документ Word, Google Docs у браузері, звичайний файл нотаток або повідомлення у Slack редактору — все це просто «текстове поле». Та сама клавіша, та сама поведінка, скрізь.

Саме це посадкові сторінки надмірно ускладнюють. Жодних плагінів для підключення до вашої видавничої системи, жодних інтеграцій, яких треба чекати від ІТ-відділу, жодного кроку з експортом. Курсор стоїть у чернетці, ви говорите, слова з'являються в чернетці. Поки ви говорите, з'являється невелика капсула — щоб ви знали, що Whisper слухає і записує:

Cancel
Оверлей запису: невелика капсула, що з'являється, поки ви говорите, — підтвердження того, що Whisper слухає.

Гаряча клавіша — єдине, що варто налаштувати одразу. На Windows це Ctrl+Space; на Mac — Command+Option, модифікатор, який утримуєте під час мовлення. Обидва можна змінити в Налаштуваннях, якщо вони конфліктують зі скороченнями вашого редактора. Один ранній користувач написав о 2:14 ночі — гаряча клавіша конфліктувала з аудіопрограмою, і лист закінчувався словом «незручно». Я відправив оновлення з панеллю налаштування клавіш через вісім хвилин і ліг спати. Тепер кожну клавішу можна переназначити. Якщо ви вже налаштовували диктування на Windows або на Mac раніше — це та сама м'язова пам'ять, тепер направлена на інструменти редакції.

Налаштування за дві хвилини (Windows або Mac)

Вам знадобиться Mac на Apple Silicon або ПК з Windows 10 або новішою версією, робочий мікрофон і те, в чому ви пишете чернетки, — відкрите у десктопному застосунку або браузері. Весь локальний конвеєр безкоштовний для будь-якого зареєстрованого акаунта, без запиту платіжних даних під час реєстрації. Ось послідовність дій.

Крок 1 — Встановіть Whisper і увійдіть.

Завантажте зі сторінки завантаження, встановіть і створіть безкоштовний акаунт. Без картки. Весь локальний конвеєр транскрибування одразу доступний.

Ви зрозумієте, що все спрацювало, коли в треї з'явиться значок застосунку і майстер налаштування запропонує вибрати модель.

Крок 2 — Оберіть режим транскрибування.

Застосунок не вибирає за вас. Є три варіанти: Cloud (OpenAI, власний ключ), Local Parakeet або Local Whisper. Для конфіденційних нотаток і вихідних матеріалів починайте з локального режиму — детальніше про це нижче.

Ви зрозумієте, що все спрацювало, коли модель завершить завантаження і відображатиметься як готова.

Крок 3 — Підтвердіть гарячу клавішу.

На Windows за замовчуванням Ctrl+Space, на Mac — Command+Option, яку утримують як «push-to-talk». На Mac надайте дозвіл на Доступність, коли з'явиться запит; без нього вставлення за курсором не дістанеться інших застосунків.

Ви зрозумієте, що все спрацювало, коли тестовий запис вставиться у будь-яке текстове поле.

Крок 4 — Поставте курсор у чернетку і говоріть.

Відкрийте CMS, документ або файл нотаток, клікніть у текст, утримуйте гарячу клавішу, скажіть речення, відпустіть. Стенограма з'явиться там, де курсор.

Ви зрозумієте, що все спрацювало, коли сказане речення опиниться в чернетці у вигляді тексту.

Whisper
Реальний десктопний застосунок Whisper на екрані налаштувань із відкритими панелями «Транскрибування» та «ШІ».

Найповільніший етап — завантаження моделі, а не налаштування. Все інше — чотири кроки вище. Коли все запущено, перенести думку з голови в чернетку перестає бути завданням для друкування і стає завданням для мовлення.

Написання чернеток і польові нотатки голосом

На практиці це розділяється на два режими, і вони відчуваються по-різному. Перший — написання за столом: курсор у CMS або документі, промовляєте лід, основну тезу, секцію, яку вже відпрацювали. Ви не продиктуєте відполіровану фінальну версію — ніхто так не робить, — але швидко отримаєте брудну першу чернетку на екрані за частку звичного часу. Редагувати те, що вже є, набагато легше, ніж дивитися на порожнє поле. Функції кастомного словника і гарячих слів у Local Whisper теж допоможуть, якщо ваша тема рясніє іменами і жаргоном, з якими загальна модель плутається.

Другий режим — фіксація в полі, і саме тут гаряча клавіша виправдовує себе. Ви виходите зі слухання і промовляєте три речі, які не хочете забути, прямо у файл нотаток. Фіксуєте номер телефону, нагадування, точне формулювання офіційної заяви, яку занотували скороченнями. Це не для публікації в такому вигляді — це ваш сирий матеріал, те, що інакше прийшлося б передруковувати пізніше з каракулів, які не розберете. Скажіть це один раз, чітко, поки свіже.

Один справді корисний бонус у режимі Cloud — і я чесний щодо обсягу: можна вимовити фразу-активацію «Hey whisper», щоб зробити швидкий веб-пошук прямо під час написання чернетки: дата, правопис, назва — і відповідь повертається за кілька секунд. Це зручна перевірка фактів на ходу, а не дослідницький інструмент, і журналіст все одно перевіряє все важливе за реальним джерелом. Зручно для «то був бюджет 2019-го чи 2020-го», не виходячи з чернетки. Не замінник репортажу.

Локально або хмара: який режим для конфіденційних нотаток

Для журналіста починайте з локального режиму, і причина — захист джерел, а не швидкість. Нотатка про конфіденційне джерело, чернетка чутливого матеріалу, робочий файл, який ви ніколи б не передали підряднику, — локальний режим працює повністю на вашому комп'ютері без відправлення чогось на сервер. Це правильний параметр за замовчуванням, коли матеріал може поставити джерело під загрозу. Хмара стає запасним варіантом для рідкісних складних записів, а не повсякденним інструментом. Якщо ваш Mac на Apple Silicon або ПК куплений кілька років тому, локальний режим впорається з щоденним диктуванням без проблем.

Ось чим відрізняються три шляхи, бо застосунок змушує вибирати, і краще вибрати свідомо:

  • Local ParakeetTDT-рушій від NVIDIA, близько 600 МБ, найшвидший локальний варіант — у 5–10 разів швидший за Whisper на CPU. Підтримує англійську плюс 24 інші європейські мови, всього 25. Без перекладу на англійську. Якщо ви пишете англійською або іншою європейською мовою, це швидкий, повністю офлайн варіант.
  • Local Whisperповільніший за Parakeet на тому самому комп'ютері, але багатомовні збірки охоплюють 99 мов і вміють перекладати на англійську. Збірки лише для англійської — тільки англійська, не 99. Вибирайте його для китайської, японської, корейської, перекладацької роботи або коли потрібні кастомний словник і гарячі слова для теми з великою кількістю власних назв. Стандартна англійська модель — близько 480 МБ.
  • Cloud (OpenAI, BYOK)найвища точність і швидкий веб-пошук; використовує ваш власний ключ OpenAI, який оплачується напряму через OpenAI. Транскрибування за замовчуванням працює на gpt-4o-mini-transcribe. Потрібен інтернет — це єдиний шлях, що виходить за межі вашого комп'ютера; тримайте його подалі від усього, що пов'язано з джерелами. Хмарний режим входить до складу Whisper Pro.

Проста правда: для більшості журналістської роботи з чернетками і нотатками локального режиму цілком достатньо. Обидва локальні рушії працюють повністю на вашому комп'ютері — а це головне, коли файл може містити ім'я джерела. Хмара виправдовує себе, коли потрібна висока точність для складного запису або швидкий пошук під час написання. Для щоденної роботи починайте з локального і переходьте до хмари тільки тоді, коли локального вже не вистачає.

Від продиктованої чернетки до чистого тексту

Сире диктування виходить як суцільний потік. Ви кажете: «ну рада проголосувала чотири проти трьох за перезонування ну Гендерсон проти цитата це створює поганий прецедент кінець цитати передзвонити до відділу планування завтра» — і це суцільна стіна без розділових знаків, яку видає будь-який речовий рушій. Приведення до ладу — ось де режими розходяться.

Голосовий набір Windows додає розділові знаки під час мовлення, а macOS Dictation справляється з основами, коли ви вимовляєте «кома» або «крапка». Для серйозніше редагування — видалення слів-паразитів, виправлення потоку свідомості, перетворення продиктованого абзацу на те, що можна вставити в чернетку, — Whisper може запустити прохід ШІ. Скажіть «Hey whisper» — і текст покращиться перед вставленням. На локальній моделі це відбувається через Ollama; у хмарному режимі за замовчуванням — gpt-5-mini.

Thinking...
Вихідний

ну рада проголосувала чотири проти трьох за перезонування ну гендерсон проти цитата це створює поганий прецедент кінець цитати передзвонити до відділу планування завтра

Виправлений

Рада проголосувала 4–3 за перезонування. Гендерсон проти: «Це створює поганий прецедент». Передзвонити до відділу планування завтра.

Одне тверде застереження — бо це журналістика, і точність тут є роботою. Прохід ШІ для редагування — для ваших власних чернеток і нотаток: він приводить до ладу слова, які ви сказали самі. Не покладайтеся на нього, щоб отримати дослівну цитату, яку ви надрукуєте і за якою відповідатимете. Якщо цитата має бути точною — перевірте її за оригінальним записом або своїми нотатками. Щоразу. Диктування швидко дає вам чернетку; воно не засвідчує цитату. Хто каже, що речовий рушій дає готові до публікації, дослівні цитати — продає демо, а не реальний понеділок з дедлайном.

Той самий потік «продиктував — підчистив» добре працює і далеко за межами репортажу — можна диктувати чистий текст у будь-який редактор однією гарячою клавішею, і довгий уривок перетворюється на кілька сказаних речень замість абзацу, який треба набирати.

Коли диктування не підходить і потрібен інструмент транскрибування

Портативний диктофон і мікрофон на столі, підготовлені для інтерв'ю

Це ключова теза всього гіду, тому скажу прямо. Щойно ви записуєте іншу людину — інтерв'ю, джерело по телефону, учасників панелі, прес-брифінг з кількома голосами, — диктування не підходить. Диктування створено для того, щоб вводити ваші слова в курсор, один мовець, у режимі реального часу. Воно не розділяє мовців, не заточене під дослівний запис чужого аудіо, і цитата, яку ви надрукуєте, — не те місце, де варто це з'ясовувати.

Для цього завдання зверніться до окремої служби транскрибування — категорії, побудованої навколо аудіо з кількома мовцями, міток мовців, часових міток і текстового запису, за яким можна звіряти цитати. Це справді інший продукт, і хороший варто грошей, коли точність чужих слів — це ваш результат. Якщо потрібні сертифіковані або юридично значимі стенограми, це ще більш вузький фаховий сервіс, і я не буду вдавати, що гаряча клавіша диктування це покриває.

Іноді правильний інструмент вже є безкоштовно на вашому комп'ютері. Якщо треба лише кинути дворядкову нотатку або швидке нагадування — операційна система справиться. На Windows натисніть клавішу Windows + H, і вбудована панель Голосового набору відкриється біля курсора; вона сама ставить розділові знаки і підходить для коротких відрізків, хоча передає дані через сервери Microsoft і потребує інтернету, тому офлайн-варіантом не є — а це важливо, якщо нотатка містить ім'я джерела. На Mac Dictation дозволяє вводити текст голосом у будь-якому місці, де можна друкувати; налаштовується в Системних параметрах у розділі «Клавіатура», а на Apple Silicon загальний текст може оброблятися на пристрої. Переходьте до спеціалізованого системного інструменту, коли вбудовані засоби починають гальмувати: довгі чернетки, багатомовна робота, офлайн-конфіденційність або одна гаряча клавіша, що однаково поводиться у CMS, документі та нотатках.

Якщо більша частина того, що ви фіксуєте, — це короткі нотатки, а не повні чернетки, логіка в голосовому введенні нотаток підійде найкраще — там акцент на швидкій фіксації, а не на тривалому написанні.

Диктування не напише за вас матеріал і не транскрибує інтерв'ю — це ніколи не було його роботою. Воно прибирає клавіатуру з ланцюжка, поки ви пишете власні тексти і ведете власні нотатки — швидко, офлайн, якщо матеріал конфіденційний. Більшу частину цього гіду я продиктував у звичайний файл нотаток гарячою клавішею, якій байдуже, яке вікно активне, а потім підчистив і переніс у чернетку. Інтерв'ю для нього я відправив у службу транскрибування. Правильний інструмент для правильного завдання. Ось і весь секрет.

Спробуйте на наступній чернетці

Утримайте гарячу клавішу, говоріть, відпустіть. Перша чернетка потрапляє туди, де курсор, — у CMS, документ або файл нотаток. Інтерв'ю, як і раніше, іде до інструменту транскрибування.

Локальний режим безкоштовний для будь-якого зареєстрованого акаунта. Картка для початку не потрібна.

Фото Denys Medvediev

Denys Medvediev

Я той, хто читає нашу службову пошту — і, швидше за все, диктує відповіді.

Додаткове читання