Автор: Денис Медведєв

Посібник

Програма для диктування для лікарів

Це диктування для власного письма лікаря — електронні листи, направлення, особисті нотатки, адміністративна робота, чернетки досліджень — голосом у будь-якому десктопному застосунку. Це не інструмент клінічної документації, EHR або медичної транскрипції, і він не дає жодних гарантій відповідності вимогам.

Останнє оновлення: червень 2026

Ноутбук, блокнот і кава на акуратному робочому столі — образ повсякденної адміністративної роботи

Програма для диктування для лікарів у тому сенсі, який розглядається тут, — це інструмент загального призначення, яким лікар користується для власного письма: електронні листи, направлення, особисті нотатки, адміністративна робота, чернетки досліджень — голосом у будь-якому десктопному застосунку. Гаряча клавіша транскрибує мовлення в місці курсору. Працює офлайн у локальному режимі і не є інструментом клінічної документації або відповідності вимогам.

Почну з того, чим це не є, — бо ключове слово «програма для диктування для лікарів» відкриває два зовсім різних світи, і плутати їх — марнувати ваш час. Один світ — клінічна документація: озвучення записів про пацієнтів в електронну медичну карту з усією точністю, інтеграцією та відповідністю вимогам, яких це потребує. Це окрема категорія спеціалізованих продуктів, і Whisper до неї не належить. Я ще раз скажу про це далі й покажу, до якого інструменту варто звернутися, якщо саме це вам потрібно.

Інший світ — усе решта, що лікар пише протягом дня і що не стосується медичної карти пацієнта. Лист-направлення до колеги. Відповідь на запит. Нотатка для адміністратора клініки щодо розкладу. Перший сирий чернеток статті. Лист організаторам конференції. Це просте письмо, таке саме, як у будь-кого іншого, — і саме про нього цей посібник. Його можна вимовляти замість того, щоб набирати, у будь-якому застосунку на вашому комп'ютері, однією гарячою клавішею.

Ось межа, яку я хочу провести чітко і не розмивати. Whisper — це інструмент продуктивності для диктування. Він перетворює ваше мовлення на текст у місці курсору в будь-якому застосунку з фокусом. Це не клінічний інструмент і не засіб роботи з медичними записами, він не призначений для захищеної медичної інформації і не дає жодних гарантій щодо HIPAA, EHR або відповідності іншим вимогам. Не використовуйте його для диктування записів про пацієнтів. Використовуйте його для власного неклінічного письма.

За цією межею є багато простору. Дві чесні властивості роблять його особливо зручним саме для власного письма лікаря. Локальний режим працює повністю на вашому пристрої, тож текст листа чи чернетки не залишає ноутбук — це реальна властивість того, де відбувається обробка, а не сертифікат відповідності. А локальний Whisper приймає власний словник, тож термінологія, якою ви користуєтеся щодня, перестає перекручуватися. Я покажу, як це налаштувати, продемонструю, для якого письма це підходить, і прямо скажу, коли слід відкласти цей інструмент і купити спеціалізований медичний продукт.

Що це таке і що ним не є

Акуратний стіл із ноутбуком і закритим блокнотом — образ адміністративного та особистого письма

Що це таке: інструмент диктування загального призначення, який вводить ваші слова в будь-який десктопний застосунок, — щоб лікар міг складати власні листи, направлення, особисті нотатки, адміністративні повідомлення й дослідницькі тексти голосом замість набирання. Він однаково поводиться у поштовому клієнті, текстовому редакторі та браузері, бо вставляє текст у місці курсору й не залежить від того, в якому застосунку цей курсор знаходиться.

Що ним не є — скажу прямо, щоб не залишалося двозначностей: це не інструмент клінічної документації, не плагін для EHR або EMR, не медична транскрипція і не засіб для ведення записів про пацієнтів, діагностики чи лікування. Він не дає жодних гарантій щодо HIPAA, GDPR або будь-яких інших нормативних вимог. Чесні причини, чому лікар усе одно може ним скористатися, прозаїчні та правдиві: набирати довгі листи й чернетки втомлює, а диктувати власну кореспонденцію швидше, ніж друкувати. Ось і все. Жодного медичного застосування.

Я тримаю цю межу на виду, бо обидва світи продаються поруч, а різниця між ними суттєва. Клінічний продукт побудований навколо медичної карти пацієнта — з інтеграцією та відповідністю вимогам, яких це потребує. Інструмент продуктивності, як цей, побудований навколо курсору та ваших власних слів. Одне й те саме дієслово — «диктувати» — і зовсім різна відповідальність. Якщо ваш запис призначений для медичної карти, цей посібник для вас тут закінчується, і вам варто перейти до розділу «Коли потрібен клінічний інструмент».

Натисніть гарячу клавішу, говоріть — текст з'явиться в місці курсору

Механіка проста. Ви натискаєте гарячу клавішу, говорите, відпускаєте — і транскрипт вставляється в місці курсору в будь-якому активному текстовому полі. Whisper утримує коротке «хвостик» після того, як ви відпустили клавішу, щоб останнє слово не обрізалося. Оскільки вставка відбувається через курсор операційної системи, застосунок знизу — просто «будь-яке текстове поле»: вікно написання листа, документ Word, шаблон направлення у вашому редакторі, тіло чернетки дослідження. Під час говоріння з'являється маленька капсула, яка показує, що Whisper слухає.

Нічого не потрібно підключати до конкретної програми. Жодних плагінів, жодних токенів для вставки, жодних завдань синхронізації. Курсор у листі — ви говорите — слова з'являються у листі. Та сама клавіша вводить наступне речення чернетки статті, або повідомлення для адміністратора клініки, або нотатку собі між справами. Один інструмент — для кожного текстового поля, в якому ви б однаково набирали.

Cancel
Оверлей запису: маленька капсула, яка з'являється під час говоріння, — так ви знаєте, що Whisper вас слухає.

Гаряча клавіша — єдине, що варто налаштувати свідомо. На Windows це Ctrl+Space; на Mac — Command+Option, режим push-to-talk, який утримуєте під час говоріння й відпускаєте для зупинки. Обидві можна змінити у Налаштуваннях, якщо вони конфліктують із чимось, що ви вже використовуєте. (Конфлікт гарячих клавіш — найпоширеніша причина звернень «не працює», і майже ніколи це не баг — це два застосунки, що борються за одну клавішу; саме тому тут кожна гаряча клавіша налаштовується.) Якщо ви вже налаштовували голосовий ввід у Windows або на Mac — це та сама м'язова пам'ять, тепер спрямована на власне письмо.

Налаштування за дві хвилини (Windows або Mac)

Вам потрібен Mac на Apple Silicon або ПК з Windows 10 або новішою, робочий мікрофон і відкритий застосунок, у якому ви пишете: поштовий клієнт, текстовий редактор або браузер. Увесь локальний конвеєр безкоштовний для будь-якого авторизованого акаунту — карта не потрібна при реєстрації. Ось послідовність дій.

Крок 1 — Встановіть Whisper і увійдіть.

Завантажте зі сторінки завантаження, встановіть і створіть безкоштовний акаунт. Без карти. Увесь локальний конвеєр транскрипції відкривається одразу.

Ви зрозумієте, що все спрацювало, коли в треї з'явиться іконка застосунку і майстер налаштування запропонує вибрати модель.

Крок 2 — Оберіть спосіб транскрипції.

Застосунок не вибирає за вас. Доступно три варіанти: Cloud (OpenAI, власний ключ), Local Parakeet або Local Whisper. Для кореспонденції й чернеток, які ви хочете зберегти на пристрої, починайте з локального — детальніше про вибір через два розділи.

Ви зрозумієте, що все спрацювало, коли модель завантажиться і відобразиться як готова.

Крок 3 — Підтвердіть гарячу клавішу.

На Windows за замовчуванням Ctrl+Space, на Mac — Command+Option у режимі push-to-talk. На Mac надайте дозвіл на доступність, коли з'явиться запит; без нього вставка в місці курсору не матиме доступу до інших застосунків.

Ви зрозумієте, що все спрацювало, коли тестовий запис вставиться в будь-яке текстове поле.

Крок 4 — Поставте курсор у лист або документ і говоріть.

Відкрийте поштовий клієнт або текстовий редактор, клацніть там, де зазвичай набираєте, утримуйте гарячу клавішу, скажіть речення, відпустіть. Транскрипт з'явиться в місці курсору.

Ви зрозумієте, що все спрацювало, коли вимовлене речення опиниться в листі або документі у вигляді тексту.

Whisper
Реальний десктопний застосунок Whisper на екрані налаштувань із відкритими панелями Транскрипція та ШІ.

Найповільніша частина — завантаження моделі, а не саме налаштування. Усе решта — чотири кроки вище. Після запуску написання довгого направлення або відповіді, яку ви відкладали, перестає бути завданням з набирання і стає завданням з говоріння — а наприкінці довгого дня це зовсім інша втома.

голосовий ввід у Windows · на Mac

Для повсякденного, неклінічного письма

Подумайте про все, що ви пишете протягом дня і що не є медичною картою. Лист-направлення колезі — здебільшого суцільний текст, який ви й так складаєте самі. Накопичена пошта: відповідь на запрошення на конференцію, повідомлення адміністратору клініки, відповідь на запит від адміністрації. Нотатка собі про повторний огляд або статтю, яку треба прочитати. Перший чорновий варіант статті, анотація до постера, текст для навчального слайду. Жодне з цього не є клінічною документацією, і все це швидше вимовляти, ніж набирати.

Довгий лист — саме там диктування виправдовує себе. Більшість людей друкують зі швидкістю приблизно сорок слів на хвилину; говорять — ближче до ста сорока п'яти. Ви не отримаєте готового листа на швидкості мовлення — ніхто не отримує, — але зможете викласти його основу приблизно за третину часу, а потім підправити. Мета не в тому, щоб пропустити редагування. Мета — перенести повільний перший прохід зі швидкості набирання на швидкість говоріння, щоб те набирання, яке залишиться, було виправленням, а не написанням з нуля.

Чесна думка, що лежить в основі всього цього посібника: більшість інструментів продуктивності — це замасковані проблеми з набиранням. Швидший поштовий клієнт, кращий шаблон, охайніша скринька — усе це будівельні ліси навколо самого акту набирання. Реальне вирішення проблеми «я проводжу вечори за відповідями на листи» — не більш зручний застосунок. Просто не набирати це. Продиктуйте відповідь, виправте два слова, які були розпізнані неправильно, надішліть і йдіть додому. Ось у чому структурна перевага, і вона не має жодного стосунку до жодного пацієнта.

Локально чи в хмарі: тримайте свій текст на пристрої

Для власного письма лікаря варто розуміти одну важливу властивість: де обробляється аудіо. Локальний режим працює повністю на вашому пристрої — слова листа чи чернетки транскрибуються на ноутбуці й нікуди не надсилаються. Це твердження про технічну реалізацію, а не сертифікат відповідності вимогам, і я не буду прикидатися, що це одне й те саме. Але це реальна й корисна властивість, коли те, що ви диктуєте, — ваша власна кореспонденція, яку ви хочете залишити у себе. Хмарний режим надсилає аудіо на OpenAI для транскрипції — протилежний вибір. Ось чим відрізняються три варіанти, бо застосунок змушує вас обрати.

Вибір залежить від того, що ви пишете і що для вас важливо:

  • Local ParakeetРушій TDT від NVIDIA, близько 600 МБ, і найшвидший локальний варіант — у 5–10 разів швидший за Whisper на CPU. Охоплює англійську та ще 24 європейські мови, 25 загалом. Без перекладу на англійську і без власного словника. Якщо ви пишете англійською і хочете швидкий, повністю офлайн диктант для повсякденних листів і пошти — це простий вибір.
  • Local WhisperПовільніший за Parakeet на тому самому пристрої, але багатомовні збірки охоплюють 99 мов і можуть перекладати на англійську, а — і це тут найважливіше — він приймає власний словник. Саме там ваша термінологія перестає перекручуватися. Обирайте цей варіант, якщо ваші чернетки насичені спеціальними термінами або ви пишете іншою мовою, не англійською. Типова англомовна модель — близько 480 МБ. Повністю на вашому пристрої.
  • Cloud (OpenAI, BYOK)найвища базова точність і доступ до вебу з використанням вашого власного ключа OpenAI, що оплачується безпосередньо через OpenAI. За замовчуванням транскрипція виконується через gpt-4o-mini-transcribe. Потребує інтернету й надсилає аудіо з пристрою — це єдиний варіант, який залишає ваш ноутбук. Хмарна поверхня є частиною Whisper Pro. Для кореспонденції, яку ви хочете зберегти локально, я б цей варіант пропустив.

Проста правда полягає в тому, що для більшої частини власного письма лікаря — листів, пошти, нотаток, чернеток — локального варіанту більш ніж достатньо. Обидва локальні рушії працюють повністю на вашому пристрої і нічого не надсилають на сервер. Хмарний варіант виправдовує себе, коли потрібна максимальна точність для складного запису або коли потрібен факт із вебу посеред речення. Якщо зберігання власного тексту на власному диску — частина вашої мотивації, починайте з локального і залишайте хмару як виняток. Ніщо з цього не змінює межу: цей інструмент усе одно не для медичних карт, незалежно від обраного варіанту.

Термінологія, суцільний текст і прибирання після диктування

Необроблений диктант виходить суцільним потоком. Ви кажете «дякую за направлення я переглянув нотатки і думаю варто призначити повторний огляд через шість тижнів і скопіювати адміністратора клініки», — і саме такий непунктований масив тексту будь-який мовний рушій вам і видасть. Перетворити це на лист, який ви відправите, допомагають дві речі: правильне розпізнавання термінів і виправлення механіки.

Термінологія — саме тут загальне диктування зазвичай підводить, бо мовна модель вгадує слова, яких не очікує. Local Whisper приймає власний словник — ваш власний список спеціальних термінів, назв препаратів, скорочень, власних назв — і схиляється до них, тож слова, які ви вживаєте щодня, перестають виходити неправильно. Parakeet і хмарна транскрипція цей список не приймають, тож якщо ваші чернетки насичені термінологією, Local Whisper — це варіант, який її захистить. Для механіки — прибирання «ем», виправлення суцільного тексту, розбивка монологу на речення — Whisper може виконати прохід очищення за допомогою ШІ. Скажіть фразу активації «Hey whisper», і текст буде покращено перед вставкою. На локальній моделі це виконується через Ollama; у хмарному режимі за замовчуванням використовується gpt-5-mini.

Thinking...
Необроблений

дякую за направлення я переглянув нотатки і думаю варто призначити повторний огляд через шість тижнів і скопіювати адміністратора клініки

Очищений

Дякую за направлення. Я переглянув нотатки і думаю, варто призначити повторний огляд через шість тижнів та скопіювати адміністратора клініки.

Кілька слів про те, для чого призначений прохід очищення, а для чого ні. Це прохід механіки: пунктуація, слова-паразити, розбивка на речення. Це не оцінка змісту і вже точно не клінічна перевірка чого б то не було. Сприймайте це як приведення до ладу власного тексту і перечитуйте результат перед відправкою — так само, як перечитуєте будь-що набране. Модель виправляє потік тексту; відповідальність за кожне слово, що виходить, залишається за вами.

Той самий потік «говорив — очистив» приносить результат у всьому вашому письмі — ви так само можете вести власні швидкі нотатки голосом, кидаючи рядок у будь-який застосунок для нотаток між справами замість того, щоб набирати.

Коли натомість потрібен клінічний інструмент

Дві стрілки на дорожньому покритті вказують у різні боки — ілюстрація вибору

Це найважливіший розділ, тому скажу прямо. Якщо те, що ви диктуєте, — клінічна документація: запис про пацієнта, будь-що, що потрапляє в електронну медичну карту, будь-яка захищена медична інформація або медична транскрипція з вимогами відповідності, — то Whisper не підходить, і вам треба припинити читати й купити спеціалізований продукт для медичного диктування. Програмне забезпечення класу Dragon Medical існує саме для цього: побудоване навколо медичної карти пацієнта, інтегроване з EHR-системами і продається з усім апаратом відповідності вимогам, яких потребує клінічна робота. У Whisper нічого цього немає, і він на це не претендує.

Справа не в скромності. Справа в тому, що інструмент продуктивності для диктування і продукт для клінічної документації відповідають на різні питання. Один вставляє ваші власні слова у ваш власний лист. Інший відповідає за точність, інтеграцію та відповідність вимогам у регульованому записі про пацієнта. Я не збираюся розмивати цю межу, щоб утримати вас на цій сторінці. Якщо ваше завдання живе в медичній карті — зверніться до медичного продукту, призначеного для цього. Це чесна відповідь, і саме її я б дав колезі, який запитав.

Для дуже коротких неклінічних фрагментів правильний інструмент може вже бути безкоштовним на вашому пристрої. На Windows клавіша Windows + H відкриває вбудований рядок голосового введення в будь-якому місці курсору; він ставить пунктуацію самостійно, але маршрутизується через сервери Microsoft і потребує інтернету, тож офлайн-варіантом не є. На Mac функція Dictation дозволяє вводити текст голосом у будь-якому місці, де можна набирати, а на Apple Silicon загальний текст може оброблятися прямо на пристрої. Нижче планки «довгий лист або справжній чернеток» — використовуйте безкоштовне. Тягніться до спеціалізованого інструменту, коли письмо стає довгим, термінологія густою або ви хочете одну гарячу клавішу, що однаково поводиться скрізь, — і тягніться до клінічного продукту, щойно в гру входить медична карта пацієнта.

Якщо вам важлива локальна обробка через бажання тримати власний текст подалі від чужих серверів, ширший огляд приватного, локального перетворення мовлення на текст пояснює, що насправді означає «локально» і де його межі.

Весь посібник — одна межа і багато простору за нею. Межа: це не клінічний інструмент, не для медичних карт, жодних гарантій відповідності вимогам. Простір: кожен лист, лист-направлення, нотатка й чернеток, які лікар пише і які не мають стосунку до карти, — вимовлені замість набраних, у будь-якому застосунку, офлайн за бажанням. Більшу частину цього я продиктував голосом у текстове поле, яке не є EHR, інструментом, який не знає, що таке EHR. Власне, у цьому й суть.

Спробуйте на наступному листі або повідомленні

Утримуйте гарячу клавішу, говоріть, відпустіть. Транскрипт з'явиться там, де знаходиться ваш курсор: у листі, чернетці або будь-якому іншому застосунку, в якому ви пишете. Не в медичній карті.

Безкоштовний локальний режим для будь-якого авторизованого акаунту. Карта для початку не потрібна.

Фото Denys Medvediev

Denys Medvediev

Я той, хто читає нашу підтримку, і, найімовірніше, диктує відповіді.

Додаткове читання