Автор: Денис Медведєв

Посібник

Мовлення в текст для тих, хто вивчає англійську

Якщо англійська не ваша рідна мова, ви можете писати нею за допомогою голосу. Натисніть гарячу клавішу, скажіть — і чистий англійський текст з'явиться в будь-якому застосунку прямо на місці курсора. ШІ-обробка виправляє граматику й слова-паразити. Це інструмент для письма, а не репетитор вимови.

Останнє оновлення: червень 2026

Ноутбук і блокнот на столі біля сонячного вікна — образ вивчення мови та письма

Мовлення в текст для тих, хто вивчає англійську, дозволяє нерідним мовцям писати англійською голосом, а не клавіатурою. Інструмент на кшталт Whisper транскрибує усне мовлення прямо на місці курсора в будь-якому застосунку, а ШІ-обробка прибирає граматичні помилки й слова-паразити. Розпізнавання акценту непогане, але не ідеальне; це засіб для письма, а не вчитель вимови.

Англійська — моя третя мова. Я вивчав її після української та російської, переважно з документації та баг-репортів — і це настільки ж романтично, як звучить. Роками найповільнішою частиною письма англійською був не пошук думки. Проблема була в наборі тексту — шукати потрібне слово, поки пальці не встигають, сумніватися в правописі, губити речення, яке щойно склалося в голові, десь між клавіатурою й екраном.

Говорити швидше, ніж друкувати, будь-якою мовою — навіть тією, яку ще вчиш. Мовлення в текст закриває цей розрив: ви вимовляєте англійське речення, яке вже можете сказати вголос, а інструмент записує його за вас. Але є нюанс, про який мало хто говорить: він чує ваш акцент, а не рівень знань. Із акцентами зараз справді добре. Але вчителем він не є — і про обидві речі я скажу чесно.

Ось коротко. Сучасне мовлення в текст працює на сімействі моделей Whisper, навченому на величезній кількості реального аудіо з різними акцентами. Тобто нерідний мовець може диктувати й отримувати придатний англійський текст більшість часу — не бездоганний, але міцний чорновик, який легко виправити.

Тому питання для того, хто вивчає англійську, не «чи зрозуміє воно мене». Зазвичай — так. Справжні питання: яка модель найкраще справляється з акцентами й мовами, запускати локально чи в хмарі, і як використовувати ШІ-обробку, щоб усний чорновик перетворився на чистий письмовий текст. Розберемо все це, налаштуємо за дві хвилини — і я скажу, коли інструмент для диктування взагалі не підходить для вашого завдання.

Чому писати англійською голосом зручніше, якщо це не рідна мова

Відкритий підручник з мови та блокнот поруч із ноутбуком на дерев'яному столі

Складне в письмі другою мовою — рідко самі ідеї. Проблема в терті між думкою і сторінкою. Ви знаєте, що хочете сказати. Можете сказати це вголос. Але набирати текст означає одночасно боротися з правописом, порядком слів і розкладкою клавіатури — і речення, що вже склалося в голові, непомітно розчиняється. Мовлення оминає більшу частину цієї боротьби.

Швидкість диктування — близько 145 слів на хвилину, тоді як набір тексту дає приблизно 40. Для рідного мовця це приємне прискорення. Для того, хто пише другою або третьою мовою, різниця ще відчутніша: набирати нерідною мовою повільніше і з більшою кількістю помилок. Зекономлені зусилля витрачаються на головне — правильно висловити думку, — а не на механіку письма.

Є ще один, тихіший плюс. Коли вимовляєш речення і бачиш його записаним, одразу розумієш, чи воно насправді має сенс. Незграбна фраза виглядає незграбно на екрані так, як не завжди звучить у голові. Цей зворотний зв'язок корисний для того, хто вчиться, — так само, як він допомагає студенту, що перетворює лекцію на нотатки. Граматику сам по собі він не виправить — для цього є ШІ-обробка, про неї далі — але бачити власні слова на сторінці — це вже маленький урок.

Натисніть гарячу клавішу, скажіть по-англійськи — текст з'явиться на місці курсора

Механіка проста — у цьому й уся принадність. Натискаєте гарячу клавішу, говорите, відпускаєте — і транскрипт вставляється на місці курсора в будь-якому активному текстовому полі. Whisper витримує коротку паузу після відпускання клавіші, щоб останнє слово не зрізалося — зручно, коли ще шукаєш кінець англійського речення. Оскільки вставка відбувається через курсор ОС, це однаково працює в email, Google Doc, чаті або домашньому завданні.

Нічого не потрібно налаштовувати для кожного застосунку окремо. Ніяких розширень для браузера, плагінів чи токенів. Курсор у полі, ви говорите — слова з'являються. Поки ви говорите, на екрані з'являється маленька капсула, яка підтверджує, що все слухається:

Cancel
Оверлей запису: маленька капсула, що з'являється під час мовлення — підтверджує, що Whisper вас слухає.

Гарячу клавішу варто налаштувати один раз і забути. У Windows це Ctrl+Space; на Mac — Command+Option, клавіша-модифікатор у режимі «тримати й говорити». Обидві можна змінити в Налаштуваннях, якщо вони конфліктують із чимось, що ви вже використовуєте. Якщо ви колись налаштовували голосовий набір у Google Docs — ідея та сама, але не прив'язана до одного застосунку: та сама клавіша заповнює будь-яке поле на екрані.

Налаштування за дві хвилини (Windows або Mac)

Вам потрібен Mac на Apple Silicon або Windows 10 і новіший, робочий мікрофон і будь-який застосунок для введення тексту. Весь локальний конвеєр безкоштовний для будь-якого авторизованого акаунту — картку при реєстрації не просять. Ось послідовність дій.

Крок 1 — Встановіть Whisper і увійдіть.

Завантажте з сторінки завантаження, встановіть і створіть безкоштовний акаунт. Без картки. Весь локальний конвеєр транскрипції відкривається одразу.

Ви зрозумієте, що все спрацювало, коли в треї з'явиться іконка застосунку і майстер налаштування запропонує вибрати модель.

Крок 2 — Виберіть режим транскрипції.

Застосунок не вибирає за вас. Доступно три варіанти: Cloud (OpenAI, ваш власний ключ), Local Parakeet або Local Whisper. Для роботи з акцентами та перекладу найважливіші багатомовні моделі Whisper — докладніше про це далі.

Ви зрозумієте, що все спрацювало, коли модель завершить завантаження і з'явиться статус «готово».

Крок 3 — Перевірте гарячу клавішу.

У Windows за замовчуванням — Ctrl+Space, на Mac — Command+Option у режимі утримання. На Mac надайте дозвіл на Доступність, коли з'явиться запит; без нього вставка на місці курсора не зможе досягти інших застосунків.

Ви зрозумієте, що все спрацювало, коли тестовий запис вставиться в будь-яке текстове поле.

Крок 4 — Поставте курсор у текстове поле і говоріть.

Відкрийте email, документ або чат, клацніть у полі, утримуйте гарячу клавішу, скажіть речення по-англійськи, відпустіть. Транскрипт з'явиться там, де знаходиться курсор.

Ви зрозумієте, що все спрацювало, коли ваше усне англійське речення опиниться в полі як текст.

Whisper
Справжній десктопний застосунок Whisper на екрані налаштувань із відкритими панелями Транскрипції та ШІ.

Найповільніше — завантаження моделі, а не саме налаштування. Решта — це чотири кроки вище. Щойно все запустилося, написання англійського листа перестає бути завданням для клавіатури і стає завданням для голосу — а коли англійська — це те, що ви ще практикуєте, саме це й потрібно.

голосовий набір у Windows · на Mac

Як воно справляється з акцентами та трюк із 99 мовами

Скажу прямо про акценти, бо тут чесна відповідь важлива. Моделі Whisper навчені на широкому спектрі реального мовлення, включно з великою кількістю нерідної англійської. На практиці це означає, що сильний нерідний акцент зазвичай транскрибується точно. Зазвичай. Дуже важкі акценти, швидке мовлення, фоновий шум, ім'я та технічний термін в одному реченні — все це ще може збивати з пантелику. Інструмент добрий. Але не магічний, і якщо хтось каже, що він ідеально розпізнає кожен акцент — вам продають демо, а не реальне вівторкове використання.

Два практичних важелі впливають на точність більше, ніж вибір моделі. Перший — мікрофон: USB-мікрофон за $20 дасть більше для точності, ніж будь-яке оновлення моделі, і крапка. Говорити чітко й трохи повільніше теж допомагає — а для того, хто практикує англійську, це й так природньо. Другий — сімейство моделей. Багатомовні збірки Whisper охоплюють 99 мов і краще справляються з акцентованою англійською, ніж англомовні збірки, — бо вони «чули» набагато більше різного мовлення. Local Parakeet охоплює англійську та ще 24 європейські мови — 25 загалом — і є найшвидшим локальним варіантом, але переклад не підтримує. Збірки .en — виключно для англійської, без перекладу.

Цей останній момент відкриває справді корисний трюк для тих, хто вчиться. Багатомовні моделі Whisper можуть перекладати на англійську в процесі транскрипції. Тобто коли англійське речення не складається — слово крутиться на язиці рідною мовою, але в голові воно вже не по-англійськи — можна сказати його рідною мовою і отримати англійський чорновик. Це не відполірований переклад, і я б не відправляв його без правки, але як спосіб скласти текст найсильнішою мовою, а потім довести його до ладу англійською — він усуває справжній бар'єр. Скажіть мовою, якою думаєте; відредагуйте мовою, яку вчите.

Локально чи в хмарі: що підходить тому, хто вивчає мову

Для більшості ESL-письма — листів, домашніх завдань, повідомлень, першого чорновика есе — локального режиму цілком достатньо, і він безкоштовний та офлайн. Хмара стає в нагоді, коли потрібна максимальна точність для складного запису або треба щось швидко знайти під час диктування. Ось чим відрізняються три шляхи — застосунок змушує вибирати, тому краще вибирати усвідомлено.

Різниця зводиться до швидкості, охоплення мов і того, куди йде ваш голос.

  • Local ParakeetTDT-рушій від NVIDIA, близько 600 МБ, найшвидший локальний варіант — у 5–10 разів швидший за Whisper на CPU. Охоплює англійську та 24 інші європейські мови, 25 загалом. Переклад на англійську не підтримує. Якщо ваша рідна мова — одна з європейських і ви пишете англійською, це швидкий і повністю офлайн-варіант.
  • Local Whisperповільніший за Parakeet на тому самому пристрої, але багатомовні збірки охоплюють 99 мов, краще справляються з акцентами та підтримують переклад на англійську. Обирайте для китайської, японської, корейської, арабської або будь-якої мови, яку Parakeet не підтримує, — а також для трюку з диктуванням рідною мовою. Модель за замовчуванням для англійської займає близько 480 МБ.
  • Cloud (OpenAI, BYOK)найкраща точність і доступ до мережі, з використанням вашого власного ключа OpenAI, де вартість нараховується напряму OpenAI. Транскрипція за замовчуванням виконується через gpt-4o-mini-transcribe. Потрібен інтернет, тому це єдиний шлях, який виходить за межі вашого пристрою. Хмарна функція є частиною Whisper Pro.

Скучна правда така: для повсякденного письма англійською локальна багатомовна модель Whisper цілком підходить більшості тих, хто вчиться: 99 мов, пристойна стійкість до акцентів, переклад на англійську за потреби — і нічого не надсилається на сервер. Обидва локальні рушії працюють повністю на вашому пристрої, що важливо, якщо ви диктуєте щось приватне — особисте есе, заявку на роботу, повідомлення, в якому хочете точно все сформулювати. Починайте локально. Тягніться до хмари лише тоді, коли місцевий рівень точності вас не влаштовує.

Як перетворити усний чорновик на чистий письмовий текст

Сирий диктант будь-якою мовою виходить суцільним потоком. Ви вимовляєте речення так, як сказали б його вголос — зі словом-паразитом, самовиправленням, комою, яку не озвучили, — і отримуєте неструктурований масив без розділових знаків, який повертає будь-який рушій. Для того, хто вчиться, саме тут мовлення в текст починає окупатися: ШІ-обробка робить те, що найважче дається другою мовою.

Whisper може запускати ШІ-обробку сирого тексту перед тим, як він потрапляє на екран. Скажіть активаційну фразу «Hey whisper» — і усний чорновик буде вдосконалено: слова-паразити видалено, розділові знаки розставлено, суцільний потік розбито на речення, очевидні помилки виправлено. У локальному режимі це виконується через Ollama; у хмарному — за замовчуванням gpt-5-mini. Граматика й структура виправляються, але зміст залишається вашим — результат звучить, як ви, тільки чистіше.

Thinking...
Сирий

so um i want to ask about the the deadline for the assignment because i am not sure is it friday or next monday and also can i send it by email

Оброблений

I want to ask about the deadline for the assignment, because I'm not sure if it's Friday or next Monday. Also, can I send it by email?

Одне чесне застереження. ШІ-обробка виправляє граматику й форму, але не пояснює, чому щось змінила. Якщо ваша мета — вивчити правило, прочитайте «до» і «після» поруч — різниця і є урок. Якщо мета — просто відправити чистий лист до дедлайну, дозвольте виправити і рухайтеся далі. Обидва варіанти цілком виправдані; це різні цілі, і лише ви знаєте, яка з них зараз ваша.

Той самий потік «говорю — очищую» працює для всього, що ви пишете, а не лише в одному застосунку — можна набирати текст швидше голосом в email, документах і чатах, і довгий абзац стає кількома усними реченнями замість стіни тексту, яку набираєш одне обережне слово за раз.

Коли мовлення в текст — не той інструмент для того, хто вивчає англійську

Старий дороговказ із двома стрілками в різні боки — ілюстрація вибору інструменту

Краще втратити ваш клік, ніж витратити ваш час, тому скажу прямо: ось де інструмент для диктування — не та відповідь. Якщо ваша мета — покращити вимову, це не сюди. Мовлення в текст перетворює мовлення на текст; він не оцінює ваш акцент, не виправляє те, як ви вимовляєте слово, і не скаже, що «thirty» прозвучало як «dirty». Для цього потрібен мовний застосунок із акцентом на вимові, репетитор або мовний партнер. Інструмент транскрипції — це помічник для письма, а не тренер з мовлення, і стверджувати протилежне було б нечесно.

Ще кілька чесних альтернатив. Якщо потрібно продиктувати лише коротке повідомлення, безкоштовні вбудовані засоби вашого пристрою цілком упораються: у Windows натисніть Windows + H, щоб відкрити вбудовану панель голосового набору; на Mac увімкніть Диктування в Системних налаштуваннях у розділі Клавіатура — на Apple Silicon загальний текст обробляється прямо на пристрої. Windows-варіант потребує підключення до інтернету і надсилає дані на сервери Microsoft, тобто офлайн-режиму немає. А якщо хочете інструмент, який насправді пояснює граматичні правила з прикладами та вправами — це вже перевірювач граматики або навчальний застосунок: ШІ-обробка тут виправляє текст, а не проводить урок.

Беріть спеціалізований системний інструмент для диктування тоді, коли саме письмо є вузьким місцем: довгі листи, есе, заяви — все, що ви можете сказати швидше, ніж набрати англійською, і де хочете одну гарячу клавішу, яка однаково працює в кожному застосунку на Windows і Mac. Якщо ні — користуйтеся тим, що є безкоштовно, або тим, що підходить для конкретного завдання. Правильна відповідь іноді вказує не на нас — і я завжди так скажу.

Якщо вибираєте, де диктувати, платформні посібники детально описують налаштування — голосовий набір у Windows описує той самий процес крок за кроком на ПК.

Англійська — моя третя мова, і більшу частину цього посібника я написав, диктуючи його в текстове поле, а потім даючи ШІ-обробці виправити шви, які я ніколи б не почув на слух. Ось чесна пропозиція: він не зробить вашу англійську ідеальною і не навчить правил, але допоможе перенести речення з голови на сторінку набагато швидше, ніж ваші пальці. Виправляти — все одно вам. Допомога — у швидкості.

Напишіть наступного англійського листа голосом

Утримуйте гарячу клавішу, скажіть по-англійськи, відпустіть. Чистий текст з'явиться там, де курсор — у листі, документах і в усіх інших застосунках теж.

Локальний режим безкоштовний для будь-якого авторизованого акаунту. Картка не потрібна.

Фото Дениса Медведєва

Denys Medvediev

Я той, хто читає наші листи підтримки — і, швидше за все, диктую відповіді.

Додаткове читання