Автор: Денис Медведєв

Інструкція

Голос у текст у VS Code, чесна версія

VS Code Speech диктує прямо в редакторі, локально на пристрої і безкоштовно. А ось чесна частина: для повідомлення коміту, терміналу й браузера системна гаряча клавіша дістає туди, куди розширення редактора не дотягнеться.

Останнє оновлення: червень 2026

Яскравий програмний код на екрані комп'ютера у редакторі коду — звичне робоче місце розробника

Голос у текст у VS Code працює через VS Code Speech — безкоштовне офіційне розширення від Microsoft, яке диктує в редактор локально на пристрої та забезпечує голосовий чат із Copilot. Для диктування поза редактором — у терміналі, браузері чи повідомленні коміту деінде — системний інструмент на кшталт Whisper вставляє текст під курсором у будь-якому застосунку. Обидва працюють офлайн.

Тож коротка відповідь — так, і це добре. Якщо ви припускали, що VS Code не вміє в голос, припиніть шукати. Microsoft випустив VS Code Speech у версії 1.87 у лютому 2024 року, воно працює локально й безкоштовне. Більшості розробників, які хочуть диктувати всередині редактора, вистачить двох абзаців. І це нормально. Цікаве починається тоді, коли те, що ви хочете надиктувати, узагалі не в редакторі.

Ось чого вам ніхто не каже наперед. Диктувати код голосом — погана ідея: вимовте вголос «відкрити дужку, кемел-кейс, user ID, закрити дужку» — і до обіду здастеся. Але голос для тексту навколо коду — повідомлень комітів, коментарів, README, опису PR, який ви відкладали, — обганяє друкування. Диктування йде десь на 145 слів за хвилину проти приблизно 40 за хвилину при друкуванні. Саме цей розрив і робить десять хвилин налаштування вартими того.

Голосова ситуація у VS Code: розширення VS Code Speech

Крупний план ноутбука з програмою для написання коду поруч із горнятком кави — типове робоче середовище редактора до додавання голосового вводу

За замовчуванням голос у текст у VS Code не ввімкнений. Ви додаєте його одним офіційним розширенням. Відкрийте вкладку Extensions, знайдіть VS Code Speech, переконайтеся, що видавець — Microsoft (сторінка ms-vscode.vscode-speech у Marketplace), і встановіть. Жодного ключа API, жодної реєстрації й жодного платного тарифу. Розширення завантажує невелику локальну модель розпізнавання мовлення — і ви готові.

Щоб диктувати в редактор, виконайте команду Voice: Start Dictation in EditorCtrl+Alt+V на Windows та Linux, Opt+Cmd+V на Mac. Зупинити — командою Voice: Stop Dictation in Editor, прив'язаною до Escape. Натисніть і утримуйте те саме сполучення для того, що Microsoft називає «режимом рації»: розпізнавання працює, поки ви тримаєте клавіші, і надсилає текст тієї ж миті, щойно ви їх відпускаєте. Це найближче до кнопки push-to-talk, що є в редакторі.

Те саме розширення робить ще одну, окрему річ: голосовий чат із GitHub Copilot. Виконайте Chat: Start Voice Chat (Ctrl+I / Cmd+I), або ввімкніть слово-активатор «Hey Code» і спілкуйтеся з Copilot Chat без рук. Жоден загальний інструмент диктування цього не повторює. Якщо ви прийшли саме за розмовою з Copilot, відповідь — VS Code Speech, і другої не існує.

Одне технічне зауваження: офіційна документація VS Code перелічує 26 підтримуваних мов, що задаються налаштуванням accessibility.voice.speechLanguage. Вам може трапитися стара сторінка вікі microsoft/vscode, де написано «лише англійська» — вона застаріла. Перемагає актуальна документація.

Воно працює на вашому пристрої, офлайн — і це важить менше, ніж здається

Замок на синьо-білих смугастих дверях — символ приватного диктування, що лишається на вашому власному пристрої

VS Code Speech працює локально на пристрої. Згідно з офіційною документацією VS Code щодо голосової підтримки, «Записи ніколи не надсилаються до жодного онлайн-сервісу, а обчислюються локально на вашому комп'ютері». Після завантаження моделі інтернет не потрібен; ваші усні коментарі лишаються на ноутбуці.

Хочу бути тут чесним, бо саме на цьому багато «альтернативних» статей шахраюють. Локальний режим Whisper теж повністю офлайн, аудіо ніколи не залишає пристрій. Тож офлайн — це не перевага лише Whisper. Це паритет. Те саме з ціною — VS Code Speech безкоштовний, а локальний конвеєр Whisper безкоштовний без картки під час реєстрації. Якщо хтось радить вам змінити інструмент «бо він офлайн і безкоштовний» — вам продають те, що ви вже маєте.

Чесна різниця — це охоплення. VS Code Speech працює локально й безкоштовно всередині VS Code. Питання в тому, що ви робите, коли текст живе деінде.

Куди VS Code Speech не дотягнеться: усе, що поза VS Code

VS Code Speech диктує в редактор і в чат. Це і є його межа, за задумом — воно не друкує в інтегрований термінал як звичайний ввід, не дістає браузера й не торкається Slack, Jira чи вашого git-клієнта з графічним інтерфейсом. Жодного недоліку в цьому немає. Розширення редактора, яке потайки перехоплювало б усю вашу клавіатуру, було б гіршим розширенням.

Але подумайте, де насправді живе текст розробника. Повідомлення коміту в терміналі чи окремому git-клієнті. Опис PR на GitHub у браузері. Кроки відтворення бага, які ви вставляєте у тикет Jira чи issue на GitHub. Повідомлення в Slack з поясненням, чому збірка червона. Майже нічого з цього не відбувається в панелі редактора. Це відбувається в п'яти інших вікнах, і розширення редактора не може піти туди за вами.

Ось де розрив — редактор це одне вікно з восьми.

Whisper для тексту навколо коду, у будь-якому застосунку

Whisper — це десктопний застосунок для Windows і macOS, а не розширення VS Code. Оскільки він працює на рівні операційної системи, він вставляє транскрипцію під курсором у будь-якому застосунку, де можна друкувати — у редакторі VS Code та інтегрованому терміналі, так, але також у браузері, Slack, Teams, Gmail, вашій IDE від JetBrains, Notion. Одна гаряча клавіша, кожне вікно.

Cancel
Накладка запису: невелика капсула, що з'являється, поки ви говорите, аби ви знали, що Whisper слухає.

Гаряча клавіша — Ctrl+Space на Windows і Command+Option (push-to-talk) на macOS. Утримуйте її, говоріть, відпускайте — і текст лягає туди, де вже був ваш курсор. Якщо Command+Option дуже схоже на Opt+Cmd+V від VS Code Speech — гостре око. Ті самі клавіші-модифікатори, різні механізми: одне — внутрішня команда VS Code, інше — системна гаряча клавіша, яку можна переприв'язати в Налаштуваннях. Вони не конфліктують; вони живуть на різних рівнях.

Це єдина думка, яку я тут відстою: найкращий лайфхак продуктивності — менше кроків, а не швидші кроки. Перемикання вікон, пошук потрібної голосової команди для цього застосунку, пам'ятання, який інструмент де диктує — це кроки. Одна системна гаряча клавіша, що працює в терміналі так само, як у браузері, прибирає крок. Швидкість — приємна, але справжній виграш у тому, що не треба думати, у якому вікні ти зараз.

Увесь застосунок, наживо

Whisper
Справжній десктопний застосунок Whisper — оберіть шлях транскрипції, потім утримуйте гарячу клавішу будь-де, і текст з'явиться під курсором.

Це справжній десктопний застосунок вище — налаштування, режими, усе. Whisper підтримує понад 90 мов і в локальному, і в хмарному режимі (лінійка багатомовних моделей сягає 99+; збірки .en лише англійські). VS Code Speech покриває 26. Але я б ніколи не радив вам змінювати інструмент заради кількості. Ви змінили б його заради охоплення.

Прибирайте надиктоване автоматично

Thinking...

Ось єдине, чого сире диктування не зробить за вас. У Whisper є необов'язковий прохід AI-очищення, що перетворює сумбурно надиктоване повідомлення коміту на охайний текст — локально через Ollama в безкоштовному режимі або через OpenAI у Pro. Ви кажете «е-е, виправ оту штуку, де кнопка входу, ну, не працює в Safari» — і виходить речення, яке ви справді поклали б у коміт. Колись я відправив коміт, у якому було просто «виправив штуку». Майбутній я не подякував минулому. VS Code Speech робить просте диктування; прохід очищення — це фішка Whisper. Для повідомлень комітів і описів PR це різниця між диктуванням, що економить час, і диктуванням, яке ви переробляєте вручну.

Не диктуйте сам код

Це межа, і аудиторія розробників відчуває її миттєво, якщо я говоритиму туманно, тож скажу прямо: не пишіть вихідний код голосом і не довіряйте жодному інструменту, який стверджує, що так можна. Сімнадцять символів у рядку TypeScript роблять диктування коду повільнішим за той самий тачпад, якого ви уникали. Whisper — для тексту навколо коду, а не для коду. Коментарі, повідомлення комітів, markdown-документи, README, текст PR, гілка в Slack. Там, де ви пишете людською мовою, перемагає голос. Там, де ви пишете синтаксис, клавіатура вже перемогла.

І щоб бути таким само чесним в інший бік: Whisper не робить голосового чату з Copilot. Це не заміна VS Code Speech — це інструмент для тих восьми інших вікон.

Коли VS Code Speech — кращий вибір

Детальний крупний план клавіш-стрілок чорної клавіатури — натяк на команди редактора й внутрішні гарячі клавіші

Я радше втрачу вас на користь правильного інструмента, ніж триматиму на неправильному. Тож прямо: якщо все, що вам потрібно, — це диктувати всередині редактора VS Code або спілкуватися з Copilot Chat голосом, встановіть VS Code Speech і зовсім оминіть Whisper. Воно безкоштовне, офіційне, локальне, підтримує 26 мов і має слово-активатор «Hey Code», якого не повторює жоден загальний інструмент диктування. Не додавайте другий застосунок для роботи, яку вбудоване вже робить.

Ще два випадки. Перший — Linux — VS Code Speech виходить на Linux; десктопний Whisper лише для Windows і macOS. Якщо ви на Linux, питання вже вирішене. Другий — суто-в-редакторі робочі процеси — якщо ваше диктування справді відбувається лише в панелі редактора, системна гаряча клавіша розв'язує проблему, якої у вас немає. Тягніться до Whisper, коли текст живе поза VS Code. Інакше вбудованого достатньо, а «достатньо» — це гарне місце, щоб зупинитися.

Якщо редактор — єдине місце, де ви диктуєте, ви завершили цю статтю три розділи тому, і це гарний результат. VS Code Speech — правильний вибір за замовчуванням, воно безкоштовне й говорить з Copilot. Того дня, коли вашому голосу треба буде потрапити в термінал, браузер і повідомлення коміту, а ви не відстежуватимете, у якому вікні перебуваєте, — ось коли системна гаряча клавіша виправдовує себе. Більшість цієї статті я надиктував, не торкаючись редактора. Код, звісно, я надрукував.

Надиктуйте своє наступне повідомлення коміту

Завантажте Whisper, утримуйте гарячу клавішу й дивіться, як транскрипція лягає в термінал, браузер чи редактор — туди, де вже стоїть ваш курсор.

Якщо ви на Mac, ось налаштування для macOS.

Безкоштовний локальний режим для будь-якого облікового запису з входом. Картка для старту не потрібна.

Фото Дениса Медведєва

Денис Медведєв

Це я читаю нашу пошту підтримки — найімовірніше, диктуючи відповіді.