Інструкція
Голос у текст у Zendesk: дзвінки проти ваших відповідей
Zendesk Talk розшифровує дзвінок клієнта. Він не друкує вашу відповідь. А ось щоб надиктувати відповідь, нотатку чи макрос, який ви справді пишете, потрібен системний інструмент із гарячою клавішею — як-от Whisper. Він працює офлайн, в Agent Workspace і в кожній сторонній програмі, де ви проводите день.
Останнє оновлення: червень 2026

Голос у текст у Zendesk — це насправді дві різні речі. Zendesk Talk розшифровує записаний дзвінок клієнта або голосове повідомлення й додає розшифровку до журналу тикета — але не друкує вашу відповідь. А щоб надиктувати відповідь, нотатку чи макрос, який ви справді пишете, у Zendesk нативної функції немає; із цим впорається системний інструмент на кшталт Whisper за допомогою гарячої клавіші.
Більшість агентів, які це шукають, хочуть однієї речі: перестати вкотре — сорокового разу за день — друкувати ту саму відповідь і просто сказати її вголос. Розрив між мовленням і набором тексту цілком реальний: більшість людей говорять близько 150 слів за хвилину, а друкують під тиском черги хіба що третину цього — і саме в цьому весь сенс диктування. Тож пошук логічний. Плутанина в тому, що насправді роблять голосові функції Zendesk: вони звучать як диктування, але ним не є. Я витратив добрих двадцять хвилин у документації Zendesk, переконуючи себе, що пропустив перемикач диктування для агента. Не пропустив. Його там немає. Дайте я проведу межу чітко, а потім покажу частину, яка справді працює.
Ось коротка версія. Голосові інструменти Zendesk живуть на телефонному каналі. Вони слухають клієнта. А те, що ви собі уявляєте — ви говорите, і ваші слова з’являються в полі відповіді — це інша категорія, і живе вона на рівні операційної системи, а не всередині Zendesk. Щойно ви побачите цей поділ, уся плутанина зникне.
Натисніть гарячу клавішу, говоріть — і відповідь надрукується сама
Уся механіка — це одна клавіша. Ви утримуєте глобальну гарячу клавішу, говорите, відпускаєте — і текст з’являється там, де стоїть курсор: у публічній відповіді, у внутрішній нотатці, у тілі макроса, у статті Guide. У Windows за замовчуванням це Ctrl+Space; у macOS — Command+Option, утримувані як push-to-talk. Жодного меню, жодного завантаження, жодного «натисніть запис». Та сама клавіша працює і в Zendesk Agent Workspace, і в кожній іншій програмі, до якої ви перемикаєтеся між тикетами — Slack, Teams, Gmail, Notion.
Ця остання деталь важить більше, ніж здається. Whisper — це нативна десктопна програма для Windows і macOS, а не розширення браузера. Тож коли ви перемикаєтеся зі вкладки Zendesk, щоб написати інженерам у Slack про баг, та сама гаряча клавіша все одно працює. Розширення браузера зупиняється на межі вкладки. Саме завдяки цьому охопленню на рівні ОС трюк працює і у вашій CRM — агенти так само використовують його для голосу в текст у Salesforce і диктування в HubSpot.
Zendesk Talk розшифровує дзвінок. Він не друкує вашу відповідь.

Саме тут усі спотикаються, тож скажу прямо. Згідно з офіційним FAQ Zendesk про розшифровку дзвінків, Talk бере записаний телефонний дзвінок між клієнтом і агентом і після завершення дзвінка додає розшифровку та підсумок до журналу розмови в тикеті як внутрішні нотатки. Розшифровуються лише записані дзвінки. Zendesk також розшифровує аудіо голосових повідомлень, і це коштує приблизно цент за хвилину.
Усе це — голосовий канал. Він розшифровує дзвінок, на якому клієнт. Він справді корисний: якщо вам потрібен письмовий запис усної розмови, прикріплений до тикета, це саме робота Zendesk, і вам варто нею користуватися.
Чим він не є, так це диктуванням для агента. Жодна з цих функцій не дає вам наговорити вашу друковану відповідь у редактор. Нудна правда в тому, що в Zendesk немає нативної функції для цього. Працівник Zendesk підтвердив це на офіційному форумі спільноти компанії: розшифровка голосу в реальному часі була лише в планах і зсунулася з початку 2024 року на пізніший квартал, та й той пункт стосувався каналу дзвінків, а не диктування для агента. Окрема гілка із запитом на набір тексту голосом залишилася без відповіді. Обхідний шлях, який запропонував співробітник прямо в гілці, — увімкнути живі субтитри в Chrome, і це показує, наскільки далеко це від справжньої функції. Коли офіційна відповідь на «чи можу я диктувати свої відповіді» — це «а ви пробували меню доступності браузера», чесна відповідь — ні.
Що Zendesk насправді має для голосу, а чого не має
Три речі обіцяють три різні результати, але існують лише дві з них. Ось чесна карта:
- Записані дзвінки — Zendesk розшифровує їх і підшиває розшифровку до журналу тикета.
- Аудіо голосових повідомлень — Zendesk розшифровує і їх, живлячи сортування та підсумки.
- Ваша друкована відповідь, надиктована голосом — цього Zendesk не робить узагалі.
Тож якщо ви прийшли сюди з надією проговорити чергу до кінця, голосові функції Zendesk вас туди не приведуть. Вони побудовані навколо аудіо клієнта, а не вашої клавіатури. Whisper займає саме цю прогалину — це інструмент диктування на рівні операційної системи, тож він працює всередині редактора Agent Workspace так само, як набір тексту, бо для браузера це просто текст, що з’являється біля курсора.
Як надиктувати відповідь, нотатку чи макрос у тикет Zendesk
Налаштування коротке. Ось воно повністю, від початку до кінця.
- Встановіть Whisper для Windows або macOS і увійдіть. Уся локальна обробка безкоштовна для авторизованих користувачів, без картки під час реєстрації.
- Виберіть модель і дайте їй завантажитися. Одноразове завантаження триває від приблизно 140 МБ до 3 ГБ, залежно від обраної моделі. Після цього розшифровці не потрібен інтернет.
- Відкрийте тикет в Agent Workspace і клацніть у потрібне поле — публічну відповідь, внутрішню нотатку чи тіло макроса, який редагуєте.
- Утримуйте гарячу клавішу й говоріть. Ctrl+Space у Windows, Command+Option у macOS. (Якщо ви налаштовуєте це на ПК, покрокове керівництво з голосу в текст для Windows детальніше розповідає про гарячу клавішу.) Скажіть відповідь так, як сказали б її клієнтові в обличчя.
- Відпустіть клавішу. Текст з’явиться біля курсора в активному полі. Прочитайте, виправте що треба, надішліть.
Накладка запису вище показує те, що ви побачите, поки говорите — невеликий живий індикатор, нічого, що захопить ваш екран. Уперше, коли відповідь просто з’являється в редакторі, це відчувається трохи незаконним. Це відчуття зникає десь на п’ятому тикеті. А ось те, що минає судома в руці, не повертається.
Уся програма, наживо
Це справжня десктопна програма, вбудована вище — не скриншот, а сама річ. Поклацайте її. Налаштування, список моделей, конфігурація гарячої клавіші — усе тут. Що бачите — те й встановлюється.
Автоматично прибирайте у надиктованому тексті
В усному мовленні трапляються випадкові «е-е» й речення зливаються одне з одним. Whisper може зробити необов’язковий прохід AI-очищення сирої розшифровки — пунктуація, регістр і легке причісування тону — перш ніж вставити текст. У безкоштовному локальному режимі це очищення працює на вашій машині через Ollama; із Whisper Pro воно працює через ваш власний ключ OpenAI. Для публічної відповіді, яку читатиме керівник QA, цей прохід — різниця між «усними нотатками» і «відповіддю, яка пройде перевірку».
Він підтримує понад 90 мов в обох режимах, і це важливо, якщо ваша черга тикетів до обіду стрибає між англійською, іспанською та німецькою — приблизно стільки ж мов, скількома моя семирічна дитина торгується за час укладання спати. Лінійка мультимовних моделей охоплює зокрема 99+ мов; варіанти лише для англійської покривають саму англійську.
Чому локальність і офлайн важать, коли ви працюєте з даними клієнтів

Ось єдина думка, на яку я витрачуся в цій статті: диктування, яке працює лише в хмарі, без офлайн-варіанта, — це катастрофа для приватності, коли ви агент підтримки. Ви зачитуєте лист клієнта, його замовлення, інколи його домашню адресу чи спір щодо платежу карткою. Із хмарним інструментом усе це робить гак через сервери третьої сторони — без жодної причини, окрім того, що ви хотіли говорити, а не друкувати. Інструмент, який може запустити все це на вашій власній машині, не просить вас іти на такий обмін.
Локальний режим Whisper працює повністю офлайн. Аудіо ніколи не покидає вашу машину; єдиний раз, коли воно торкається мережі, — одноразове завантаження моделі. Персональні дані клієнта, які ви наговорюєте у відповідь, лишаються на пристрої. Розширення браузера й хмарні інструменти диктування, що домінують у цьому пошуку, цього сказати не можуть — вони відправляють ваше аудіо назовні для розшифровки. Якщо ваша служба підтримки працює з регульованими даними, «аудіо ніколи не покидало ноутбук» — це фраза, яку ваша команда безпеки захоче почути.
Чого він не зробить (чесні межі)
Жоден інструмент не заслуговує на ідеальну оцінку, тож ось де Whisper зупиняється.
Він вставляє в одне активне поле за раз. Він не заповнить цілу багатопольну форму тикета й не вирішить, до якого поля належать ваші слова — вони підуть туди, де стоїть курсор. Це означає, що перед тим, як говорити, треба пам’ятати про різницю між публічною відповіддю і внутрішньою нотаткою. Надиктуйте не в те поле — і можете злити внутрішню нотатку просто клієнту. Курсор робить рівно те, на що ви його навели, а це або функція, або зізнання — залежно від того, куди ви навели. Спершу клацніть, потім говоріть.
Він вставляє текст, а не форматування. Він не натисне кнопку напівжирного в редакторі й не побудує маркований список голосом — він друкує слова в CKEditor, так само як це робила б ваша клавіатура. І, як кожен інструмент диктування, він найслабший на рядках, що не є словами: ідентифікатори акаунтів, номери замовлень, коди SKU, коди помилок. Я бачив, як він перетворив «тикет ZD тире чотири чотири нуль два» на щось із зайвою четвіркою — а це саме та деталь, яку клієнт помічає. Він розшифровує те, що ви кажете, але будь-який код перевіряйте очима перед надсиланням.
Коли пропустити Whisper і взяти щось інше

Я б радше, аби ви скористалися правильним інструментом, ніж нашим. Якщо вам потрібен письмовий запис усної розмови, прикріплений до тикета, це розшифровка дзвінків Zendesk Talk — це робота Zendesk, а не Whisper, і вона вже вбудована у ваш телефонний канал. Не тягніться до програми диктування, щоб розв’язати задачу логування дзвінків.
Якщо ви хочете лише іноді надиктувати відповідь і не бажаєте нічого встановлювати, ваша операційна система вже постачає безкоштовний варіант. У Windows є Голосовий набір на Win+H; у macOS є вбудоване Dictation. Обидва працюють у всій системі, зокрема й у редакторі Zendesk. Вони працюють лише на одній платформі, за замовчуванням покладаються на хмару й дають менше контролю — але для агента на одній машині, який диктує двічі на день, безкоштовно й уже встановлено — це справедливий обмін.
Тягніться до Whisper, коли хочете щодня розгрібати чергу голосом, хочете офлайн, аби дані клієнтів лишалися на місці, хочете одну гарячу клавішу для Zendesk і сторонніх програм, у яких живете, і хочете це безкоштовно, без картки. Whisper безкоштовний для локальної обробки під час реєстрації; хмарна поверхня Pro додає 7-денний пробний період. Актуальні цифри живуть на сторінці цін.
Zendesk слухає дзвінок клієнта. Він ніколи не створювався, щоб друкувати вашу половину розмови. Ця друга задача — ви говорите, ваші слова з’являються в полі відповіді — і є тією, що перетворює день на 200 тикетів на щось, що пробачать ваші зап’ястки. Клацніть поле, утримайте клавішу, говоріть. Завантажте Whisper і розберіться з одним тикетом голосом. Якщо ваші руки не подякують вам до обіду — повертайтеся до набору тексту.
Розберіться з наступним тикетом голосом
Клацніть поле, утримайте клавішу, говоріть, відпустіть. Відповідь з’явиться біля курсора — у Zendesk Agent Workspace і в кожній сторонній програмі, у якій ви живете.
Безкоштовний локальний режим для будь-якого авторизованого акаунта. Картка для старту не потрібна.



