Інструкція
Голос у текст у Figma без плагіна
У Figma немає вбудованого диктування, а її єдина аудіофункція — це жива голосова розмова між співавторами, а не транскрипція. Щоб ваші слова потрапили на полотно, ви встановлюєте плагін зі спільноти або запускаєте загальносистемну гарячу клавішу, яка набирає текст у будь-якому активному полі — включно з Figma.
Останнє оновлення: червень 2026

Голос у текст у Figma — це не вбудована функція. У Figma немає власного диктування, а її єдина аудіофункція — це жива голосова розмова між співавторами, що не є транскрипцією. Щоб надиктувати коментар, анотацію чи текстовий шар у Figma, дизайнери або встановлюють плагін зі спільноти, або запускають загальносистемну гарячу клавішу диктування, яка набирає текст у будь-якому активному полі.
Я бачив, як дизайнерка витратила чотири хвилини, набираючи ті самі два речення в коментар Figma — двічі, бо автовиправлення перетворило «padding» на «pudding». Вона робить це десятки разів на день. Коментарі, анотації-розмітки, нотатки для передачі — нічого з цього не є дизайнерською роботою, але все це — набір тексту. Найшвидші люди, яких я знаю у Figma, тихцем перестали робити це руками.
Ось частина, яка спершу всіх збиває з пантелику: у Figma справді є «аудіо»-функція, і вона не має до цього жодного стосунку. Аудіо у Figma — це жива голосова розмова: ви з колегами говорите в реальному часі, поки разом колупаєте той самий кадр. Це телефонна розмова всередині дизайн-файлу. Вона не перетворює ваші слова на текст. Тож коли хтось каже: «Хіба Figma вже не вміє голос?» — так, але не той, що треба. Нудна правда в тому, що диктування — те саме, що ставить слова на полотно, — у продукті взагалі відсутнє.
Figma не вміє голос у текст. Ось що вона дійсно вміє.

У Figma немає власного голосу в текст. Люди постійно про це просять — на форумі Figma є відкриті запити на функції, як-от «Voice input to comment» та «Add voice to text prompting to Figma Make», що є ввічливим інтернет-способом підтвердити: функції не існує.
Що в Figma справді є, так це аудіочат, і він по-справжньому корисний — просто для іншої задачі. Він дозволяє співавторам говорити вголос усередині файлу чи дошки FigJam, на десктопі та у браузері, замість того щоб переходити в окремий дзвінок. Це голосовий чат. Це не мовлення в текст. Ніщо зі сказаного вами в аудіо Figma ніколи не потрапляє в поле коментаря чи текстовий шар.
Тож у вас є два чесні шляхи до справжнього диктування у Figma. Шлях перший: плагін зі спільноти, який живе всередині Figma. Шлях другий: загальносистемний інструмент диктування, що набирає текст у будь-якому активному полі на вашому комп'ютері, включно з Figma. Далі — про обидва, зокрема про те, коли який є правильним вибором.
Шлях плагіна: «Voice to Text for Figma» та подібні
Для цього є реальні плагіни. «Voice to Text for Figma» — це плагін зі спільноти, де ви відкриваєте голосовий інструмент, говорите, і транскрипт потрапляє у вибраний текстовий шар. «Hey Figma Speech Recognition» робить щось подібне. Вони працюють. Я хочу бути чесним щодо цього, перш ніж пояснити, чому вони здаються незграбними.
Ось пастка, і вона структурна, а не баг. Плагіни Figma не мають доступу до вашого мікрофона. Тож, щоб почути вас, ці плагіни відкривають окреме вікно браузера, розпізнають вашу мову за допомогою вбудованого Web Speech API браузера, а потім надсилають текст назад у Figma через з'єднання WebSocket. Щоб надиктувати один коментар, ви стрибаєте між вікном Figma, спливаючим вікном браузера, що слухає, і назад. Потрібен сучасний браузер, і потрібно, щоб ви взагалі були в браузері.
Для коментаря з п'яти слів — нормально. Для цілого дня нотаток на передачу жонглювання вікнами швидко набридає. До того ж окремого плагіна диктування саме для FigJam немає взагалі.
Швидший шлях: загальносистемна гаряча клавіша, що набирає текст у Figma
Whisper обирає інший шлях. Це десктопний застосунок для Windows і macOS, не плагін і не браузерне розширення. Він використовує одну загальносистемну гарячу клавішу: затисніть Ctrl+Space на Windows або Command+Option на macOS, говоріть і відпустіть. Текст з'являється там, де вже стоїть ваш курсор.
Ота частина «де б не стояв ваш курсор» — це і є весь фокус. Оскільки Whisper набирає текст на рівні операційної системи, йому байдуже, що поле належить Figma. Поставте курсор у поле коментаря Figma й надиктуйте коментар. Клацніть у вибраний текстовий шар і надиктуйте текст. Зайдіть в анотацію-розмітку чи нотатку для передачі розробнику й надиктуйте специфікацію. Жодного плагіна для встановлення, жодного спливаючого вікна браузера, жодного WebSocket. Це працює і в десктопному застосунку Figma, і у Figma, запущеній у вкладці браузера, бо на рівні ОС обидва — це просто «застосунок із текстовим полем, що має фокус».
І та сама гаряча клавіша працює всюди. Ви диктуєте коментар у Figma, потім Cmd-Tab у Slack і диктуєте повідомлення розробнику, потім у пошту — та сама клавіша, та сама м'язова пам'ять, кожен застосунок.
Це справжній застосунок Whisper вище, а не скриншот — поклацайте по ньому. Ви обираєте, де виконується транскрипція, задаєте гарячу клавішу — і це майже все налаштування. Жодного сюрпризу у формі Figma: це один застосунок, одна клавіша, а Figma — лише один із застосунків, у який він набирає текст.
Що можна надиктувати у Figma (і що — ні)
Ви можете диктувати скрізь, де Figma дає вам текстовий курсор. Коментарі та відгуки до дизайну. Анотації-розмітки. Нотатки для передачі розробнику. Власне текст усередині текстового шару — основний текст, написи на кнопках, той мікротекст, який ви переписуєте одинадцять разів. Стикери FigJam теж: у FigJam немає власного диктування й немає окремого голосового плагіна, але стикер — це звичайнісіньке активне текстове поле, тож загальносистемна гаряча клавіша набирає в нього текст, як і в будь-яке інше. Провести воркшоп і фіксувати ідеї швидше, ніж люди встигають їх вимовляти, — це єдиний момент, коли я бачив, як дизайнери справді переганяють кімнату. Якщо ви живете у дошках більше, ніж у дизайн-файлах, та сама ідея переноситься й на диктування в дошки Miro.
Тепер чесна частина, виділена жирним, бо інструменти в цій сфері люблять натякати на інше. Whisper диктує в поле, яке має фокус. Він не керує Figma. Він не намалює кадр, не пересуне шар, не перейменує компонент, не змінить розмір нічого й не створить об'єкти голосом. Він набирає слова там, де стоїть ваш курсор — по одному полю за раз — і це вся його робота. Whisper замінює набір тексту, а не дизайн. (Якщо вам потрібен інструмент, який зсуває шар на 2px ліворуч, коли ви кажете «зсунь на 2px ліворуч», — це інший і значно сміливіший продукт, ніж мій.) До речі, та сама обмеженість одним полем є й у плагінів, і у власного диктування вашої операційної системи — ніхто в цій категорії не керує всім редактором.
Локально, офлайн і вичищено
У сирому диктуванні є словесний баласт. «Е-е», «той, ну, той інтервал», момент, коли ви виправляєте себе посеред речення. Whisper може запустити необов'язковий ШІ-прохід очищення після транскрипції, який підрізає баласт і виправляє очевидні огріхи, лишаючи вам щось, що ви справді вставили б у нотатку для передачі. Очищення виконується локально на вашій машині у безкоштовному режимі або через хмару, якщо ви ввімкнете функції Pro й додасте власний ключ. Воно по-справжньому зручне для словника дизайн-системи — назв компонентів, назв токенів, слів, які звичайне автовиправлення перекручує в щось ніякове. Whisper також працює з понад 90 мовами в локальному й хмарному режимах, тож команда, що пише UI-текст німецькою й переглядає його англійською, не перемикається між інструментами.

Локальний режим працює повністю офлайн. Жодного інтернету під час транскрипції, і ваше аудіо ніколи не залишає машину — єдиний раз, коли потрібне з'єднання, — це одноразове завантаження моделі, десь від приблизно 140 МБ до 3 ГБ залежно від того, яку модель ви оберете. Після цього мережу можна вимкнути, а диктування все одно працює — у поїзді, у літаку, в офісі, що блокує половину інтернету.
Між нами, це та частина, на якій я не йшов би на компроміс. Лише хмарне диктування — це катастрофа приватності, що тільки й чекає, щоб бути транскрибованою. Анотація, яку ви диктуєте, може описувати невипущений продукт, екран цін, схему безпеки — це саме те, що не повинно проходити крізь логи постачальника лише тому, що вам захотілося не набирати текст. Шлях плагіна залежить від мовного рушія браузера й окремого вікна; локальне диктування тримає аудіо на тому єдиному пристрої, у якого вже є мікрофон і цілком хороший процесор. Якщо ви маєте справу з чимось чутливим, ця різниця перестає бути просто приємним доповненням.
Коли плагін Figma чи диктування ОС має більше сенсу

Я не встановлював би Whisper для всіх. Якщо ви лише зрідка диктуєте випадковий коментар із п'яти слів і живете цілком усередині Figma у вкладці браузера, безкоштовний плагін зі спільноти на кшталт «Voice to Text for Figma» впорається — відкрили голосовий інструмент, поговорили, готово. Без завантаження.
А може, вам взагалі нічого з цього не потрібно. У Windows вбудоване безкоштовне диктування — натисніть Win+H і говоріть у більшість активних полів, включно з Figma. У macOS є Диктування в налаштуваннях клавіатури. Обидва безкоштовні, жодне не потребує встановлення, і для коротких сесій вони цілком годяться. Тягніться по десктопний застосунок диктування на кшталт Whisper, коли хочете три речі, яких безкоштовні варіанти не зовсім дають: щоб воно працювало офлайн, а аудіо лишалося на вашій машині; одну гарячу клавішу для кожного застосунку, а не лише для Figma; і ШІ-очищення технічного словника дизайн-системи. Якщо жодне з цього вам не важливе, зекономте місце на диску — ваш трекпад протягне ще рік.
Willow — ще один загальносистемний інструмент диктування, націлений на той самий робочий процес у Figma: гаряча клавіша в будь-якому текстовому полі, без плагіна — тож категорія не зводиться лише до нас. Чесний краєвид такий: плагіни для прив'язаного до браузера швидкого диктування, ваша ОС для коротких безкоштовних сесій і десктопний застосунок диктування, коли ви хочете, щоб воно було всюди й офлайн.
Налаштування: три кроки, без плагіна Figma
Ви не торкаєтеся меню плагінів Figma заради цього. Уся суть у тому, що інструмент диктування живе поза Figma.
- Завантажте та встановіть Whisper на Windows чи macOS, потім увійдіть. Локальний конвеєр безкоштовний, без картки при реєстрації; функції Cloud — це платна частина Pro.
- Підтвердьте свою гарячу клавішу. За замовчуванням це Ctrl+Space на Windows і Command+Option на macOS — змініть її в налаштуваннях, якщо вона конфліктує з тим, чим ви вже користуєтесь.
- Відкрийте Figma, клацніть у будь-яке текстове поле — коментар, шар, стикер — затисніть гарячу клавішу, говоріть, відпустіть. Слова з'являться під курсором.
Ось і все. Жодного схвалення плагіна, жодного спливаючого вікна браузера, жодного налаштування під кожен застосунок. Уперше, коли я це демонстрував, я за звичкою все одно інстинктивно потягнувся до меню плагінів Figma, а потім згадав, що встановлювати нічого. Якщо ви коли-небудь хотіли набирати текст швидше голосом у всіх своїх застосунках, то випадок із Figma — лише одна зупинка на цьому шляху. Те саме налаштування люди використовують, щоб диктувати в ClickUp та більшості інших інструментів.
Моя семирічна донька розібралася з гарячою клавішею раніше, ніж зрозуміла, який із застосунків — це Figma. Вона затиснула клавішу, наговорила стикер про дракона й відпустила — і слова просто були там: без меню, без плагіна, без жодного уявлення, що все це мало бути складним. Ось де планка. Якщо дитина може надиктувати дракона в стикер, не читаючи інструкції, то дизайнер може надиктувати нотатку для передачі між ковтками кави. Руки й так ніколи не були сенсом цієї роботи. Той самий підхід працює і для голосу в текст на Mac у решті ваших застосунків.
Готові перестати набирати коментарі руками?
Завантажте Whisper, клацніть у будь-яке поле Figma, затисніть гарячу клавішу й дивіться, як з'являється транскрипт — без плагіна, без спливаючого вікна браузера.
Безкоштовний локальний режим для будь-якого облікового запису з входом. Картка для старту не потрібна.



