Посібник
Голос у текст у Logseq
У Logseq немає вбудованої диктовки на комп'ютері. Рішення — це інструмент, що працює в усій системі: натискаєте гарячу клавішу, говорите, і розшифрований текст вставляється там, де стоїть курсор, у будь-якому блоці Logseq. Диктовка вашої ОС теж згодиться для коротких нотаток.
Останнє оновлення: червень 2026

Голос у текст у Logseq працює через інструмент рівня системи, а не через сам Logseq. У десктопному застосунку Logseq немає вбудованої диктовки. Рішення — інструмент на зразок Whisper: натискаєте гарячу клавішу, говорите, і текст вставляється там, де стоїть курсор, у будь-якому блоці Logseq. Диктовка вашої операційної системи теж згодиться для коротких нотаток.
Я веду щоденник у Logseq, бо більше довіряю папці з простим markdown, ніж будь-якій хмарі. Єдине, чого мені завжди бракувало, — це можливість наговорити блок замість того, щоб його друкувати. Я пішов шукати потрібне налаштування. Налаштування немає. У Logseq немає кнопки мікрофона, і після ретельних пошуків я впевнений, що він її від мене не ховає.
Люди шукають «голос у текст у Logseq», нічого не знаходять у застосунку й вирішують, що проґавили якийсь перемикач. Ні. Цього перемикача ніколи не було. Хороша новина в тому, що рішення займає близько двох хвилин, за бажанням працює повністю офлайн і як бонус діє в кожному іншому застосунку, який ви відкриваєте.
Ось те, про що більшість сторінок навколо цього запиту прямо не скаже. Блок у Logseq — це просто текстове поле, таке саме, як Gmail чи рядок пошуку. Диктовці, що вставляє текст біля курсора, байдуже, у якому застосунку цей курсор стоїть.
Тож справжнє питання не «як увімкнути голосовий набір у Logseq». Перемикача немає. Питання таке: «який інструмент диктовки запустити поверх Logseq», і відповідь залежить від того, чи хочете ви безкоштовне-і-вбудоване, лише-для-Mac, чи одну офлайн гарячу клавішу, що поводиться однаково всюди. Я пройдуся по всьому, налаштую один варіант за дві хвилини й підкажу, коли спеціальний інструмент взагалі не потрібен.
Чи є в Logseq вбудована диктовка?

Ні. У десктопному застосунку Logseq немає вбудованої функції перетворення мовлення на текст, диктовки чи голосового набору для запису в блок голосом. На блоці немає кнопки мікрофона, немає голосової команди, немає прихованого налаштування. Якщо ви перерили Налаштування в його пошуках — можете зупинитися. Його там немає.
Що справді існує — це набір спільнотних плагінів зі словом «whisper» у назві, і саме тут люди заплутуються. Ці плагіни розшифровують аудіофайл або посилання на YouTube у текст постфактум. Вони корисні, але це не жива диктовка. Ви не можете поставити курсор у сьогоднішній запис, заговорити й бачити, як з'являються слова. Вони обробляють запис; вони не друкують за вас, поки ви думаєте. Плутанина між цими двома речами коштує цілого дня, і я волів би, щоб ви цей день пропустили.
Мобільна картина — це окрема історія, варта одного речення, щоб ви не ганялися за нею на не тому пристрої: новіший мобільний застосунок Logseq додав певну голосову розшифровку, але це функція телефона, а на телефоні ви все одно скористаєтеся мікрофоном клавіатури. На десктопному графі, де більшість людей реально живе, вам потрібен інструмент, що працює поверх Logseq. Є три чесні категорії, і решта цього посібника їх розглядає.
Натиснули гарячу клавішу, заговорили — текст з'явився в блоці
Ось і вся механіка, і вона нудна в найкращому сенсі. Ви натискаєте гарячу клавішу, говорите, відпускаєте — і розшифрований текст вставляється там, де стоїть курсор, у тому текстовому полі, що зараз у фокусі. Whisper тримає коротку паузу після того, як ви відпустили клавішу, тож останнє слово не обрізається. Оскільки текст вставляється біля курсора ОС, блок Logseq — це просто «будь-яке текстове поле». Десктопний застосунок чи версія в браузері — поведінка однакова.
Ось ту частину лендинги надто ускладнюють. Немає жодного плагіна, який треба встановлювати в Logseq, немає API-токена для вставляння, немає синхронізації, за якою треба наглядати. Ваш курсор у блоці, ви говорите — слова з'являються в блоці. Поки ви говорите, з'являється невелика капсула, щоб ви знали, що йде запис:
Гаряча клавіша — це та єдина річ, яку варто одразу налаштувати правильно. У Windows це Ctrl+Space; на Mac — Command+Option, режим «натисни-і-говори» лише з модифікаторами, який ви утримуєте під час мовлення. Обидві можна змінити в Налаштуваннях, якщо вони конфліктують із чимось, чим ви вже користуєтеся. (Моя молодша донька якось сказала мені, що гаряча клавіша «не працює» в її програмі для малювання. То був конфлікт, а не баг, — саме так я зрозумів, що пересічна людина гадки не має, що таке конфлікт гарячих клавіш. Тож тепер кожну гарячу клавішу можна налаштувати.) Якщо ви колись налаштовували диктовку у Windows або на Mac, то це та сама м'язова пам'ять, спрямована на інший застосунок.
Налаштування за дві хвилини (Windows чи Mac)
Вам потрібен Mac на Apple Silicon або ПК на Windows 10 чи новішій, робочий мікрофон і відкритий Logseq — у десктопному застосунку чи в браузері. Уся локальна обробка безкоштовна для будь-якого облікового запису з входом, без запиту платіжних даних під час реєстрації. Ось послідовність дій.
Крок 1 — Встановіть Whisper і увійдіть.
Завантажте зі сторінки завантаження, встановіть і створіть безкоштовний обліковий запис. Без картки. Уся локальна обробка розшифровки відкривається одразу.
Ви зрозумієте, що все спрацювало, коли в треї з'явиться іконка застосунку, а майстер налаштування запропонує обрати модель.
Крок 2 — Оберіть спосіб розшифровки.
Застосунок не обирає за вас. Маєте три варіанти: Хмара (OpenAI, зі своїм ключем), локальний Parakeet або локальний Whisper. Для приватних нотаток у щоденнику починайте з локального — детальніше за два розділи нижче.
Ви зрозумієте, що все спрацювало, коли модель завершить завантаження й покажеться як готова.
Крок 3 — Підтвердіть свою гарячу клавішу.
У Windows за замовчуванням Ctrl+Space, на Mac — Command+Option в режимі «натисни-і-говори». На Mac надайте дозвіл Accessibility, коли його запитають; без нього вставляння біля курсора не зможе дістатися інших застосунків.
Ви зрозумієте, що все спрацювало, коли тестовий запис вставиться в будь-яке текстове поле.
Крок 4 — Поставте курсор у блок Logseq і говоріть.
Відкрийте свій граф, клацніть у блок, утримуйте гарячу клавішу, скажіть речення, відпустіть. Розшифрований текст з'явиться там, де стоїть курсор, — у блоці.
Ви зрозумієте, що все спрацювало, коли наговорене речення опиниться текстом у блоці Logseq.
Найповільніша частина — це завантаження моделі, а не налаштування. Усе інше — чотири кроки вище. Щойно все запрацює, фіксація думки у вашому графі перестає бути задачею для друку й стає задачею для мовлення.
Плагін для Logseq проти гарячої клавіші рівня системи
Більшість сторінок у топі за цим запитом скеровують вас на плагін для Logseq або на Blurt — спеціальний інструмент у меню-барі Mac, що говорить прямо у ваш конспект. Це нормальні відповіді, але кожна з однією структурною заковикою. Плагіни в стилі whisper розшифровують аудіофайли, а не живе мовлення в блок, який ви редагуєте. А Blurt, за власним описом, працює лише на macOS — якщо ви на Windows, це взагалі не варіант.
Гаряча клавіша рівня системи обходить обидва обмеження. Вона вставляє текст біля курсора ОС незалежно від того, яке вікно ним володіє, тож та сама клавіша, що заповнює блок Logseq, заповнює і поле написання листа в Gmail, повідомлення в Slack, і повідомлення коміту. Один інструмент, кожне текстове поле, і на Windows, і на Mac. Вам не доводиться нічого вчити заново, коли ви перемикаєте застосунки, і не потрібне інше рішення залежно від ноутбука.
Якщо ви на Mac і записуєте лише всередині Logseq, Blurt — це акуратний, сфокусований вибір, який варто розглянути. Щойно ви на Windows або хочете той самий процес у кожній програмі, яку відкриваєте, перемагає варіант рівня системи. Я б узяв одну гарячу клавішу, бо перемикаю застосунки приблизно сорок разів на годину й не хочу запам'ятовувати сорок різних кнопок диктовки.
Локально чи в хмарі: який режим для приватного графа
Для Logseq спершу спробуйте локальний режим. Багато хто з нас обрав Logseq саме тому, що це локальний за своєю суттю простий текст — конспект зустрічі, недооформлена ідея, запис у щоденнику, який ви нізащо не хотіли б тримати на чиємусь сервері. Дивним був би вибір зберігати нотатки на власному диску, а потім гнати свій голос через хмару, щоб вони туди потрапили. Якщо ваш Mac на Apple Silicon чи ваш ПК з останніх кількох років, локальний режим без проблем впорається з повсякденною диктовкою, а хмара стає запасним виходом, а не варіантом за замовчуванням.
Ось чим відрізняються три способи, бо застосунок змушує вас обирати, а я волів би, щоб ви обрали добре:
- Локальний Parakeet — Рушій TDT від NVIDIA, близько 600 МБ, і найшвидший локальний варіант — у 5–10 разів швидший за Whisper на CPU. Охоплює англійську плюс 24 інші європейські мови, 25 загалом. Без перекладу на англійську. Якщо ви ведете щоденник англійською чи іншою європейською мовою, це швидкий, повністю офлайн вибір.
- Локальний Whisper — повільніший за Parakeet на тій самій машині, але багатомовні збірки охоплюють 99 мов і вміють перекладати на англійську. Збірки лише для англійської — це лише англійська, а не 99 мов. Обирайте цей варіант для китайської, японської, корейської чи будь-якої роботи з перекладом, яку Parakeet не вміє. Стандартна англійська модель — близько 480 МБ.
- Хмара (OpenAI, свій ключ) — найкраща точність і доступ до вебу, з використанням вашого власного ключа OpenAI, оплата за який іде напряму OpenAI. Розшифровка за замовчуванням працює на gpt-4o-mini-transcribe. Потрібен інтернет, тож це єдиний спосіб, що залишає вашу машину. Хмарна частина входить до Whisper Pro.
Нудна правда в тому, що для тих текстів, які більшість людей кладе в Logseq, локального режиму цілком досить. Обидва локальні рушії працюють повністю на вашій машині, нічого не надсилаючи на сервер, — а в цьому й увесь сенс локального за своєю суттю графа. Хмара виправдовує своє місце тоді, коли вам потрібна найвища точність на складному записі або щоб модель витягла факт із вебу посеред речення. Для звички вести щоденник починайте з локального режиму й тягніться до хмари лише тоді, коли локального вам бракує.
Пунктуація, блоки та markdown Logseq голосом
Сира диктовка виходить суцільним потоком. Ви кажете «окей перевір документ з архітектурою познач його project alpha і нагадай мені в четвер», і це той непунктуйований мур, який вам видає будь-який мовний рушій. Очищення цього — там, де способи розходяться.
Голосовий набір Windows додає пунктуацію, поки ви говорите, а Диктовка macOS опрацьовує базову пунктуацію, коли ви кажете «кома» чи «крапка». Для серйознішого очищення — прибрати «емммм», виправити суцільні потоки, перетворити наговорений абзац на щось, що ви справді залишили б у своєму графі, — Whisper може виконати прохід AI. Скажіть фразу активації «Hey whisper», і текст покращується, перш ніж він з'явиться. На локальній моделі це працює через Ollama; у хмарному режимі за замовчуванням це gpt-5-mini.
окей перевір документ з архітектурою познач його project alpha і нагадай мені в четвер еммм перед стендапом
Окей, перевір документ з архітектурою, познач його Project Alpha і нагадай мені в четвер перед стендапом.
Щодо власної структури Logseq — вкладених блоків, посилань #tag і [[page]], маркерів TODO — чесна відповідь така: голос дає вам текст, а власний синтаксис Logseq дає вам структуру. Продиктуйте речення, а потім натисніть Tab для відступу, # для тегу чи [[ для посилання на сторінку — так само, як завжди. Жоден інструмент диктовки не наколдує синтаксис конспекту Logseq на команду; той, хто обіцяє «скажи tag project alpha і дивись, як воно зв'яжеться», продає вам демо, а не звичайний вівторок. Швидко занесіть слова голосом, а блоки сформуйте клавішами, які ви вже знаєте.
Той самий процес «наговори-потім-очисти» добре окупається далеко за межами вашого графа — ви також можете диктувати охайний текст у будь-який застосунок однією гарячою клавішею, тож довгий блок стає кількома наговореними реченнями замість абзацу, який ви друкуєте.
Коли для Logseq можна обійтися без інструмента диктовки

Іноді правильний інструмент — це безкоштовний, який уже є на вашій машині, і вдавати інше було б нечесно. Якщо ви заносите в Logseq лише короткі нотатки — швидкий рядок у щоденнику, нагадування з двох слів — ваша операційна система впорається з цим задарма.
У Windows натисніть клавішу Windows + H, і вбудована панель Голосового набору відкриється там, де стоїть курсор, зокрема й у блоці Logseq. Вона сама розставляє пунктуацію й цілком згодиться для коротких реплік. Заковика: вона ходить через сервери Microsoft і потребує інтернету, тож це не офлайн-варіант, а це важить більше, ніж зазвичай, коли весь сенс вашого графа — залишатися локальним. На Mac Диктовка дозволяє говорити, щоб вводити текст усюди, де можна друкувати; налаштовується в Системних налаштуваннях у розділі Клавіатура, а на Apple Silicon звичайний текст можна обробляти на пристрої. А якщо ви користувач Mac, який живе цілковито всередині Logseq, Blurt — це сфокусований, рідний вибір, створений саме для цього.
Тягніться до спеціального інструмента рівня системи, коли вбудовані рішення починають дошкуляти: довгі нотатки, багатомовна робота, офлайн-приватність у Windows або бажання мати одну гарячу клавішу, що поводиться однаково в Logseq, вашій пошті та вашому редакторі. Нижче цієї планки користуйтеся тим, що безкоштовне. Я не казатиму вам встановлювати застосунок заради нагадування на один рядок.
Той самий компроміс виникає, якщо ви ведете нотатки ще десь — логіка в диктовці в Obsidian ідентична, бо обидва — локальні за своєю суттю markdown-застосунки, де справжня інтеграція — це курсор, а не плагін.
Що почитати далі
Logseq так і не випустив кнопку мікрофона, і після написання цього я майже впевнений, що ніколи й не випустить. Йому це не потрібно, бо інтеграція — це курсор. Наговоріть у блок, отримайте текст, сформуйте його синтаксисом, який ви вже знаєте. Я надиктував більшу частину цього посібника в текстове поле, яке не було Logseq, інструментом, якому байдуже, що це за поле, а потім вставив усе у власний граф. Ось і весь фокус.
Спробуйте у своєму наступному блоці Logseq
Утримуйте гарячу клавішу, говоріть, відпускайте. Розшифрований текст потрапляє в той блок, де стоїть ваш курсор, — і в кожен інший застосунок теж.
Безкоштовний локальний режим для будь-якого облікового запису з входом. Картка для початку не потрібна.



