Автор: Денис Медведєв

Посібник

Whisper для Mac

«Whisper для Mac» означає одну з двох речей. Або це відкрита модель OpenAI Whisper, яка працює на Mac через Python і командний рядок, або це застосунок для Mac, що використовує Whisper під капотом. Більшості людей потрібен саме другий варіант. Просто вони ще цього не знають.

Останнє оновлення: червень 2026

MacBook і мікрофон на столі — образ голосового диктування Whisper на Mac

Whisper для Mac — це дві різні речі під однією назвою. Сама модель відкрита й безкоштовна, але офіційний спосіб її запустити потребує Python і командного рядка, до того ж вона транскрибує файли, а не вашу живу мову. Якщо ви хочете натиснути гарячу клавішу й одразу побачити свої слова в будь-якому застосунку Mac, вам потрібен застосунок для диктування, як-от Whisper by Remskill, у якого весь локальний конвеєр безкоштовний для кожного авторизованого користувача.

Whisper — це модель, а не застосунок для Mac

Дозвольте розставити крапки над «і» в назві, бо в результатах пошуку все злилося докупи.

Whisper — це відкрита модель перетворення мовлення на текст від OpenAI, випущена під ліцензією MIT. Модель безкоштовна. Код безкоштовний. Ви можете завантажити ваги й запустити їх на власній машині, без жодного облікового запису. Ось ця частина справді є «Whisper для Mac» у буквальному сенсі.

Заковика в тому, як саме ви її запускаєте. Офіційний OpenAI Whisper — це інструмент для Python і командного рядка. Ви встановлюєте його через pip, вам також потрібен інструмент командного рядка ffmpeg, а потім ви вказуєте йому на аудіофайл. Він транскрибує записи: audio.mp3, audio.wav, щось у цьому дусі. Він не вписує вашу живу мову в Mail чи Slack. Він перетворює на текст файл, який у вас уже є.

Існує шість розмірів моделі (tiny, base, small, medium, large і turbo), чотири з них мають варіанти лише для англійської, які жертвують точністю заради швидкості. Whisper багатомовний і може перекладати мовлення англійською одним прапорцем. Хороша модель. Нудна правда в тому, що сама модель ніколи не була складною частиною. Складно вписати її в те, як ви реально працюєте на Mac.

Інструменти для Mac, що обгортають Whisper, і для чого кожен із них

Більшість людей, які шукають «Whisper для Mac», не хочуть мати справу з pip. Їм потрібен застосунок. Є кілька хороших, і вони не взаємозамінні. Вони діляться на два табори.

Табір перший: транскрибувати файли

whisper.cpp — це простий порт Whisper на C/C++ під ліцензією MIT, і він почувається як удома на Apple Silicon, оптимізований під ARM NEON, фреймворк Accelerate, Metal і Core ML. Він працює лише на CPU, ви збираєте його з вихідного коду й керуєте ним з командного рядка. Якщо вам комфортно в терміналі й потрібна сира, швидка, локальна транскрипція файлів — він чудовий. MacWhisper дає вам графічну версію тієї ж ідеї. Він транскрибує аудіо- та відеофайли прямо на пристрої за допомогою OpenAI Whisper і NVIDIA Parakeet, без жодних даних, що залишають вашу машину, плюс має функцію диктування на рівні всієї системи. Якщо ваша робота — перетворювати записи на транскрипти, це правильний табір.

Табір другий: вписувати вашу живу мову

Це диктування. Ви натискаєте гарячу клавішу, говорите — і текст з’являється під вашим курсором у тому застосунку, що активний. Тут живе VoiceInk. Він відкритий під GPL-3.0, запускає локальні моделі на Apple Neural Engine, зокрема Parakeet v3, і вставляє текст під курсором за допомогою комбінації «натисни й говори». Він потребує Apple Silicon і macOS 14.4 або новішої. superwhisper теж тут — з живим диктуванням плюс транскрипцією файлів, локально чи в хмарі, на Mac, Windows та iOS.

Whisper by Remskill, застосунок, який роблю я, належить до другого табору. Диктування понад усе. Варто розуміти, у якому ви таборі, перш ніж щось завантажувати.

Що Whisper by Remskill робить на Mac

Я опишу те, що збудував, а далі ви зможете порівняти його з рештою.

Whisper
Живий застосунок Whisper by Remskill — бічна панель, панель транскрипції та картки з AI-інструкціями. Це справжній інтерфейс, а не скриншот.

Це застосунок для диктування. Ви натискаєте гарячу клавішу, говорите — і текст лягає під курсором у будь-якому застосунку: Mail, Notes, Slack, ваш редактор коду, поле, де ви заповнюєте цьогорічний дозвіл для школи. Гаряча клавіша за замовчуванням на Mac — це Command і Option, затиснуті разом, і її можна повністю перепризначити. Уся транскрипція відбувається на вашому Mac. Жодного файлу для завантаження, жодного запису, яким треба керувати.

І ви не запускаєте Python. Жодного pip, жодного ffmpeg, жодного терміналу, жодного GPU. Усе це — чистий Rust. Двигуни Whisper і Parakeet працюють через бібліотеку під назвою transcribe-rs, без жодного вбудованого Python-сайдкара. Локальна транскрипція працює на вашому CPU, без потреби в окремому GPU, а сам застосунок займає близько 25 МБ на диску.

Щодо самої моделі — вибирати вам. Локальний Whisper дає вам 8 моделей, 99 мов, переклад англійською, власний словник, контроль розміру променя (beam-size) і зміщення за ключовими словами. Повільніше, зате найбільше контролю. Parakeet — це двигун NVIDIA TDT, близько 600 МБ, і він працює в 5–10 разів швидше за Whisper на CPU, охоплює англійську плюс ще 24 європейські мови, без перекладу англійською. Хмарний режим — це третій шлях: ви приносите власний ключ OpenAI, а ми не беремо собі ні копійки. Я свідомо не вибираю за вас. Ми розкладаємо відмінності по поличках у статті Whisper проти Parakeet, якщо хочете довгу версію.

Локальна точність зазвичай тримається в межах від 95% до 99%. Увесь локальний конвеєр безкоштовний для кожного авторизованого користувача: Whisper, Parakeet, офлайн-очищення тексту через Ollama, історія транскрипцій, пресети, ключові слова, апаратне прискорення, завантаження моделей і власна гаряча клавіша. Жодного способу оплати під час реєстрації. Ви можете користуватися ним на 3 пристроях. Платний тариф, Whisper Pro, лише додає хмарну поверхню: хмарну транскрипцію OpenAI, хмарне AI-очищення та вебпошук. Ціни живуть на сторінці цін. Я не наводжу тут чисел, бо сторінки цін змінюються, і вам варто читати їх прямо з першоджерела.

Одне чесне обмеження: наша збірка для Mac працює лише на Apple Silicon, від M1 до M4. Якщо у вас Intel Mac, цей застосунок не для вас — і за хвилину я підкажу, що вам підійде.

Ось як насправді виглядає ваше перше диктування. Натискаєте гарячу клавішу, з’являється невеликий індикатор запису, ви говорите, відпускаєте — і вичищений текст падає туди, де стояв ваш курсор. Накладка нижче — це справжнє, що показує застосунок, а не макет.

Pasted
Реальна накладка «готово» після диктування — справжній інтерфейс застосунку в момент, коли повністю локальне диктування завершується.

Налаштування коротке. Завантажте застосунок, увійдіть, дайте йому підтягнути одну модель. Parakeet — найменша, близько 600 МБ, або модель Whisper, якщо вам потрібні мови чи переклад. Виберіть гарячу клавішу або залиште Command і Option. Тоді відкрийте Mail, затисніть гарячу клавішу й скажіть речення. Це й увесь онбординг. Моя молодша донька впоралася без жодного уточнювального запитання до мене — а це єдиний тест на зручність, якому я повністю довіряю. Якщо вам потрібен довший покроковий розбір зі скриншотами й усіма трьома шляхами моделей, я написав окремий посібник: голос у текст на Mac.

Чому я тримаю все локально на Mac

Ось моя одна тверда думка для цієї статті: диктування лише через хмару — це катастрофа для приватності.

Таблиця із зарплатою вашого керівника, лист до школи вашої дитини, юридична записка, яку ви чернетите в потязі. Нічого з цього не має проходити через сервери постачальника лише тому, що вам захотілося набирати текст голосом. У вашому Mac уже є мікрофон і CPU. Для одного абзацу диктування йому не потрібен сервер у ланцюжку. З локальними двигунами аудіо ніколи не залишає вашу машину. Це той варіант за замовчуванням, до якого я б тягнувся, — і він безкоштовний.

Хмарний режим існує на той випадок, коли вам справді потрібні найновіші моделі OpenAI або відповіді з вебу — на вашому власному ключі. Це запасний вихід, а не парадні двері.

Коли MacWhisper, VoiceInk або CLI — кращий вибір

Я був би поганим провідником, якби вдавав, що один застосунок виграє в кожному випадку. Це не так. Ось де я б скерував вас деінде.

Ви здебільшого транскрибуєте записи

Якщо ваш день — це згодовування епізодів подкастів, записів інтерв’ю чи зустрічей у транскрипт, вам потрібен інструмент для транскрипції файлів, а не застосунок для диктування. MacWhisper зроблений саме для цього: перетягуєте файл, отримуєте текст, прямо на пристрої. Користуйтеся ним. Ми не робимо завантаження файлів. Ми вписуємо вашу живу мову.

Вам потрібне сире, скриптоване, безкоштовне — і ви живете в терміналі

Тоді whisper.cpp — це відповідь. Він під ліцензією MIT, оптимізований під Apple Silicon, працює лише на CPU, і ви можете передати його в конвеєр будь-чого. Якщо ви з тих, хто любить збирати з вихідного коду, вам буде там щасливіше, ніж у будь-якому графічному інтерфейсі.

Вам потрібне повністю відкрите диктування, і у вас Apple Silicon

VoiceInk під GPL-3.0, ви можете прочитати чи перевірити кожен рядок, і він вставляє текст під курсором, як і ми. Це надійний безкоштовний варіант. Ми ж — керований застосунок, з обліковими записами, історією, хмарним BYOK і підтримкою Windows, і ми не відкритий код. Тож якщо відкритий код для вас жорстка вимога — це ваше рішення, і VoiceInk тут хороший вибір.

У вас Intel Mac

Наш застосунок не запуститься. Відкритий whisper.cpp можна зібрати й запустити на Intel, а вбудоване Apple Dictation безкоштовне для коротких нотаток. Будь-який із них кращий за очікування на машину з Apple Silicon, яку ви ще не купили.

Якщо ви запам’ятаєте лише одне

Модель безкоштовна й відкрита. Рішення, яке має значення, — це те, що ви навколо неї обгортаєте: термінал, графічний інтерфейс для транскрипції файлів чи гарячу клавішу, що вписує вашу живу мову в те, на що ви дивитеся. Підбирайте обгортку під завдання, а на Mac ігноруйте Python, якщо він вам щиро не до душі. Є три типи людей, що йдуть шукати Whisper на Mac: ті, у кого є тека із записами, ті, хто більше ніколи не хоче набирати текст, і ті, кому просто сподобалася назва. Двоє з них опинилися не в тому таборі — аж поки не дочитали до цього місця.

Більшу частину цієї статті я продиктував, а не набрав, що видалося доречним. Той єдиний абзац, який я набрав руками, мав більше друкарських помилок.

Що почитати далі

Спробуйте на своєму Mac

Завантажте Whisper by Remskill, увійдіть і продиктуйте своє перше речення на Mac. Локальний тариф безкоштовний, а чи знадобиться вам колись хмара — вирішите згодом.

Безкоштовна локальна транскрипція назавжди. Жодного способу оплати під час реєстрації. Лише Apple Silicon.

Фото Denys Medvediev

Denys Medvediev

Я той, хто читає нашу пошту підтримки — найімовірніше, диктуючи відповіді.