Автор: Денис Медведєв

Пояснення

Whisper безкоштовний?

Так — Whisper від OpenAI поширюється з відкритим кодом під ліцензією MIT, тому модель можна безкоштовно завантажити й використовувати, навіть у комерційних цілях. Єдина складність — запустити її: налаштування, залежності та власне залізо. Простіший безкоштовний шлях — запускати Whisper локально через десктопний застосунок.

Останнє оновлення: червень 2026

Відкритий замок на клавіатурі ноутбука — символ відкритого коду і безкоштовного програмного забезпечення

Whisper безкоштовний. OpenAI випустив і код, і ваги моделі під дозвільною ліцензією MIT, тож будь-хто може завантажити, запустити й навіть комерційно використовувати цю модель розпізнавання мовлення без жодних витрат. Єдина складність — налаштування: щоб запустити Whisper самостійно, потрібні Python, ffmpeg і власне залізо. Десктопний застосунок позбавляє від цієї складності.

Люди питають «Whisper безкоштовний?» і чекають підступу — бо в 2026 році майже нічого справді хорошого не буває безплатним. Тож відповім одразу, без виправдань: так. OpenAI випустив Whisper під ліцензією MIT — і код, і ваги моделі — що є одним із найдозвільніших варіантів ліцензування. Ви можете завантажити його, запускати, змінювати, вбудовувати у власний продукт, заробляти на ньому гроші — і OpenAI не попросить у вас ані копійки, ані рядка подяк.

Це головне, і це правда. Але є нюанс, який у заголовку не вміщується: «модель безкоштовна» і «використання моделі безкоштовне» — це різні речі. Модель — це файл. Щоб цей файл перетворював слова на текст на вашому екрані, потрібні налаштування, певна витримка в командному рядку та комп'ютер, здатний впоратися з математикою. Нічого прихованого — просто робота, і саме вона є справжньою ціною відкритої версії.

Більшість сторінок, що змагаються за цей запит, плутають дві речі. У розмові фігурують два Whisper. Перший — відкрита модель, яку OpenAI опублікував на GitHub: безкоштовна, під MIT, ваша для запуску. Другий — хмарний API транскрипції від OpenAI, який використовує ту саму родину моделей, але тарифікується за хвилину. Одна назва, дуже різний рахунок.

Тож «Whisper безкоштовний?» має три чесні відповіді. Сама модель: безкоштовна, крапка. Запуск самостійно: безкоштовно в грошах, але платите налаштуванням і власним залізом. Якщо хтось хостить її за вас: це коштує грошей — чи то API OpenAI, чи то хмарний тариф платного застосунку. Цей посібник розглядає всі три варіанти, показує простий безкоштовний шлях і чесно каже про те, що справді не є безкоштовним.

Що таке Whisper насправді

Аудіохвиля на екрані поруч із мікрофоном — мовлення перетворюється на текст

Whisper — це модель перетворення мовлення на текст, яку OpenAI випустив наприкінці 2022 року. Подаєте аудіо — отримуєте текст. І справляється вона з цим добре: навчена на величезному масиві багатомовних записів, вона краще за попередників справляється з акцентами, фоновим шумом і десятками мов. Вона також може перекладати мовлення іншими мовами в англійський текст — те, з чим старі інструменти ніколи не справлялися чисто.

Ключове слово тут — «модель». Whisper — це не застосунок, який запускаєш подвійним кліком. Це мозок: файл навчених ваг плюс код для їх роботи. Сам по собі він не має вікна, кнопки, підключення до мікрофона. Це двигун, а не автомобіль. Чимало продуктів, про які ви чули, — це тихо Whisper із шаром фарби зверху, і це нормально. Але варто знати, що двигун усередині — той самий безкоштовний компонент у кожному з них.

Саме ця відмінність і робить питання заплутаним. Коли хтось каже «Whisper коштує $30 на місяць» — мають на увазі не модель, а якийсь застосунок, що обернув модель і бере гроші за оболонку. Коли кажуть «Whisper безкоштовний» — мають на увазі двигун, який OpenAI роздав безкоштовно. Обидва твердження правдиві одночасно, про різні речі — саме тому ви й шукаєте пряму відповідь.

Так, ліцензія MIT робить його справді безкоштовним

Це не «безкоштовно» в маркетинговому сенсі — де «безкоштовно» означає пробний період, який закінчується, або тариф, що постійно підштовхує до апгрейду. OpenAI випустив код і ваги моделі Whisper під ліцензією MIT. MIT — дозвільна, добре відома відкрита ліцензія: вона дозволяє використовувати, копіювати, змінювати й розповсюджувати програмне забезпечення, зокрема комерційно, фактично з однією умовою — зберігати повідомлення про авторські права. Без плати, роялті, поплатень за місце чи дозволів.

На практиці: ви можете завантажити Whisper для особистого використання, запускати його в бізнесі, вбудувати в продукт на продаж, транскрибувати подкаст для клієнта — все це без виплат OpenAI. Навчені ваги — та дорога частина, яка потребувала великих ресурсів для виробництва, — теж безкоштовні, а не тільки код оболонки. Саме в це важко повірити, бо компанії зазвичай тримають навчені ваги під замком. OpenAI тут так не зробив.

Cancel
Whisper працює локально: оверлей запису з'являється під час мовлення, і жодного лічильника хвилин у фоні.

Одне чесне застереження, щоб ніхто не процитував мене неправильно. «Безкоштовно під MIT» стосується ліцензії, а не обіцянки, що експлуатація нічого не коштує. Електрика не безкоштовна. Комп'ютер не безкоштовний. Ваш час не безкоштовний. Але програмне забезпечення і модель — те, за що компанії зазвичай беруть підписку, — це справді, назавжди, без зірочок безкоштовно. (Те саме «безкоштовно», коли двічі перечитуєш ліцензію, бо впевнений, що щось пропустив. Ні, не пропустили.)

Складність — у самостійному запуску

Ось де безкоштовна версія отримує свій цінник — оплачений часом, а не грошима. Запустити Whisper у сирому вигляді, через відкрите джерело, означає зайти в командний рядок. Стандартна установка — пакет Python, а значить, спочатку потрібно правильно налаштувати Python. Whisper також потребує ffmpeg — окремого аудіоінструменту, встановленого в системному шляху. На деяких машинах знадобиться ще й Rust, щоб зібрати залежність токенізатора. Для розробника — нічого незвичного. Для всіх інших — це ціла половина дня.

Далі — залізо. Whisper виконує серйозні обчислення, і більші, точніші моделі виконують їх дуже багато. На звичайному CPU велика модель може транскрибувати запис довше, ніж він сам триває. Для швидкості потрібна пристойна GPU, якої в більшості ноутбуків немає. Тож справжня вартість безкоштовної версії — не гроші, а Python-середовище, яке треба підтримувати, команда, яку запускаєш вручну для кожного файлу, і достатньо швидкий комп'ютер, щоб не чекати. (Я спостерігав, як не-розробник слідував статті в блозі «Встановлення Whisper за 5 хвилин». П'яти хвилин не вийшло. Пішла субота і дзвінок мені.)

І ще одна річ, якої сира версія не дає: живе диктування. Командний рядок Whisper транскрибує файл, який ви вже записали. Він не чатиться у фоні, не чекає на гарячу клавішу і не вставляє текст до курсора, поки ви говорите. Для цього — саме того, чого більшість людей хочуть, коли шукають відповідь, — потрібна оболонка навколо моделі. Добра новина: найкраща оболонка теж безкоштовна — про це в наступному розділі.

Простий безкоштовний шлях: Whisper у застосунку

Ви можете зберегти всю «безкоштовність» відкритої моделі й уникнути всієї тяганини з самостійним запуском. Саме для цього ми й створили Whisper by Remskill — він запускає ту саму відкриту модель Whisper локально на вашому комп'ютері, без Python, без ffmpeg, без командного рядка. Весь локальний конвеєр безкоштовний для будь-якого авторизованого облікового запису, і платіжну картку при реєстрації ніхто не питає. Ви отримуєте двигун із відкритим кодом без домашнього завдання з відкритого коду. Ось як налаштувати.

Крок 1 — Встановіть застосунок і увійдіть.

Завантажте зі сторінки завантаження, встановіть і створіть безкоштовний обліковий запис. Без картки. Локальний конвеєр транскрипції відкривається одразу — без Python, без ffmpeg, нічого з цього.

Ви дізнаєтеся, що все спрацювало, коли у треї з'явиться іконка і майстер налаштування запропонує вибрати модель.

Крок 2 — Виберіть локальну модель.

Застосунок не вибирає за вас. Для локального режиму є Whisper (8 моделей, 99 мов, переклад до англійської) або Parakeet (швидший, англійська плюс 24 європейські мови). Модель завантажується один раз і повністю працює на вашому комп'ютері.

Ви дізнаєтеся, що все спрацювало, коли модель завершить завантаження і відобразиться як готова.

Крок 3 — Підтвердіть гарячу клавішу.

На Windows за замовчуванням Ctrl+Space, на Mac — Command+Option утримується як push-to-talk. На Mac дайте дозвіл на доступність, коли система запитає, — інакше вставка по курсору не зможе дістатися до інших застосунків.

Ви дізнаєтеся, що все спрацювало, коли тестовий запис вставиться в будь-яке текстове поле.

Крок 4 — Поставте курсор де завгодно і говоріть.

Клікніть у будь-яке текстове поле — електронний лист, документ, рядок пошуку — утримайте гарячу клавішу, скажіть речення, відпустіть. Транскрипція з'являється там, де курсор, — розпізнана Whisper, на вашому комп'ютері, безкоштовно.

Ви дізнаєтеся, що все спрацювало, коли вимовлене речення з'явиться в полі як текст.

Whisper
Справжній десктопний застосунок Whisper by Remskill на екрані налаштувань із відкритими панелями Транскрипція та ШІ.

Найповільніша частина — одноразове завантаження моделі, а не будь-який ритуал налаштування. Після цього та сама відкрита модель, якій колись потрібне було Python-середовище і команда для кожного файлу, просто сидить у треї й вставляє текст при натисканні клавіші. Якщо ви зважуєте варіанти диктування на Windows або Mac — це та версія, де Whisper нарешті відчувається як застосунок, а не як проект.

Локальний Whisper безкоштовний, хмара — платна

Ось де відповідь на «чи безкоштовно» потребує чіткої межі. Запускати Whisper локально — безкоштовно: ваш комп'ютер, ваш CPU, без серверів, без тарифікації за хвилину. Платна частина — хмара: хмарний API транскрипції OpenAI тарифікується за хвилину, і будь-який застосунок на хмарному тарифі перекладає цю вартість на вас. У нашому застосунку весь локальний конвеєр безкоштовний; хмарна поверхня — єдине, що стоїть за Whisper Pro. Ось як насправді відрізняються три шляхи — бо ви можете обрати:

  • Локальний Parakeet — безкоштовноРушій NVIDIA TDT, близько 600 МБ, і найшвидший локальний варіант — у 5–10 разів швидший за Whisper на CPU. Підтримує англійську плюс 24 інші європейські мови — 25 загалом. Без перекладу до англійської. Якщо ви переважно говорите англійською й хочете швидкості на скромному залізі — це швидкий, повністю офлайновий, безкоштовний вибір.
  • Локальний Whisper — безкоштовносправжня відкрита модель Whisper, яка працює на вашому комп'ютері безкоштовно. Багатомовні збірки підтримують 99 мов і можуть перекладати до англійської; збірки лише для англійської — тільки англійська. Повільніший за Parakeet на тому ж залізі, але правильний вибір для китайської, японської, корейської або будь-якої перекладацької роботи. Модель англійської за замовчуванням важить близько 480 МБ.
  • Хмара (OpenAI, BYOK) — платно за хвилинунайвища точність і живий доступ до мережі — використовує ваш власний ключ OpenAI, що тарифікується напряму OpenAI; транскрипція за замовчуванням через gpt-4o-mini-transcribe. Це та частина, яка коштує грошей — тарифікується OpenAI, а не нами. Потребує інтернету. Хмарна поверхня — єдине, що входить до Whisper Pro.

Скучна правда в тому, що для більшості щоденного диктування локальний Whisper або Parakeet цілком достатній — і це безкоштовний шлях від початку до кінця. Обидва повністю працюють на вашому комп'ютері, нічого не надсилаючи на сервер. Хмара виправдовує свою тарифікацію за хвилину лише тоді, коли потрібна найвища точність на складному записі або модель повинна підтягнути факт з мережі посеред речення. Якщо ваше питання суто «Whisper безкоштовний?» — відповідь, що має значення: локальний шлях — так, починайте з нього.

Моделі, точність і очищення сирого тексту

Безкоштовна модель — це не одна модель, це ціла родина, і саме вибір моделі є справжнім важелем точності. Менші моделі швидкі й легкі; велика багатомовна модель найточніша і найважча. У версії з командним рядком ви обираєте розмір і миритеся зі швидкістю. У застосунку обираєте зі списку, і модель завантажується один раз. Головне: точність залежить від моделі та вашого мікрофона набагато більше, ніж від будь-якої оплати. USB-мікрофон за $20 покращить транскрипти більше, ніж будь-який апгрейд.

Яку б модель ви не використовували, сире диктування виходить суцільним потоком. Ви кажете «добре отже модель безкоштовна під MIT але щоб запустити самостійно потрібні python і ffmpeg» — і це неструктурована стіна тексту, яку видає будь-який мовленнєвий рушій. Прибрати це — окремий крок. Whisper by Remskill може запустити прохід ШІ через транскрипт: скажіть активаційну фразу «Hey whisper» — і текст покращиться перед тим, як потрапить на екран: слова-паразити видалено, пунктуація виправлена. На локальній моделі це робиться через Ollama безкоштовно; у хмарному режимі — через gpt-5-mini за замовчуванням.

Thinking...
Сирий

добре отже модель безкоштовна під mit але щоб запустити самостійно потрібні python і ffmpeg і ну пристойний комп'ютер інакше повільно

Очищений

Добре, отже модель безкоштовна під MIT, але щоб запустити самостійно, потрібні Python і ffmpeg, а також пристойний комп'ютер — інакше повільно.

Тобто питання точності має два безкоштовних важелі й один платний. Безкоштовні: виберіть модель, що підходить вашому залізу, і подавайте чистий звук із більш-менш пристойного мікрофона. Платний: хмарна транскрипція — дозволяє отримати найновіші хостингові моделі, коли локальна якість вас не задовольняє. Для переважної більшості диктування саме безкоштовні важелі є вирішальними. Той, хто обіцяє «ідеальні транскрипти без жодних зусиль», не дуже чесний з вами — модель безкоштовна, але хороший вхідний сигнал робить більшість роботи.

Цей самий потік «говориш — очищаєш» працює скрізь, не лише тут — ви можете диктувати чистий текст у будь-який застосунок однією гарячою клавішею, і довге повідомлення стає кількома мовленими реченнями замість абзацу, який треба набирати.

Коли платити за Whisper справді має сенс

Терези з двома чашами — ілюстрація ситуацій, коли безкоштовного достатньо, а коли варто платити

Оскільки вся стаття про те, що «це безкоштовно», я повинен чесно показати й зворотний бік: є випадки, коли платити — правильне рішення, і вдавати інакше було б рекламним трюком, а не відповіддю. Якщо безкоштовний локальний шлях вас влаштовує — беріть його і закривайте вкладку, більшість людей на цьому зупиняється. Але кілька ситуацій справді виправдовують платний тариф.

Платіть за хмарний шлях, коли точність на складному записі важливіша за гроші: інтерв'ю із сильним акцентом, запис у галасливому середовищі, юридичний транскрипт, де одне неправильне слово дорого обійдеться. Хостингові моделі OpenAI обходять локальні на важких матеріалах, і ви платите OpenAI за хвилину саме за цю перевагу. Платіть і тоді, коли хочете, щоб асистент підтягнув живий факт із мережі посеред речення — локальна модель просто не може цього зробити офлайн. І якщо вам справді потрібна нульова інсталяція на чужому комп'ютері, де не можна нічого встановити — заблокований робочий ноутбук, де не дозволяють Python чи завантаження моделей, — хостинговий сервіс може бути єдиним варіантом. Поза цими випадками безкоштовний локальний шлях — не менш гідна версія. Це та сама відкрита модель, що робить ту саму роботу, безкоштовно.

Платний варіант виправданий, коли вбудований безкоштовний починає не справлятися: найвища точність на складному аудіо, живий пошук в мережі або машина, де нічого локально не запустиш. Нижче цієї планки безкоштовна модель на власному залізі — правильна відповідь, і я не збираюся переконувати платити за те, що OpenAI вже роздав. Безкоштовна версія існує, вона працює, і під капотом — той самий двигун.

А якщо ваша причина хотіти безкоштовний локальний Whisper — приватність, щоб голос не потрапляв на чийсь сервер — варто прочитати далі про повністю офлайн-розпізнавання мовлення, бо саме це дає запуск моделі на власному комп'ютері.

Отже: Whisper безкоштовний? Модель — так, справді, ліцензована під MIT і ваша для запуску. Безкоштовне використання означає або половину дня в командному рядку, або застосунок, який зробив це за вас. Платна частина — виключно хмара: хостинг, який суворо кажучи не потрібен для щоденного диктування. Більшу частину цього тексту я надиктував у текстове поле — безкоштовна локальна модель слухала, на ноутбуці, який жодного разу не просив картку, щоб розпізнати речення. Це вся відповідь, і рідко коли її приємно так давати.

Запустіть безкоштовний Whisper без налаштувань

Натисніть гарячу клавішу, говоріть, відпустіть. Відкрита модель транскрибує на вашому комп'ютері, безкоштовно, і вставляє текст там, де курсор.

Локальний режим безкоштовно для будь-якого авторизованого облікового запису. Картка не потрібна.

Фото Denys Medvediev

Denys Medvediev

Я той, хто читає нашу підтримку — і, швидше за все, відповідаю, диктуючи.

Додаткове читання