Посібник
Як перетворити mp3 на текст
Щоб перетворити mp3 на текст, пропустіть файл через інструмент розпізнавання мовлення. Безкоштовний і приватний варіант — це локальний застосунок з відкритим кодом на кшталт Buzz чи командного рядка OpenAI Whisper, які транскрибують прямо на вашому комп’ютері. Швидший на старті варіант — вебконвертер, до якого ви завантажуєте файл.
Останнє оновлення: червень 2026

Щоб перетворити mp3 на текст, пропустіть файл через інструмент розпізнавання мовлення. Безкоштовний і приватний варіант — це локальний застосунок з відкритим кодом на кшталт Buzz чи командного рядка OpenAI Whisper, які транскрибують прямо на вашому комп’ютері. Швидший на старті варіант — вебконвертер, до якого ви завантажуєте файл. Обидва перетворюють аудіо на текст, який можна редагувати.
Отже, у вас є mp3, і вам потрібні слова, які в ньому звучать. Записане інтерв’ю, голосова нотатка, епізод подкасту, лекція, яку ви зберегли з телефона. Завдання щоразу однакове: узяти аудіо й отримати текст, який можна редагувати.
Хороша новина в тому, що у 2026 році це вже давно вирішена задача, і більшість способів зробити це безкоштовні. Трохи дратує те, що всі інструменти називаються майже однаково, тож дозвольте я їх розкладу по поличках.
Є три чесні варіанти. Запустити безкоштовний локальний інструмент на власному комп’ютері (найприватніше, без завантаження кудись, безкоштовно). Скористатися застосунком для Mac, створеним саме для цього. Або завантажити файл у вебсервіс, який транскрибує його на сервері — це найшвидше на старті, хоча аудіо залишає ваш комп’ютер. Правильний вибір залежить від того, що для вас важливіше — приватність чи зручність, і наскільки технічно ви налаштовані сьогодні.
Скажу незручну річ одразу, бо ховати її було б нечесно. Застосунок, який робить моя команда, Whisper by Remskill, не перетворює mp3-файли. Це інструмент живого диктування. Ви затискаєте гарячу клавішу, говорите — і ваші слова з’являються там, де ви друкуєте. Зовсім інше завдання. Я поясню, де він стає у пригоді, ближче до кінця, але якщо ви прийшли сюди перетворити вже наявний запис — вам потрібні інструменти, описані нижче.
Безкоштовний і приватний варіант — це локальний інструмент з відкритим кодом
Якщо ви не хочете, щоб ваш запис лежав на чужому сервері, виконайте транскрибування на власному комп’ютері. Рушій, який для цього використовують майже всі, — це OpenAI Whisper, випущений під ліцензією MIT: безкоштовний у використанні, з відкритим кодом, безкоштовний у запуску. Це та сама родина моделей, на якій працює чимало платних застосунків, рекламу яких ви бачили.
Є кілька способів реально ним скористатися — від «мені комфортно в терміналі» до «дайте мені, будь ласка, кнопку, яку можна натиснути».
OpenAI Whisper (командний рядок на Python)
Встановіть його через pip, встановіть інструмент ffmpeg, від якого він залежить, а тоді вкажіть йому ваш файл: whisper recording.mp3 --model turbo. Він прочитає mp3, транскрибує його й запише текстовий файл. Є шість розмірів моделей — від крихітної швидкої до великої точної, тож ви можете міняти швидкість на точність. Він багатомовний і навіть може перекладати неангломовне аудіо англійською. Підступність — у налаштуванні. pip та ffmpeg не складні, але й не дрібниця. Якось я витратив двадцять хвилин, лагодячи шлях до ffmpeg на новенькому ноутбуці. А в мене магістерський диплом.
whisper.cpp
Та сама модель Whisper, переписана чистими C та C++, тож вона працює швидко без Python і без важких залежностей. Вона працює лише на CPU й добряче оптимізована під Mac на Apple Silicon. Теж під ліцензією MIT. Ви збираєте її з вихідного коду й запускаєте з командного рядка, тож це чітко для тих, кому комфортно в терміналі. Це економний варіант, якщо вам треба перетравити багато файлів.
Buzz
Саме його я раджу нетехнічним людям. Buzz — це звичайний застосунок для робочого столу зі звичайним вікном. Ви відкриваєте його, обираєте свій mp3, і він транскрибує офлайн на вашому комп’ютері. Він побудований на OpenAI Whisper, уміє транскрибувати й перекладати та працює на macOS, Windows і Linux. Ліцензія MIT, безкоштовно. Жодного термінала, жодного pip, жодного танцю з ffmpeg. Якщо у вас один файл і ви хочете зробити справу з мінімумом метушні — це і є відповідь.
Whisper Desktop (Const-me)
Застосунок для Windows для тих, у кого є відеокарта. Він транскрибує аудіофайли й використовує GPU, щоб робити це швидко, а це важливо, коли файл довгий. Це відкритий код під ліцензією MPL-2.0. Лише Windows. Якщо ви на ПК з пристойним GPU і двогодинним записом — це швидкісна смуга.

На Mac окремий застосунок позбавляє вас мороки з налаштуванням
Якщо ви на Mac і командний рядок — не ваше уявлення про гарний вечір, то MacWhisper створений саме для цього. Ви перетягуєте в нього аудіо- чи відеофайл, і він транскрибує на пристрої, тож нічого не залишає ваш комп’ютер. Він запускає ті самі моделі OpenAI Whisper, а ще рушій Parakeet від NVIDIA, і добре справляється з транскрибуванням файлів. Він також експортує у формати, які вам справді потрібні, як-от файли субтитрів для відео.
MacWhisper за задумом орієнтований на файли: запис на вході, текст на виході. У цьому весь його сенс, і він із цим добре справляється. Я згадую його окремо, бо це найближче до відповіді «в один клік» на Mac саме для того, що ви шукали.
Вебконвертер найшвидший на старті, але ваше аудіо залишає ваш комп’ютер
Інший варіант узагалі не потребує встановлення. Чимало вебсервісів дають вам завантажити mp3, зачекати хвилину й завантажити транскрипт. Жодного налаштування, жодної моделі для завантаження, працює з телефона чи позиченого ноутбука. Для швидкої разової задачі ця зручність цілком реальна, і я не вдаватиму, ніби це не так.
Ось одна тверда думка в цій статті, і я підкріплю її очевидною причиною, а не маханням рукою. Коли ви завантажуєте запис у вебконвертер, аудіо залишає ваш комп’ютер і опиняється на чужому сервері. Для подкасту, який ви все одно збираєтесь публікувати, — кого це обходить. А от для записаної розмови з HR, лікарського висновку чи зустрічі з клієнтом, де вголос називають суму зарплати чи ім’я пацієнта, — це рішення про приватність, яке ви ухвалюєте, часто навіть не прочитавши сторінку, де написано, як довго зберігається файл. Локальний інструмент виконує ту саму роботу, і аудіо нікуди не йде. Транскрибування лише через хмару для чутливих записів — це катастрофа приватності, яка тільки й чекає, щоб її затранскрибували.
Якщо вебконвертер справді вам пасує, варто придивитися до ландшафту сервісів транскрибування. Я писав про цю компанію в інших місцях. Почніть з огляду швидкого транскрибування та посібника з конвертерів аудіо в текст — обидва розглядають варіант із завантаженням і локальний поруч.
Обирайте точність і мову моделлю, а не маркетингом
Хоч би на якому інструменті ви зупинились, точність здебільшого залежить від двох речей, які ви контролюєте: розміру моделі й мікрофона, на який записали аудіо. Більші моделі повільніші й точніші. Менші — швидші й легші. Більшість локальних інструментів вище дають вам вибір, бо всі вони запускають ті самі базові моделі Whisper під різними кнопками.
Нудна правда, яку ніхто, хто продає вам «розумний AI»-конвертер, не хоче казати вголос: чистий запис на дешевому USB-мікрофоні переб’є каламутний, пропущений через найбільшу модель. Інструмент не може «розчути» назад кондиціонер. Якщо ваш mp3 записаний через усю кімнату на мікрофон ноутбука — стримайте сподівання й, можливо, перезапишіть, якщо ще є змога.
Де Whisper by Remskill стає у пригоді, а де ні
А тепер чесна частина, яку я обіцяв. Whisper by Remskill не бере ваш mp3 і не перетворює його на текст. Він створений для іншого моменту.
Це інструмент живого диктування. Ви натискаєте гарячу клавішу (Ctrl+Space на Windows за замовчуванням, її можна перепризначити), говорите — і ваші слова друкуються прямо в тому застосунку, де ви перебуваєте: у вашій пошті, у документі, у повідомленні Slack, у коментарі до коду. Транскрибування відбувається локально, поки ви говорите, і текст з’являється біля курсора за мить після того, як ви замовкли. Жодного файлу, жодного завантаження, жодного циклу «записати, потім перетворити».
То коли ж це той інструмент, який вам справді потрібен? Коли потрібних слів ще не існує у вигляді запису, бо вони все ще у вас у голові. Якщо ваша справжня мета ніколи не була «перетворити цей файл», а радше «швидко перенести власні усні слова в документ» — ви взагалі пропускаєте запис. Ви думаєте, ви говорите, воно надруковане. Уся локальна послідовність безкоштовна, і вона працює на Windows та Mac (Apple Silicon). Якось я надиктував листа вчительці, список покупок і відповідь сестрі за той час, поки закипав чайник, а потім забув власне налити чай. Інструмент спрацював. Я — ні.
Щоб скласти повну картину того, як живе офлайн-транскрибування працює всередині, посібник з офлайн-розпізнавання мовлення копає глибше. Але якщо у вас просто зараз у теці завантажень лежить запис — поверніться вгору сторінки. Buzz або командний рядок Whisper — ось що вам потрібно, а не ми.
Якщо це потрібно лише раз
Один файл, один раз, і повторювати не плануєте? Відкрийте Buzz, киньте туди свій mp3 і дайте йому попрацювати. Це безкоштовно, працює офлайн, і ви не встановите нічого, що довелося б підтримувати. Ось і вся порада. Лишіть інструменти командного рядка на той день, коли у вас буде п’ятдесят файлів замість одного.
Найшвидший спосіб перетворити mp3 — це не мати mp3 узагалі. Але для запису, який у вас уже є, безкоштовний локальний інструмент доведе вас до результату, нікуди його не надсилаючи.
Whisper by Remskill — для живого диктування, а не конвертації файлів
Якщо ваша мета — переносити власні усні слова в документ, не друкуючи, подивіться, як працює живе диктування. Щоб перетворити запис, який у вас уже є, Buzz — це безкоштовна відповідь вище.
Безкоштовна локальна послідовність. Windows і Mac (Apple Silicon).



