Guida
Come convertire un mp3 in testo
Per convertire un mp3 in testo, passa il file in uno strumento di riconoscimento vocale. La via gratuita e privata è un'app open-source locale come Buzz o la riga di comando di OpenAI Whisper, che trascrivono sul tuo computer. La via più rapida da avviare è un convertitore web su cui caricare il file.
Ultimo aggiornamento: giugno 2026

Per convertire un mp3 in testo, passa il file in uno strumento di riconoscimento vocale. La via gratuita e privata è un'app open-source locale come Buzz o la riga di comando di OpenAI Whisper, che trascrivono sul tuo computer. La via più rapida da avviare è un convertitore web su cui caricare il file. Entrambe trasformano l'audio in testo modificabile.
Hai un mp3 e ti servono le parole che contiene. Un'intervista registrata, un memo vocale, una puntata di podcast, una lezione salvata dal telefono. Il compito è sempre lo stesso: prendere l'audio e ottenere un testo che puoi modificare.
La buona notizia è che nel 2026 questo è un problema risolto, e la maggior parte dei modi per farlo è gratuita. La notizia un po' fastidiosa è che gli strumenti hanno tutti nomi che si somigliano, quindi lascia che faccia un po' di ordine.
Ci sono tre strade oneste. Usare uno strumento locale gratuito sul tuo computer (la più privata, nessun caricamento, costo zero). Usare un'app Mac pensata per questo. Oppure caricare il file su un servizio web che lo trascrive su un server: è il modo più rapido da avviare, anche se l'audio lascia il tuo computer. Quella giusta dipende da quanto tieni alla privacy rispetto alla comodità, e da quanto ti senti tecnico oggi.
Devo dire subito la parte scomoda, perché sarebbe disonesto nasconderla. L'app che fa il mio team, Whisper by Remskill, non converte i file mp3. È uno strumento di dettatura in tempo reale. Tieni premuto un tasto di scelta rapida, parli, e le tue parole compaiono in qualsiasi cosa tu stia scrivendo. Tutt'altro lavoro. Spiegherò dove si inserisce verso la fine, ma se sei arrivato qui per convertire una registrazione che hai già, gli strumenti qui sotto sono quelli che vuoi.
La via gratuita e privata è uno strumento open-source locale
Se non vuoi che la tua registrazione finisca sul server di qualcun altro, esegui la trascrizione sul tuo computer. Il motore che quasi tutti usano per questo è OpenAI Whisper, rilasciato con licenza MIT, gratuito da usare, gratuito da leggere, gratuito da eseguire. È la stessa famiglia di modelli che alimenta molte delle app a pagamento che hai visto pubblicizzate.
Ci sono diversi modi per usarlo davvero, da "me la cavo bene con un terminale" a "per favore, datemi un pulsante da cliccare".
OpenAI Whisper (riga di comando Python)
Installalo con pip, installa lo strumento ffmpeg da cui dipende, poi puntalo al tuo file: whisper recording.mp3 --model turbo. Legge l'mp3, lo trascrive e scrive un file di testo. Ci sono sei dimensioni di modello, da uno minuscolo e veloce a uno grande e accurato, così puoi scambiare velocità con precisione. È multilingue e può persino tradurre in inglese l'audio non in inglese. Il problema è la configurazione. pip e ffmpeg non sono difficili, ma non sono nemmeno una passeggiata. Una volta ho passato venti minuti a sistemare un percorso di ffmpeg su un portatile nuovo. Ho una laurea magistrale.
whisper.cpp
Lo stesso modello Whisper, riscritto in semplice C e C++ così da girare veloce senza Python e senza dipendenze pesanti. Funziona solo sulla CPU ed è ottimizzato a fondo per i Mac con Apple Silicon. Anche questo con licenza MIT. Lo compili dal codice sorgente e lo esegui dalla riga di comando, quindi è decisamente per chi se la cava con un terminale. È l'opzione snella se hai parecchi file da macinare.
Buzz
Questo è quello che consiglio a chi non è tecnico. Buzz è una normale app desktop con una normale finestra. La apri, scegli il tuo mp3, e lo trascrive offline sul tuo computer. È basato su OpenAI Whisper, può trascrivere e tradurre, e funziona su macOS, Windows e Linux. Licenza MIT e gratuito. Niente terminale, niente pip, niente armeggiare con ffmpeg. Se hai un solo file e vuoi sbrigartela con il minimo sforzo, è questa la risposta.
Whisper Desktop (Const-me)
Un'app Windows per chi ha una scheda grafica. Trascrive i file audio e usa la GPU per farlo in fretta, il che conta quando il file è lungo. È open source con licenza MPL-2.0. Solo Windows. Se sei su un PC con una GPU decente e una registrazione di due ore, questa è la corsia veloce.

Su Mac, un'app dedicata ti risparmia la configurazione
Se sei su Mac e la riga di comando non è la tua idea di una buona serata, MacWhisper è fatto esattamente per questo. Trascini un file audio o video al suo interno e lo trascrive sul dispositivo, così nulla lascia il tuo computer. Usa gli stessi modelli OpenAI Whisper, più il motore Parakeet di NVIDIA, e svolge bene il lavoro di trascrizione dei file. Esporta anche nei formati che ti servono davvero, come i file di sottotitoli per i video.
MacWhisper è pensato anzitutto per i file: registrazioni in entrata, testo in uscita. È tutto il suo scopo, e lo fa bene. Lo segnalo apposta perché è la cosa più vicina a una risposta Mac in un clic per esattamente quello che hai cercato.
Un convertitore web è il più rapido da avviare, ma il tuo audio lascia il computer
L'altra via non richiede alcuna installazione. Moltissimi servizi web ti permettono di caricare un mp3, aspettare un minuto e scaricare la trascrizione. Nessuna configurazione, nessun modello da scaricare, funziona da un telefono o da un portatile preso in prestito. Per una cosa veloce e una tantum, quella comodità è reale, e non farò finta del contrario.
Ecco l'unica opinione netta di questo articolo, e la sosterrò con la ragione ovvia anziché con frasi vaghe. Quando carichi una registrazione su un convertitore web, l'audio lascia il tuo computer e atterra sul server di qualcun altro. Per un podcast che stai comunque per pubblicare, chi se ne importa. Per una telefonata HR registrata, il referto di un medico, o una riunione con un cliente in cui viene pronunciata ad alta voce una cifra di stipendio o il nome di un paziente, quella è una decisione sulla privacy che stai prendendo, spesso senza leggere la pagina che ti dice per quanto tempo il file viene conservato. Uno strumento locale fa lo stesso lavoro e l'audio non va da nessuna parte. La trascrizione solo nel cloud è, per le registrazioni sensibili, un disastro per la privacy in attesa di essere trascritto.
Se un convertitore web è davvero la scelta giusta per te, vale la pena dare un'occhiata al panorama dei servizi di trascrizione. Ne ho scritto altrove. Parti dalla guida alla trascrizione veloce e dalla guida ai convertitori da audio a testo, che coprono entrambe la via del caricamento e quella locale, una accanto all'altra.
Scegli accuratezza e lingua con il modello, non con il marketing
Qualunque strumento tu scelga, l'accuratezza dipende soprattutto da due cose che controlli: la dimensione del modello e il microfono con cui è stato registrato l'audio. I modelli più grandi sono più lenti e più accurati. Quelli più piccoli sono più veloci e leggeri. La maggior parte degli strumenti locali qui sopra ti lascia scegliere, perché eseguono tutti gli stessi modelli Whisper sottostanti dietro pulsanti diversi.
La verità noiosa che nessun venditore di un convertitore con "AI intelligente" vuole dire ad alta voce: una registrazione pulita su un microfono USB economico batte una registrazione confusa passata nel modello più grande. Lo strumento non può cancellare il rumore del condizionatore già sentito. Se il tuo mp3 è stato registrato dall'altra parte della stanza con il microfono di un portatile, ridimensiona le aspettative e magari registra di nuovo, se sei ancora in tempo.
Dove si inserisce Whisper by Remskill, e dove no
Ora la parte onesta che ho promesso. Whisper by Remskill non prende il tuo mp3 e lo trasforma in testo. È costruito per un momento diverso.
È uno strumento di dettatura in tempo reale. Premi un tasto di scelta rapida (Ctrl+Space su Windows per impostazione predefinita, rimappabile), parli, e le tue parole vengono digitate direttamente in qualsiasi app tu stia usando: la tua email, il tuo documento, un messaggio Slack, un commento nel codice. La trascrizione avviene localmente mentre parli, e il testo arriva al cursore un attimo dopo che hai smesso. Niente file, niente caricamento, niente ciclo registra-poi-converti.
Quindi quand'è che è davvero lo strumento che vuoi? Quando le parole che ti servono non esistono ancora come registrazione, perché sono ancora nella tua testa. Se il tuo vero obiettivo non era mai "convertire questo file" ma "mettere in fretta le mie parole pronunciate in un documento", salti del tutto la registrazione. Lo pensi, lo dici, è digitato. L'intera pipeline locale è gratuita e funziona su Windows e Mac (Apple Silicon). Una volta ho dettato una email all'insegnante, una lista della spesa e una risposta a mia sorella nel tempo che ci ha messo il bollitore a bollire, poi mi sono dimenticato di versare davvero il tè. Lo strumento ha funzionato. Io no.
Per il quadro completo di come funziona sotto il cofano la trascrizione in tempo reale e offline, la guida al riconoscimento vocale offline va più a fondo. Ma se hai una registrazione che ti sta nella cartella dei download proprio adesso, torna su nella pagina. Buzz o la riga di comando di Whisper è quello che vuoi, non noi.
Se ti serve solo una volta
Un file, una volta sola, nessun piano di rifarlo? Apri Buzz, trascina dentro il tuo mp3, lascialo lavorare. È gratuito, funziona offline, e non avrai installato nulla che devi mantenere. È tutta qui la raccomandazione. Tieni gli strumenti da terminale per il giorno in cui avrai cinquanta file invece di uno.
Il modo più veloce per convertire un mp3 è non avere un mp3. Ma per la registrazione che hai già, uno strumento locale gratuito ti porta dove vuoi senza inviarla da nessuna parte.
Whisper by Remskill serve per la dettatura in tempo reale, non per la conversione dei file
Se il tuo obiettivo è mettere le tue parole pronunciate in un documento senza digitare, scopri come funziona la dettatura in tempo reale. Per convertire una registrazione che hai già, Buzz è la risposta gratuita qui sopra.
Pipeline locale gratuita. Windows e Mac (Apple Silicon).



