Di Denys Medvediev

Guida

Come trascrivere le interviste

Per trascrivere un'intervista in modo automatico, passa la registrazione a uno strumento di riconoscimento vocale: un'opzione open-source gratuita come Buzz o OpenAI Whisper sul tuo computer per la privacy, oppure un servizio di trascrizione cloud quando hai bisogno anche delle etichette per i parlanti e di un editor curato. Scegli il locale per gratuità e riservatezza, il cloud per la diarizzazione.

Ultimo aggiornamento: giugno 2026

La scrivania di uno studio podcast con microfoni e un mixer audio, allestita per registrare una conversazione

Per trascrivere un'intervista in modo automatico, passa la registrazione a uno strumento di riconoscimento vocale: un'opzione open-source gratuita come Buzz o OpenAI Whisper sul tuo computer per la privacy, oppure un servizio di trascrizione cloud quando hai bisogno anche delle etichette per i parlanti e di un editor curato. Scegli il locale per gratuità e riservatezza, il cloud per la diarizzazione.

Dico subito la parte scomoda, perché ti risparmia dieci minuti. Whisper by Remskill, l'app a cui appartiene questo blog, non trascrive le registrazioni di interviste. È dettatura in tempo reale: tieni premuto un tasto, parli, e le parole compaiono al cursore in qualsiasi app. È un lavoro completamente diverso dall'elaborare una registrazione di un'ora con due persone e ottenere un trascritto con le etichette. Questa guida parla quindi degli strumenti che fanno davvero il lavoro dell'intervista, scritta da qualcuno che preferisce mandarti da quello giusto piuttosto che fingere di esserlo.

Un trascritto di intervista è più difficile di quanto sembri per un motivo solo: i parlanti. Uno strumento di trascrizione semplice ti restituisce un muro di testo. Quello che vuoi di solito è "Intervistatore:" e "Soggetto:" davanti a ogni turno. Si chiama diarizzazione, e non tutti gli strumenti la fanno. La distinzione che conta è locale contro cloud. Gli strumenti locali girano sul tuo laptop, non costano nulla e non caricano mai l'audio. I servizi cloud caricano il file ma tendono a gestire le etichette dei parlanti e ti offrono un editor. Qui sotto trovi la mappa onesta, poi la parte in cui ti dico esattamente dove ci collochiamo noi e dove no.

Il modo gratuito e privato: sul tuo computer

Se l'intervista è delicata — una fonte da proteggere, un paziente, un dirigente interno — la registrazione non dovrebbe mai lasciare il tuo computer. Gli strumenti open-source gratuiti trascrivono interamente sul dispositivo.

Whisper di OpenAI è il modello su cui si basa la maggior parte di questi strumenti. È rilasciato con licenza MIT, lo installi con un singolo comando pip, e trascrive file audio dalla riga di comando. Viene fornito in sei dimensioni, quattro delle quali con varianti solo in inglese, quindi si bilancia velocità e precisione in base all'hardware. È multilingue e può persino tradurre il parlato in inglese mentre trascrive. Il limite per le interviste: Whisper base trascrive le parole, ma non etichetta chi le ha dette. La diarizzazione dei parlanti richiede strumenti aggiuntivi sovrapposti, oppure un servizio cloud che la include già.

Se la riga di comando ti manda in crisi, Buzz è il tasto facile. È un'app grafica che trascrive e traduce audio offline sul tuo computer, basata su Whisper, con licenza MIT e disponibile su macOS, Windows e Linux. Trascini la registrazione, scegli un modello, aspetti, leggi il trascritto. Per chi vuole trascrivere un'intervista gratis, è la strada più corta.

Altri due da conoscere. whisper.cpp è un port in C/C++ di Whisper che gira solo su CPU ed è ottimizzato per Apple Silicon: più veloce, nessun Python, ma si compila e si usa dalla riga di comando. E MacWhisper è un'app Mac basata su Whisper locale e Parakeet di NVIDIA, che punta proprio sulla trascrizione di file — esattamente il caso d'uso dell'intervista. Tutti questi mantengono l'audio sul tuo computer. Nessuno di loro, da solo, ti consegna etichette pulite per i parlanti.

I servizi cloud aggiungono etichette per i parlanti e un editor

Questo è il bivio in cui decidi quanto vale la tua privacy. I servizi di trascrizione dedicati caricano la tua registrazione sui loro server, la elaborano e ti restituiscono un trascritto che di solito indica i parlanti, mettendolo in un editor dove puoi correggere i nomi ed esportare. Quella comodità è reale, e per un podcast pubblico o un panel che puoi condividere tranquillamente, è lo strumento migliore.

Se è questo il tuo bisogno — etichette multi-parlante, timestamp, una superficie di editing pulita — guarda alla categoria consolidata delle trascrizioni di riunioni e registrazioni, non a un'app di dettatura. Ho analizzato quel panorama nel pezzo sulle alternative a Otter.ai e in quello sulle alternative a Rev; entrambi coprono gli strumenti cloud che fanno diarizzazione ed editing come si deve.

Ecco l'opinione, e porta un conto allegato. Un team con cui ho lavorato aveva fatto costruire a un contractor un prototipo interno di dettatura che chiamava un'IA cloud per ogni enunciato. Il manager aprì la dashboard dei costi a fine trimestre e trovò una cifra a cinque cifre, in gran parte dovuta alla riscrittura delle registrazioni degli standup quattro volte per una logica di retry troppo aggressiva. La risposta del CFO fu lapidaria: potremmo smettere di pagare per caricare riunioni che hanno già le note. I soldi erano il problema minore. Il vero problema era che un quarto delle chiamate interne viveva ora sui server di un fornitore. La trascrizione cloud è davvero la scelta giusta per le etichette dei parlanti e l'editing. È la scelta sbagliata per una registrazione che non vorresti mai uscisse dall'edificio. Scegli su quel criterio, non sul marketing.

Come scegliere, in una frase

Chi arriva su questa pagina è di tre tipi: chi è attento alla privacy, chi ha scadenze pressanti, e chi vuole solo i nomi dei parlanti senza pensarci. Due di questi dovrebbero andare sul locale.

  • Vuoi gratuità e privacyBuzz (il più semplice) o Whisper sul tuo computer. L'audio non viene mai caricato.
  • Hai bisogno di etichette per i parlanti e di un editor curatoun servizio di trascrizione cloud. L'audio viene caricato; è il compromesso.
  • Su Mac, vuoi un'app orientata ai fileMacWhisper, sul dispositivo.

Il tiebreaker onesto: se la registrazione è sensibile, la risposta è locale, punto. Se è una conferenza pubblica e vuoi la diarizzazione già pronta, il cloud guadagna il suo posto. La maggior parte delle trascrizioni di interviste rientra nel primo caso, ed è per questo che parto dagli strumenti locali gratuiti. Se il tempo di elaborazione è la tua preoccupazione, la guida alla trascrizione audio veloce illustra i parametri per accelerare.

Dove si colloca davvero Whisper by Remskill

Pasted
L'overlay post-dettatura che viene distribuito — com'è una dettatura live completamente locale nel momento in cui finisce. Non c'è nessun pulsante "carica una registrazione" qui.

Ora la parte in cui tracciamo la linea chiaramente, perché il peggior esito di questo articolo sarebbe che tu scaricassi la nostra app aspettandoti che elabori una registrazione. Non lo fa. Whisper by Remskill è dettatura prima di tutto: un tasto di scelta rapida attiva il tuo parlato in tempo reale, che viene trascritto e incollato al cursore in qualsiasi app tu stia usando. Non c'è un pulsante "carica un file di intervista" e non c'è diarizzazione, perché è costruita per una voce sola: la tua, in questo momento.

Quindi dove lo usa un intervistatore? Attorno all'intervista, non sull'intervista. Dettando le domande di preparazione in un documento prima di entrare. Parlando delle note di follow-up nel secondo in cui la conversazione finisce, mentre le impressioni sono fresche e le mani tengono ancora il caffè. Abbozzando l'articolo a voce una volta che il trascritto esiste. Il tasto predefinito su Windows è Ctrl+Space, completamente rimappabile, e l'intera pipeline locale è gratuita per qualsiasi utente registrato, senza carta di credito alla registrazione. C'è anche un livello cloud a pagamento che aggiunge trascrizione basata su OpenAI e ricerca web per la dettatura live, ma riguarda sempre il digitare con la voce, non trascrivere una registrazione a due persone.

Whisper
Questa è la vera app desktop — barra laterale, pannello di trascrizione e schede di istruzioni AI — non uno screenshot.

Usala per la scrittura attorno all'intervista. Usa Buzz o un servizio cloud per l'intervista stessa. Strumenti diversi, lavori diversi. Preferisco che tu lo sappia prima di installare qualcosa.

Un'ultima parola

La maggior parte delle registrazioni di interviste che vale la pena trascrivere sono quelle che vorresti meno caricare: la parentesi off-the-record, la fonte che si è fidata di te, il paziente. È per questo che gli strumenti locali gratuiti meritano il loro posto: il file rimane sul tuo laptop. Una volta ho passato un weekend a regolare le impostazioni del modello per ripulire un audio opaco, prima di accorgermi che il vero problema era il microfono del laptop a quindici centimetri da una ventola. Ho una laurea magistrale. Compra prima il microfono.

E quando il trascritto è pronto e arriva il momento di scrivere davvero il pezzo, è lì che la nostra app smette di essere una comparsa.

Ditta l'articolo, una volta che il trascritto esiste

Trascrivi l'intervista con Buzz o un servizio cloud. Poi scarica Whisper by Remskill e ditta il pezzo — l'unica parte del flusso di lavoro per interviste per cui siamo stati costruiti. La pipeline locale è gratuita, senza carta di credito alla registrazione.

Dettatura locale gratuita per sempre. Nessun metodo di pagamento alla registrazione. Non trascriviamo registrazioni — usa uno strumento locale o un servizio cloud per quello.

Foto di Denys Medvediev

Denys Medvediev

Sono io che leggo la nostra email di supporto, probabilmente dettando le risposte.

Letture correlate