Di Denys Medvediev

Guida

Software di trascrizione delle riunioni

Un unico termine di ricerca, due lavori molto diversi. Certi strumenti mandano un bot nella tua videochiamata per scrivere note condivise. Altri elaborano una registrazione che hai già, offline, sul tuo laptop. Ecco come capire quale ti serve davvero.

Ultimo aggiornamento: giugno 2026

Tavolo conferenze vuoto con microfoni e monitor, pronto per una riunione che il software trascriverà

Il software di trascrizione delle riunioni trasforma le conversazioni parlate in testo ricercabile e scritto. Funziona in due modi: in tempo reale, con la trascrizione che appare mentre le persone parlano, e post-riunione, dove la registrazione viene elaborata in seguito per produrre note più pulite, con etichette dei partecipanti e timestamp. La maggior parte degli strumenti entra automaticamente nelle chiamate tramite sincronizzazione del calendario e un bot; alcuni lavorano senza bot a partire da una registrazione già esistente.

La prima volta che ho visto un team accumulare un conto a cinque cifre per trascrivere riunioni, le riunioni avevano già le note. Un collaboratore esterno aveva collegato un prototipo di dettatura AI interno che chiamava l'API cloud per ogni enunciato, con una logica di retry così aggressiva da trascrivere quattro volte la stessa registrazione dello standup. Il manager aprì il pannello dei costi a fine trimestre. Nella stanza calò il silenzio.

La verità, per quanto poco romantica, è questa: scegliere lo strumento sbagliato costa caro in denaro, in privacy o in tempo, spesso prima che qualcuno se ne accorga.

È proprio questo il senso di quest'articolo. I team vogliono note di riunione automatiche da un decennio, e gli strumenti finalmente ci riescono. Il problema è che svolgono lavori completamente diversi sotto la stessa etichetta. Alcuni entrano nella tua videochiamata come bot e scrivono note condivise per tutti. Altri elaborano una registrazione dopo il fatto, offline, sul tuo laptop.

Di seguito percorro entrambi i percorsi, cito gli strumenti che vale la pena conoscere e sono onesto sul lavoro che la nostra app non fa: non è un bot per riunioni. Come persona che legge le email di supporto, posso dirti che la maggior parte della confusione in questa categoria nasce da chi sceglie il tipo sbagliato di strumento fin dal primo giorno. Ho risposto abbastanza volte alla stessa email da riconoscerla dall'oggetto.

Cosa fa il software di trascrizione delle riunioni (e i due modi in cui funziona)

Al di là del marketing, ogni strumento qui fa una sola cosa: prende l'audio e produce testo. L'audio è il parlato umano di una riunione. Il testo è una trascrizione. Tutto il resto — riepiloghi, azioni, etichette dei partecipanti, ricerca — è costruito sopra quella singola conversione.

La categoria si divide in base al momento in cui avviene la conversione.

  • Trascrizione in tempo reale funziona mentre le persone parlano. Le parole appaiono sullo schermo uno o due secondi dopo il relatore. È quello che ottieni da una traccia di sottotitoli in diretta su Zoom o Microsoft Teams, e dai bot di appunti che mostrano la trascrizione in corso durante la chiamata. È utile sul momento: per l'accessibilità, per seguire il filo, per cogliere un nome che ti sei perso.
  • Trascrizione post-riunione viene eseguita su una registrazione dopo la fine della chiamata. Lo strumento ha l'intero file, quindi può prendersi il tempo che vuole. Rimuove le false partenze, indica chi ha detto cosa, aggiunge i timestamp e compone un documento leggibile. L'elaborazione post-riunione produce un testo più pulito, con etichette dei partecipanti e timestamp, rispetto alla versione in diretta. Il compromesso è l'attesa.

La maggior parte degli strumenti noti (Otter, Fireflies, Fathom, tl;dv) fa entrambe le cose, e ricevono l'audio nello stesso modo: un bot entra nella chiamata. Colleghi il tuo calendario Google o Outlook, lo strumento vede una riunione con un link video e invia un partecipante nella stanza per ascoltare e registrare. Quella piccola finestra di registrazione che hai visto nella griglia di Zoom è l'intero modello in un unico fotogramma.

Un terzo percorso, più silenzioso, si nasconde dietro il termine di ricerca: trascrivere una registrazione che già possiedi, sul tuo dispositivo, senza bot e senza chiamata. È il software di dettatura e trascrizione, non un bot per riunioni, ed è lì che vive la nostra app. Ne parlo più avanti, compresa la parte onesta su quando è la scelta sbagliata.

Quando un bot per riunioni è la scelta giusta (e Whisper non lo è)

Notetaker · Sync settimanaleRegistrazione
In chiamata
Maria (host)
Tom
Priya
Bot notetaker
Trascrizione in diretta

Maria 10:02 Iniziamo con la data di lancio.

Tom 10:02 Credo slitteremo di una settimana.

Auto-join: calendario sincronizzato · Riepilogo + azioni dopo la chiamata
Un bot-notetaker per riunioni: entra automaticamente alla chiamata dal tuo calendario, compare nell'elenco dei partecipanti e scrive una trascrizione in diretta condivisa con tutti. Whisper non fa questo.

Se il tuo problema è «qualcosa dovrebbe entrare nella mia chiamata Zoom, Teams o Google Meet, catturare tutto e consegnare note condivise all'intero team dopo», hai bisogno di un bot per riunioni. Whisper non lo fa. Non entra automaticamente in una chiamata, non registra gli altri partecipanti e non esegue la diarizzazione multi-speaker su una videoconferenza. Fingere il contrario ti farebbe perdere il pomeriggio.

Per quel lavoro, le scelte giuste sono i bot-notetaker. Otter.ai entra in Zoom, Microsoft Teams e Google Meet per scrivere e condividere note automaticamente, e ha un piano Basic gratuito se vuoi provare il modello prima di pagare. Fireflies.ai entra su invito o in automatico dalle riunioni del calendario, e il suo piano gratuito include trascrizione illimitata con riepiloghi AI limitati. tl;dv registra Google Meet, Zoom e Teams, propone una modalità senza bot, e offre un piano gratuito senza limiti di tempo. Fathom ha un piano gratuito con registrazioni illimitate e una scelta tra acquisizione senza bot (in beta) o con bot.

Questa è la parte dell'articolo in cui ti mando altrove di proposito. Otter è per le riunioni. Whisper è per la scrittura. Sono categorie diverse, e pagare per quella sbagliata è l'errore più comune in tutto questo settore. Se hai bisogno di diarizzazione multi-speaker su una chiamata registrata, auto-join dal calendario e un riepilogo nel canale del team prima che la riunione finisca, un bot-notetaker fa un lavoro che la nostra app non è mai stata costruita per fare. Noi rendiamo la scrittura a voce rapida; loro rendono automatica la cattura di una stanza. Scegli prima la categoria, poi lo strumento.

Quanto è accurata davvero la trascrizione AI delle riunioni?

La risposta onesta: meglio di quanto ti aspetti su audio pulito, peggio di quanto speri in una riunione reale. La categoria si attesta intorno all'85-95% di precisione su audio chiaro in una sola lingua, con cali in presenza di rumore di fondo, accenti, gerghi e persone che parlano contemporaneamente. I servizi con verifica umana risalgono verso il 99%, perché qualcuno corregge ciò che il modello ha mancato.

La nostra modalità locale riporta una precisione che in genere si colloca tra il 95 e il 99%, con i modelli più grandi che ottengono risultati migliori. Voglio essere preciso: si tratta della nostra misurazione sul nostro software, non di un confronto indipendente con Otter o Fireflies, e non intendo inventarne uno. Chiunque ti fornisca una singola percentuale di precisione per la trascrizione di riunioni senza dirti le condizioni audio sta vendendo, non misurando.

Ecco la parte che nessuno commercializza, perché non c'è nulla da vendere. Il microfono conta più del modello. Un microfono USB da venti euro fa più per la tua trascrizione che passare da un modello piccolo a quello più grande. La maggior parte delle trascrizioni pessime che ho visto non erano un fallimento del modello. Erano un microfono del laptop che captava il condizionatore, quattro persone in una stanza con un solo vivavoce, o un auricolare Bluetooth che tagliava la prima parola di ogni frase. Prima migliora l'audio. L'AI non può togliere dalla registrazione quello che ha già sentito.

Altri due fattori influenzano la precisione. Il primo è come lo strumento determina dove una persona smette di parlare e un'altra inizia, il che diventa più difficile quando le persone si sovrappongono (il motivo per cui qualsiasi trascrizione della mia famiglia a cena sembrerebbe un unico fiume di 400 parole). Il secondo è il supporto al vocabolario personalizzato: la possibilità di inserire nomi di prodotti, cognomi e acronimi che nessun modello generale ha mai visto. Whisper ti permette di impostare un vocabolario personalizzato e di dare priorità alle hotword sul suo motore Whisper locale, e molti bot per riunioni lo fanno pure. Se le tue chiamate sono piene di gerghi tecnici, quella singola impostazione vale più di un aggiornamento del modello.

Senza bot e offline: trascrivere una registrazione che hai già

Ecco il percorso che il termine di ricerca non mette in evidenza, e quello per cui la nostra app è costruita. Non hai sempre bisogno di un software che entri in una riunione. A volte hai già la registrazione — un messaggio vocale di un colloquio individuale, un'intervista, l'esportazione di un webinar, una clip inviata da un collega — e hai solo bisogno di testo pulito da essa, sul tuo dispositivo, senza bot in nessuna chiamata.

Un software di dettatura e trascrizione come Whisper si adatta perfettamente qui, e guadagna il suo posto grazie alla privacy. In modalità locale tutto gira sul tuo laptop. L'audio non lascia mai il dispositivo: nessun server in mezzo, nessun log del fornitore, nessun contatore di costi cloud. La discussione sullo stipendio del tuo capo, la registrazione legale, la conversazione con le risorse umane: nulla di tutto questo dovrebbe finire nello storage di terze parti solo perché hai bisogno di una trascrizione. Il local-first non è una funzionalità qui. È il punto fondamentale.

Whisper
La vera app Whisper, in esecuzione locale — puoi interagirci. Questo è il percorso senza bot: puntala su una registrazione che hai già e ottieni testo pulito, sul tuo dispositivo.

Whisper utilizza due motori locali, entrambi in Rust puro tramite transcribe-rs, senza sidecar Python che rallenta l'avvio. Il primo è il Whisper open-source di OpenAI, che nelle sue versioni multilingue copre 99 lingue e può tradurre in inglese, con dimensioni dei modelli che vanno da Base (circa 140 MB) fino a Large v3 (circa 3 GB). Le versioni solo inglese sono esattamente questo — solo inglese — e tendono a girare in modo un po' più snello. Il secondo motore è Parakeet TDT di NVIDIA, circa 600 MB, descritto nell'app come 5-10 volte più veloce di Whisper su CPU, e copre l'inglese più 24 lingue europee (25 in totale), senza traduzione verso l'inglese. Scegli Parakeet per la velocità se lavori principalmente in inglese. Scegli Whisper se hai bisogno di traduzione o di una lingua che Parakeet non copre.

CancelTranscribing
L'overlay di Whisper mentre elabora una registrazione — un piccolo widget flottante, nessun bot in nessuna chiamata.

L'interazione è la stessa che uso tutto il giorno. Tieni premuto il tasto di scelta rapida — Ctrl+Space su Windows, oppure la combinazione Command+Option push-to-talk su Mac, tenendo entrambi i tasti premuti e rilasciando uno dei due per fermarti — parla, e il testo compare nel cursore in qualsiasi app sia in primo piano. Un piccolo overlay mostra lo stato durante l'elaborazione. Per una registrazione invece che per il parlato in diretta, punta l'app sul file e ricevi la trascrizione. Se vuoi approfondire la parte della dettatura, la nostra guida al riconoscimento vocale offline entra nei dettagli su come eseguire tutto sul dispositivo.

Esiste anche un'opzione Cloud, per chi vuole i modelli OpenAI più recenti e una ricerca web a voce nello stesso strumento. Porta la tua chiave OpenAI, di' «Hey whisper» per instradare il testo attraverso l'AI. Ma per trascrivere una registrazione che già possiedi, la modalità locale è la risposta, ed è gratuita per qualsiasi utente registrato.

Gli altri strumenti da conoscere

Questa categoria è affollata e i risultati di ricerca sono dominati da liste che classificano sei o dieci strumenti ciascuna. Ecco una mappa semplice per evitarti di leggere dieci recensioni per capire a cosa serve ognuno. Tutte le funzionalità seguenti provengono dalle pagine ufficiali di ciascuno strumento.

  • Otter.aiil bot notetaker di riferimento. Entra in Zoom, Teams e Meet; piano Basic gratuito con 300 minuti mensili, livelli Pro e Business a pagamento. Trascrizione in sei lingue: inglese, spagnolo, francese, tedesco, giapponese, cinese.
  • Fireflies.aiil bot entra su invito o in auto-join dal calendario. Piano gratuito con trascrizione illimitata e riepiloghi AI limitati; supporta 100+ lingue tra i vari piani.
  • tl;dvregistra Meet, Zoom e Teams, propone una modalità senza bot, trascrive in 30+ lingue, piano gratuito senza limiti di tempo né carta di credito.
  • Fathompiano gratuito con registrazioni illimitate, scelta tra acquisizione senza bot (beta) o con bot; livelli Premium, Team e Business a pagamento.
  • Nottadispone di un bot per Zoom, Teams e Meet e di un piano gratuito; il suo centro assistenza elenca circa 58 lingue.
  • Zoom e Teams, integratiprima di acquistare qualcosa, controlla quello per cui stai già pagando. Zoom trascrive le registrazioni cloud e offre la trascrizione in tempo reale AI Companion in 46 lingue nei piani a pagamento idonei. Microsoft Teams ha la trascrizione in diretta integrata in circa 50 e più lingue parlate; la trascrizione tradotta in diretta richiede Teams Premium.

Ecco la stessa mappa in formato tabella, con solo le informazioni verificabili sulle pagine ufficiali di ciascuno strumento. Nessun dato su precisione o velocità, perché nessuno li ha confrontati sullo stesso audio, e non intendo inventare il test.

Strumenti di trascrizione delle riunioni a confronto: metodo di acquisizione, dove girano, supporto offline, modello di prezzo, numero di lingue e a cosa serve ciascuno.
StrumentoAcquisizioneLocale/CloudFunziona offlineModello di prezzoLingueIdeale per
Otter.aiBot entra nella chiamataCloudNoPiano gratuito + a pagamento per utente6Il notetaker di squadra predefinito
Fireflies.aiBot su invito o auto-joinCloudNoPiano gratuito + a pagamento per utente100+Trascrizione gratuita generosa
tl;dvRegistra la chiamata, modalità senza botCloudNoGratuito per sempre + a pagamento30+Nessun bot nella griglia della riunione
FathomSenza bot (beta) o con botCloudNoGratuito per sempre + a pagamentoNon indicato nella pagina prezziRegistrazioni gratuite illimitate
NottaBot entra nella chiamataCloudNoPiano gratuito + a pagamento~58 (centro assistenza)Un bot con piano gratuito
Zoom / Teams (integrato)Nativo nella chiamataCloudNoIncluso nei piani a pagamento idoneiZoom 46, Teams 50+Quello per cui paghi già
Whisper by RemskillNessuna chiamata; trascrive un file o dettaturaLocale (Cloud opzionale)Piano locale gratuito + Pro99 multilingue, 25 ParakeetPrivato, senza bot, sul dispositivo

Se le tue riunioni girano già su un piano Zoom o Teams a pagamento, la trascrizione integrata potrebbe essere tutto ciò di cui hai bisogno, senza aggiungere un altro abbonamento o un altro bot alla chiamata.

Cosa sceglierei per ogni situazione

Leggo le email di supporto, quindi vedo il rimpianto da strumento sbagliato abbastanza spesso da avere un'opinione. Ecco come sceglierei.

  • Vuoi le note di una videochiamata di squadra, automaticamente, condivise con tutti. Usa un bot notetaker. Otter se vuoi l'opzione rifinita di default, Fireflies o Fathom se vuoi un piano gratuito generoso, tl;dv se non vuoi il bot nella griglia della riunione.
  • Sei già su un piano Zoom o Teams a pagamento. Prova la trascrizione integrata prima di pagare per un terzo strumento.
  • Hai una registrazione e vuoi testo pulito, in privato, sul tuo dispositivo. Questo è il percorso senza bot e offline: Whisper, o un altro strumento di trascrizione locale. L'audio rimane sul dispositivo.
  • Vuoi scrivere a voce (email, documenti, note durante o dopo la chiamata) nel cursore, in qualsiasi app. Quella è dettatura, ed è il lavoro per cui Whisper è stato costruito. Il nostro confronto tra software di trascrizione spiega in modo più dettagliato la differenza tra dettatura e note di riunione.
  • Hai bisogno di una trascrizione quasi perfetta garantita per un verbale legale o di conformità. Usa un servizio con verifica umana. L'AI da sola non supera il 99% su audio reale.

L'errore da evitare è pagare un bot per riunioni per fare dettatura, o aspettarsi che uno strumento di dettatura entri nelle tue chiamate. Categorie diverse. Scegli quella che corrisponde al lavoro. Ho sviluppato software per quindici anni e l'anno scorso ho comunque comprato lo strumento sbagliato per un compito, quindi non è una lezione di chi l'ha azzeccata al primo colpo.

Prezzi, in numeri chiari

La maggior parte degli strumenti qui ha un piano gratuito che vale la pena provare prima di tirare fuori la carta. Otter, Fireflies, tl;dv e Fathom offrono tutti un piano gratuito, con livelli a pagamento quando hai bisogno di più minuti, più posti o spazio illimitato. I bot notetaker di solito fanno pagare per utente al mese, il che si somma in fretta in un team.

Whisper è gratuito per ogni utente registrato su tutta la pipeline locale — entrambi i motori, il potenziamento AI tramite Ollama, la cronologia, i preset, il vocabolario personalizzato, il tasto di scelta rapida, tutto — senza richiedere un metodo di pagamento alla registrazione. Il piano a pagamento aggiunge la superficie Cloud per chi vuole i modelli di OpenAI e la ricerca web a voce. I numeri esatti per mensile, annuale, lifetime e posti team si trovano nella pagina dei prezzi. Preferisco che tu parta gratis e decida da solo piuttosto che portare un prezzo fuori contesto qui.

Scegli il tipo di strumento prima del brand. Se un bot deve entrare nella tua chiamata, usa un notetaker. Se una registrazione sul tuo laptop deve diventare testo privato, usa qualcosa offline. Il conto a cinque cifre che ho visto accumulare a quel team è arrivato dal non aver mai chiesto per quale lavoro stessero pagando — e quella è una riunione di cui nessuno aveva bisogno della trascrizione.

Prova il percorso senza bot su una registrazione che hai già

Scarica Whisper, puntalo su una registrazione e guarda il testo pulito arrivare — sul tuo dispositivo, senza bot in nessuna chiamata.

Gratuito per ogni utente registrato su tutta la pipeline locale. Nessun metodo di pagamento alla registrazione.

Foto di Denys Medvediev

Denys Medvediev

Sono io che leggo le email di supporto, quasi sempre dettando le risposte.

Approfondimenti