Guida
App per la trascrizione delle lezioni, spiegate bene
Registrazione dal vivo o autodettatura, da dove arriva l'audio, e la linea locale-vs-cloud che gli studenti dovrebbero valutare più attentamente di quanto non facciano.
Ultimo aggiornamento: giugno 2026

Un'app per la trascrizione delle lezioni converte le lezioni parlate in testo ricercabile, catturando l'audio dal vivo oppure trascrivendo una registrazione in seguito. Alcuni strumenti registrano in cloud. Altri, come Whisper, trascrivono ciò che detti sul dispositivo con un tasto push-to-talk. La scelta giusta dipende da chi parla e da dove viene elaborato l'audio.
La scorsa primavera uno studente mi ha inviato via email la registrazione di una lezione di chimica organica di 90 minuti, chiedendomi perché il suo strumento di trascrizione avesse trasformato "enantiomero" in "e un antimorbo". Domanda legittima. La risposta onesta è che quasi tutte le app per lezioni affrontano la stessa sfida difficile: trasformare il rumore di fondo di un'aula con un professore lontano dal microfono in testo pulito. La differenza sta in dove va l'audio e chi può tenerlo. Una lezione di 90 minuti è lo scenario peggiore per l'audio: distanza, eco, gergo tecnico e un microfono progettato per le videochiamate.
Gli studenti cercano da anni una trascrizione affidabile delle lezioni, e le app di presa appunti integrate sono rimaste appena al di sopra dell'inutilità per clip brevi. Nel 2026 il divario si è ridotto. Diverse app trasformano ora un'intera lezione in una trascrizione ricercabile più un riassunto, e alcune lo fanno interamente sul tuo laptop senza che nulla esca dal dispositivo. Questo articolo spiega la differenza tra registrare una lezione dal vivo e dettare i propri appunti, da dove proviene l'audio, e la linea locale-vs-cloud che gli studenti dovrebbero valutare più attentamente. Alla fine saprai quale tipo di strumento fa al caso tuo. Leggo gran parte delle email di supporto che gli studenti ci inviano, e la verità un po' noiosa è che la maggior parte proviene da chi ha scelto la categoria sbagliata di app dal primo giorno. Quella pila di ticket è, a modo suo, il motivo per cui questo articolo esiste.
Tre tipi di studenti cercano un'app per la trascrizione delle lezioni: quello a cui si accorcia la mano dopo 20 minuti di appunti, quello che si distrae e vuole una registrazione di backup, e quello che studia in una lingua che non è la sua prima. Tutti e tre stanno risolvendo lo stesso problema — stare al passo con un essere umano che parla — e tutti e tre stanno per scoprire che "app di trascrizione" significa due cose molto diverse.
Registra la lezione, ottieni testo pulito. Questo è tutto.
Togliendo il marketing, ogni app di trascrizione delle lezioni fa una sola cosa. Prende l'audio di qualcuno che parla e restituisce testo che puoi cercare, citare e studiare. Il professore parla, l'app ascolta, le parole finiscono sulla pagina. Le differenze tra gli strumenti dipendono tutte da questo: se l'audio viene catturato dal vivo o in un secondo momento, se viene elaborato su un server o sulla tua macchina, e come l'app perfeziona il risultato.
Whisper by Remskill gestisce la parte di dettatura. Tieni premuto un tasto, parli, e la trascrizione viene incollata al cursore in qualsiasi app tu stia usando — che si tratti di Notion, Word, un documento Google o un'email. Su Windows il tasto predefinito è Ctrl+Space. Su macOS è la combinazione Command+Option push-to-talk: tieni premuto per registrare, rilascia per fermarti. Dopo aver rilasciato, il microfono rimane attivo per un buffer di coda di 500 millisecondi così l'ultima parola non viene tagliata. Non c'è nessun passaggio "entra nella riunione" né attesa di caricamento. Parli, e un secondo o due dopo il testo è lì.
Questa distinzione conta più per le lezioni che per la maggior parte dei casi d'uso, ed è la cosa successiva da chiarire.
Cattura dal vivo e dettatura degli appunti non sono la stessa cosa

Ecco la distinzione che confonde la maggior parte degli studenti. Alcune app sono progettate per catturare una lezione dal vivo: registrano la stanza, o entrano in una chiamata Zoom, e trascrivono la voce del professore per te. Altre sono progettate per farti dettare, con la tua voce, gli appunti e i riassunti che vuoi. Entrambe producono una trascrizione. Non sono intercambiabili.
Whisper appartiene al secondo gruppo. Trascrive ciò che il microfono sente mentre parli. È eccellente per la parte dello studio che arriva dopo la lezione: dettare il riassunto a mente fresca, ragionare ad alta voce su un esercizio, registrare la tua spiegazione di un concetto, o scrivere un'email a un gruppo di studio. Non è un bot che si siede in aula e cattura il professore al posto tuo. Se vuoi catturare in modo autonomo una lezione dal vivo di qualcun altro, uno strumento dedicato alla registrazione è la scelta migliore, e ne citerò qualcuno più avanti nella sezione onesta.
La verità un po' noiosa è che la trascrizione più accurata che puoi ottenere da una lezione è quella in cui chi parla è vicino a un buon microfono. Quando detti il tuo riassunto, la tua bocca è a 20 centimetri dal microfono. Quando registri un professore, la sua bocca è a 20 metri di distanza, dietro un podio, in lotta con un impianto di climatizzazione. Stesso software, due mondi di risultati completamente diversi.
Da dove proviene l'audio della lezione

Ogni trascrizione inizia con un microfono, e un'aula universitaria è il posto in cui i buoni microfoni vanno a soffrire. L'audio può provenire da tre posti. Il primo è il microfono integrato del tuo laptop, ottimizzato per chi è seduto proprio davanti a lui: ottimo per dettare i propri appunti, pessimo per un professore dall'altro lato di un'aula da 200 posti. Il secondo è l'audio loopback del sistema, il suono che esce dagli altoparlanti, quello che cattureresti durante una lezione Zoom dal vivo o una classe online registrata. Il terzo è un microfono esterno dedicato posizionato vicino alla fonte.
Il posizionamento del microfono è la leva più importante per l'accuratezza, non il modello. Un microfono USB da $20 fa più per una trascrizione di qualsiasi aggiornamento a un modello più grande. Ho visto studenti angosciarsi su quale app fosse "la più accurata" mentre dettavano in un microfono del laptop in un bar. L'app non era mai il problema. L'audio lo era.
Per una classe online o una lezione Zoom, catturare l'audio loopback funziona perché il parlato arriva già attraverso canali digitali puliti. Per un'aula grande con persone fisicamente presenti, la risposta realistica è registrare vicino alla fonte — siediti nelle prime file o usa un microfono a clip — e trascrivere in seguito. Nessuna app trasforma una registrazione confusa in una trascrizione perfetta. Trasformano un audio buono in ottimo testo, e un audio pessimo in "e un antimorbo".
Trascrizione locale e cloud tracciano un confine sulla privacy che gli studenti dovrebbero vedere
La maggior parte dei confronti tra app per lezioni salta questa parte, ed è quella a cui terrei di più come studente. Dove viene elaborato l'audio? Due risposte. Gli strumenti cloud inviano la tua registrazione a un server, la trascrivono lì, e ti restituiscono il testo. Gli strumenti locali fanno tutto sul tuo laptop, senza che nulla esca dalla macchina.
Tra me e te, la trascrizione solo-cloud di una lezione è una decisione sulla privacy che le persone prendono senza rendersi conto di prenderla. Una registrazione del tuo professore — le sue parole, la sua ricerca non pubblicata, il commento a margine sull'esame imminente — che finisce nei log di un fornitore è una cosa irrilevante, finché non lo è più. Prima il locale, altrimenti lascia perdere. È un'affermazione più netta di quelle che faccio di solito, e la sostengo: quando una registrazione vive solo sul tuo laptop, non c'è violazione di server che possa diffonderla, nessuna modifica ai termini di servizio che conceda diritti di addestramento a tua insaputa, nessun account dimenticato da eliminare.
Whisper esegue la trascrizione locale in puro Rust, senza Python sidecar, usando due motori tra cui scegliere. Il Whisper locale offre diverse dimensioni di modello, da un modello Base di circa 140 MB a un Large v3 multilingue di circa 3 GB, e le varianti multilingue coprono 99 lingue con traduzione verso l'inglese. NVIDIA Parakeet è un modello da circa 600 MB, copre l'inglese più 24 lingue europee per un totale di 25, ed è da 5 a 10 volte più veloce di Whisper su CPU, anche se non può tradurre o gestire le lingue asiatiche. Se vuoi la massima qualità e accesso al web, c'è anche una modalità Cloud che usa la tua chiave OpenAI. L'intero pipeline locale è gratuito per qualsiasi utente registrato, senza carta al momento dell'iscrizione; il Cloud è un componente aggiuntivo a pagamento. Il tutto funziona anche senza connessione internet, e c'è una guida più dettagliata nella nostra guida al riconoscimento vocale offline se questa è la tua preoccupazione principale.
Le altre app per lezioni che vale la pena conoscere
Whisper è uno strumento di dettatura, non un bot che registra la stanza, quindi per la cattura di lezioni dal vivo la mossa onesta è indicarti app costruite per farlo. Ecco come differiscono le opzioni più comuni, con dati reali dove una fonte primaria li ha forniti.
| App | A cosa serve | Dove viene elaborato l'audio | Piano gratuito nella realtà | Lingue |
|---|---|---|---|---|
| Whisper by Remskill | Dettare i propri appunti e riassunti | Locale (Whisper o Parakeet) o Cloud con chiave propria | Pipeline locale completa gratuita, nessuna carta | 99 su Whisper multilingue; 25 su Parakeet |
| Otter | Registrare e riassumere riunioni/lezioni dal vivo | Cloud | 300 min/mese, limite di 30 min per registrazione | Non indicato dalla fonte |
| Apple Voice Memos | Registrare una lezione, poi leggere la trascrizione | Apple (integrato) | Integrato in macOS | Non indicato dalla fonte |
| Notta | App per appunti AI cloud per riunioni/lezioni | Cloud | Prezzi non verificati | Decine, secondo il conteggio di Notta |
Alcune di quelle righe meritano un commento. Il piano Basic gratuito di Otter offre 300 minuti di trascrizione al mese con un limite di 30 minuti per registrazione, il che significa che una singola lezione di 90 minuti non si adatta a una registrazione gratuita. Apple Voice Memos può registrare l'audio e poi mostrarne una trascrizione, quindi per gli studenti Mac è una vera opzione "registra la lezione, leggila dopo" già installata sul dispositivo. Notta dice di supportare decine di lingue, ma non ho potuto aprire la sua pagina dei prezzi per verificare i limiti di minuti, quindi tratta i dettagli dei piani come "da controllare prima di impegnarsi".
Quando evitare Whisper per le lezioni
Se la tua vera necessità è mettere uno strumento davanti a un professore in carne e ossa e andartene con le sue parole, salta Whisper. Noi trascriviamo ciò che detti tu, non quello che dice qualcuno dall'altra parte dell'aula. Per la cattura automatica dal vivo, usa uno strumento dedicato alla registrazione. Su Mac, Apple Voice Memos registra la stanza e poi ti mostra una trascrizione gratuitamente, già installata. Se vuoi la cattura di riunioni dal vivo con etichette dei parlanti e riassunti, Otter è fatto per quello. Il suo piano gratuito gestisce 300 minuti al mese, ma il limite di 30 minuti per registrazione significa che per una lezione completa serve il piano a pagamento. Usa Whisper per lo studio che avviene dopo la lezione: il riassunto che detti, il problema che ragioni ad alta voce, l'email che mandi mentre prepari la cena.
Trascrizione locale gratuita, Pro per il cloud
Ecco la parte che gli studenti chiedono di più: i costi. L'intera parte locale di Whisper — entrambi i motori, la pulizia AI tramite modello locale, la cronologia, il tasto personalizzato, i download dei modelli — è gratuita per qualsiasi utente registrato, senza metodo di pagamento richiesto all'iscrizione. È una scelta deliberata. La trascrizione locale gira sulla CPU del tuo laptop. Fare pagare un abbonamento mensile per una capacità di calcolo che hai già pagato non ci sembrava giusto.
Il piano a pagamento, Whisper Pro, aggiunge l'accesso al Cloud: trascrizione cloud OpenAI, miglioramento AI cloud, e ricerca web vocale. È la parte con un costo per utilizzo lato OpenAI e un server nel flusso, quindi si trova dietro un abbonamento con un breve trial Cloud. I numeri esatti sono sulla pagina dei prezzi. Per la dettatura pura durante lo studio delle lezioni, la maggior parte degli studenti non lascia mai il piano locale gratuito. Questo è il punto.
Un martedì sera dell'ultimo semestre stavo preparando i cestini del pranzo (panino, frutta, lo yogurt che il piccolo si rifiuta di mangiare) quando mia figlia grande aveva bisogno di rispondere alla maestra riguardo a una gita. Ho preso il laptop con una mano sola, ho tenuto premuto il tasto e ho dettato l'email tra una fetta di cetriolo e l'altra: pausa per chiedere come si scriveva il nome della maestra, pausa ancora quando il piccolo ha chiesto perché la luna a volte non si vede, poi avanti. L'email è partita. I cestini sono stati preparati. La mia calligrafia, a voler essere onesti, non avrebbe prodotto né l'una né gli altri. Questa è la versione della trascrizione che si adatta alla vita vera: non un bot in un'aula, ma una voce che tiene il passo quando hai le mani occupate. Scegli lo strumento giusto per il lavoro, poi vai a studiare. Scopri come funziona Whisper.
Vuoi provarlo nella prossima sessione di studio?
Scarica Whisper, tieni premuto il tasto e detta il riassunto della lezione finché è ancora fresco. Il pipeline locale completo è gratuito.
Trascrizione locale gratuita per qualsiasi account registrato — nessuna carta all'iscrizione.



