Di Denys Medvediev

Confronto

Whisper vs Parakeet

Whisper e Parakeet sono i due motori vocali locali integrati in Whisper by Remskill, e la scelta si riduce a un unico compromesso. Parakeet è da 5 a 10 volte più veloce di Whisper su una CPU, ma gestisce l'inglese più 24 lingue europee. Whisper è più lento, ma copre 99 lingue, traduce in inglese e ti dà un controllo preciso.

Ultimo aggiornamento: giugno 2026

Forme d'onda audio colorate su uno schermo di editing scuro, che evocano due motori vocali

Whisper e Parakeet sono entrambi inclusi gratuitamente in Whisper by Remskill, e passi dall'uno all'altro con un menu a tendina. Parakeet è da 5 a 10 volte più veloce su una CPU e copre l'inglese più 24 lingue europee. Whisper è più lento, ma copre 99 lingue, traduce in inglese e ti offre vocabolario personalizzato e controllo del beam. Veloce contro flessibile, non buono contro cattivo.

Whisper e Parakeet sono i due motori vocali locali integrati in Whisper by Remskill, e la scelta si riduce a un unico compromesso. Parakeet è da 5 a 10 volte più veloce di Whisper su una CPU, ma gestisce l'inglese più 24 lingue europee. Whisper è più lento, ma copre 99 lingue, traduce in inglese e ti dà un controllo preciso.

Li offriamo entrambi, quindi questo non è uno spot pubblicitario

La maggior parte degli articoli "X vs Y" sono scritti da chi vende X. Questo è diverso. Noi offriamo entrambi i motori nella stessa app. Scegli quello che preferisci da un menu a tendina, lo scarichi una volta e cambi quando vuoi.

Questo significa che non ho alcun motivo per convincerti a scegliere quello sbagliato. Se Parakeet è quello giusto per te, voglio che usi Parakeet. Se hai bisogno di Whisper, voglio che usi Whisper. L'app non sceglie per te, e nemmeno io lo farò. Mi limiterò a spiegarti in cosa ciascuno dei due è davvero bravo.

Entrambi funzionano completamente offline. Entrambi sono gratuiti per ogni utente che ha effettuato l'accesso. Niente carta, niente bolletta cloud al minuto, niente costi extra per il secondo motore.

Parakeet è quello veloce

Parakeet è il modello TDT di NVIDIA. La sigla sta per Token-and-Duration Transducer, un encoder FastConformer collegato a un decoder che predice sia le parole sia la loro durata. Non c'è bisogno che tu ricordi nulla di tutto questo. La parte che conta è nella frase successiva.

È da 5 a 10 volte più veloce di Whisper su una semplice CPU. Niente GPU richiesta, nessuna attesa. Rilasci la scorciatoia e il testo è praticamente già lì.

Il modello incluso è Parakeet v3, circa 600 MB su disco, e copre l'inglese più altre 24 lingue europee, 25 in totale. La qualità è buona. Non al livello di Whisper-large, ma più che sufficiente per la dettatura di tutti i giorni: email, note, messaggi, le cose che la maggior parte di noi scrive tutto il giorno.

Quello che Parakeet non fa: non tradurrà il tuo parlato in inglese e non accetta vocabolario personalizzato o suggerimenti di hotword. Se detti in francese, ottieni testo in francese. Che è esattamente ciò che vuole la maggior parte di chi parla francese, quindi è un problema solo se la traduzione è l'unico motivo per cui sei qui.

Whisper è quello meticoloso

Whisper è il modello open di OpenAI, e dentro la nostra app arriva in otto varianti. Quattro solo per l'inglese e quattro multilingue, da un modello Base di circa 140 MB fino a un Large v3 di circa 3 GB. Scegli la dimensione che si adatta alla tua macchina e alla tua pazienza.

I modelli multilingue coprono 99 lingue, non 25. Tra queste cinese, giapponese, coreano e arabo, quelle che Parakeet salta del tutto. Whisper inoltre tradurrà una qualsiasi di esse in inglese in un solo passaggio, cosa che Parakeet non può fare.

E Whisper ti dà un controllo che Parakeet non offre: vocabolario personalizzato, impostazioni di beam-size e bias delle hotword, così smette di storpiare il nome del tuo collega o quello del tuo prodotto. Se detti termini tecnici tutto il giorno, quel controllo è la differenza tra un testo pulito e una noiosa sessione di trova-e-sostituisci.

Il prezzo da pagare è la velocità. Sulla stessa CPU, Whisper è più lento, a volte molto più lento con i modelli più grandi. La verità noiosa è che la maggior parte di chi sceglie Whisper non sta scegliendo l'accuratezza rispetto a Parakeet, quanto piuttosto le lingue e il controllo rispetto alla velocità.

Whisper
Il selettore di modelli reale di Whisper by Remskill — entrambi i motori selezionabili nell'app vera e propria, non uno screenshot.

Il confronto onesto, in un'unica tabella

Ecco l'intera decisione in sette righe. Nessuna cifra in dollari — entrambi i motori sono gratuiti sullo stesso piano.

Confronto delle funzionalità tra Parakeet e Whisper all'interno di Whisper by Remskill
FunzionalitàParakeetWhisper
MotoreNVIDIA TDT (FastConformer + Token-and-Duration Transducer)OpenAI Whisper
Dimensione del download~600 MB (un modello)da ~140 MB a ~3 GB (8 modelli)
Lingue25, inglese + 24 europee99 (modelli multilingue)
Traduzione in ingleseNo
Velocità su CPUda 5 a 10 volte più velocePiù lento
Vocabolario personalizzato / hotword / controllo del beamNo
Ideale perDettatura veloce in inglese / lingue UE su una CPU99 lingue, traduzione, controllo preciso

Entrambi sono locali, entrambi sono offline, entrambi sono gratuiti sullo stesso piano. La tabella non è "buono vs cattivo". È "veloce vs flessibile".

Quale dovresti scegliere davvero

Questa è la parte che la maggior parte degli articoli di confronto evita, quindi eccola chiara e diretta.

Per la maggior parte degli utenti di lingua inglese, scegli Parakeet. La velocità vince ogni giorno. Detti decine di volte al giorno, e la differenza tra "il testo compare all'istante" e "il testo compare dopo un attimo" è la differenza tra restare nel filo del pensiero e perderlo. Oltre circa due secondi, il tuo cervello ricomincia a interagire con l'app in cui eri, e dimentichi cosa stavi dicendo. Il fatto che Parakeet sia da 5 a 10 volte più veloce su una CPU non è un vanto da scheda tecnica. È la cosa che senti cento volte al giorno.

Scegli Whisper quando hai bisogno di una delle tre cose che Parakeet non può darti: una lingua al di fuori delle 25 europee (cinese, giapponese, coreano, arabo), la traduzione in inglese, oppure il controllo con vocabolario personalizzato e hotword per nomi e gergo.

Sono il tipo di persona che disegna lo schema dell'architettura prima ancora di installare il runtime, quindi il mio istinto è sempre "usa lo strumento più capace". Qui quell'istinto sbaglia. Lo strumento più capace è Whisper, ma lo strumento giusto per un'abitudine quotidiana di dettatura in inglese è di solito quello più veloce. La capacità che non usi è solo dimensione di download.

CancelTranscribing
L'overlay di registrazione reale dell'app durante la dettatura — stessa scorciatoia e stesso overlay qualunque motore tu scelga.

Un caso reale in cui vince Whisper

All'inizio, alla terza settimana dopo il lancio, un utente mi scrisse via email chiedendo se l'app potesse gestire l'ucraino-verso-inglese a metà frase. Leggeva le notizie da Kiev in tempo reale, cambiando lingua ogni poche parole. Avevo dato per scontato che "multilingue" volesse dire scegli-una-lingua-per-sessione. Lui intendeva un vero code-switching, in una lingua che le 25 di Parakeet non coprono nemmeno del tutto per quel flusso di lavoro. Il modello multilingue di Whisper se l'è cavata: 99 lingue, rilevamento automatico, traduzione in inglese nello stesso passaggio. Non mi ha più riscritto per confermare. Scelgo di leggerlo come un buon segno.

Questa è l'intera regola in una sola storia. Se la tua giornata assomiglia alla sua, la velocità di Parakeet non ti aiuta, perché Parakeet non è proprio in grado di fare il lavoro. Per chiunque abbia una giornata fatta di email in inglese dettate tra una riunione e l'altra, la velocità è proprio il punto.

Come passare dall'uno all'altro

Non devi impegnarti per sempre. Apri il selettore di modelli, scegli Parakeet o un qualsiasi modello Whisper, e si scarica una volta sola. Torna indietro ogni volta che cambia il lavoro: Parakeet per il pacchetto di email del mattino, Whisper Large v3 il pomeriggio in cui trascrivi un'intervista in giapponese.

Stessa scorciatoia, stesso overlay, stesse impostazioni in entrambi i casi. Su Windows il valore predefinito è Ctrl+Space. Su Mac è un accordo push-to-talk Command+Option, ed è rimappabile se va in conflitto con qualcos'altro. Il motore è un menu a tendina, non una reinstallazione.

Se ricordi una cosa sola

Parakeet per velocità e inglese. Whisper per 99 lingue, traduzione e controllo. Non devi scegliere al momento dell'installazione, perché entrambi sono inclusi nella stessa app e cambiarli è questione di un menu a tendina, non di una decisione di download a cui resti vincolato.

Se vuoi il quadro più ampio sul perché eseguire tutto questo sulla tua macchina sia meglio che inviare l'audio a un server, ne ho scritto in speech-to-text offline. E se ci stai valutando rispetto a una specifica app a pagamento, l'articolo alternativa a superwhisper copre quel confronto diretto.

Installa entrambi i motori e lascia che sia il primo pomeriggio a decidere

Scarica l'app, installa Parakeet e un modello Whisper — sono entrambi gratuiti — e lascia che il tuo primo pomeriggio risolva la questione.

Entrambi i motori locali sono gratuiti per sempre. Nessun metodo di pagamento alla registrazione. La prova Cloud di 7 giorni chiede una carta solo al momento dell'upgrade.

Foto di Denys Medvediev

Denys Medvediev

Sono quello che legge le email del nostro supporto, molto probabilmente dettando le risposte.

Letture di approfondimento