Par Denys Medvediev

Comparatif

Whisper face à Parakeet

Whisper et Parakeet sont les deux moteurs de reconnaissance vocale locaux intégrés à Whisper by Remskill, et le choix se résume à un seul compromis. Parakeet est 5 à 10 fois plus rapide que Whisper sur un CPU, mais il gère l'anglais plus 24 langues européennes. Whisper est plus lent, mais il couvre 99 langues, traduit vers l'anglais et vous offre un contrôle fin.

Dernière mise à jour : juin 2026

Formes d'ondes audio colorées sur un écran de montage sombre, évoquant deux moteurs de reconnaissance vocale

Whisper et Parakeet sont tous deux fournis gratuitement avec Whisper by Remskill, et vous passez de l'un à l'autre depuis un menu déroulant. Parakeet est 5 à 10 fois plus rapide sur un CPU et couvre l'anglais plus 24 langues européennes. Whisper est plus lent mais couvre 99 langues, traduit vers l'anglais et vous donne un vocabulaire personnalisé et le réglage du beam. Rapide contre flexible, pas bon contre mauvais.

Whisper et Parakeet sont les deux moteurs de reconnaissance vocale locaux intégrés à Whisper by Remskill, et le choix se résume à un seul compromis. Parakeet est 5 à 10 fois plus rapide que Whisper sur un CPU, mais il gère l'anglais plus 24 langues européennes. Whisper est plus lent, mais il couvre 99 langues, traduit vers l'anglais et vous offre un contrôle fin.

Nous proposons les deux, donc ce n'est pas un argumentaire de vente

La plupart des articles « X contre Y » sont écrits par quelqu'un qui vend X. Celui-ci est différent. Nous proposons les deux moteurs dans la même application. Vous choisissez celui que vous voulez dans un menu déroulant, vous le téléchargez une fois, et vous changez quand vous voulez.

Autrement dit, je n'ai aucune raison de vous pousser vers le mauvais. Si Parakeet vous convient, je veux que vous utilisiez Parakeet. Si vous avez besoin de Whisper, je veux que vous soyez sur Whisper. L'application ne choisit pas à votre place, et moi non plus. Je vais simplement vous expliquer ce dans quoi chacun est vraiment bon.

Les deux fonctionnent entièrement hors ligne. Les deux sont gratuits pour tout utilisateur connecté. Pas de carte bancaire, pas de facture cloud à la minute, pas de surcoût pour le second moteur.

Parakeet, c'est le rapide

Parakeet est le modèle TDT de NVIDIA. TDT signifie Token-and-Duration Transducer : un encodeur FastConformer relié à un décodeur qui prédit à la fois les mots et leur durée. Vous n'avez rien de tout cela à retenir. Ce qui compte tient dans la phrase suivante.

Il est 5 à 10 fois plus rapide que Whisper sur un simple CPU. Pas besoin de GPU, pas d'attente. Vous relâchez le raccourci et le texte est pour ainsi dire déjà là.

Le modèle fourni est Parakeet v3, environ 600 Mo sur le disque, et il couvre l'anglais plus 24 autres langues européennes, soit 25 au total. La qualité est bonne. Pas au niveau de Whisper-large, mais largement suffisante pour la dictée du quotidien : e-mails, notes, messages, tout ce que la plupart d'entre nous tapons à longueur de journée.

Ce que Parakeet ne fait pas : il ne traduit pas votre parole en anglais, et il n'accepte ni vocabulaire personnalisé ni suggestions de mots-clés. Si vous dictez en français, vous obtenez du texte en français. Ce qui est exactement ce que veulent la plupart des francophones, donc ce n'est un problème que si la traduction est la seule raison de votre venue.

Whisper, c'est le minutieux

Whisper est le modèle ouvert d'OpenAI, et dans notre application il existe en huit déclinaisons. Quatre uniquement en anglais et quatre multilingues, d'un modèle Base d'environ 140 Mo jusqu'à un Large v3 d'environ 3 Go. Vous choisissez la taille qui convient à votre machine et à votre patience.

Les modèles multilingues couvrent 99 langues, pas 25. Cela inclut le chinois, le japonais, le coréen et l'arabe, celles que Parakeet ignore complètement. Whisper traduit aussi n'importe laquelle d'entre elles vers l'anglais en une seule étape, ce que Parakeet ne peut pas faire.

Et Whisper vous donne un contrôle que Parakeet n'offre pas : vocabulaire personnalisé, réglage du beam et biais de mots-clés pour qu'il arrête d'écorcher le nom de votre collègue ou de votre produit. Si vous dictez des termes techniques toute la journée, ce contrôle fait la différence entre un texte propre et une corvée de rechercher-remplacer.

Le prix à payer, c'est la vitesse. Sur le même CPU, Whisper est plus lent, parfois beaucoup plus lent sur les modèles les plus volumineux. La vérité un peu terne, c'est que la plupart des gens qui choisissent Whisper ne choisissent pas tant la précision face à Parakeet que les langues et le contrôle face à la vitesse.

Whisper
Le sélecteur de modèles de Whisper by Remskill, en direct — les deux moteurs sont sélectionnables dans la vraie application, ce n'est pas une capture d'écran.

La comparaison honnête, dans un seul tableau

Voici toute la décision en sept lignes. Aucun montant en dollars dedans : les deux moteurs sont gratuits sur le même palier.

Comparaison des fonctionnalités entre Parakeet et Whisper au sein de Whisper by Remskill
FonctionnalitéParakeetWhisper
MoteurNVIDIA TDT (FastConformer + Token-and-Duration Transducer)OpenAI Whisper
Taille du téléchargement~600 Mo (un seul modèle)~140 Mo à ~3 Go (8 modèles)
Langues25, anglais + 24 européennes99 (modèles multilingues)
Traduction vers l'anglaisNonOui
Vitesse sur CPU5 à 10 fois plus rapidePlus lent
Vocabulaire personnalisé / mots-clés / contrôle du beamNonOui
Idéal pourDictée rapide en anglais / langues européennes sur un CPU99 langues, traduction, contrôle fin

Les deux sont locaux, les deux sont hors ligne, les deux sont gratuits sur le même palier. Le tableau n'oppose pas « bon contre mauvais ». Il oppose « rapide contre flexible ».

Lequel devriez-vous vraiment choisir

C'est la partie que la plupart des comparatifs esquivent, alors la voici sans détour.

Pour la plupart des utilisateurs anglophones, choisissez Parakeet. La vitesse l'emporte au quotidien. Vous dictez des dizaines de fois par jour, et l'écart entre « le texte apparaît instantanément » et « le texte apparaît après un battement » est l'écart entre rester dans le fil de sa pensée et le perdre. Au-delà d'environ deux secondes, votre cerveau recommence à se reconnecter à l'application où vous étiez, et vous oubliez ce que vous étiez en train de dire. Que Parakeet soit 5 à 10 fois plus rapide sur un CPU, ce n'est pas une vantardise de fiche technique. C'est la chose que vous ressentez cent fois par jour.

Choisissez Whisper quand vous avez besoin de l'une des trois choses que Parakeet ne peut pas vous offrir : une langue hors des 25 langues européennes (chinois, japonais, coréen, arabe), la traduction vers l'anglais, ou le contrôle du vocabulaire personnalisé et des mots-clés pour les noms et le jargon.

Je suis le genre de personne qui dessine le schéma d'architecture avant d'installer le runtime, donc mon réflexe est toujours « prends l'outil le plus capable ». Ce réflexe est faux ici. L'outil le plus capable, c'est Whisper, mais le bon outil pour une habitude de dictée quotidienne en anglais, c'est généralement le plus rapide. Une capacité dont vous ne vous servez pas n'est qu'une taille de téléchargement.

CancelTranscribing
La vraie surcouche d'enregistrement en pleine dictée — même raccourci et même surcouche quel que soit le moteur choisi.

Un vrai cas où Whisper l'emporte

Au tout début, un utilisateur m'a écrit la troisième semaine après le lancement pour me demander si l'application pouvait gérer le passage de l'ukrainien à l'anglais en milieu de phrase. Il lisait les actualités de Kyiv en temps réel et changeait de langue tous les quelques mots. J'avais supposé que « multilingue » voulait dire choisir-une-langue-par-session. Lui parlait d'une vraie alternance de codes, dans une langue que les 25 de Parakeet ne couvrent même pas complètement pour ce type d'usage. Le modèle multilingue de Whisper s'en est sorti : 99 langues, détection automatique, traduction vers l'anglais dans la même passe. Il ne m'a jamais réécrit pour confirmer. Je choisis d'y voir bon signe.

Toute la règle tient dans cette histoire. Si votre journée ressemble à la sienne, la vitesse de Parakeet ne vous aide pas, parce que Parakeet ne peut tout simplement pas faire le travail. Pour tous ceux dont la journée consiste à dicter des e-mails en anglais entre deux réunions, la vitesse, c'est tout l'intérêt.

Comment passer de l'un à l'autre

Vous n'avez pas à vous engager. Ouvrez le sélecteur de modèles, choisissez Parakeet ou n'importe quel modèle Whisper, et il se télécharge une fois. Revenez en arrière dès que le travail change : Parakeet pour le lot d'e-mails du matin, Whisper Large v3 l'après-midi où vous transcrivez un entretien en japonais.

Même raccourci, même surcouche, mêmes réglages dans les deux cas. Sous Windows, le raccourci par défaut est Ctrl+Space. Sur Mac, c'est un accord push-to-talk Command+Option, et il est remappable s'il entre en conflit avec autre chose. Le moteur, c'est un menu déroulant, pas une réinstallation.

Si vous ne devez retenir qu'une chose

Parakeet pour la vitesse et l'anglais. Whisper pour 99 langues, la traduction et le contrôle. Vous n'avez pas à choisir au moment de l'installation, puisque les deux sont fournis dans la même application et que basculer est un menu déroulant, pas une décision de téléchargement dont vous restez prisonnier.

Si vous voulez la vue d'ensemble plus complète sur les raisons pour lesquelles faire tourner tout cela sur votre propre machine vaut mieux qu'envoyer l'audio à un serveur, j'en ai parlé dans la reconnaissance vocale hors ligne. Et si vous nous comparez à une application payante précise, l'article alternative à superwhisper couvre ce face-à-face.

Installez les deux moteurs et laissez le premier après-midi trancher

Téléchargez l'application, installez Parakeet et un modèle Whisper — les deux sont gratuits — et laissez votre propre premier après-midi régler le débat.

Les deux moteurs locaux sont gratuits pour toujours. Aucun moyen de paiement à l'inscription. L'essai Cloud de 7 jours ne demande une carte qu'au moment de la mise à niveau.

Photo de Denys Medvediev

Denys Medvediev

C'est moi qui lis nos e-mails de support, fort probablement en dictant les réponses.

Pour aller plus loin