Par Denys Medvediev

Explication

Whisper est-il gratuit ?

Oui — Whisper d'OpenAI est open-source sous licence MIT, donc le modèle est libre de téléchargement et d'utilisation, même à des fins commerciales. Le bémol, c'est l'exécution : configuration, dépendances, et votre propre matériel. Le chemin gratuit le plus simple, c'est d'utiliser Whisper en local via une application de bureau.

Dernière mise à jour : juin 2026

Cadenas ouvert posé sur un clavier d'ordinateur portable, évoquant l'open-source et les logiciels libres

Whisper est gratuit. OpenAI a publié son code et ses poids de modèle sous la licence permissive MIT, ce qui permet à n'importe qui de télécharger, d'exécuter et même d'utiliser commercialement ce modèle de transcription vocale sans frais. Le seul bémol, c'est la configuration : faire tourner Whisper soi-même nécessite Python, ffmpeg et du matériel à soi. Une application de bureau supprime ce bémol.

Les gens demandent « Whisper est-il gratuit ? » en s'attendant à un piège, parce qu'en 2026 presque rien de bien n'est vraiment gratuit. Alors soyons directs avant les nuances : oui. OpenAI a publié Whisper sous licence MIT — code et poids du modèle inclus — ce qui est à peu près aussi permissif qu'une licence logicielle peut l'être. Vous pouvez le télécharger, l'utiliser, le modifier, l'intégrer dans votre propre produit et en faire payer l'accès, sans qu'OpenAI vous demande un centime ni une mention.

Voilà le titre, et il est vrai. Ce que le titre ne dit pas, c'est la différence entre « le modèle est gratuit » et « utiliser le modèle est gratuit ». Ce n'est pas la même chose. Le modèle est un fichier. Transformer ce fichier en mots qui s'affichent à l'écran demande de la configuration, un peu de patience face à la ligne de commande, et un ordinateur capable de faire le calcul. Rien de tout ça n'est caché — c'est juste du travail, et c'est le vrai prix de la version open-source.

Voilà ce que la plupart des pages sur ce sujet mélangent. Il y a deux Whisper dans la conversation. L'un est le modèle open-source qu'OpenAI a publié sur GitHub — gratuit, MIT, à vous de faire tourner. L'autre est l'API de transcription hébergée d'OpenAI, qui utilise la même famille de modèles mais vous facture à la minute. Même nom, facture très différente.

Donc « Whisper est-il gratuit ? » se divise en trois réponses honnêtes. Le modèle lui-même : gratuit, point final. Le faire tourner soi-même : gratuit en euros, mais vous payez en configuration et en matériel personnel. Le faire héberger par quelqu'un : ça coûte de l'argent, que ce soit l'API d'OpenAI ou le niveau cloud d'une application payante. Ce guide passe en revue les trois options, montre le chemin gratuit le plus simple, et dit clairement ce qui n'est pas réellement gratuit.

Ce qu'est vraiment Whisper

Forme d'onde audio sur un écran à côté d'un microphone, représentant la parole transformée en texte

Whisper est un modèle de transcription vocale qu'OpenAI a publié fin 2022. Vous lui donnez de l'audio, il vous rend du texte. Et il s'en sort bien — entraîné sur une immense quantité d'audio multilingue, il gère les accents, le bruit de fond et des dizaines de langues mieux que les logiciels de dictée qu'on maudissait tous. Il peut aussi traduire des propos dans d'autres langues directement en texte anglais, ce que les anciens outils n'ont jamais vraiment réussi à faire proprement.

Le mot important est « modèle ». Whisper n'est pas une appli sur laquelle on double-clique. C'est le cerveau — un fichier de poids entraînés accompagné du code pour les exécuter. Tout seul, il n'a pas de fenêtre, pas de bouton, pas de prise micro. C'est le moteur, pas la voiture. Beaucoup de produits que vous connaissez ne sont, en coulisse, rien d'autre que Whisper avec une couche de vernis par-dessus — ce qui est tout à fait valide, mais ça vaut la peine de savoir que le moteur en dessous est la même pièce gratuite dans chacun d'eux.

Cette distinction explique pourquoi la question prête à confusion. Quand quelqu'un dit « Whisper coûte 30 dollars par mois », il ne parle pas du modèle — il parle d'une appli qui a emballé le modèle et fait payer l'emballage. Quand quelqu'un dit « Whisper est gratuit », il parle du moteur qu'OpenAI a mis à disposition. Les deux affirmations sont vraies en même temps, mais portent sur des choses différentes — c'est exactement pour ça que vous cherchez une réponse claire.

Oui, la licence MIT le rend vraiment gratuit

Ce n'est pas du « gratuit marketing », où « gratuit » signifie un essai qui expire ou un niveau qui vous harcèle. OpenAI a publié le code et les poids du modèle Whisper sous la licence MIT. La licence MIT est une licence open-source permissive et bien connue : elle vous permet d'utiliser, copier, modifier et distribuer le logiciel, y compris à des fins commerciales, avec pour seule condition de conserver l'avis de droits d'auteur. Pas de frais, pas de redevance, pas de coût par poste, pas de demande d'autorisation.

En termes pratiques : vous pouvez télécharger Whisper pour un usage personnel, l'utiliser dans une entreprise, l'intégrer dans un produit que vous vendez, transcrire un podcast pour un client — tout ça sans payer OpenAI. Les poids du modèle — la partie entraînée qui coûte cher à produire — sont également gratuits, pas seulement le code d'encapsulation. C'est là que les gens ont du mal à y croire, parce que les entreprises gardent habituellement les poids entraînés sous clé. OpenAI ne l'a pas fait ici.

Cancel
Whisper tourne en local : l'overlay d'enregistrement apparaît pendant que vous parlez, sans compteur à la minute qui tourne en arrière-plan.

Une précision honnête pour que personne ne me cite de travers. « Gratuit sous MIT » parle de la licence, pas d'une promesse que ça ne coûte rien à faire fonctionner. L'électricité n'est pas gratuite. Un ordinateur n'est pas gratuit. Votre temps n'est pas gratuit. Mais le logiciel et le modèle — les parties pour lesquelles une entreprise demanderait normalement un abonnement — ceux-là sont vraiment, définitivement, sans astérisque, gratuits. (Le genre de gratuit où on relit la licence deux fois parce qu'on est sûr d'avoir raté quelque chose. On n'a rien raté.)

Le bémol, c'est de le faire tourner soi-même

C'est là que la version gratuite a son prix — payé en temps plutôt qu'en argent. Faire tourner Whisper de façon brute, en open-source, passe par la ligne de commande. L'installation standard est un paquet Python, ce qui signifie qu'il faut d'abord configurer Python correctement. Whisper a aussi besoin de ffmpeg, un outil audio séparé, installé et accessible dans le chemin système. Sur certaines machines, il faut également Rust, juste pour qu'une dépendance du tokenizer puisse compiler. Rien d'exotique pour un développeur. Pour tout le monde, c'est un après-midi.

Il y a aussi le matériel. Whisper fait de vrais calculs, et les modèles les plus grands et les plus précis en font beaucoup. Sur un CPU classique, le grand modèle peut mettre plus de temps à transcrire un enregistrement que la durée de l'enregistrement lui-même. Pour avoir de la vitesse, il faut une GPU correcte, ce que la plupart des ordinateurs portables n'ont pas. Alors le vrai coût de la version gratuite, ce n'est pas des euros — c'est un environnement Python à maintenir, une commande à lancer à la main pour chaque fichier, et un ordinateur assez rapide pour ne pas vous faire attendre. (J'ai regardé quelqu'un qui n'est pas développeur suivre un article de blog « installer Whisper en 5 minutes ». Ce n'était pas cinq minutes. C'était un samedi, et un coup de téléphone à moi.)

Et encore une chose que la version brute ne vous donne pas : la dictée en direct. Whisper en ligne de commande transcrit un fichier que vous avez déjà enregistré. Il ne reste pas en arrière-plan, n'attend pas un raccourci clavier et ne colle pas du texte là où est votre curseur pendant que vous parlez. Pour ça — ce que la plupart des gens veulent vraiment quand ils cherchent — il faut une couche par-dessus le modèle. La bonne nouvelle, c'est que la meilleure couche est aussi gratuite, et c'est la section suivante.

La façon gratuite et simple : utiliser Whisper dans une appli

Vous pouvez garder tout le « gratuit » du modèle open-source et faire l'impasse sur toute la taxe « faire tourner soi-même ». C'est exactement pour ça qu'on a construit Whisper by Remskill — il fait tourner le même modèle Whisper open-source en local sur votre machine, sans Python, sans ffmpeg, sans ligne de commande. Tout le pipeline local est gratuit pour tout compte connecté, sans moyen de paiement demandé à l'inscription. Vous obtenez le moteur open-source sans les devoirs open-source. Voici comment configurer.

Étape 1 — Installez l'appli et connectez-vous.

Téléchargez depuis la page de téléchargement, installez, et créez un compte gratuit. Pas de carte. Le pipeline de transcription local s'ouvre immédiatement — sans Python, sans ffmpeg, rien de tout ça.

Vous saurez que ça fonctionne quand l'icône dans la barre des tâches apparaît et que l'assistant de configuration propose de choisir un modèle.

Étape 2 — Choisissez un modèle local.

L'appli ne choisit pas pour vous. En local, vous avez Whisper (8 modèles, 99 langues, traduction vers l'anglais) ou Parakeet (plus rapide, anglais plus 24 langues européennes). Le modèle se télécharge une fois et tourne entièrement sur votre machine.

Vous saurez que ça fonctionne quand un modèle finit de se télécharger et s'affiche comme prêt.

Étape 3 — Confirmez votre raccourci clavier.

Sur Windows, le raccourci par défaut est Ctrl+Space ; sur Mac, Command+Option maintenu en mode push-to-talk. Sur Mac, accordez la permission Accessibilité quand elle est demandée, sinon le collage au curseur ne peut pas atteindre les autres applis.

Vous saurez que ça fonctionne quand un enregistrement test se colle dans n'importe quel champ de texte.

Étape 4 — Placez votre curseur n'importe où et parlez.

Cliquez dans n'importe quelle zone de texte — un e-mail, un document, une barre de recherche — maintenez le raccourci, dites une phrase, relâchez. La transcription apparaît là où se trouve le curseur, transcrite par Whisper, sur votre machine, gratuitement.

Vous saurez que ça fonctionne quand votre phrase prononcée se retrouve dans le champ sous forme de texte.

Whisper
La vraie appli de bureau Whisper by Remskill sur l'écran des paramètres, avec les panneaux Transcription et IA ouverts.

La partie lente, c'est le téléchargement unique du modèle, pas un rituel de configuration. Après ça, le même modèle open-source qui demandait un environnement Python et une commande par fichier se retrouve simplement dans votre barre des tâches et colle du texte quand vous appuyez sur une touche. Si vous comparez vos options de dictée sur Windows ou sur Mac, c'est la version où Whisper ressemble enfin à une appli plutôt qu'à un projet.

Whisper en local est gratuit, le cloud est la partie payante

C'est là qu'il faut tracer une ligne claire dans la réponse à « est-ce gratuit ? ». Faire tourner Whisper en local est gratuit — votre machine, votre CPU, pas de serveur, pas de facturation à la minute. La partie payante, c'est le cloud : l'API de transcription hébergée d'OpenAI facture à la minute, et le niveau cloud de toute appli répercute ce coût. Dans notre appli, tout le pipeline local est gratuit ; la surface Cloud est la seule chose derrière Whisper Pro. Voici comment les trois options diffèrent vraiment, parce que vous avez le choix :

  • Parakeet local — gratuitLe moteur TDT de NVIDIA, environ 600 Mo, et l'option locale la plus rapide — 5 à 10 fois plus rapide que Whisper sur CPU. Couvre l'anglais plus 24 autres langues européennes, soit 25 au total. Pas de traduction vers l'anglais. Si vous parlez principalement anglais et voulez de la vitesse sur du matériel modeste, c'est le choix rapide, entièrement hors ligne et sans frais.
  • Whisper local — gratuitle véritable modèle Whisper open-source, qui tourne sur votre machine sans rien payer. Les versions multilingues couvrent 99 langues et peuvent traduire vers l'anglais ; les versions anglais uniquement sont réservées à l'anglais. Plus lent que Parakeet sur le même matériel, mais le bon choix pour le chinois, le japonais, le coréen ou tout travail de traduction. Le modèle anglais par défaut pèse environ 480 Mo.
  • Cloud (OpenAI, BYOK) — payant à la minutemeilleure précision et accès web en direct, en utilisant votre propre clé OpenAI facturée directement par OpenAI — la transcription utilise gpt-4o-mini-transcribe par défaut. C'est la partie qui coûte de l'argent, facturée à la minute par OpenAI, pas par nous. Nécessite internet. La surface Cloud est la seule chose incluse dans Whisper Pro.

La vérité sans fard, c'est que pour la dictée quotidienne ordinaire, Whisper local ou Parakeet suffit largement, et c'est le chemin gratuit de bout en bout. Les deux tournent entièrement sur votre machine sans rien envoyer à un serveur. Le Cloud justifie son coût à la minute seulement quand vous voulez une précision haut de gamme sur un enregistrement difficile, ou quand vous avez besoin que le modèle cherche un fait sur le web en pleine phrase. Si votre question était strictement « Whisper est-il gratuit ? », la réponse qui compte c'est : le chemin local l'est, commencez par là.

Modèles, précision et nettoyage du texte brut

Le modèle gratuit n'est pas un seul modèle — c'est une famille, et celui que vous choisissez est le vrai levier de précision. Les modèles plus petits sont rapides et légers ; le grand modèle multilingue est le plus précis et le plus lourd. Sur la version open-source en ligne de commande, vous choisissez la taille du modèle et vous faites avec la vitesse. Dans une appli, vous choisissez dans une liste et le modèle se télécharge une fois. L'essentiel : la précision vient du modèle et de votre microphone bien plus que de ce que vous payez. Un micro USB à 20 € fait plus pour vos transcriptions que n'importe quelle mise à niveau.

Quel que soit le modèle que vous utilisez, la dictée brute sort sans ponctuation ni structure. Vous dites « bon alors le modèle est gratuit sous MIT mais pour le faire tourner soi-même il faut python et ffmpeg » et c'est le mur sans ponctuation que tout moteur vocal vous tend. Nettoyer ça, c'est une étape à part. Whisper by Remskill peut lancer un passage IA sur la transcription : dites la phrase d'activation « Hey whisper » et le texte est amélioré avant d'atterrir — les mots de remplissage supprimés, la ponctuation corrigée. Sur un modèle local, ça passe par Ollama gratuitement ; en mode cloud, c'est gpt-5-mini par défaut.

Thinking...
Brut

okay so the model is free under mit but running it yourself needs python and ffmpeg and um a decent computer otherwise its slow

Nettoyé

Okay, so the model is free under MIT, but running it yourself needs Python and ffmpeg, and a decent computer — otherwise it's slow.

Donc la question de la précision a deux leviers gratuits et un payant. Les leviers gratuits : choisissez un modèle adapté à votre matériel, et donnez-lui un audio propre depuis un micro convenable. Le levier payant : la transcription cloud, qui vous donne accès aux derniers modèles hébergés quand la qualité locale ne suffit pas. Pour l'écrasante majorité de la dictée, ce sont les leviers gratuits qui comptent. Ceux qui promettent « des transcriptions parfaites sans effort » ne jouent pas franc jeu — le modèle est gratuit, mais une bonne entrée audio fait toujours l'essentiel du travail.

Ce même flux parler-puis-nettoyer est utile partout, pas seulement ici — vous pouvez dicter du texte propre dans n'importe quelle appli avec un seul raccourci clavier, pour qu'un long message devienne quelques phrases parlées plutôt qu'un paragraphe à taper.

Quand payer pour Whisper est vraiment judicieux

Une balance pesant deux options, illustrant quand le gratuit suffit et quand payer est judicieux

Puisque tout l'article dit « c'est gratuit », je vous dois l'autre moitié honnête : il y a des moments où payer est le bon choix, et prétendre le contraire serait un discours commercial, pas une réponse. Si le chemin local gratuit vous convient, prenez-le et fermez l'onglet — la plupart des gens s'arrêtent là. Mais quelques situations justifient vraiment un niveau payant.

Payez pour le chemin cloud quand la précision sur un enregistrement difficile compte plus que votre argent — une interview avec un fort accent, un enregistrement en extérieur bruyant, une transcription juridique où un mot erroné vous coûte cher. Les modèles OpenAI hébergés surpassent les modèles locaux sur les cas difficiles, et vous payez OpenAI à la minute pour exactement cet avantage. Payez aussi si vous voulez que l'assistant cherche un fait en direct sur le web en pleine phrase, ce qu'un modèle local ne peut simplement pas faire hors ligne. Et si vous avez vraiment besoin de zéro configuration sur une machine que vous ne contrôlez pas — un ordinateur pro verrouillé où vous ne pouvez pas installer Python ni télécharger un modèle — un service hébergé est peut-être la seule porte ouverte. En dehors de ces cas, le chemin local gratuit n'est pas une version inférieure. C'est le même modèle open-source, qui fait le même travail, pour rien.

Optez pour le payant quand la route gratuite intégrée commence à montrer ses limites : précision haut de gamme sur un audio difficile, recherches web en direct, ou une machine où vous ne pouvez rien faire tourner en local. En dessous de ce seuil, le modèle gratuit sur votre propre matériel est la bonne réponse, et je ne vais pas vous dire de payer pour ce qu'OpenAI a déjà offert. La version gratuite existe, elle fonctionne, et c'est le même moteur en dessous.

Et si votre raison de vouloir Whisper gratuit et local, c'est la confidentialité — garder votre voix hors des serveurs de quelqu'un — l'argument en faveur de la transcription vocale entièrement hors ligne vaut la peine d'être lu ensuite, parce que c'est exactement ce que vous obtenez en faisant tourner le modèle sur votre propre machine.

Alors : Whisper est-il gratuit ? Le modèle l'est, vraiment, sous licence MIT et à vous de faire tourner. L'utiliser gratuitement signifie soit un après-midi en ligne de commande, soit une appli qui a fait cet après-midi pour vous. La partie payante, c'est uniquement le cloud — un hébergement dont vous n'avez pas strictement besoin pour la dictée quotidienne. J'ai écrit l'essentiel de ceci en parlant dans une zone de texte, avec le modèle local gratuit qui écoutait, sur un ordinateur portable qui ne m'a jamais demandé une carte de crédit pour transcrire une phrase. Voilà la réponse complète, et c'est une des rares fois où il fait bon la donner.

Utilisez Whisper gratuitement sans la configuration

Maintenez le raccourci, parlez, relâchez. Le modèle open-source transcrit sur votre machine, gratuitement, et colle le texte là où se trouve votre curseur.

Mode local gratuit pour tout compte connecté. Aucune carte requise pour commencer.

Photo de Denys Medvediev

Denys Medvediev

C'est moi qui lis notre e-mail de support, très probablement en dictant les réponses.

Pour aller plus loin