Guide
Comment utiliser la dictée vocale sur Windows
Windows intègre la saisie vocale. Appuyez sur la touche Windows + H dans n'importe quelle zone de texte, attendez l'indication « Écoute en cours » et parlez. Une connexion internet et un micro fonctionnel sont nécessaires. Pour un usage intensif, hors ligne ou sur plusieurs applications, un outil dédié avec un seul raccourci fait la même chose partout.
Dernière mise à jour : juin 2026

Pour utiliser la dictée vocale sur Windows, placez le curseur dans n'importe quelle zone de texte et appuyez sur la touche Windows + H. La barre de saisie vocale s'ouvre, affiche « Écoute en cours » et transcrit ce que vous dites. Il vous faut un microphone fonctionnel, une connexion internet et la reconnaissance vocale en ligne activée dans Paramètres, Confidentialité et sécurité, Voix.
La plupart des gens ignorent que Windows peut taper à leur place. Cette fonction est livrée avec Windows 10 et 11, elle ne nécessite aucun assistant d'installation et se cache derrière un raccourci clavier dont personne ne parle : la touche Windows + H. Placez votre curseur dans une zone de texte, maintenez la touche Windows enfoncée, appuyez sur H, et une petite barre s'ouvre en haut de l'écran et commence à écouter.
C'est vraiment tout — et pour de courtes sessions, ça fonctionne bien. Le hic, c'est ce que Microsoft indique clairement mais que la plupart des articles passent sous silence : la saisie vocale de Windows achemine votre voix via le cloud Microsoft, donc il lui faut une connexion internet pour quoi que ce soit. Ce seul détail détermine si la fonction intégrée vous suffit ou si vous aurez besoin d'autre chose. Je commencerai par présenter honnêtement la fonction native, puis je vous dirai où elle trouve ses limites.
Voici ce que les listes de tutoriels n'évoquent pas clairement. La saisie vocale de Windows est une vraie fonction, gratuite et intégrée, qui fonctionne dans n'importe quelle zone de texte acceptant un curseur — votre navigateur, Word, un message Slack, la barre de recherche. Aucune installation n'est nécessaire. Le raccourci est la touche Windows + H, et une fois que vous savez qu'il existe, vous l'utiliserez.
La réponse honnête se découpe donc en deux parties. Première partie : comment activer la fonction native et l'utiliser correctement — ce dont la plupart des gens ont besoin. Deuxième partie : là où Win+H atteint ses limites — pas d'internet, longues dictées, mots systématiquement mal reconnus — et ce qu'un outil dédié règle à chaque fois. Je couvrirai les deux, configurerai l'alternative en deux minutes et vous dirai franchement quand Win+H suffit déjà.
Ce qu'est réellement la saisie vocale Windows

La saisie vocale Windows est une fonction intégrée qui vous permet de saisir du texte en parlant plutôt qu'en tapant. Elle est incluse dans Windows 10 et Windows 11, ne coûte rien et fonctionne dans toute zone de texte où vous pouvez placer un curseur. La description officielle de Microsoft vaut la peine d'être citée car elle pose les limites : la saisie vocale « utilise la reconnaissance vocale en ligne, alimentée par Azure Speech Services ». Trois choses découlent de cette seule phrase.
Premièrement, elle nécessite internet. Votre voix est envoyée aux serveurs de Microsoft pour être convertie en texte — sans connexion, la saisie vocale ne fait rien. Deuxièmement, vous avez besoin d'un microphone fonctionnel — celui intégré au laptop convient pour commencer. Troisièmement, comme la reconnaissance se fait dans le cloud, la précision est généralement bonne et votre CPU n'est pas sollicité. Voilà les compromis en résumé : gratuit et précis, mais uniquement en ligne et sans confidentialité.
Les gens confondent souvent cela avec l'ancienne Reconnaissance vocale Windows, avec le nouveau Accès vocal, ou avec la dictée au sein d'une seule application. Pour le cas d'usage courant « je veux parler et voir les mots apparaître dans ce que j'écris », celle qu'il vous faut est la saisie vocale, ouverte avec la touche Windows + H. La section suivante est le mode d'emploi concret.
L'activer avec la touche Windows + H
Pas d'application à lancer ni d'assistant à parcourir. Placez votre curseur là où vous voulez que les mots apparaissent, puis déclenchez la saisie vocale avec un raccourci clavier. Voici la procédure complète, avec le seul détour dans les paramètres dont vous pourriez avoir besoin.
Cliquez dans une zone de texte — un document, un e-mail, un chat, la barre d'adresse — pour y placer le curseur. Appuyez sur la touche Windows + H. Une petite barre de saisie vocale apparaît en haut de l'écran. Attendez qu'elle indique « Écoute en cours » avant de parler ; si vous commencez trop tôt, elle coupe vos premiers mots. Parlez normalement, et le texte apparaît là où se trouve votre curseur. Appuyez sur le bouton microphone de la barre, ou de nouveau sur le raccourci, pour arrêter.
Si rien ne se passe, deux raisons sont habituellement en cause. Votre microphone n'est pas configuré ou autorisé — la saisie vocale nécessite un micro fonctionnel. Ou la reconnaissance vocale en ligne est désactivée, ce qui signifie que la partie cloud de la fonction est coupée. Activez-la dans Démarrer, puis Paramètres, puis Confidentialité et sécurité, puis Voix, et réglez la Reconnaissance vocale en ligne sur Activé. Si la barre s'ouvre mais n'atteint jamais « Écoute en cours », c'est presque toujours la connexion internet, puisque la reconnaissance se fait sur les serveurs de Microsoft plutôt que sur votre machine. (Si Win+H se comporte de façon plus capricieuse, j'ai écrit un article dédié sur pourquoi Win+H cesse de fonctionner et comment y remédier.)
La meilleure option pour un usage intensif : un seul raccourci partout
La fonction intégrée est parfaite jusqu'à ce que vous heurtiez l'un de ses murs — pas d'internet dans le train, une longue session de dictée, ou un mot systématiquement mal reconnu. La solution est un outil système qui fait le même travail mais tourne sur votre propre machine, conserve une courte mémoire tampon pour ne pas couper votre dernier mot, et utilise un seul raccourci dans toutes les applications. Il vous faut un PC sous Windows 10 ou plus récent, un microphone fonctionnel et un compte. L'ensemble du pipeline local est gratuit pour tout compte connecté, sans moyen de paiement demandé à l'inscription. Voici la procédure.
Étape 1 — Installez Whisper et connectez-vous.
Téléchargez depuis la page de téléchargement, installez et créez un compte gratuit. Pas de carte. Le pipeline de transcription locale s'ouvre immédiatement.
Vous saurez que ça fonctionne quand l'icône de la barre des tâches apparaît et que l'assistant de configuration propose de choisir un modèle.
Étape 2 — Choisissez un mode de transcription.
L'application ne choisit pas pour vous. Vous avez trois options : Cloud (OpenAI, avec votre propre clé), Local Parakeet ou Local Whisper. Pour remplacer le comportement en ligne uniquement de Win+H par quelque chose de hors ligne, choisissez un moteur local — plus de détails deux sections plus bas.
Vous saurez que ça fonctionne quand un modèle a fini de se télécharger et apparaît comme prêt.
Étape 3 — Confirmez votre raccourci.
Sur Windows, le raccourci par défaut est Ctrl+Space, maintenu en mode appui. Modifiez-le dans les Paramètres s'il entre en conflit avec quelque chose que vous utilisez déjà. Contrairement à Win+H, maintenir la touche enfoncée conserve l'enregistrement aussi longtemps que vous la tenez.
Vous saurez que ça fonctionne quand un enregistrement test est collé dans n'importe quel champ de texte.
Étape 4 — Placez votre curseur n'importe où et parlez.
Cliquez dans un document, un e-mail ou une boîte de chat, maintenez le raccourci enfoncé, prononcez une phrase, relâchez. La transcription est collée à l'endroit du curseur, dans l'application active.
Vous saurez que ça fonctionne quand votre phrase prononcée apparaît en texte dans la zone de saisie.
La partie lente est le téléchargement unique du modèle, pas la configuration. Après ça, écrire dans n'importe quelle application cesse d'être une tâche de frappe et devient une tâche de parole — et ça continue de fonctionner même quand le Wi-Fi lâche.
Si vous avez déjà utilisé la reconnaissance vocale sur Windows 11, c'est la même idée mais avec un raccourci qui ne s'arrête pas tout seul.
Ponctuation : commandes vocales ou automatique
La parole brute n'a pas de virgules. Chaque outil de dictée gère ça de l'une ou l'autre manière, et la saisie vocale Windows propose en réalité les deux. Elle dispose d'une ponctuation automatique, qui ajoute virgules et points selon votre façon de parler, à activer depuis l'icône d'engrenage de la barre de saisie vocale. Et elle reconnaît les commandes parlées : dites « point », « virgule », « nouvelle ligne », « ouvrir les guillemets » et « fermer les guillemets », et elle insère le signe plutôt que les mots.
Le menu engrenage de cette barre mérite un coup d'œil rapide. Au-delà de la ponctuation automatique, il contient le filtre de grossièretés et le choix du microphone par défaut. Rien n'est enfoui ; tout est à un clic de la barre qui s'ouvre avec Win+H. Pendant que vous parlez, un petit indicateur montre que la fonction écoute — la même idée que tout bon outil de dictée utilise pour que vous ne vous demandiez jamais si ça vous a entendu :
La limite de la ponctuation par commande, c'est qu'elle vous oblige à narrer la mise en forme — « virgule », « nouvelle ligne », « point » — ce qui convient pour un court texte mais devient épuisant sur un long paragraphe. La ponctuation automatique aide, mais elle vous donne tout de même une transcription littérale de ce que vous avez dit, hésitations et faux départs compris. Nettoyer ça en quelque chose que vous garderiez est une étape à part, et c'est là qu'un outil dédié prend l'avantage. Plus de détails ci-dessous.
Local ou cloud : le choix que Win+H ne vous laisse pas faire
La saisie vocale Windows a choisi pour vous — c'est le cloud, un point c'est tout. Votre voix est envoyée aux serveurs de Microsoft à chaque fois. C'est sans problème pour une liste de courses, mais vraiment problématique pour une note sur un tableau de salaires ou un e-mail client que vous préféreriez ne pas faire transcrire hors site. Un outil dédié vous donne le choix que la fonction native omet. Voici comment les trois options se distinguent, car l'application vous demande de choisir et je préfère que vous choisissiez bien :
- Local Parakeet — Le moteur TDT de NVIDIA, environ 600 Mo, et l'option locale la plus rapide — 5 à 10 fois plus rapide que Whisper sur CPU. Couvre l'anglais plus 24 autres langues européennes, 25 au total. Pas de traduction vers l'anglais. Si vous dictez en anglais ou dans une autre langue européenne et que vous voulez de la vitesse sans rien quitter votre machine, c'est le choix rapide.
- Local Whisper — Plus lent que Parakeet sur la même machine, mais les versions multilingues couvrent 99 langues et peuvent traduire vers l'anglais. Les versions anglais uniquement sont limitées à l'anglais, pas 99 langues. Choisissez Whisper pour le chinois, le japonais, le coréen, ou tout travail de traduction que Parakeet ne peut pas faire. Le modèle anglais par défaut fait environ 480 Mo.
- Cloud (OpenAI, BYOK) — meilleure précision et accès web, avec votre propre clé OpenAI facturée directement par OpenAI. La transcription utilise gpt-4o-mini-transcribe par défaut. Nécessite internet, comme Win+H, mais c'est votre clé et votre choix. La surface Cloud fait partie de Whisper Pro.
La vérité toute simple, c'est que pour la plupart des usages quotidiens, un moteur local est largement suffisant, et c'est précisément ce que Win+H ne peut pas offrir. Les deux options locales tournent entièrement sur votre machine, sans rien envoyer à un serveur. Le Cloud justifie sa place quand vous voulez une précision maximale sur un enregistrement difficile ou que vous avez besoin que le modèle aille chercher une information sur le web en milieu de phrase. Commencez en local, et passez au cloud seulement si le local ne suffit plus.
Des résultats plus propres sans énoncer chaque virgule
Win+H et un outil dédié vous donnent tous les deux le même point de départ : un bloc continu. Vous dites « bon alors on reporte la deadline à vendredi on prévient le client et on réserve la salle pour deux personnes », et c'est le mur de texte non ponctué que tout moteur vocal vous remet. Win+H peut ponctuer en temps réel ou prendre des commandes verbales. Ni l'un ni l'autre ne supprime les « euh » ni ne corrige une phrase que vous avez recommencée à mi-chemin.
Ce nettoyage, c'est là qu'un passage par l'IA gagne sa place. Dites la phrase d'activation « Hey whisper » et le texte transcrit est amélioré avant d'atterrir — mots parasites supprimés, phrases enchainées découpées, majuscules corrigées. Sur un modèle local qui tourne via Ollama sur votre machine ; en mode cloud, c'est gpt-5-mini par défaut. Vous dites la version brouillon une seule fois et récupérez la version que vous enverriez vraiment.
okay so move the deadline to friday tell the client and book the room for two um before lunch
Okay, so move the deadline to Friday, tell the client, and book the room for two before lunch.
Il y a aussi les mots qu'un moteur générique manque à chaque fois — un nom de produit, le patronyme d'un collègue, un terme technique. Win+H ne vous offre aucun moyen de les lui enseigner. Un outil dédié vous permet de favoriser un vocabulaire personnalisé pour que les mots que vous utilisez tous les jours cessent de revenir mal orthographiés. Il ne fabriquera pas une mise en forme que vous n'avez pas demandée, et quiconque vous promet « dites titre et regardez-le se mettre en forme tout seul » vous vend une démo, pas une solution du quotidien. Posez les mots rapidement et proprement par la voix ; faites la mise en page avec les touches que vous connaissez déjà.
Ce même flux parler-puis-nettoyer est la raison pour laquelle les gens changent — vous pouvez taper plus vite à la voix dans toutes vos applications plutôt que d'énoncer des virgules dans une barre intégrée qui ne fonctionne qu'en ligne.
Quand Win+H suffit déjà

Parfois, ce qui est déjà gratuit sur votre machine est la bonne réponse, et prétendre le contraire serait malhonnête. La saisie vocale Windows est genuinement efficace pour une grande partie des besoins des gens, et installer quoi que ce soit de plus serait superflu.
Restez sur Win+H si vous êtes connecté la plupart du temps, si vos dictées arrivent en courtes rafales, et si ça ne vous dérange pas que votre voix passe par le cloud de Microsoft. Une réponse Slack de deux lignes, une requête de recherche, une note rapide dans un document — appuyez sur la touche Windows + H, attendez « Écoute en cours », parlez, c'est fait. C'est gratuit, c'est intégré, et ça ponctue tout seul. Pour un rappel d'une ligne, je ne vais pas vous conseiller d'installer une application.
Passez à un outil dédié et système quand la fonction native commence à coincer : pas d'internet dans un avion ou un train, de longues plages de dictée où l'appui maintenu bat une barre qui expire, la confidentialité sur du texte que vous ne voulez pas quitter votre machine, des mots systématiquement mal reconnus, ou l'envie d'un seul raccourci qui se comporte de façon identique dans tous les programmes. En deçà de ce seuil, Win+H gagne sur le prix et l'absence de configuration. Au-delà, l'écart est réel.
Si vous hésitez encore de quel côté vous vous situez, la comparaison détaillée dans le guide des alternatives à Win+H expose exactement où chaque option trouve sa place, sans vernis marketing.
Windows a livré la saisie vocale il y a des années et l'a cachée derrière un raccourci que personne ne mentionne à voix haute. Maintenant vous le savez : touche Windows + H, attendez « Écoute en cours », parlez. Pour la plupart des petites tâches, c'est toute la réponse — et c'est gratuit. Le jour où vous êtes hors ligne, ou que vous dictez quelque chose de plus long qu'un SMS, ou qu'un mot revient systématiquement mal transcrit, vous saurez exactement quel mur vous avez touché — et quel outil vous aide à le franchir. J'ai écrit une bonne partie de cet article à la voix, dans une application qui se fiche de savoir dans quelle zone de texte est mon curseur. Internet a coupé deux fois pendant. La dictée n'a rien remarqué.
Essayez une dictée vocale qui fonctionne aussi hors ligne
Maintenez un seul raccourci, parlez, relâchez. La transcription atterrit dans la zone de texte où se trouve votre curseur — dans un train, dans un avion, ou avec le Wi-Fi coupé.
Mode local gratuit pour tout compte connecté. Pas de carte requise pour commencer.



