Par Denys Medvediev

Dépannage

La dictée Windows bloquée sur Initialisation

La saisie vocale (Win+H) qui reste figée sur « Initialisation » est presque toujours due à un processus en arrière-plan qui s'est bloqué. Arrêtez l'application Microsoft Text Input dans le Gestionnaire des tâches, appuyez de nouveau sur Win+H, et ça redémarre la plupart du temps. Si le problème revient sans cesse, la cause profonde est le service de reconnaissance vocale en ligne dont elle dépend.

Dernière mise à jour : juin 2026

Une personne devant un ordinateur portable, agacée par un processus figé à l'écran, aucun visage dans le cadre

La dictée Windows bloquée sur l'initialisation se règle en arrêtant l'application Microsoft Text Input dans le Gestionnaire des tâches, puis en appuyant de nouveau sur Win+H. Si le problème revient, désactivez puis réactivez la reconnaissance vocale en ligne dans Confidentialité et sécurité, puis redémarrez. Un outil de dictée hors ligne dédié contourne tout cela, car la transcription locale n'attend jamais le service de reconnaissance vocale en ligne de Microsoft.

Vous appuyez sur Win+H, la petite barre de saisie vocale apparaît, et puis… elle reste là, immobile. « Initialisation. » Parfois « Préparation en cours. » Les points défilent. Vous attendez. Vous parlez quand même, plein d'espoir, comme on s'adresse à une enceinte connectée manifestement endormie. Rien ne s'affiche. J'ai vu exactement ce scénario se produire sur trois machines différentes, et la première fois, ça m'a coûté un bon quart d'heure avant de comprendre ce qui était réellement bloqué.

Voici la version courte avant la version longue : ce n'est presque jamais votre microphone, et presque toujours un processus en arrière-plan que Windows a lancé, n'a pas terminé, et ne relancera pas de lui-même. La solution prend une trentaine de secondes dans le Gestionnaire des tâches. La raison pour laquelle ça revient sans cesse, c'est une autre histoire, plus lente, à propos du service de reconnaissance vocale en ligne dont Win+H dépend en silence — et je vais l'aborder aussi.

Ce que personne ne dit clairement dès le premier résultat de recherche : la saisie vocale de Windows n'est pas une fonctionnalité autonome. Quand vous appuyez sur Win+H, Windows lance un processus auxiliaire et, en coulisses, contacte le service de reconnaissance vocale en ligne de Microsoft pour effectuer la reconnaissance proprement dite. « Initialisation » est l'écran que vous voyez pendant que cet échange a lieu. Quand le processus auxiliaire se bloque — généralement après une mise à jour de Windows ou un cycle de veille/réveil — l'échange ne se termine jamais, et la barre reste figée indéfiniment.

Les vraies questions sont donc : comment la débloquer tout de suite, comment l'empêcher de revenir, et existe-t-il un moyen de dicter qui ne dépende de rien de tout ça. Je vais traiter les trois, avec les étapes exactes de Microsoft, et je serai honnête sur les cas où la fonctionnalité intégrée suffit vraiment.

Pourquoi la dictée Windows se bloque sur « Initialisation »

Un écran d'ordinateur portable affichant un chargement figé, évoquant un processus bloqué

Dans Windows 11, la dictée s'appelle la saisie vocale, et elle convertit la parole en texte grâce à la reconnaissance vocale en ligne. Ce dernier point résume tout. Win+H n'est qu'une interface. La reconnaissance se fait via le service de reconnaissance vocale en ligne de Microsoft, et un auxiliaire local appelé l'application Microsoft Text Input gère la connexion. Quand cet auxiliaire se bloque, vous obtenez « Initialisation » sans fin en vue.

D'après les propres fils d'assistance et la documentation de Microsoft, les causes récurrentes sont courtes et précises. Le processus de l'application Microsoft Text Input se bloque, généralement après une mise à jour de Windows ou après le réveil de l'ordinateur depuis la veille. Le paramètre de confidentialité Reconnaissance vocale en ligne est désactivé, si bien que l'échange avec le cloud ne peut jamais démarrer. La langue de saisie ou de reconnaissance ne correspond pas à un pack de reconnaissance installé. L'accès au microphone est bloqué au niveau de la confidentialité. Ou une mise à jour de Windows a laissé le service vocal dans un état défectueux qu'un redémarrage n'a pas corrigé.

À dire haut et fort : ce n'est pas votre matériel. Si votre micro fonctionne dans un appel, il fonctionne pour la dictée. La panne se situe en amont du microphone, dans la partie de Windows censée réveiller le moteur de reconnaissance. Cela explique aussi pourquoi les solutions ci-dessous consistent à redémarrer des processus et à activer/désactiver des services, et non à acheter un nouveau casque.

La solution rapide qui marche pour la plupart des gens

Redémarrez le processus auxiliaire. C'est celle qui débloque la situation pour la grande majorité des gens, et elle prend moins d'une minute. Les étapes, directement issues du fil d'assistance de Microsoft :

Ouvrez le Gestionnaire des tâches (clic droit sur la barre des tâches puis Gestionnaire des tâches, ou appuyez sur Ctrl+Alt+Suppr et sélectionnez-le). Cliquez sur « Plus de détails » si vous êtes en affichage compact. Sous Processus en arrière-plan, trouvez « Application Microsoft Text Input », faites un clic droit dessus et choisissez « Fin de tâche ». Appuyez ensuite de nouveau sur Win+H. La barre de saisie vocale relance l'auxiliaire de zéro, l'échange se termine, et la barre passe de « Initialisation » à l'écoute. Si le processus n'apparaît pas dans la liste, un simple redémarrage fait la même chose — ça prend juste plus de temps.

Cancel
Une superposition de dictée dédiée montre qu'elle écoute réellement — aucun état ambigu « Initialisation » à patienter.

Voilà la correction qui règle le problème immédiat. La superposition ci-dessus provient d'un autre outil — une application de dictée à l'échelle du système — et elle est là pour souligner un contraste : un enregistreur local vous montre soit qu'il écoute, soit qu'il y a une erreur. Il n'y a pas de troisième état où il reste figé indéfiniment à faire semblant de démarrer, parce qu'il n'y a aucun service cloud à réveiller au préalable. Plus de détails dans la section suivante, car si ça vous arrive chaque semaine, la réponse durable est de ne pas dépendre de la chose qui se bloque sans cesse.

La solution définitive : une dictée qui ne s'initialise jamais

Si vous arrêtez la même tâche un jour sur deux, la solution durable est de cesser de compter sur une fonctionnalité qui doit téléphoner à la maison avant de fonctionner. Un outil de dictée local transcrit sur votre propre machine — il n'y a aucun service de reconnaissance vocale en ligne à réveiller, donc aucune « Initialisation » où rester bloqué. Il vous faut un PC sous Windows 10 ou plus récent et un microphone qui fonctionne. Voici la configuration en quatre étapes avec Whisper.

Étape 1 — Installez Whisper et connectez-vous.

Téléchargez depuis la page de téléchargement, installez, et créez un compte gratuit. Pas de carte bancaire. Tout le pipeline de transcription locale s'ouvre immédiatement.

Vous saurez que ça a marché quand l'icône de l'application apparaît dans la barre d'état système et que l'assistant de configuration vous propose de choisir un modèle.

Étape 2 — Choisissez une voie de transcription locale.

L'application ne choisit pas à votre place. Pour une solution hors ligne, prenez Local Parakeet (le plus rapide en anglais) ou Local Whisper (multilingue, traduction). Les deux fonctionnent entièrement sur votre machine. Le cloud est également proposé, mais c'est la seule voie qui utilise le réseau.

Vous saurez que ça a marché quand un modèle finit de se télécharger et s'affiche comme prêt.

Étape 3 — Définissez votre raccourci.

Le raccourci par défaut sous Windows est Ctrl+Space, maintenu enfoncé comme un push-to-talk. Choisissez-en un autre dans les Paramètres si Ctrl+Space entre en conflit avec une autre application. C'est une touche dédiée, donc elle ne volera pas le focus ni ne s'arrêtera toute seule comme peut le faire Win+H.

Vous saurez que ça a marché quand un enregistrement test se colle dans n'importe quel champ de texte.

Étape 4 — Placez votre curseur n'importe où et parlez.

Cliquez dans n'importe quelle zone de texte — e-mail, document, barre de recherche — maintenez le raccourci, dites une phrase, relâchez. La transcription se colle là où se trouve votre curseur, transcrite localement, sans écran d'initialisation.

Vous saurez que ça a marché quand votre phrase prononcée apparaît sous forme de texte, sans attendre un échange avec le cloud.

Whisper
La vraie application de bureau Whisper sur l'écran des paramètres, avec les panneaux Transcription et IA ouverts.

La seule partie lente est le téléchargement unique du modèle. Après ça, l'application est locale, donc le mode de défaillance qui vous a amené ici — un auxiliaire bloqué en attente d'un serveur — n'existe tout simplement pas dans la conception. Elle enregistre, transcrit sur votre processeur, et colle. Aucun service de reconnaissance vocale en ligne dans la boucle qui pourrait se bloquer.

Si vous préférez réparer celle qui est intégrée

Beaucoup de gens veulent simplement que Win+H refonctionne et ne veulent pas d'une autre application. C'est légitime. Voici le dépannage Windows plus poussé, dans l'ordre où je l'essaierais, le tout issu des propres documentations et fils d'assistance de Microsoft. Rien de tout cela ne touche au registre, donc rien ici ne peut casser votre machine.

D'abord, le paramètre que la plupart des gens manquent. La saisie vocale nécessite que la reconnaissance vocale en ligne soit activée. Allez dans Démarrer, Paramètres, Confidentialité et sécurité, Voix, et activez la Reconnaissance vocale en ligne. Si elle est déjà activée et que la dictée reste bloquée, désactivez-la, patientez un instant, puis réactivez-la pour forcer le service à se rétablir. Ensuite, vérifiez votre langue. Sous Paramètres, Heure et langue, Voix, assurez-vous que la langue de la voix correspond à la langue dans laquelle vous tapez et que le pack de reconnaissance correspondant est installé. Une discordance ici est une cause discrète de barre figée.

Troisièmement, les autorisations du microphone au niveau système. Sous Paramètres, Confidentialité et sécurité, Microphone, confirmez que « Accès au microphone » est activé et que les applications sont autorisées à utiliser le micro — la saisie vocale fait partie de ces applications. Quatrièmement, lancez l'utilitaire de résolution des problèmes de voix intégré : dans les versions plus anciennes, il se trouve sous Paramètres, Mise à jour et sécurité, Résolution des problèmes, Utilitaires supplémentaires, Voix. Cinquièmement, assurez-vous que Windows est entièrement à jour, car plusieurs de ces fils se terminent par « une mise à jour ultérieure l'a corrigé » — le revers étant qu'une mise à jour en est parfois la cause. Et si tout cela échoue, un redémarrage débloque un service vocal qu'une mise à jour a laissé dans un état défectueux. Le hic honnête avec chacune de ces solutions : elles corrigent le symptôme, pas la dépendance. Win+H a toujours besoin de l'échange avec le cloud à chaque fois que vous appuyez dessus, ce qui est exactement la chose qui continue de casser.

Local ou cloud : quel mode évite vraiment ce problème

Si la raison de votre présence ici est une fonctionnalité qui n'arrête pas d'attendre un serveur, la réponse est le mode local, point final. Les deux moteurs locaux fonctionnent entièrement sur votre machine sans rien envoyer où que ce soit, et c'est tout l'intérêt — pas de service de reconnaissance vocale en ligne signifie pas d'« Initialisation » où rester bloqué. Voici comment les trois voies que l'application vous fait choisir diffèrent réellement.

L'application vous fait choisir, alors voici comment j'aborderais la question pour ce problème précis :

  • Local ParakeetLe moteur TDT de NVIDIA, environ 600 Mo, et l'option locale la plus rapide — 5 à 10 fois plus rapide que Whisper sur CPU. Couvre l'anglais plus 24 autres langues européennes, 25 au total. Pas de traduction vers l'anglais. Entièrement hors ligne. Si vous parlez anglais ou une langue européenne, c'est le moyen le plus rapide de quitter le manège de l'échange avec le cloud.
  • Local Whisperplus lent que Parakeet sur la même machine, mais les versions multilingues couvrent 99 langues et peuvent traduire vers l'anglais. Les versions anglais uniquement sont anglais uniquement, pas 99. Choisissez celui-ci pour le chinois, le japonais, le coréen, ou tout travail de traduction, ce que Parakeet ne peut pas faire. Le modèle anglais par défaut pèse environ 480 Mo. Également entièrement hors ligne.
  • Cloud (OpenAI, BYOK)la meilleure précision et un accès au web, en utilisant votre propre clé OpenAI facturée directement par OpenAI. La transcription tourne sur gpt-4o-mini-transcribe par défaut. Il a besoin d'Internet — c'est donc la seule voie qui, comme Win+H, dépend d'un réseau. La surface Cloud fait partie de Whisper Pro.

La vérité un peu ennuyeuse, c'est que pour la dictée de tous les jours, le local suffit amplement, et pour la frustration précise qui vous a amené ici, le local est le vrai remède. Le cloud mérite sa place quand vous voulez une précision de premier ordre sur un enregistrement difficile ou que vous avez besoin d'aller chercher un fait sur le web en pleine phrase. Mais si votre reproche est « ça n'arrête pas d'attendre un serveur », choisir une autre voie dépendante d'un serveur passerait à côté de l'essentiel. Commencez en local.

Un texte plus net une fois que la dictée fonctionne vraiment

Une fois que la dictée fonctionne — intégrée ou non — vous vous heurtez à la réalité suivante : la parole brute ressort comme un long flot sans ponctuation. Vous dites « bon alors réinitialise le mot de passe réponds au client et dis-lui que c'est réglé avant midi », et c'est le mur sans ponctuation que vous tend n'importe quel moteur vocal. C'est dans le nettoyage que les outils se distinguent.

La saisie vocale de Windows peut ajouter la ponctuation au fil de la parole une fois lancée. Pour un nettoyage plus poussé — supprimer les « euh », corriger les phrases interminables, transformer un paragraphe parlé en quelque chose que vous enverriez vraiment — Whisper peut effectuer un passage par l'IA avant que le texte n'arrive. Dites la phrase d'activation « Hey whisper » et le texte est d'abord amélioré. Sur un modèle local, cela passe par Ollama ; en mode cloud, c'est gpt-5-mini par défaut.

Thinking...
Brut

bon alors réinitialise le mot de passe réponds au client et dis-lui que c'est réglé avant midi euh et mets mon manager en copie

Nettoyé

Bon, alors réinitialise le mot de passe, réponds au client et dis-lui que c'est réglé avant midi — et mets mon manager en copie.

L'étape de nettoyage est aussi la raison pour laquelle un outil dédié vaut son pesant d'or, au-delà du simple fait d'éviter le blocage sur « Initialisation ». Vous n'obtenez pas seulement une capture fiable ; vous obtenez un texte plus proche du résultat final. Si vous voulez la version plus large de tout ça, c'est ce même enchaînement parler-puis-nettoyer qui vous permet de taper plus vite à la voix dans chaque application que vous ouvrez, pas seulement la fenêtre où Win+H s'est trouvé par hasard.

Et comme ça se colle au curseur dans n'importe quel champ, le même enchaînement fonctionne aussi dans un onglet de navigateur — dicter dans Google Docs se comporte exactement comme dicter dans un éditeur de bureau, ce que Win+H ne peut pas toujours garantir dès que le focus change.

Quand celle qui est intégrée suffit

Un espace de travail apaisé avec un ordinateur portable, évoquant un problème résolu

Voici le moment où je vous dissuade d'installer quoi que ce soit. Si arrêter l'application Microsoft Text Input a réglé le problème et qu'il n'est pas revenu, vous n'avez pas besoin d'une autre application. Un blocage ponctuel sur l'initialisation après une mise à jour, c'est exactement ça — un cas isolé. Win+H est gratuit, intégré, et pour de courtes salves c'est vraiment très bien. Je ne vais pas vous dire d'installer un logiciel pour dicter une réponse de deux lignes.

La voie intégrée est le bon choix quand quelques conditions sont réunies : vous dictez surtout des textes courts, vous êtes de toute façon toujours en ligne, et vous êtes à l'aise avec l'idée que votre voix parte vers le cloud de Microsoft pour être reconnue. Ce dernier point est le vrai embranchement. Win+H fait transiter votre voix par le service de reconnaissance vocale en ligne de Microsoft par conception — très bien pour une liste de courses, à réfléchir à deux fois pour un e-mail client ou tout ce que vous préféreriez garder sur votre propre machine.

Tournez-vous vers un outil dédié et hors ligne quand l'intégré commence à faire mal de façon répétée : le blocage revient après chaque mise à jour, vous dictez de longs passages, vous travaillez hors ligne ou voulez que votre voix reste locale, ou vous voulez un seul raccourci qui se comporte pareil dans toutes les applications plutôt qu'une barre qui s'initialise parfois et parfois non. En deçà de ce seuil, servez-vous de ce qui est gratuit. Les solutions plus haut dans ce guide sont là précisément pour ça.

Si le vrai souci est plus large que ce seul blocage — Win+H qui ne fait rien, aucun texte du tout, ou la mauvaise langue — la liste de contrôle plus complète dans la reconnaissance vocale qui ne fonctionne pas sous Windows couvre le reste des modes de défaillance qui ne sont pas strictement un blocage sur « Initialisation ».

Pour aller plus loin

Windows a livré une fonctionnalité vocale qui doit réveiller un service cloud avant de taper le moindre mot, puis n'a pas prévu de moyen pour qu'elle réessaie quand le réveil échoue. Alors on met fin à une tâche en arrière-plan dont le nom compte trois mots de trop, on appuie de nouveau sur les deux mêmes touches, et on déclare l'affaire réglée. Ça l'est généralement. Mais la première fois qu'une fonctionnalité vous oblige à ouvrir le Gestionnaire des tâches pour l'utiliser, vous commencez discrètement à en chercher une qui n'a pas besoin de ça. J'ai dicté la majeure partie de ce guide avec un outil qui ne m'a jamais montré une seule fois le mot « Initialisation ». C'est tout l'argument.

Dictez sans l'écran d'initialisation

Maintenez un raccourci, parlez, relâchez. La transcription arrive à votre curseur dans n'importe quelle application — transcrite localement, sans aucun service cloud à réveiller au préalable.

Mode local gratuit pour tout compte connecté. Aucune carte bancaire requise pour commencer.

Photo de Denys Medvediev

Denys Medvediev

C'est moi qui lis nos e-mails d'assistance, fort probablement en dictant les réponses.