Guide
Logiciel de dictée pour les journalistes
Les journalistes rédigent plus vite en parlant qu'en tapant. Appuyez sur un raccourci, parlez, et vos mots apparaissent au curseur dans n'importe quelle application — votre CMS, un document, un fichier de notes. C'est fait pour composer votre propre texte et vos notes de terrain, pas pour transcrire une interview.
Dernière mise à jour : juin 2026

Un logiciel de dictée pour journalistes convertit les paroles d'un reporter en texte directement au curseur, dans n'importe quelle application. Un raccourci clavier lance la saisie ; le brouillon, l'intro ou la note de terrain apparaît là où se trouve le curseur. C'est conçu pour composer votre propre texte à la voix, et ça fonctionne hors ligne pour les notes sensibles. Ça ne transcrit pas les interviews — c'est un autre travail.
La journée d'un reporter, c'est surtout taper les mêmes choses deux fois. Vous griffonnez une citation dans un carnet sur les marches du tribunal, puis vous la retapez à votre bureau. Vous rédigez l'intro dans votre tête en rentrant, et vous en avez oublié la moitié quand vous ouvrez l'ordinateur. Le clavier est le goulot d'étranglement, et le clavier se fiche bien que vous ayez une deadline.
Les gens cherchent « logiciel de dictée pour journalistes » en espérant un seul outil qui fait tout — rédiger, prendre des notes et enregistrer la réunion du conseil municipal. Ça n'existe pas, et je préfère le dire dès la deuxième ligne plutôt que de vous faire perdre votre après-midi. La dictée, c'est pour les mots que vous composez vous-même. Enregistrer une source et transformer cet audio en transcription verbatim, c'est un autre métier entièrement. Ce guide traite du premier travail, et il vous dit clairement quand vous tourner vers le second.
Voilà la distinction que la plupart des pages ciblant ce mot-clé brouillent volontairement. La dictée, c'est vous qui parlez et l'ordinateur qui tape ce que vous dites, dans le champ où se trouve votre curseur. La transcription, c'est enregistrer quelqu'un d'autre — une source, un panel, un appel téléphonique — et récupérer ensuite un compte rendu textuel précis. Même idée de base, outil complètement différent, enjeux complètement différents.
La vraie question n'est donc pas « quelle est la meilleure appli de dictée pour les journalistes ». C'est « qu'est-ce qui convient à quelle partie du travail ». Un outil de dictée piloté par raccourci comme Whisper est excellent pour rédiger vos propres textes, consigner des notes de terrain et capturer une idée avant qu'elle ne s'évapore. Pour l'interview elle-même — plusieurs interlocuteurs, des citations que vous allez publier et défendre — vous avez besoin d'un service de transcription dédié. Je vais détailler le côté dictée, vous montrer comment le configurer en deux minutes, et tracer la ligne clairement pour que vous ne confiiez pas une citation au mauvais outil.
Pourquoi les reporters se tournent vers la dictée

Le vrai besoin, c'est la vitesse avant que la pensée ne refroidisse. Un reporter quitte la conférence de presse avec l'intro à moitié écrite dans la tête, l'angle clair en marchant jusqu'à la voiture, la formulation parfaite sous la douche — puis s'assoit au clavier et regarde un tiers de tout ça s'évanouir entre ses doigts. On parle environ à 145 mots par minute. On tape à environ 40. C'est dans cet écart que meurent les bons premiers jets.
Il y a aussi la question des mains. Ceux qui écrivent pour vivre écrivent beaucoup, et les poignets gardent le score. La dictée n'est pas un remède médical et je n'irai pas prétendre le contraire, mais elle retire le clavier de l'équation un moment, ce qui représente un vrai soulagement les jours de forte production. Les mains se reposent, le brouillon avance quand même, et le secrétariat de rédaction n'y voit que du feu. C'est tout le propos — pas de la thérapie, juste moins de touches entre votre tête et la page.
Et ce sont les petites captures qui s'accumulent. La citation que vous voulez noter avant d'en oublier la formulation exacte. Le rappel à rappeler la deuxième source. La note de trois lignes sur l'atmosphère de la pièce, que vous ne tapperiez jamais d'une main en marchant mais que vous direz volontiers à voix haute. Rien de tout ça n'est un article. Tout ça, c'est le tissu conjonctif du reportage, et tout ça va plus vite à dire qu'à taper.
Un raccourci, vous parlez, les mots atterrissent dans votre brouillon
Le mécanisme est banal, ce qui est exactement ce que vous voulez sous pression. Vous appuyez sur un raccourci, vous parlez, vous relâchez, et la transcription se colle à l'endroit de votre curseur dans l'application active. Whisper conserve une courte queue après que vous ayez lâché la touche, pour que votre dernier mot ne soit pas coupé. Parce que le texte est collé au niveau du curseur système, votre champ de brouillon dans le CMS, un document Word, Google Docs dans le navigateur, un simple fichier de notes ou un message Slack à votre rédacteur en chef sont tous « une zone de texte ». Même touche, même comportement, partout.
C'est là où les pages de présentation compliquent inutilement les choses. Pas de plugin à brancher dans votre système de publication, pas d'intégration à attendre du service informatique, pas d'étape d'export. Votre curseur est dans le brouillon, vous parlez, les mots apparaissent dans le brouillon. Une petite capsule s'affiche pendant que vous parlez, pour que vous sachiez que l'appli écoute et enregistre :
Le raccourci, c'est la seule chose à bien régler dès le départ. Sur Windows, c'est Ctrl+Space ; sur Mac, c'est Command+Option, une combinaison de touches maintenues en push-to-talk pendant que vous parlez. Les deux sont modifiables dans les Paramètres si elles entrent en conflit avec un raccourci de votre outil de rédaction. Un utilisateur précoce a envoyé un e-mail à 2h14 du matin — le raccourci entrait en conflit avec son logiciel audio, et le message se terminait par le mot « inutilisable ». J'ai livré un panneau de personnalisation des raccourcis huit minutes plus tard et je suis retourné me coucher. Maintenant chaque raccourci est remappable. Si vous avez déjà configuré la dictée sur Windows ou sur Mac, c'est la même mémoire musculaire appliquée à vos outils de rédaction.
Configuration en deux minutes (Windows ou Mac)
Il vous faut un Mac Apple Silicon ou un PC sous Windows 10 ou plus récent, un microphone fonctionnel, et l'application dans laquelle vous rédigez — ouverte dans l'appli de bureau ou dans le navigateur. Tout le pipeline local est gratuit pour tout compte connecté, sans moyen de paiement demandé à l'inscription. Voici les étapes.
Étape 1 — Installer Whisper et se connecter.
Téléchargez depuis la page de téléchargement, installez et créez un compte gratuit. Pas de carte. Tout le pipeline de transcription locale s'ouvre immédiatement.
Vous saurez que ça fonctionne quand l'icône de barre d'état de l'application apparaît et que l'assistant de configuration propose de choisir un modèle.
Étape 2 — Choisir un mode de transcription.
L'application ne choisit pas pour vous. Vous avez trois options : Cloud (OpenAI, apportez votre propre clé), Local Parakeet ou Local Whisper. Pour les notes sensibles et les sources, commencez en local — plus d'informations deux sections plus bas.
Vous saurez que ça fonctionne quand un modèle finit de se télécharger et s'affiche comme prêt.
Étape 3 — Confirmer votre raccourci.
Windows utilise Ctrl+Space par défaut, Mac utilise Command+Option maintenu en push-to-talk. Sur Mac, accordez la permission Accessibilité lorsqu'elle est demandée ; sans elle, le collage au curseur ne peut pas atteindre les autres applications.
Vous saurez que ça fonctionne quand un enregistrement de test se colle dans n'importe quel champ de texte.
Étape 4 — Placez votre curseur dans votre brouillon et parlez.
Ouvrez votre CMS, document ou fichier de notes, cliquez dans le texte, maintenez le raccourci, dites une phrase, relâchez. La transcription apparaît là où se trouve le curseur.
Vous saurez que ça fonctionne quand votre phrase parlée est présente dans le brouillon sous forme de texte.
La partie lente, c'est le téléchargement du modèle, pas la configuration. Tout le reste, ce sont les quatre étapes ci-dessus. Une fois lancée, sortir une pensée de votre tête pour la mettre dans le brouillon cesse d'être une tâche de frappe pour devenir une tâche de parole.
Rédiger des textes et capturer des notes de terrain à la voix
En pratique, ça se divise en deux modes, et ils se vivent différemment. Le premier, c'est la rédaction au bureau : curseur dans le CMS ou le document, vous déroulez l'intro, le paragraphe-clé, la partie que vous avez déjà reportée. Vous ne dicterez pas une version finale polie — personne ne le fait — mais vous obtiendrez un premier jet rapide et imparfait à l'écran en une fraction du temps, et éditer un texte qui existe vaut mieux que fixer un champ vide. Les fonctionnalités de vocabulaire personnalisé et de mots-clés du Whisper local aident aussi si votre secteur est plein de noms et de jargon qu'un modèle générique rate.
Le second mode, c'est la capture sur le terrain, et c'est là que le raccourci justifie son existence. Vous sortez d'une audition et vous dites les trois choses que vous ne voulez pas perdre, directement dans un fichier de notes. Vous enregistrez un numéro de téléphone, un suivi, la formulation exacte d'une déclaration officielle que vous avez notée en sténo. Ce n'est pas destiné à la publication tel quel — c'est votre matière première, ce que vous taporiez autrement plus tard depuis une écriture illisible. Dites-le une fois, clairement, pendant que c'est frais.
Un extra vraiment utile en mode Cloud, et je reste honnête sur sa portée : vous pouvez dire la phrase d'activation « Hey whisper » pour lancer une rapide recherche web en pleine rédaction — une date, une orthographe, un titre — et la réponse revient en quelques secondes. C'est un outil de vérification rapide, pas un moteur de recherche, et un journaliste vérifie de toute façon ce qui compte auprès d'une vraie source. Pratique pour « c'était le budget 2019 ou 2020 » sans quitter le brouillon. Pas un substitut au reportage.
Local ou cloud : quel mode pour les notes sensibles
Pour un journaliste, commencez en mode local, et la raison, c'est la protection des sources, pas la vitesse. Une note sur une source confidentielle, un brouillon non publié d'un article sensible, un fichier de travail que vous ne confieriez jamais à un prestataire — le mode local tourne entièrement sur votre machine sans rien envoyer à un serveur. C'est le bon réglage par défaut quand le contenu pourrait mettre une source en danger. Le Cloud devient la sortie de secours pour les enregistrements difficiles rares, pas l'outil quotidien. Si votre Mac est Apple Silicon ou votre PC date des dernières années, le mode local gère la dictée quotidienne sans se plaindre.
Voici comment les trois options diffèrent, car l'application vous demande de choisir et j'aimerais que vous choisissiez bien :
- Local Parakeet — Le moteur TDT de NVIDIA, environ 600 Mo, et l'option locale la plus rapide — 5 à 10 fois plus rapide que Whisper sur CPU. Couvre l'anglais plus 24 autres langues européennes, 25 au total. Pas de traduction vers l'anglais. Si vous rédigez en anglais ou dans une autre langue européenne, c'est le choix rapide et entièrement hors ligne.
- Local Whisper — plus lent que Parakeet sur la même machine, mais les versions multilingues couvrent 99 langues et peuvent traduire vers l'anglais. Les versions anglais uniquement sont anglais uniquement, pas 99. Choisissez celui-ci pour le chinois, le japonais, le coréen, la traduction, ou quand vous voulez un vocabulaire personnalisé et des mots-clés pour un secteur très chargé en noms propres. Le modèle anglais par défaut pèse environ 480 Mo.
- Cloud (OpenAI, BYOK) — meilleure précision et recherche web rapide, en utilisant votre propre clé OpenAI facturée directement par OpenAI. La transcription utilise gpt-4o-mini-transcribe par défaut. Nécessite internet, donc c'est la seule option qui quitte votre machine — ne l'utilisez pas pour du contenu sensible aux sources. La surface Cloud fait partie de Whisper Pro.
La vérité toute simple, c'est que pour le type de rédaction et de prise de notes que la plupart des reportages impliquent, le local suffit amplement. Les deux moteurs locaux tournent entièrement sur votre machine, ce qui est tout l'intérêt quand le fichier pourrait identifier une source. Le Cloud trouve sa place quand vous voulez une précision maximale sur un audio difficile ou une recherche rapide en cours de rédaction. Pour une habitude quotidienne, commencez en local et ne passez au cloud que quand le local vous laisse sur votre faim.
Transformer un brouillon dicté en texte propre
La dictée brute sort comme un bloc compact. Vous dites « bon le conseil a voté quatre contre trois sur le rezonage euh Henderson contre citation cela crée un mauvais précédent fin de citation faire un suivi avec le service urbanisme demain », et c'est le mur non ponctué que tout moteur de synthèse vocale vous remet. Le nettoyer, c'est là que les modes divergent.
Windows Voice Typing ajoute de la ponctuation pendant que vous parlez, et macOS Dictation gère les bases quand vous dites « virgule » ou « point ». Pour un nettoyage plus poussé — supprimer les remplisseurs, corriger les phrases à rallonge, transformer un paragraphe parlé en quelque chose que vous intégreriez vraiment dans un brouillon — Whisper peut lancer une passe IA. Dites « Hey whisper » et le texte est amélioré avant d'atterrir. Sur un modèle local, ça passe par Ollama ; en mode cloud, c'est gpt-5-mini par défaut.
bon le conseil a voté quatre contre trois sur le rezonage euh henderson contre citation cela crée un mauvais précédent fin de citation faire un suivi avec le service urbanisme demain
Le conseil a voté 4–3 sur le rezonage. Henderson contre : « Cela crée un mauvais précédent. » Faire un suivi avec le service urbanisme demain.
Une mise en garde ferme, parce que c'est du journalisme et que la précision est le métier. Une passe de nettoyage IA s'applique à vos propres brouillons et notes — elle arrange les mots que vous avez prononcés. Ne comptez pas dessus pour produire une citation verbatim que vous allez publier et défendre. Si une citation doit être exacte pour la page, vous la vérifiez contre l'enregistrement source ou vos notes, à chaque fois. La dictée accélère votre brouillon ; elle ne certifie pas une citation. Quiconque vous dit qu'un moteur de reconnaissance vocale vous donne des citations prêtes à publier, mot pour mot, vous vend une démo, pas un mardi ordinaire.
Ce même flux parler-puis-nettoyer porte ses fruits bien au-delà du reportage — vous pouvez aussi dicter de la prose propre dans n'importe quelle application d'écriture avec le même raccourci, pour qu'un long passage devienne quelques phrases parlées plutôt qu'un paragraphe à taper.
Quand abandonner la dictée et utiliser un outil de transcription

C'est la ligne essentielle de ce guide, alors je vais être direct. Dès l'instant où vous enregistrez une autre personne — une interview, une source au téléphone, un panel, un briefing de presse avec plusieurs voix — la dictée est le mauvais outil. La dictée est conçue pour taper les mots que vous prononcez au curseur, un seul locuteur, en direct. Elle ne sépare pas les interlocuteurs, elle n'est pas calibrée pour produire un enregistrement verbatim de l'audio de quelqu'un d'autre, et une citation que vous allez publier n'est pas le bon endroit pour le découvrir.
Pour ce travail, tournez-vous vers un service de transcription dédié — la catégorie conçue autour de l'audio multi-locuteurs, des étiquettes de locuteurs, des horodatages et d'un compte rendu textuel que vous pouvez vérifier contre une citation. C'est un produit genuinement différent, et un bon vaut la peine d'être payé quand la précision sur les mots de quelqu'un d'autre est le livrable. Si vous avez besoin de transcriptions certifiées ou de niveau juridique, c'est encore un service spécialisé différent, et je ne prétendrai pas qu'un raccourci de dictée y suffit.
Et parfois le bon outil est déjà gratuit sur votre machine. Si vous ne faites que laisser une note de deux lignes ou un rappel rapide, votre système d'exploitation vous couvre. Sur Windows, appuyez sur la touche Windows + H et la barre Voice Typing intégrée s'ouvre à votre curseur ; elle ponctue toute seule et convient pour de courtes saisies, bien qu'elle passe par les serveurs de Microsoft et nécessite internet, donc ce n'est pas une option hors ligne — ce qui compte quand la note nomme une source. Sur Mac, Dictation vous permet de parler pour saisir du texte partout où vous pouvez taper, configuré dans les Réglages Système sous Clavier, et sur Apple Silicon le texte général peut être traité sur l'appareil. Passez à un outil dédié à l'échelle du système quand les outils natifs commencent à vous freiner : longs brouillons, travail multilingue, confidentialité hors ligne, ou un seul raccourci qui se comporte de la même façon dans votre CMS, votre document et vos notes.
Si la plupart de ce que vous capturez sont de courtes notes plutôt que des brouillons complets, la logique de la prise de notes voix-vers-texte est la plus proche, et elle mise davantage sur la capture rapide que sur la composition longue.
La dictée ne rédigera pas l'article à votre place, et elle ne transcrivra pas votre interview — ce n'a jamais été son travail. Ce qu'elle fait, c'est retirer le clavier de l'équation pendant que vous composez vos propres textes et consignez vos propres notes, rapidement, hors ligne si le contenu est sensible. J'ai dicté la majeure partie de ce guide dans un simple fichier de notes avec un raccourci qui se fiche de la fenêtre active, puis je l'ai nettoyé et déplacé dans le brouillon. L'interview que j'ai faite pour ce guide, je l'ai envoyée à un service de transcription. Le bon outil pour le bon travail. C'est tout le secret.
Essayez-le sur votre prochain brouillon
Maintenez le raccourci, parlez, relâchez. Le premier jet atterrit dans n'importe quelle application où se trouve votre curseur — votre CMS, un document, un fichier de notes. L'interview, elle, va toujours vers un outil de transcription.
Mode local gratuit pour tout compte connecté. Aucune carte requise pour commencer.



