Par Denys Medvediev

Guide

La dictée vocale dans Logseq

Logseq n'a pas de dictée intégrée sur ordinateur. La solution, c'est un outil qui fonctionne partout : vous appuyez sur un raccourci, vous parlez, et le texte s'insère à l'endroit du curseur dans n'importe quel bloc Logseq. La dictée de votre système d'exploitation fait aussi l'affaire, pour les notes courtes.

Dernière mise à jour : juin 2026

Carnet ouvert et stylo posés à côté d'un ordinateur portable sur un bureau sombre, évoquant la prise de notes et la dictée

La dictée vocale dans Logseq passe par un outil qui fonctionne partout, pas par Logseq lui-même. L'application Logseq sur ordinateur n'a pas de dictée intégrée. La solution, c'est un outil comme Whisper : vous appuyez sur un raccourci, vous parlez, et le texte s'insère à l'endroit du curseur dans n'importe quel bloc Logseq. La dictée de votre système d'exploitation fait aussi l'affaire, pour les notes courtes.

Je tiens mon journal quotidien dans Logseq parce que je fais davantage confiance à un dossier de markdown brut qu'à n'importe quel cloud. La seule chose que j'ai toujours voulue, c'était de parler dans un bloc plutôt que de le taper. J'ai cherché le réglage. Il n'y a pas de réglage. Logseq n'a pas de bouton micro, et après avoir bien fouillé, je suis certain qu'il ne m'en cache pas un.

Les gens cherchent « dictée vocale dans Logseq », ne trouvent rien dans l'application, et supposent qu'ils ont raté une case à cocher. Ce n'est pas le cas. La case n'a jamais été créée. La bonne nouvelle, c'est que la solution prend environ deux minutes, fonctionne entièrement hors ligne si vous le souhaitez, et marche dans toutes les autres applications que vous ouvrez, en prime.

Voici ce que la plupart des pages qui tournent autour de ce mot-clé ne diront pas clairement. Un bloc Logseq, c'est juste une zone de texte, exactement comme Gmail ou une barre de recherche. Une dictée qui s'insère à l'endroit du curseur se moque de l'application dans laquelle se trouve ce curseur.

La vraie question n'est donc pas « comment activer la saisie vocale dans Logseq ». Il n'y a pas d'interrupteur. La question est « quel outil de dictée faire tourner par-dessus Logseq », et la réponse dépend de ce que vous voulez : gratuit-et-intégré, réservé au Mac, ou un seul raccourci hors ligne qui se comporte de la même façon partout. Je vais tout passer en revue, en configurer un en deux minutes, et vous dire quand vous pouvez vous passer de la solution dédiée.

Logseq a-t-il une dictée intégrée ?

Des mains qui écrivent dans un carnet papier à côté d'un clavier, opposant la frappe à la dictée

Non. L'application Logseq sur ordinateur n'a aucune fonction de reconnaissance vocale, de dictée ou de saisie vocale pour écrire dans un bloc à la voix. Il n'y a pas de bouton micro sur un bloc, pas de commande vocale, pas de préférence cachée. Si vous fouillez les réglages depuis un moment, vous pouvez arrêter. Ce n'est pas là.

Ce qui existe, en revanche, c'est une série de plugins communautaires avec « whisper » dans le nom, et c'est là que les gens se perdent. Ces plugins transcrivent un fichier audio ou un lien YouTube en texte après coup. Ils sont utiles, mais ce n'est pas de la dictée en direct. Vous ne pouvez pas placer votre curseur dans le journal du jour, parler, et voir les mots apparaître. Ils traitent un enregistrement ; ils ne tapent pas pour vous pendant que vous réfléchissez. Confondre les deux coûte un après-midi, et je préfère vous l'épargner.

Le mobile, c'est un sujet à part, et qui mérite une phrase pour que vous ne vous trompiez pas d'appareil : la nouvelle application mobile de Logseq a ajouté une certaine transcription vocale, mais c'est une fonction de téléphone, et sur un téléphone, vous utiliseriez de toute façon simplement le micro du clavier. Sur le graphe d'ordinateur où la plupart des gens passent réellement leur temps, il vous faut un outil qui se place par-dessus Logseq. Il y a trois catégories honnêtes, et le reste de ce guide les couvre.

Appuyez sur un raccourci, parlez, le texte arrive dans le bloc

C'est tout le mécanisme, et il est banal au meilleur sens du terme. Vous appuyez sur un raccourci, vous parlez, vous relâchez, et le texte s'insère à l'endroit du curseur, dans le champ de texte qui a le focus. Whisper garde un court délai après que vous avez lâché la touche, pour que votre dernier mot ne soit pas coupé. Comme il s'insère au curseur du système, un bloc Logseq n'est qu'« une zone de texte parmi d'autres ». Application de bureau ou version navigateur, même comportement.

C'est la partie que les pages d'accueil compliquent à outrance. Aucun plugin à installer dans Logseq, aucun jeton d'API à coller, aucune synchronisation à surveiller. Votre curseur est dans un bloc, vous parlez, les mots apparaissent dans le bloc. Une petite capsule s'affiche pendant que vous parlez, pour que vous sachiez qu'il écoute :

Cancel
La fenêtre d'enregistrement : une petite capsule qui apparaît pendant que vous parlez, pour que vous sachiez que Whisper écoute.

Le raccourci, c'est la seule chose qu'il vaut la peine de bien régler dès le départ. Sous Windows, c'est Ctrl+Space ; sur Mac, c'est Command+Option, un raccourci « appuyer pour parler » composé uniquement de touches de modification, que vous maintenez en parlant. Les deux sont modifiables dans les réglages s'ils entrent en conflit avec quelque chose que vous utilisez déjà. (Ma plus jeune fille m'a dit un jour qu'un raccourci « ne marchait pas » dans son appli de dessin. C'était un conflit, pas un bug, et c'est comme ça que j'ai appris que la personne moyenne n'a aucune idée de ce qu'est un conflit de raccourci. Du coup, désormais, chaque raccourci est personnalisable.) Si vous avez déjà configuré la dictée sous Windows ou sur Mac, c'est la même habitude pointée vers une autre application.

Configurez-le en deux minutes (Windows ou Mac)

Il vous faut un Mac sur Apple Silicon ou un PC sous Windows 10 ou plus récent, un microphone qui fonctionne, et Logseq ouvert, dans l'application de bureau ou dans le navigateur. Toute la chaîne locale est gratuite pour n'importe quel compte connecté, sans qu'aucun moyen de paiement ne soit demandé à l'inscription. Voici la marche à suivre.

Étape 1 — Installez Whisper et connectez-vous.

Téléchargez depuis la page de téléchargement, installez, et créez un compte gratuit. Pas de carte. Toute la chaîne de transcription locale s'ouvre immédiatement.

Vous saurez que ça a marché quand l'icône de l'application apparaît dans la barre des tâches et que l'assistant de configuration propose de choisir un modèle.

Étape 2 — Choisissez un mode de transcription.

L'application ne choisit pas à votre place. Vous en avez trois : Cloud (OpenAI, avec votre propre clé), Parakeet local, ou Whisper local. Pour des notes de journal privées, commencez en local — j'y reviens deux sections plus bas.

Vous saurez que ça a marché quand un modèle finit de se télécharger et s'affiche comme prêt.

Étape 3 — Confirmez votre raccourci.

Windows utilise par défaut Ctrl+Space, le Mac Command+Option maintenu en « appuyer pour parler ». Sur Mac, accordez l'autorisation d'Accessibilité quand elle est demandée ; sans elle, l'insertion au curseur ne peut pas atteindre les autres applications.

Vous saurez que ça a marché quand un enregistrement de test s'insère dans n'importe quel champ de texte.

Étape 4 — Placez votre curseur dans un bloc Logseq et parlez.

Ouvrez votre graphe, cliquez dans un bloc, maintenez le raccourci, dites une phrase, relâchez. Le texte apparaît là où se trouve le curseur, dans le bloc.

Vous saurez que ça a marché quand votre phrase parlée se retrouve sous forme de texte dans le bloc Logseq.

Whisper
La véritable application de bureau Whisper, sur l'écran des réglages, avec les panneaux Transcription et IA ouverts.

La partie lente, c'est le téléchargement du modèle, pas la configuration. Tout le reste, ce sont les quatre étapes ci-dessus. Une fois que c'est lancé, capturer une idée dans votre graphe cesse d'être une tâche de frappe pour devenir une tâche de parole.

dictée vocale sous Windows · sur Mac

Un plugin Logseq face à un raccourci qui fonctionne partout

La plupart des pages qui se classent sur ce mot-clé vous renvoient vers un plugin Logseq ou vers Blurt, un outil Mac dédié, logé dans la barre de menus, qui dicte directement dans votre plan. Ce sont de bonnes réponses, avec chacune un accroc structurel. Les plugins de type whisper transcrivent des fichiers audio, pas la parole en direct dans le bloc que vous éditez. Et Blurt, de son propre aveu, est réservé à macOS — si vous êtes sous Windows, ce n'est tout simplement pas une option.

Un raccourci qui fonctionne partout contourne ces deux limites. Il s'insère au curseur du système quelle que soit la fenêtre concernée, si bien que la même touche qui remplit un bloc Logseq remplit aussi votre fenêtre de rédaction Gmail, un message Slack, et un message de commit. Un seul outil, tous les champs de texte, sous Windows comme sous Mac. Vous ne réapprenez rien quand vous changez d'application, et vous n'avez pas besoin d'une solution différente selon votre ordinateur.

Si vous êtes sur Mac et que vous ne capturez jamais qu'à l'intérieur de Logseq, Blurt est un choix soigné et ciblé, qui mérite un coup d'œil. Dès l'instant où vous êtes sous Windows, ou que vous voulez le même flux dans tous les programmes que vous ouvrez, la solution qui fonctionne partout l'emporte. Je miserais sur le raccourci unique parce que je change d'application à peu près quarante fois par heure et que je ne veux pas avoir quarante boutons de dictée différents à retenir.

Local ou cloud : quel mode pour un graphe privé

Pour Logseq, essayez d'abord le mode local. Beaucoup d'entre nous ont choisi Logseq précisément parce que c'est du texte brut, local d'abord — un compte-rendu de réunion, une idée à moitié formée, une entrée de journal que vous ne voudriez jamais voir sur le serveur de quelqu'un. Ce serait un drôle de choix de garder vos notes sur votre propre disque pour ensuite faire transiter votre voix par un cloud avant qu'elles n'y arrivent. Si votre Mac est en Apple Silicon ou si votre PC date des dernières années, le local gère la dictée du quotidien sans broncher, et le cloud devient l'échappatoire plutôt que la valeur par défaut.

Voici en quoi les trois modes diffèrent, parce que l'application vous oblige à choisir et que je préfère que vous choisissiez bien :

  • Parakeet localLe moteur TDT de NVIDIA, environ 600 Mo, et l'option locale la plus rapide — 5 à 10 fois plus rapide que Whisper sur CPU. Couvre l'anglais plus 24 autres langues européennes, 25 au total. Pas de traduction vers l'anglais. Si vous tenez votre journal en anglais ou dans une autre langue européenne, c'est le choix rapide et entièrement hors ligne.
  • Whisper localplus lent que Parakeet sur la même machine, mais les versions multilingues couvrent 99 langues et peuvent traduire vers l'anglais. Les versions « anglais seulement » sont uniquement en anglais, pas 99 langues. Choisissez-le pour le chinois, le japonais, le coréen, ou tout travail de traduction, ce que Parakeet ne sait pas faire. Le modèle anglais par défaut fait environ 480 Mo.
  • Cloud (OpenAI, votre propre clé)meilleure précision et accès au web, avec votre propre clé OpenAI facturée directement par OpenAI. La transcription tourne sur gpt-4o-mini-transcribe par défaut. Nécessite Internet, c'est donc le seul mode qui quitte votre machine. La partie Cloud fait partie de Whisper Pro.

La vérité ennuyeuse, c'est que pour le genre de texte que la plupart des gens mettent dans Logseq, le local suffit amplement. Les deux moteurs locaux tournent entièrement sur votre machine, sans rien envoyer à un serveur, ce qui est tout l'intérêt d'un graphe local d'abord. Le cloud gagne sa place quand vous voulez une précision de premier ordre sur un enregistrement difficile ou que vous avez besoin que le modèle aille chercher une information sur le web en pleine phrase. Pour une habitude de journal quotidien, commencez en local et ne passez au cloud que lorsque le local vous laisse sur votre faim.

Ponctuation, blocs et markdown Logseq à la voix

La dictée brute ressort comme un bloc d'un seul tenant. Vous dites « bon alors relire le doc d'architecture le taguer projet alpha et me rappeler jeudi », et c'est le mur sans ponctuation que vous tend n'importe quel moteur vocal. Le nettoyer, c'est là que les chemins divergent.

La saisie vocale de Windows ajoute la ponctuation au fur et à mesure, et la Dictée de macOS gère la ponctuation de base quand vous dites « virgule » ou « point ». Pour un nettoyage plus poussé — éliminer les « euh », corriger les phrases à rallonge, transformer un paragraphe parlé en quelque chose que vous garderiez vraiment dans votre graphe — Whisper peut lancer une passe d'IA. Dites la phrase d'activation « Hey whisper » et le texte est amélioré avant d'arriver. Sur un modèle local, ça passe par Ollama ; en mode cloud, c'est gpt-5-mini par défaut.

Thinking...
Brut

bon alors relire le doc d'architecture le taguer projet alpha et me rappeler jeudi euh avant le point d'équipe

Nettoyé

Bon, alors relire le doc d'architecture, le taguer Projet Alpha, et me rappeler jeudi avant le point d'équipe.

Pour la structure propre à Logseq — blocs imbriqués, liens #tag et [[page]], marqueurs TODO — la réponse honnête est que la voix vous donne le texte et que la syntaxe de Logseq vous donne la structure. Dictez la phrase, puis tapez la touche Tab pour indenter, le # pour un tag, ou le [[ pour un lien de page comme vous le faites toujours. Aucun outil de dictée ne fait surgir la syntaxe de plan de Logseq sur commande ; quiconque vous promet « dites tag projet alpha et regardez ça créer le lien » vous vend une démo, pas un mardi ordinaire. Mettez les mots par écrit vite, à la voix, et façonnez les blocs avec les touches que vous connaissez déjà.

Ce même flux parler-puis-nettoyer est rentable bien au-delà de votre graphe — vous pouvez aussi dicter une prose propre dans n'importe quelle application avec le raccourci unique, si bien qu'un long bloc devient quelques phrases dites plutôt qu'un paragraphe à taper.

Quand se passer d'un outil de dictée pour Logseq

Deux flèches tracées à la craie sur le sol pointant dans des directions différentes, illustrant un choix d'outil

Parfois, le bon outil est celui qui est déjà gratuit sur votre machine, et prétendre le contraire serait malhonnête. Si vous ne déposez que de courtes notes dans Logseq — une ligne de journal rapide, un rappel de deux mots — votre système d'exploitation s'en charge pour rien.

Sous Windows, appuyez sur la touche Windows + H et la barre de saisie vocale intégrée s'ouvre là où se trouve votre curseur, y compris dans un bloc Logseq. Elle ponctue toute seule et convient pour de courtes salves. Le hic : elle passe par les serveurs de Microsoft et nécessite une connexion Internet, ce n'est donc pas une option hors ligne, ce qui compte plus que d'habitude quand tout l'intérêt de votre graphe est de rester local. Sur Mac, la Dictée vous laisse parler pour saisir du texte partout où vous pouvez taper, à configurer dans Réglages Système sous Clavier, et sur Apple Silicon le texte courant peut être traité sur l'appareil. Et si vous êtes un utilisateur Mac qui vit entièrement dans Logseq, Blurt est un choix ciblé et natif, conçu exactement pour ça.

Tournez-vous vers un outil dédié, qui fonctionne partout, quand les outils intégrés commencent à montrer leurs limites : longues notes, travail multilingue, confidentialité hors ligne sous Windows, ou envie d'un seul raccourci qui se comporte de la même façon dans Logseq, votre messagerie et votre éditeur. En deçà de cette barre, utilisez ce qui est gratuit. Je ne vais pas vous dire d'installer une application pour un rappel d'une ligne.

Le même arbitrage se présente si vous tenez aussi des notes ailleurs — la logique de la dictée dans Obsidian est identique, parce que ce sont deux applications markdown local d'abord où c'est le curseur, et non un plugin, qui constitue la véritable intégration.

Pour aller plus loin

Logseq n'a jamais livré de bouton micro, et après avoir écrit ceci, je suis à peu près sûr qu'il ne le fera jamais. Il n'en a pas besoin, parce que c'est le curseur qui fait l'intégration. Parlez dans le bloc, obtenez du texte, façonnez-le avec la syntaxe que vous connaissez déjà. J'ai dicté la majeure partie de ce guide dans une zone de texte qui n'était pas Logseq, avec un outil qui se moque de la zone en question, puis j'ai collé le tout dans mon propre graphe. C'est toute l'astuce.

Essayez-le dans votre prochain bloc Logseq

Maintenez le raccourci, parlez, relâchez. Le texte arrive dans le bloc où se trouve votre curseur — et dans toutes les autres applications aussi.

Mode local gratuit pour n'importe quel compte connecté. Aucune carte requise pour commencer.

Photo de Denys Medvediev

Denys Medvediev

C'est moi qui lis nos e-mails de support, le plus souvent en dictant les réponses.