Guide
La dictée vocale dans Roam Research
Roam Research n'a pas de dictée intégrée. La solution, c'est un outil qui fonctionne partout : vous appuyez sur un raccourci, vous parlez, et la transcription se colle à l'endroit du curseur dans n'importe quel bloc Roam. La dictée de votre système d'exploitation fonctionne aussi, pour les notes courtes.
Dernière mise à jour : juin 2026

La dictée vocale dans Roam Research passe par un outil qui fonctionne partout, pas par Roam lui-même. Roam Research n'a pas de dictée intégrée. La solution, c'est un outil comme Whisper : vous appuyez sur un raccourci, vous parlez, et la transcription se colle à l'endroit du curseur dans n'importe quel bloc Roam. La dictée du système d'exploitation fonctionne aussi, pour les notes courtes.
Je tiens une page de notes quotidiennes dans Roam parce que cette histoire de pensée reliée a vraiment changé ma façon de retenir mes idées — chaque bloc est un nœud, chaque [[page]] est un fil que je peux retirer plus tard. La seule chose que j'ai toujours voulue, c'était de glisser une pensée dans un bloc en parlant plutôt qu'en tapant. Je suis allé chercher le réglage. Il n'y a pas de réglage. Roam n'a pas de bouton microphone, et après pas mal de fouilles, je suis convaincu qu'il ne m'en cache aucun.
Les gens cherchent « dictée vocale dans Roam Research », ne trouvent rien dans l'application, et supposent qu'ils ont raté une case à cocher. Ce n'est pas le cas. La case n'a jamais été créée. La bonne nouvelle, c'est que la solution prend environ deux minutes, fonctionne entièrement hors ligne si vous le souhaitez, et marche en prime dans toutes les autres applications que vous ouvrez.
Voici ce que la plupart des pages qui tournent autour de ce mot-clé ne diront pas franchement. Un bloc Roam n'est qu'un champ de texte, exactement comme Gmail ou une barre de recherche. Une dictée qui colle à l'endroit du curseur se moque de l'application dans laquelle le curseur se trouve.
Donc la vraie question n'est pas « comment activer la saisie vocale dans Roam ». Il n'y a pas d'interrupteur. La question, c'est « quel outil de dictée j'utilise par-dessus Roam », et la réponse dépend de si vous voulez quelque chose de gratuit et intégré, ou un seul raccourci hors ligne qui se comporte de la même façon partout. Je vais tout passer en revue, en configurer un en deux minutes, et vous dire quand vous pouvez vous passer de la solution dédiée.
Roam Research a-t-il une dictée intégrée ?

Non. Roam Research n'a aucune fonction de reconnaissance vocale, de dictée ou de saisie vocale intégrée pour écrire dans un bloc à la voix. Il n'y a pas de bouton microphone sur un bloc, pas de commande vocale, pas de préférence cachée. Roam accepte la saisie au clavier. Si vous avez passé les menus au peigne fin à la recherche d'un bouton de dictée, vous pouvez arrêter. Il n'y est pas.
Ce qui existe, en revanche, c'est une poignée d'extensions Roam Depot et un Live AI Assistant avec « speech » dans la description, et c'est là que les gens se perdent. Ces outils transcrivent un fichier audio que vous avez déjà enregistré — une réunion, un entretien, un extrait que vous avez importé avec /upload — en texte, après coup, généralement en appelant l'API OpenAI Whisper avec votre propre clé. Ils sont utiles, mais ce n'est pas de la dictée en direct. Vous ne pouvez pas placer votre curseur dans la note du jour, parler et voir les mots apparaître. Ils traitent un enregistrement ; ils ne tapent pas pour vous pendant que vous réfléchissez. Confondre les deux coûte un après-midi, et je préfère vous épargner cet après-midi.
Le cas du mobile est une affaire à part, et mérite une phrase pour que vous ne le poursuiviez pas sur le mauvais appareil : il existe des applications de capture compagnon qui envoient une note transcrite à la voix dans votre graphe depuis un téléphone, mais c'est une fonctionnalité du téléphone, et sur un téléphone vous utiliseriez de toute façon le microphone du clavier. Sur le graphe de bureau où la plupart des gens vivent réellement, il vous faut un outil qui se place par-dessus Roam. Il existe deux catégories honnêtes, et le reste de ce guide les couvre.
Appuyez sur un raccourci, parlez, le texte arrive dans le bloc
Voilà tout le mécanisme, et il est ennuyeux dans le bon sens du terme. Vous appuyez sur un raccourci, vous parlez, vous relâchez, et la transcription se colle à l'endroit du curseur, dans le champ de texte qui a le focus. Whisper garde un court instant après que vous avez relâché la touche, pour que votre dernier mot ne soit pas coupé. Comme la transcription se colle à l'endroit du curseur du système, un bloc Roam n'est qu'« un champ de texte parmi d'autres ». L'application web ou un habillage de bureau, c'est le même comportement — il n'y a aucune différence que Roam puisse même percevoir.
C'est la partie que les pages de présentation compliquent à outrance. Pas d'extension à installer dans Roam, pas de jeton d'API à coller, pas de synchronisation à surveiller. Votre curseur est dans un bloc, vous parlez, les mots apparaissent dans le bloc. Une petite capsule s'affiche pendant que vous parlez pour que vous sachiez qu'il écoute :
Le raccourci est la seule chose qu'il vaut la peine de bien régler dès le départ. Sous Windows, c'est Ctrl+Space ; sur Mac, c'est Command+Option, un appuyer-pour-parler à base de modificateur seul que vous maintenez en parlant. Les deux sont modifiables dans les Réglages s'ils entrent en conflit avec quelque chose que vous utilisez déjà. (Ma plus jeune fille m'a dit un jour qu'un raccourci « ne marchait pas » dans son application de dessin. C'était un conflit, pas un bug, et c'est comme ça que j'ai appris que la personne moyenne n'a aucune idée de ce qu'est un conflit de raccourcis. Alors maintenant, chaque raccourci est personnalisable.) Si vous avez déjà configuré la dictée sur Mac, c'est la même mémoire musculaire pointée vers une autre application.
Configurez-le en deux minutes (Windows ou Mac)
Il vous faut un Mac sur Apple Silicon ou un PC sous Windows 10 ou plus récent, un microphone qui fonctionne, et Roam ouvert dans votre navigateur. Toute la chaîne locale est gratuite pour tout compte connecté, sans qu'aucun moyen de paiement ne soit demandé à l'inscription. Voici la marche à suivre.
Étape 1 — Installez Whisper et connectez-vous.
Téléchargez depuis la page de téléchargement, installez, et créez un compte gratuit. Pas de carte. Toute la chaîne de transcription locale s'ouvre immédiatement.
Vous saurez que ça a marché quand l'icône de l'application apparaît dans la barre d'état et que l'assistant de configuration propose de choisir un modèle.
Étape 2 — Choisissez une voie de transcription.
L'application ne choisit pas à votre place. Vous en avez trois : Cloud (OpenAI, avec votre propre clé), Local Parakeet, ou Local Whisper. Pour des notes quotidiennes privées, commencez en local — j'en dis plus deux sections plus bas.
Vous saurez que ça a marché quand un modèle finit de se télécharger et s'affiche comme prêt.
Étape 3 — Confirmez votre raccourci.
Windows utilise par défaut Ctrl+Space, Mac utilise Command+Option maintenu en appuyer-pour-parler. Sur Mac, accordez l'autorisation d'Accessibilité quand on vous la demande ; sans elle, le collage à l'endroit du curseur ne peut pas atteindre votre navigateur.
Vous saurez que ça a marché quand un enregistrement de test se colle dans n'importe quel champ de texte.
Étape 4 — Placez votre curseur dans un bloc Roam et parlez.
Ouvrez votre graphe, cliquez dans un bloc, maintenez le raccourci, dites une phrase, relâchez. La transcription apparaît là où se trouve le curseur, dans le bloc.
Vous saurez que ça a marché quand votre phrase parlée se trouve dans le bloc Roam sous forme de texte.
La partie lente, c'est le téléchargement du modèle, pas la configuration. Tout le reste se résume aux quatre étapes ci-dessus. Une fois en marche, capturer une pensée dans votre graphe cesse d'être une tâche de frappe pour devenir une tâche de parole.
Une extension Roam ou un raccourci qui fonctionne partout
La plupart des pages qui se classent pour ce mot-clé vous orientent vers une extension Roam Depot — le Live AI Assistant, l'importateur Otter, quelque chose avec « speech » dans le nom. Ce sont de bons outils, avec un même piège structurel. Ils transcrivent un audio que vous avez déjà enregistré — un fichier de réunion, une session Otter, un extrait importé dans un bloc — pas de la parole en direct dans le bloc que vous êtes en train de modifier. Vous enregistrez, puis vous transcrivez, puis vous nettoyez le résultat. C'est un flux de transcription, pas de dictée. Ils résolvent « j'ai une heure d'audio » plutôt que « je veux glisser cette phrase dans ma note du jour ».
Un raccourci qui fonctionne partout contourne tout cela. Il colle à l'endroit du curseur du système, quelle que soit la fenêtre qui le possède, si bien que la même touche qui remplit un bloc Roam remplit aussi votre fenêtre de rédaction Gmail, un message Slack et un message de commit. Un seul outil, tous les champs de texte, sous Windows comme sur Mac. Vous ne réapprenez rien quand vous changez d'application, et rien n'a besoin de savoir qu'il s'agit de Roam — c'est le curseur qui fait l'intégration.
Si vous avez surtout des enregistrements à transcrire — des appels, des cours, des mémos vocaux déjà capturés — une extension Depot qui appelle Whisper sur le fichier est la bonne forme, et mérite un coup d'œil. Dès que ce que vous voulez vraiment, c'est réfléchir à voix haute dans un bloc tout neuf, en direct, c'est la voie qui fonctionne partout qui l'emporte. Pour ma part, j'opte pour le raccourci unique parce que je change d'application environ quarante fois par heure et que je ne veux pas avoir quarante boutons de dictée différents à retenir.
Local ou cloud : quel mode pour un graphe privé
Pour Roam, essayez d'abord le mode local. Un graphe se remplit de tout ce qui n'est pas filtré — une idée à moitié formée, un compte-rendu de réunion, une entrée de journal que vous ne voudriez jamais voir sur le serveur de quelqu'un d'autre. Si vous réfléchiriez à deux fois avant de publier un bloc en public, vous réfléchiriez sans doute à deux fois avant de faire transiter votre voix par un cloud pour l'écrire. Si votre Mac est en Apple Silicon ou si votre PC date des dernières années, le local gère la dictée du quotidien sans broncher, et le cloud devient l'issue de secours plutôt que le réglage par défaut.
Voici en quoi les trois voies diffèrent, parce que l'application vous oblige à choisir et que je préfère que vous choisissiez bien :
- Local Parakeet — Le moteur TDT de NVIDIA, environ 600 Mo, et l'option locale la plus rapide — 5 à 10 fois plus rapide que Whisper sur CPU. Il couvre l'anglais plus 24 autres langues européennes, 25 au total. Pas de traduction vers l'anglais. Si vous tenez votre journal en anglais ou dans une autre langue européenne, c'est le choix rapide et entièrement hors ligne.
- Local Whisper — plus lent que Parakeet sur la même machine, mais les versions multilingues couvrent 99 langues et peuvent traduire vers l'anglais. Les versions anglais uniquement sont anglais uniquement, pas 99 langues. Choisissez-le pour le chinois, le japonais, le coréen, ou tout travail de traduction, ce que Parakeet ne sait pas faire. Le modèle anglais par défaut fait environ 480 Mo.
- Cloud (OpenAI, votre propre clé) — la meilleure précision et l'accès au web, en utilisant votre propre clé OpenAI facturée directement par OpenAI. La transcription tourne sur gpt-4o-mini-transcribe par défaut. Il faut une connexion internet, c'est donc la seule voie qui quitte votre machine. La surface Cloud fait partie de Whisper Pro.
La vérité toute bête, c'est que pour le type de texte que la plupart des gens mettent dans Roam, le local suffit amplement. Les deux moteurs locaux tournent entièrement sur votre machine, sans rien envoyer à un serveur. Le cloud gagne sa place quand vous voulez une précision haut de gamme sur un enregistrement difficile ou que vous avez besoin que le modèle aille chercher un fait sur le web en pleine phrase. Pour une habitude de notes quotidiennes, commencez en local et ne passez au cloud que lorsque le local vous laisse sur votre faim.
Ponctuation, blocs et syntaxe Roam à la voix
La dictée brute ressort d'un seul tenant. Vous dites « bon donc revoir le doc d'architecture l'étiqueter projet alpha et me rappeler jeudi », et c'est le mur sans ponctuation que tout moteur de reconnaissance vous tend. C'est au nettoyage que les voies divergent.
La saisie vocale Windows ajoute la ponctuation pendant que vous parlez, et la Dictée macOS gère la ponctuation de base quand vous dites « virgule » ou « point ». Pour un nettoyage plus poussé — supprimer les « euh », corriger les phrases d'un seul tenant, transformer un paragraphe parlé en quelque chose que vous garderiez vraiment dans votre graphe — Whisper peut effectuer une passe d'IA. Dites la phrase d'activation « Hey whisper » et le texte est amélioré avant d'arriver. Sur un modèle local, cela passe par Ollama ; en mode cloud, c'est gpt-5-mini par défaut.
bon donc revoir le doc d'architecture l'étiqueter projet alpha et me rappeler jeudi euh avant le point d'équipe
Bon, donc revoir le doc d'architecture, l'étiqueter Projet Alpha, et me rappeler jeudi avant le point d'équipe.
Pour la structure propre à Roam — les blocs imbriqués, les liens #tag et [[page]], les marqueurs TODO — la réponse honnête, c'est que la voix vous donne le texte et que la syntaxe de Roam vous donne la structure. Dictez la phrase, puis tapez la touche Tab pour indenter le bloc, le # pour une étiquette, ou le [[ pour un lien de page, comme vous le faites toujours. Aucun outil de dictée ne fait apparaître la syntaxe d'arborescence de Roam sur commande ; quiconque vous promet « dites double-crochet projet alpha et regardez ça se lier » vous vend une démo, pas un vrai mardi de la semaine. Couchez les mots vite à la voix, façonnez les blocs avec les touches que vous connaissez déjà.
Ce même flux parler-puis-nettoyer porte ses fruits bien au-delà de votre graphe — vous pouvez aussi dicter une prose propre dans n'importe quelle application avec le raccourci unique, si bien qu'un long bloc devient quelques phrases parlées au lieu d'un paragraphe que vous tapez.
Quand se passer d'un outil de dictée pour Roam Research

Parfois, le bon outil est celui qui est déjà gratuit sur votre machine, et prétendre le contraire serait malhonnête. Si vous ne faites que déposer de courtes captures dans Roam — une ligne rapide dans la note du jour, un rappel de deux mots — votre système d'exploitation s'en charge sans frais.
Sous Windows, appuyez sur Windows key + H et la barre de saisie vocale intégrée s'ouvre là où se trouve votre curseur, bloc Roam compris. Elle ponctue toute seule et convient pour de courtes salves. Le hic : elle passe par les serveurs de Microsoft et a besoin d'une connexion internet, ce n'est donc pas une option hors ligne, ce qui compte plus que d'habitude quand votre graphe est plein de réflexions à moitié privées. Sur Mac, la Dictée vous permet de parler pour saisir du texte partout où vous pouvez taper, à configurer dans Réglages Système sous Clavier, et sur Apple Silicon le texte général peut être traité sur l'appareil. Et si ce que vous avez vraiment, c'est de l'audio enregistré — un appel, un cours — une extension Roam Depot qui transcrit le fichier convient mieux que n'importe quel outil de dictée en direct.
Optez pour un outil dédié, qui fonctionne partout, quand les outils intégrés commencent à coincer : notes longues, travail multilingue, confidentialité hors ligne sous Windows, ou l'envie d'un seul raccourci qui se comporte de la même façon dans Roam, votre messagerie et votre éditeur. En dessous de ce seuil, utilisez ce qui est gratuit. Je ne vais pas vous dire d'installer une application pour un rappel d'une ligne.
Le même compromis se présente si vous tenez aussi des notes ailleurs — la logique de la dictée dans Obsidian est identique, car là aussi c'est le curseur, et non un plugin, qui constitue la vraie intégration.
Pour aller plus loin
Roam n'a jamais livré de bouton microphone, et après avoir écrit ceci, je suis à peu près sûr qu'il ne le fera jamais. Il n'en a pas besoin, parce que c'est le curseur qui fait l'intégration. Parlez dans le bloc, obtenez du texte, façonnez-le avec les [[ et # que vous connaissez déjà. J'ai dicté la majeure partie de ce guide dans un champ de texte qui n'était pas Roam, avec un outil qui se moque du champ dont il s'agit, puis j'ai collé le tout dans mon propre graphe. Voilà toute l'astuce.
Essayez-le dans votre prochain bloc Roam
Maintenez le raccourci, parlez, relâchez. La transcription arrive dans le bloc où se trouve votre curseur — et dans toutes les autres applications aussi.
Mode local gratuit pour tout compte connecté. Aucune carte requise pour commencer.



