Guide
Voix en texte dans HubSpot
HubSpot ne propose aucune saisie vocale intégrée pour les notes, les e-mails ou les tâches. La solution est un outil qui fonctionne à l'échelle du système : vous appuyez sur un raccourci, vous parlez, et la transcription se colle là où se trouve votre curseur, dans n'importe quel champ HubSpot. La dictée de votre système d'exploitation fait l'affaire aussi, pour les captures courtes.
Dernière mise à jour : juin 2026

La voix en texte dans HubSpot passe par un outil de dictée à l'échelle du système, pas par HubSpot lui-même. Le CRM HubSpot n'a aucune saisie vocale intégrée pour les notes, les e-mails ou les tâches. Un outil comme Whisper règle le problème : appuyez sur un raccourci, parlez, et la transcription se colle là où se trouve le curseur, dans n'importe quel champ HubSpot, dans le navigateur. La dictée du système d'exploitation fait l'affaire aussi, pour les captures courtes.
Cela fait quinze ans que j'observe des commerciaux consigner leurs appels, et le schéma ne change jamais. L'appel se termine, le commercial a la tête pleine de contexte, puis il fixe la fiche du contact et tape peut-être un tiers de tout ça avant que l'appel suivant ne démarre. Les bons détails s'évaporent. Alors les gens partent à la recherche d'un bouton micro dans HubSpot. Il n'y en a pas. J'ai vérifié, puis j'ai regardé les forums de la communauté, et le manque est bien réel.
Les gens cherchent « voix en texte dans HubSpot », ne trouvent rien dans le CRM, et supposent qu'ils ont raté un réglage quelque part dans la barre d'outils de l'éditeur. Ce n'est pas le cas. HubSpot n'a jamais intégré la dictée dans le champ de note, dans l'éditeur d'e-mails ni dans la description des tâches. La bonne nouvelle, c'est que la solution prend environ deux minutes, fonctionne hors ligne si vous le souhaitez, et marche dans toutes les autres applications de votre écran, en prime.
Voici la partie que la plupart des pages qui courent après ce mot-clé oublient. Une note HubSpot n'est qu'une zone de texte dans votre navigateur, exactement comme Gmail ou une barre de recherche. Une dictée qui se colle là où est votre curseur se moque que cette zone se trouve à l'intérieur d'un CRM.
La vraie question n'est donc pas « comment activer la saisie vocale dans HubSpot ». Il n'y a pas d'interrupteur. La question est « quel outil de dictée faire tourner par-dessus HubSpot », et la réponse dépend de ce que vous voulez : du gratuit-et-intégré, ou un seul raccourci hors ligne qui se comporte de la même façon dans une note de transaction, dans l'éditeur d'e-mails et dans une tâche. Je vais expliquer ce que HubSpot fait et ne fait pas, en configurer un en deux minutes, et vous dire quand il vaut mieux laisser tomber l'outil dédié.
HubSpot propose-t-il la voix en texte ?

Pas pour la saisie. Le CRM HubSpot n'a aucune fonction de dictée ou de saisie vocale intégrée pour écrire dans une note, un e-mail ou une tâche à la voix. Il n'y a pas de bouton micro dans l'éditeur de notes ni de commande vocale dans l'éditeur d'e-mails. Il existe une idée ouverte sur le propre forum de la communauté HubSpot qui demande exactement cela, et au moins trois outils distincts existent pour greffer la dictée sur HubSpot depuis l'extérieur — ce qui est le signal le plus clair possible que le CRM ne le fait pas nativement. Si vous traquiez une icône de micro dans la barre d'outils de l'éditeur, vous pouvez arrêter.
Maintenant, la nuance honnête, car c'est là que les gens s'emmêlent. HubSpot a bel et bien des fonctions vocales — elles relèvent simplement d'une autre catégorie. HubSpot peut enregistrer et transcrire des appels commerciaux grâce à ses outils d'enregistrement d'appels et de Conversation Intelligence. C'est une fonctionnalité de type réunion : elle capture un appel qui a déjà eu lieu et produit une transcription après coup. Ce n'est pas de la dictée en direct. Vous ne pouvez pas placer votre curseur dans une note de transaction, parler, et voir vos mots apparaître dans le champ. L'un enregistre les appels ; l'autre tape à votre place pendant que vous réfléchissez. Ils résolvent des problèmes différents, et les confondre coûte un après-midi.
Whisper se situe fermement du côté dictée de cette ligne, et je veux être clair là-dessus : Whisper ne rejoint pas les appels, n'enregistre pas les réunions et ne transcrit pas un Zoom. Ce n'est pas un robot de réunion. Il dicte là où est votre curseur. Vous parlez, les mots se posent dans le champ qui a le focus. Si vous voulez la transcription d'un appel commercial d'une heure, c'est la propre Conversation Intelligence de HubSpot qui est le bon outil, et je vous y dirigerais directement. Si vous voulez consigner le récapitulatif de cet appel sous forme de note propre en trente secondes de parole, c'est le manque que comble ce guide.
Appuyez sur un raccourci, parlez, le texte se pose dans le champ
Voilà tout le mécanisme, et il est ennuyeux dans le bon sens du terme. Vous appuyez sur un raccourci, vous parlez, vous relâchez, et la transcription se colle là où est votre curseur, dans le champ de texte qui a le focus. Whisper garde une courte marge après que vous avez lâché la touche, pour que votre dernier mot ne soit pas coupé. Comme cela se colle au curseur du système, une note HubSpot n'est qu'une « zone de texte parmi d'autres ». Note de contact, note de transaction, éditeur d'e-mails, description de tâche — même comportement partout.
C'est la partie que la place de marché des extensions complique inutilement. Il n'y a pas d'application HubSpot à autoriser, pas de portée OAuth à approuver, pas d'intégration à maintenir quand HubSpot publie une mise à jour de son interface. Votre curseur est dans le champ, vous parlez, les mots apparaissent dans le champ. Une petite capsule s'affiche pendant que vous parlez, pour que vous sachiez qu'il écoute :
Le raccourci est la seule chose qu'il vaut la peine de bien régler dès le départ. Sous Windows, c'est Ctrl+Space ; sur Mac, c'est Command+Option, un push-to-talk à modificateurs seuls que vous maintenez en parlant. Les deux sont modifiables dans les Réglages s'ils entrent en conflit avec quelque chose que vous utilisez déjà. (Un commercial de HubSpot m'a dit un jour qu'un raccourci « ne marchait pas » — il entrait en conflit avec une application d'enregistrement d'écran qu'il lançait à chaque appel. C'était un conflit, pas un bug, et c'est ainsi que j'ai appris que la personne moyenne n'a aucune idée de ce qu'est un conflit de raccourci. Alors maintenant, chaque raccourci est personnalisable.) Si vous avez déjà configuré la dictée sur Windows ou sur Mac, c'est la même mémoire musculaire pointée vers un onglet différent.
Configurez-le en deux minutes (Windows ou Mac)
Il vous faut un Mac sur Apple Silicon ou un PC sous Windows 10 ou plus récent, un microphone qui fonctionne, et HubSpot ouvert dans votre navigateur. Tout le pipeline local est gratuit pour tout compte connecté, sans qu'aucun moyen de paiement ne soit demandé à l'inscription. Voici la marche à suivre.
Étape 1 — Installez Whisper et connectez-vous.
Téléchargez depuis la page de téléchargement, installez, et créez un compte gratuit. Pas de carte. Tout le pipeline de transcription local s'ouvre aussitôt.
Vous saurez que ça a marché quand l'icône de l'application apparaît dans la barre des tâches et que l'assistant de configuration vous propose de choisir un modèle.
Étape 2 — Choisissez un mode de transcription.
L'application ne choisit pas à votre place. Vous en avez trois : Cloud (OpenAI, avec votre propre clé), Parakeet en local, ou Whisper en local. Pour des données clients dans un CRM, commencez en local — j'y reviens deux sections plus bas.
Vous saurez que ça a marché quand un modèle a fini de se télécharger et s'affiche comme prêt.
Étape 3 — Confirmez votre raccourci.
Windows utilise Ctrl+Space par défaut, Mac utilise Command+Option maintenu en push-to-talk. Sur Mac, accordez l'autorisation d'Accessibilité quand on vous la demande ; sans elle, le collage au curseur ne peut pas atteindre votre navigateur.
Vous saurez que ça a marché quand un enregistrement test se colle dans n'importe quel champ de texte.
Étape 4 — Placez votre curseur dans un champ HubSpot et parlez.
Ouvrez un contact ou une transaction, cliquez dans la zone de note, maintenez le raccourci, dites une phrase, relâchez. La transcription apparaît là où est le curseur, dans le champ.
Vous saurez que ça a marché quand votre phrase parlée se trouve dans la note HubSpot sous forme de texte.
La partie lente, c'est le téléchargement du modèle, pas la configuration. Tout le reste, ce sont les quatre étapes ci-dessus. Une fois en route, consigner un appel cesse d'être une tâche de saisie et devient une tâche de parole — ce qui, pour un commercial, fait la différence entre une note qui se rédige et une note qui ne se rédige pas.
Les notes, l'éditeur d'e-mails et les descriptions de tâches
Comme la dictée se colle au curseur, chaque champ de texte de HubSpot est de la partie, et c'est ce qu'il vaut la peine de détailler pour un flux de travail commercial. Les zones de note de contact et d'entreprise, évidemment. La note de transaction où vous consignez où en est vraiment l'affaire. L'éditeur d'e-mails — dictez le corps d'une relance au lieu de le taper entre deux appels. Les descriptions de tâches, pour que « rappeler jeudi au sujet de la réticence sur le prix » soit capturé tant que c'est frais, au lieu d'être mal retenu mercredi.
Celui qui rapporte le plus, c'est le récapitulatif d'après-appel. Vous raccrochez, votre curseur va dans la note de transaction, vous maintenez le raccourci et vous dites simplement ce qui s'est passé : à qui vous avez parlé, ce sur quoi ils ont émis des réserves, ce à quoi vous vous êtes engagé, quand vous relancez. Trente secondes de parole contre trois minutes à taper un tiers de tout ça. Le détail qui s'évapore d'habitude entre l'appel et le clavier finit vraiment par entrer dans la fiche. Voilà tout l'argument — pas une saisie plus rapide, mais des notes qui existent tout court.
Rien de tout cela n'oblige HubSpot à savoir que Whisper existe. Ce n'est pas une intégration, donc ça ne casse pas quand HubSpot change son éditeur, et ça marche pareil dans votre fenêtre de rédaction Gmail quand vous écrivez à un prospect en dehors du CRM. Un seul raccourci, tous les champs, que le champ vive dans HubSpot ou non. Pour un commercial qui vit éparpillé sur une douzaine d'onglets, cette propriété « pareil partout » est la vraie fonctionnalité.
Local ou cloud : quel mode pour les données clients
Pour un CRM, réfléchissez bien au mode local en premier. Les notes que vous dictez dans HubSpot sont des données clients — noms, montants de transaction, ce qu'un prospect a dit d'un concurrent, la raison pour laquelle quelqu'un hésite. Une partie de tout ça relève du genre de chose sur laquelle votre entreprise a des règles. Ce serait un drôle de choix de faire transiter chaque récapitulatif d'appel parlé par un cloud tiers pour le faire entrer dans une fiche que vous tenez précisément parce qu'elle est sensible. Si votre Mac est en Apple Silicon ou si votre PC date des dernières années, le local gère la dictée quotidienne sans broncher, et le cloud devient la porte de sortie plutôt que le réglage par défaut.
Voici en quoi les trois modes diffèrent, car l'application vous fait choisir et je préfère que vous choisissiez bien :
- Parakeet en local — le moteur TDT de NVIDIA, environ 600 Mo, et l'option locale la plus rapide — 5 à 10 fois plus rapide que Whisper sur CPU. Il couvre l'anglais plus 24 autres langues européennes, 25 au total. Pas de traduction vers l'anglais. Si votre flux tourne en anglais ou dans une autre langue européenne, c'est le choix rapide et entièrement hors ligne.
- Whisper en local — plus lent que Parakeet sur la même machine, mais les versions multilingues couvrent 99 langues et peuvent traduire vers l'anglais. Les versions anglais-uniquement sont anglais-uniquement, pas 99 langues. Choisissez celui-ci si vous vendez à des comptes chinois, japonais ou coréens, ou si vous avez besoin de traduction, ce que Parakeet ne sait pas faire. Le modèle anglais par défaut pèse environ 480 Mo.
- Cloud (OpenAI, BYOK) — la meilleure précision et un accès au web, en utilisant votre propre clé OpenAI facturée directement par OpenAI. La transcription tourne sur gpt-4o-mini-transcribe par défaut. Il faut Internet, c'est donc le seul mode qui quitte votre machine. La surface Cloud fait partie de Whisper Pro.
La vérité ennuyeuse, c'est que pour le genre de notes que la plupart des commerciaux mettent dans HubSpot, le local suffit largement. Les deux moteurs locaux tournent entièrement sur votre machine sans rien envoyer à un serveur, ce qui est exactement ce que vous voulez pour des données clients. Le cloud mérite sa place quand vous avez besoin d'une précision de premier ordre sur un accent prononcé ou que vous voulez que le modèle aille chercher un fait sur le web en pleine note. Pour la consignation d'appels au quotidien, commencez en local et ne sortez le cloud que lorsque le local vous laisse sur votre faim.
Transformer un récapitulatif d'appel parlé en note propre
La dictée brute sort en une seule longue phrase sans ponctuation. Vous raccrochez et vous dites « bon alors parlé avec maria elle s'inquiète du calendrier de migration veut un appel avec notre équipe solutions avant de signer relance vendredi », et c'est le mur sans ponctuation que tout moteur de reconnaissance vocale vous rend. La mise au propre, c'est là que les modes divergent.
La Saisie vocale de Windows ajoute la ponctuation au fil de votre parole, et la Dictée de macOS gère la ponctuation de base quand vous dites « virgule » ou « point ». Pour un nettoyage plus poussé — retirer les « euh », corriger les phrases à rallonge, transformer un déversement précipité d'après-appel en quelque chose que le prochain commercial pourra vraiment lire — Whisper peut effectuer une passe d'IA. Dites la phrase d'activation « Hey whisper » et le texte est amélioré avant de se poser dans la note. Sur un modèle local, cela passe par Ollama ; en mode cloud, c'est gpt-5-mini par défaut.
bon alors parlé avec maria elle s'inquiète du calendrier de migration veut un appel avec notre équipe solutions avant de signer euh relance vendredi
Parlé avec Maria. Elle s'inquiète du calendrier de migration et veut un appel avec notre équipe solutions avant de signer. Relance vendredi.
Une limite honnête, parce que quelqu'un va poser la question. La dictée vous donne du texte propre dans le champ de note. Elle ne remplit pas la structure propre à HubSpot à votre place — elle ne définit pas l'étape de la transaction, n'associe pas la note au bon contact et ne crée pas la tâche de relance en tant que vraie tâche. Vous dictez les mots ; vous cliquez sur les commandes HubSpot comme vous l'avez toujours fait. Quiconque promet « dites mettez l'étape de la transaction à gagnée et regardez ça se faire » vous vend une démo, pas un mardi ordinaire. Notez vite le récapitulatif à la voix, puis utilisez les propres boutons du CRM pour les propres champs du CRM.
Ce même enchaînement parler-puis-mettre-au-propre est payant bien au-delà du CRM — vous pouvez aussi dicter une prose propre dans n'importe quelle application avec le seul raccourci, si bien qu'un long e-mail de relance devient quelques phrases parlées au lieu d'un paragraphe que vous tapez entre deux appels.
Quand renoncer à un outil de dictée pour HubSpot

Parfois, le bon outil est le gratuit déjà présent sur votre machine, et prétendre le contraire serait malhonnête. Si vous ne déposez que des captures courtes dans HubSpot — une note d'une ligne, une tâche de deux mots — votre système d'exploitation s'en charge pour rien.
Sous Windows, appuyez sur la touche Windows + H et la barre de Saisie vocale intégrée s'ouvre là où se trouve votre curseur, dans une note HubSpot comprise. Elle ponctue toute seule et convient aux courtes salves. Le hic : elle passe par les serveurs de Microsoft et a besoin d'une connexion Internet, ce n'est donc pas une option hors ligne — ce qui compte plus que d'habitude quand le texte est constitué de données clients. Sur Mac, la Dictée vous laisse parler pour saisir du texte partout où vous pouvez taper, se configure dans Réglages Système sous Clavier, et sur Apple Silicon le texte courant peut être traité sur l'appareil. Et si ce que vous voulez vraiment, c'est la transcription de l'appel commercial lui-même, laissez tomber la dictée entièrement — c'est le rôle de l'enregistrement d'appels et de la Conversation Intelligence propres à HubSpot, conçus exactement pour cette tâche.
Tournez-vous vers un outil dédié, à l'échelle du système, quand les fonctions intégrées commencent à faire mal : longs récapitulatifs d'appels, comptes multilingues, confidentialité hors ligne pour des données clients sous Windows, ou le désir d'un seul raccourci qui se comporte pareil dans une note HubSpot, votre e-mail et votre liste de tâches. En dessous de ce seuil, servez-vous de ce qui est gratuit. Je ne vais pas vous dire d'installer une application pour consigner un rappel d'une ligne.
Le même arbitrage réapparaît si votre équipe garde aussi des notes de compte dans un outil séparé — la logique qui consiste à dicter dans Notion est identique, car là aussi c'est le curseur, et non une intégration, qui est le vrai lien entre votre voix et le champ.
Pour aller plus loin
HubSpot n'a jamais sorti de bouton micro pour son champ de note, et vu tout ce qu'il a investi dans l'enregistrement d'appels à la place, je doute qu'il se précipite. Il n'en a pas besoin, parce que le curseur est l'intégration. Parlez dans le champ, obtenez du texte propre, cliquez sur les propres boutons du CRM pour le reste. J'ai dicté la moitié de ce guide dans une zone de texte qui n'était pas HubSpot, avec un outil qui se moque de quelle zone il s'agit, puis j'ai collé le tout là où ça devait aller. Voilà toute l'astuce.
Consignez votre prochain appel en parlant
Maintenez le raccourci, dites ce qui s'est passé, relâchez. Le récapitulatif se pose dans le champ HubSpot où se trouve votre curseur — et dans toutes les autres applications aussi.
Mode local gratuit pour tout compte connecté. Aucune carte requise pour commencer.



