Par Denys Medvediev

Tutoriel

Dictée vocale dans Zendesk : les appels face à vos réponses

Zendesk Talk transcrit l'appel du client. Il ne saisit pas votre réponse. Pour dicter la réponse, la note ou la macro que vous écrivez vraiment, un outil à raccourci clavier global comme Whisper s'en charge — hors ligne, dans l'Agent Workspace et dans chaque application annexe où vous passez votre journée.

Dernière mise à jour : juin 2026

Gros plan sur le bureau d'un agent de support, avec un casque posé sur des graphiques imprimés et des documents de tickets

La dictée vocale dans Zendesk recouvre deux choses bien distinctes. Zendesk Talk transcrit l'appel client enregistré ou le message vocal et joint la transcription au journal du ticket — il ne saisit pas votre réponse. Pour dicter la réponse, la note ou la macro que vous écrivez vraiment, Zendesk n'a aucune fonction native ; un outil global comme Whisper s'en occupe à l'aide d'un raccourci clavier.

La plupart des agents qui cherchent cela veulent une seule chose : arrêter de retaper la même réponse pour la quarantième fois de la journée et simplement la dire à voix haute. L'écart entre parler et taper est bien réel — la plupart des gens parlent à environ 150 mots par minute et en tapent peut-être un tiers sous la pression de la file d'attente, et c'est tout l'argument en faveur de la dictée. La recherche a donc du sens. Ce qui prête à confusion, c'est ce que font réellement les fonctions vocales de Zendesk, parce qu'elles ressemblent à de la dictée alors qu'elles n'en sont pas. J'ai passé un bon quart d'heure dans la documentation de Zendesk à me persuader que j'avais raté l'option de dictée pour les agents. Ce n'était pas le cas. Elle n'existe pas. Permettez-moi de tracer la ligne proprement, puis de vous montrer la partie qui fonctionne.

Voici la version courte. L'outillage vocal de Zendesk vit sur le canal téléphonique. Il écoute le client. Ce que vous imaginez — vous, en train de parler, et vos mots qui atterrissent dans la zone de réponse — relève d'une autre catégorie, qui se situe au niveau du système d'exploitation, pas à l'intérieur de Zendesk. Une fois que vous voyez cette séparation, tout cesse d'être confus.

Appuyez sur un raccourci, parlez, et votre réponse se tape toute seule

Le mécanisme tient en une touche. Vous maintenez un raccourci clavier global, vous parlez, vous relâchez, et le texte atterrit là où se trouve votre curseur — la réponse publique, une note interne, le corps d'une macro, un article du Guide. Sur Windows, le raccourci par défaut est Ctrl+Space ; sur macOS, c'est Command+Option maintenu en mode push-to-talk. Pas de menu, pas de téléversement, pas de « cliquer pour enregistrer ». La même touche fonctionne dans le Zendesk Agent Workspace et dans toutes les autres applications vers lesquelles vous basculez entre deux tickets — Slack, Teams, Gmail, Notion.

Cette dernière partie compte plus qu'il n'y paraît. Whisper est une application de bureau native pour Windows et macOS, pas une extension de navigateur. Donc, quand vous quittez l'onglet Zendesk pour signaler un bug à l'équipe technique sur Slack, le même raccourci fonctionne toujours. Une extension de navigateur s'arrête au bord de l'onglet. C'est cette même portée au niveau du système d'exploitation qui fait que l'astuce marche aussi dans votre CRM — les agents l'utilisent de la même façon pour la dictée vocale dans Salesforce et la dictée dans HubSpot.

Zendesk Talk transcrit l'appel. Il ne saisit pas votre réponse.

Casque posé sur des graphiques et des documents de service client, sur le bureau d'un agent

C'est sur cette ligne que tout le monde trébuche, alors disons-le clairement. D'après la FAQ officielle de Zendesk sur la transcription des appels, Talk prend un appel téléphonique enregistré entre un client et un agent et, une fois l'appel terminé, ajoute la transcription et un résumé au journal de conversation du ticket sous forme de notes internes. Seuls les appels enregistrés sont transcrits. Zendesk transcrit aussi l'audio des messages vocaux, qu'il facture autour d'un cent la minute.

Tout cela relève du canal vocal. Il transcrit l'appel sur lequel se trouve le client. C'est réellement utile — si vous voulez une trace écrite d'un appel parlé jointe au ticket, c'est exactement le rôle de Zendesk, et vous devriez vous en servir.

Ce que ce n'est pas, c'est de la dictée pour l'agent. Aucune de ces fonctions ne vous laisse dicter votre réponse tapée dans la zone de composition. La triste vérité, c'est que Zendesk n'a aucune fonction native pour cela. Un employé de Zendesk l'a confirmé sur le forum communautaire de l'entreprise : la transcription vocale en temps réel n'était qu'au stade de la feuille de route et a glissé du début 2024 à un trimestre ultérieur, et même cet élément concernait le canal d'appel, pas la dictée des agents. Un autre fil de demande réclamant la saisie par reconnaissance vocale est resté sans réponse. La solution de contournement qu'un membre du personnel a suggérée dans le fil consistait à activer les sous-titres en direct de Chrome, ce qui vous indique à quel point on est loin d'une vraie fonctionnalité. Quand la réponse officielle à « puis-je dicter mes réponses ? » est « avez-vous essayé le menu d'accessibilité du navigateur ? », la réponse honnête est non.

Ce que Zendesk propose vraiment pour la voix, et ce qu'il ne propose pas

Trois choses promettent trois résultats différents, et seulement deux d'entre elles existent. Voici la carte honnête :

  • Appels enregistrés — Zendesk les transcrit et range la transcription dans le journal du ticket.
  • Audio des messages vocaux — Zendesk le transcrit aussi, pour alimenter le tri et les résumés.
  • Votre réponse tapée, dictée à la voix — Zendesk ne fait pas cela du tout.

Donc, si vous êtes venu ici en espérant venir à bout de la file d'attente à la voix, les fonctions vocales de Zendesk ne vous y mèneront pas. Elles sont construites autour de l'audio du client, pas de votre clavier. Whisper se loge dans cet espace vide — c'est un outil de dictée au niveau du système d'exploitation, donc il fonctionne dans la zone de composition de l'Agent Workspace exactement comme la frappe au clavier, parce que pour le navigateur, ce n'est que du texte qui arrive au curseur.

Comment dicter dans une réponse, une note ou une macro de ticket Zendesk

Cancel
L'indicateur d'enregistrement en direct : un petit repère qui apparaît pendant que vous parlez, pour que vous sachiez que Whisper écoute — rien qui ne s'empare de votre écran.

La configuration est courte. Voici tout le processus, du début à la fin.

  1. Installez Whisper pour Windows ou macOS et connectez-vous. Tout le pipeline local est gratuit pour les utilisateurs connectés, sans carte bancaire à l'inscription.
  2. Choisissez un modèle et laissez-le se télécharger. Ce téléchargement unique va d'environ 140 Mo à 3 Go selon le modèle retenu. Ensuite, la transcription n'a plus besoin d'Internet.
  3. Ouvrez un ticket dans l'Agent Workspace et cliquez dans le champ souhaité — la réponse publique, une note interne ou le corps d'une macro que vous êtes en train de modifier.
  4. Maintenez le raccourci et parlez. Ctrl+Space sur Windows, Command+Option sur macOS. (Si vous configurez cela sur un PC, le guide de la dictée vocale sous Windows détaille le raccourci plus en profondeur.) Dites la réponse comme vous la diriez au client en face.
  5. Relâchez la touche. Le texte atterrit au curseur dans le champ actif. Relisez, corrigez ce qu'il faut, envoyez.

L'indicateur d'enregistrement ci-dessus montre ce que vous verrez pendant que vous parlez — un petit repère en direct, rien qui ne s'empare de votre écran. La première fois que la réponse apparaît tout simplement dans la zone de composition, ça paraît presque interdit. Cette sensation s'estompe vers le cinquième ticket. La crampe à la main qui disparaît, elle, ne revient pas.

L'application entière, en direct

Whisper
La vraie application de bureau Whisper, intégrée et cliquable — fouillez dans les paramètres, la liste des modèles et la configuration du raccourci. Ce que vous voyez est ce qui s'installe.

C'est la vraie application de bureau qui est intégrée ci-dessus — pas une capture d'écran, la chose elle-même. Fouillez dedans. Les paramètres, la liste des modèles, la configuration du raccourci, tout y est. Ce que vous voyez est ce qui s'installe.

Nettoyez la dictée automatiquement

Thinking...

Le langage parlé est ponctué de « euh » égarés et enchaîne les phrases. Whisper peut effectuer une passe de nettoyage IA facultative sur la transcription brute — ponctuation, casse et un léger lissage du ton — avant de coller le texte. En mode local gratuit, ce nettoyage tourne sur votre machine via Ollama ; avec Whisper Pro, il passe par votre propre clé OpenAI. Pour une réponse publique qu'un responsable qualité va relire, cette passe fait toute la différence entre « des notes parlées » et « une réponse qui passe la relecture ».

Il gère plus de 90 langues dans les deux modes, ce qui compte si votre file de tickets bascule entre l'anglais, l'espagnol et l'allemand avant le déjeuner — à peu près le même nombre de langues que mon enfant de sept ans utilise pour négocier l'heure du coucher. La gamme de modèles multilingues atteint précisément plus de 99 langues ; les variantes uniquement anglaises ne couvrent que l'anglais.

Pourquoi le local et le hors ligne comptent quand vous manipulez des données clients

Un appareil enveloppé d'une chaîne et d'un cadenas, symbolisant des données privées et verrouillées qui ne quittent jamais la machine

Voici la seule opinion que je vais défendre dans cet article : une dictée qui ne tourne que dans le cloud, sans option hors ligne, est une catastrophe pour la confidentialité quand vous êtes agent de support. Vous lisez à voix haute l'e-mail d'un client, sa commande, parfois son adresse personnelle ou un litige sur une carte bancaire. Avec un outil exclusivement cloud, tout cela fait un détour par les serveurs d'un tiers — pour la seule raison que vous vouliez parler plutôt que taper. Un outil capable de tout faire tourner sur votre propre machine ne vous demande pas de faire ce compromis.

Le mode local de Whisper tourne entièrement hors ligne. L'audio ne quitte jamais votre machine ; le seul moment où il touche le réseau, c'est le téléchargement unique du modèle. Les données personnelles du client que vous dictez dans une réponse restent sur l'appareil. Les outils de dictée à extension de navigateur et cloud qui dominent cette recherche ne peuvent pas en dire autant — ils envoient votre audio à l'extérieur pour le faire transcrire. Si votre organisation de support manipule des données réglementées, « l'audio n'a jamais quitté l'ordinateur portable » est une phrase que votre équipe de sécurité voudra entendre.

Ce qu'il ne fera pas (les limites honnêtes)

Aucun outil ne mérite un blanc-seing, alors voici là où Whisper s'arrête.

Il colle dans un seul champ actif à la fois. Il ne remplit pas tout un formulaire de ticket à plusieurs champs, et il ne décide pas à quel champ vos mots appartiennent — ils vont là où se trouve le curseur. Cela veut dire que vous devez faire attention à la différence entre la réponse publique et la note interne avant de parler. Dictez dans la mauvaise, et vous pouvez divulguer une note interne directement au client. Le curseur fait exactement ce que vous pointez, ce qui est soit une fonctionnalité, soit un aveu selon l'endroit que vous avez pointé. Cliquez d'abord, parlez ensuite.

Il insère du texte, pas de la mise en forme. Il ne pilotera pas le bouton gras de la zone de composition ni ne construira une liste à puces à la voix — il tape des mots dans CKEditor, exactement comme le ferait votre clavier. Et comme tout outil de dictée, il est le plus faible sur les chaînes qui ne sont pas des mots : identifiants de compte, numéros de commande, codes SKU, codes d'erreur. Je l'ai vu transformer « ticket ZD tiret quatre quatre zéro deux » en quelque chose avec un quatre de trop, soit précisément le genre de détail qu'un client remarque. Il transcrit ce que vous dites, mais vérifiez chaque code à l'œil avant d'appuyer sur envoyer.

Quand laisser Whisper de côté et utiliser autre chose

Bureau épuré avec un clavier et un écran, illustrant le choix de l'outil de support vers lequel se tourner

Je préfère que vous utilisiez le bon outil plutôt que le nôtre. Si vous avez besoin d'une trace écrite d'un appel parlé jointe au ticket, c'est la transcription d'appel de Zendesk Talk — c'est le rôle de Zendesk, pas celui de Whisper, et c'est déjà intégré à votre canal téléphonique. Ne sortez pas une application de dictée pour résoudre un problème de journalisation d'appels.

Si vous voulez juste dicter une réponse de temps en temps et ne rien installer, votre système d'exploitation embarque déjà une option gratuite. Windows propose la saisie vocale avec Win+H ; macOS dispose de la Dictée intégrée. Les deux fonctionnent à l'échelle du système, y compris dans la zone de composition de Zendesk. Elles sont limitées à une seule plateforme, s'appuient sur le cloud par défaut et vous donnent moins de contrôle — mais pour un agent sur une seule machine qui dicte deux fois par jour, gratuit et déjà installé est un compromis honnête.

Tournez-vous vers Whisper quand vous voulez vider la file à la voix tous les jours, le voulez hors ligne pour que les données clients restent en place, voulez un seul raccourci à travers Zendesk et les applications annexes où vous vivez, et le voulez gratuit sans carte bancaire. Whisper est gratuit pour le pipeline local dès l'inscription ; la surface Pro Cloud ajoute un essai de 7 jours. Les tarifs en vigueur sont indiqués sur la page des tarifs.

Zendesk écoute l'appel du client. Il n'a jamais été conçu pour taper votre moitié de la conversation. Ce second travail — vous qui parlez, vos mots qui atterrissent dans la zone de réponse — c'est celui qui transforme une journée à 200 tickets en quelque chose que vos poignets pardonnent. Cliquez dans le champ, maintenez la touche, parlez. Téléchargez Whisper et videz un ticket à la voix. Si vos mains ne vous remercient pas avant le déjeuner, revenez à la frappe au clavier.

Videz votre prochain ticket à la voix

Cliquez dans le champ, maintenez la touche, parlez, relâchez. La réponse atterrit au curseur — dans le Zendesk Agent Workspace et dans chaque application annexe où vous vivez.

Mode local gratuit pour tout compte connecté. Aucune carte bancaire requise pour commencer.

Photo de Denys Medvediev

Denys Medvediev

C'est moi qui lis notre e-mail de support, fort probablement en dictant les réponses.