Par Denys Medvediev

Tutoriel

Voix au texte dans Canva : dictez avec un raccourci

Canva n'a pas de dictée en direct. Magic Write génère du texte à partir d'une instruction ; Speech to Text transcrit un fichier. Pour dicter vos propres mots dans une zone de texte, un commentaire ou un Doc Canva, vous utilisez un raccourci clavier qui fonctionne dans tout le système, comme Whisper.

Dernière mise à jour : juin 2026

Bureau de graphiste avec un ordinateur portable, un carnet et des nuanciers de couleurs disposés pour un travail créatif visuel

La voix au texte dans Canva n'est pas une fonctionnalité intégrée. Canva propose Magic Write (génération de texte par IA à partir d'une instruction tapée) et Speech to Text (transcription d'un fichier que vous avez déjà enregistré), mais pas de dictée en direct dans une zone de texte. Un outil de bureau qui fonctionne dans tout le système, comme Whisper, comble ce manque : maintenez un raccourci, parlez, et les mots s'inscrivent au niveau du curseur dans n'importe quel champ Canva.

Cette phrase déroute pas mal de monde, alors reprenons plus doucement. Canva possède quatre choses portant l'étiquette « voix » ou « IA », et aucune n'est vous en train de dicter vos propres mots dans une zone de texte. Confondez-les et vous passerez vingt minutes à chercher un bouton de dictée qui n'a jamais existé.

Ceci est un guide pratique. Je vais démêler les quatre fonctionnalités « voix » de Canva, vous montrer comment dicter dans une vraie zone de texte, un commentaire et un Doc Canva avec un seul raccourci, nommer la seule chose que cette méthode ne fera pas, et vous dire quand laisser tomber mon outil complètement.

Canva propose-t-il la voix au texte ? Magic Write n'est pas de la dictée

Bureau créatif vu de haut avec un livre de design, des stylos et des autocollants colorés pour la mise en page

Canva a des fonctionnalités à saveur vocale. Il n'a pas de dictée en direct. Voici les quatre choses que les gens confondent, séparées.

Magic Write, c'est de la génération de texte par IA, pas votre voix. Vous tapez une instruction — « écris trois slogans pour un studio de yoga » — et l'IA de Canva rédige le texte. La page Magic Write de Canva est claire : c'est vous qui tapez l'instruction ; votre voix n'est jamais l'entrée. L'IA écrit à votre place. La dictée, elle, écrit ce que vous avez dit. Deux métiers différents.

Speech to Text transcrit un fichier que vous avez déjà enregistré. La fonctionnalité Speech to Text de Canva prend un enregistrement ou une vidéo existante — sa page mentionne les formats MP4, MOV ou M4V jusqu'à 500 Mo et moins de 90 minutes, ou un lien YouTube — et la convertit en texte après coup. Vraiment utile, et j'y reviendrai plus loin. Mais elle transcrit un fichier, pas vous en train de parler en direct dans une zone de texte.

Text to Speech fonctionne dans l'autre sens. Le générateur de voix par IA de Canva transforme un texte tapé en voix off pour des vidéos. Texte en entrée, audio en sortie. L'exact opposé de la dictée.

Le micro de l'IA Canva ne remplit que la zone d'instruction. L'assistant a une icône de microphone, mais elle remplit l'instruction de l'IA à la voix — vous dictez une commande à l'assistant. Elle n'écrit pas dans le texte de votre design, vos commentaires ou le corps de votre Doc.

Donc le verdict honnête : Canva n'a aucune dictée en direct dans vos champs de texte. Ce travail — parler, et voir vos mots apparaître au curseur — est assuré par un outil de bureau distinct. C'est toute la raison d'être de cet article.

Dictez dans les zones de texte et les docs Canva avec un raccourci

La solution se situe en dessous de Canva, au niveau du système d'exploitation. Vous installez une application de dictée de bureau, elle s'approprie un raccourci global, et ce raccourci colle le texte transcrit dans le champ où se trouve le curseur — une zone de texte Canva, un commentaire, un Doc Canva. La même touche fonctionne dans Slack, Gmail et votre éditeur, parce que l'outil vit au niveau du système, pas à l'intérieur d'un onglet de navigateur.

Avec Whisper, le raccourci par défaut est Ctrl+Space sous Windows et Command+Option sous macOS. Le déroulé est identique sur chaque surface Canva :

Cancel
L'overlay d'enregistrement : une petite capsule qui apparaît pendant que vous parlez, pour que vous sachiez que Whisper écoute.
  1. Cliquez dans le champ voulu — une zone de texte sur le canevas, la ligne de commentaire ou un Doc Canva.
  2. Maintenez le raccourci et parlez. Dites la phrase comme vous la diriez à voix haute.
  3. Relâchez. Une seconde ou deux plus tard, les mots apparaissent au curseur.
  4. Jetez un œil, corrigez un mot si besoin, continuez à créer.

C'est tout le geste. Pas de boîte de dialogue « démarrer la dictée », pas de seconde fenêtre, pas de copier-coller depuis ailleurs. Vous restez dans le champ Canva où vous étiez déjà. Ça marche que vous utilisiez Canva dans le navigateur ou l'application de bureau Canva, parce que l'outil se moque de ce qui est affiché à l'écran.

Voici ma seule opinion pour cet article, appuyée par un chiffre. Le meilleur gain de productivité, ce n'est pas taper plus vite — c'est avoir moins d'étapes. La frappe tourne autour de 40 mots par minute ; la parole, environ 145, soit à peu près 3,6 fois plus vite. Le vrai gain, c'est d'éviter le changement de posture s'arrêter-s'asseoir-taper. Vous mettez en page un carrousel, vous avez une légende en tête, vous la dites, elle est là. La voix n'accélère pas les étapes. Elle en supprime quelques-unes.

Whisper
La vraie application de bureau Whisper — choisissez un mode de transcription, appuyez sur le raccourci et regardez le texte atterrir dans le champ.

Ce qui est intégré au-dessus, c'est la vraie application, pas une capture d'écran. Choisissez un mode de transcription, appuyez sur le raccourci, regardez le texte arriver. Canva ne sait même pas que l'outil existe — pour Canva, on dirait exactement que vous avez tapé, sauf que vous n'avez pas tapé.

Il y a trois modes, et l'application ne choisit pas à votre place. Le mode Cloud utilise votre propre clé OpenAI pour une précision optimale et des réponses web. Parakeet est l'option locale la plus rapide pour l'anglais et 24 langues européennes. Les modèles multilingues de Whisper couvrent plus de 99 langues, avec détection automatique, plus la traduction vers l'anglais. Pour le travail Canva au quotidien — un titre, une légende, un commentaire — même les plus petits modèles locaux suivent le rythme, et le chiffre côté client est de plus de 90 langues dans les deux modes si vous rédigez des campagnes multilingues.

Nettoyez la dictée automatiquement

Thinking...

Le langage parlé brut contient les « euh », le faux départ, le « non, oublie ça ». Whisper propose un nettoyage par IA facultatif par-dessus la transcription : une passe locale qui tourne sur votre propre machine en mode gratuit, ou une passe cloud en Pro si vous apportez votre clé. Activez-le et « euh mets le titre en gras et sympa genre dix pour cent de réduction cette semaine seulement » devient une phrase propre. Désactivez-le et vous obtenez la transcription mot pour mot — chaque « euh » inclus, ce qui est une forme d'honnêteté à part entière. C'est vous qui décidez, enregistrement par enregistrement.

C'est aussi ici que la confusion avec Magic Write revient, alors réglons-la définitivement. Magic Write génère du texte à partir d'une instruction que vous tapez. Le nettoyage de Whisper peaufine les mots que vous avez réellement prononcés. L'un invente la phrase ; l'autre range la vôtre. Si vous vouliez que l'IA écrive le slogan, c'est Magic Write. Si vous vouliez dire le slogan et le voir tapé proprement, c'est ceci.

Là où il colle le texte, et la seule chose qu'il ne fera pas

Maintenant, la note honnête sur le périmètre, parce que personne d'autre dans ces résultats de recherche ne le dit clairement. Whisper colle le texte transcrit dans l'unique champ qui a le focus — une zone de texte, un commentaire ou un Doc, là où se trouve le curseur. C'est tout le contrat.

Il ne créera pas, ne déplacera pas, ne redimensionnera pas, ne recolorera pas et ne concevra pas d'éléments Canva à la voix, et il n'exécutera pas de commandes Canva. Vous ne pouvez pas dire « ajoute un cadre », « passe la police en gras » ou « agrandis le logo » et que ça se produise. Il transforme la parole en texte au curseur. Il ne pilote pas l'outil de design. (J'ai passé un après-midi embarrassant, au début, à essayer de faire bouger des formes avec des commandes vocales. Les formes sont restées exactement là où elles étaient. J'ai un master.)

Bon à savoir : Willow, une application de dictée concurrente pour Mac et Windows, va plus loin sur un point — elle prend en charge les commandes de mise en forme vocales en ligne, donc vous pouvez dire « puce » ou « nouvelle ligne » en plein milieu d'une phrase et la mise en forme apparaît au fur et à mesure que vous dictez. Whisper ne le prétend pas ; il colle du texte brut et vous laisse la mise en forme à la main. Si la mise en forme pilotée à la voix est ce que vous cherchez, c'est une vraie raison de regarder Willow. Je préfère le dire que vous le découvriez après l'installation.

Hors ligne et privé

Ordinateur portable affichant une icône de cadenas de sécurité sur une table, évoquant un traitement privé hors ligne

Les graphistes manipulent du texte qui ne doit pas sortir de l'entreprise. Un nom de produit pas encore annoncé. La date de lancement d'un client sous NDA. Une ligne de tarif pas encore publique. Quand vous dictez ça dans un outil 100 % cloud, l'audio part vers un serveur et en revient pour devenir du texte.

Le mode local de Whisper tourne entièrement sur votre machine. Pas d'internet pendant la transcription, et l'audio ne quitte jamais l'ordinateur portable. La seule connexion dont vous avez besoin, c'est le téléchargement unique du modèle, quelque part entre environ 140 Mo et 3 Go selon le modèle choisi. Après ça, vous pouvez dicter tout un deck de légendes Canva en avion, le Wi-Fi coupé.

C'est la ligne la plus nette entre les outils qui comblent le manque de dictée de Canva. Voice In, l'extension de navigateur, est basée sur le cloud. La page Canva de Willow met en avant une rétention de données nulle mais ne mentionne pas de mode hors ligne. Whisper propose explicitement une transcription locale sur l'appareil. Pour un texte « titre de la semaine », ça n'aura pas d'importance. Pour tout ce que vous hésiteriez à lire à voix haute dans un open space, le sur-appareil est le choix par défaut, ennuyeux et correct. Le même raisonnement parcourt nos guides sur l'ajout de la voix au texte dans Figma et de la voix au texte dans Miro — l'outil de design change, le raisonnement non.

Quand Magic Write ou la dictée de l'OS ont plus de sens

Bureau bien rangé avec un ordinateur portable, des livres et une lampe installés pour un travail de design concentré

Je ne vais pas prétendre que Whisper est la bonne réponse à chaque fois. Trois cas où il ne l'est pas :

Vous voulez en fait transcrire un enregistrement existant. Si vous avez déjà un mémo vocal, un extrait de webinaire ou un lien YouTube et que vous voulez en extraire les mots, ce n'est pas de la dictée — c'est de la transcription de fichier, et le Speech to Text de Canva le fait dans l'éditeur sans outil supplémentaire. Utilisez la fonctionnalité intégrée de Canva ; c'est la bonne pour ce travail.

Vous ne travaillez jamais que dans l'onglet Canva du navigateur et vous voulez un module gratuit pour le navigateur. Voice In est une extension Chrome et Edge conçue exactement pour ça. Elle ne peut pas atteindre l'application de bureau Canva ni rien en dehors du navigateur, mais si le navigateur est tout votre univers, elle convient.

Vous voulez une dictée déjà présente sur votre ordinateur. Windows a la saisie vocale sur Win+H ; macOS a Apple Dictation. Les deux dictent dans tout le système vers Canva, navigateur ou bureau, gratuitement et sans rien installer. Chacune est limitée à une plateforme et la qualité varie, mais pour de courtes salves, c'est une option gratuite correcte.

Tournez-vous vers Whisper quand vous voulez que l'audio reste sur votre appareil, un outil gratuit sans carte à l'inscription, ou un seul raccourci qui fonctionne de la même façon dans l'application de bureau Canva et dans toutes les autres applications que vous touchez.

Combien ça coûte

Magic Write et Speech to Text de Canva vivent dans les paliers gratuit et Pro des forfaits Canva — la tarification de Canva, pas la mienne. La page Canva de Willow offre 2 000 mots gratuits par semaine pour tester, sans carte, puis un palier payant au-delà. Voice In est une extension de navigateur freemium. Tout le pipeline local de Whisper — la partie qui dicte dans vos champs Canva — est gratuit à l'inscription, sans carte. Whisper Pro ajoute la surface Cloud et est livré avec un essai Cloud de 7 jours, où une carte n'est nécessaire que pour cette mise à niveau, jamais à la première inscription. Ne confondez pas les deux : la dictée qui gère votre travail Canva, c'est la partie gratuite. Les chiffres se trouvent sur notre page de tarifs si vous les voulez.

La plupart des recherches « voix au texte dans Canva » se terminent par la même petite déception : vous partez chercher un bouton de dictée, vous tombez sur Magic Write, et vous réalisez qu'il veut écrire le texte à votre place, pas taper ce que vous avez dit. Le bouton n'est pas dans Canva. Il se situe une couche en dessous, dans un raccourci. J'ai montré le geste à ma fille cadette une fois — cliquer, maintenir, parler, relâcher — et elle a écrit une légende pour une carte d'anniversaire avant que j'aie fini d'expliquer. Elle a sept ans. Elle n'a pas posé une seule question de suivi, ce que je ne peux pas dire de la plupart des adultes que j'ai formés. Si vous voulez la version sans clavier partout, voici comment taper plus vite avec la voix, y compris la voix au texte sur un Mac.

Dictez votre prochaine légende Canva

Cliquez dans le champ, maintenez la touche, parlez, relâchez. La transcription atterrit là où se trouve votre curseur — dans Canva et dans toutes les autres applications aussi.

Mode local gratuit pour tout compte connecté. Aucune carte requise pour commencer.

Photo de Denys Medvediev

Denys Medvediev

C'est moi qui lis nos e-mails de support, le plus souvent en dictant les réponses.