Par Denys Medvediev

Guide

Les outils de notes de réunion par IA, sans détour

La catégorie regroupe deux produits très différents, et les pages marketing brouillent la frontière. L'un envoie un robot dans votre appel. L'autre n'y touche jamais. Voici comment savoir lequel il vous faut vraiment.

Dernière mise à jour : juin 2026

Ordinateur portable ouvert et carnet à spirale vierge avec un stylo et un café sur un bureau en bois pendant une journée de travail

Un outil de notes de réunion par IA enregistre une conversation et la transforme en transcription, résumé et liste d'actions. La plupart sont des robots à connexion automatique qui rejoignent un appel Zoom, Teams ou Meet et rédigent les notes pour toute la salle. Il existe un second type, sans robot : vous dictez vous-même les notes, et rien ne rejoint l'appel. Choisissez les robots (Otter, Fireflies, Granola, Read AI, tl;dv) quand vous voulez qu'un robot assiste à la réunion et en fasse le récapitulatif ; choisissez un outil de dictée comme Whisper quand vous voulez vos propres notes, claires et à la voix, sans enregistrer toute la salle.

Une réunion d'une heure représente à peu près 9 000 mots prononcés, en estimation rapide. Personne ne les tape à la main, et c'est pourquoi toute une industrie d'outils rejoint désormais vos appels sans y être invitée pour rédiger les notes à votre place. La vérité un peu ennuyeuse : « outil de notes de réunion par IA » désigne deux produits différents, et les pages marketing font tout pour brouiller la frontière. L'un envoie un robot dans la salle. L'autre ne touche jamais à l'appel. Choisissez le mauvais et soit vous payez pour une fonction dont vous ne voulez pas, soit vous envoyez l'enregistrement de toute votre réunion quelque part où vous n'aviez pas l'intention de le faire.

Voici le verdict d'entrée de jeu, puisqu'il s'agit d'un comparatif. Vous voulez qu'un robot assiste à votre Zoom et remette à chacun un récapitulatif après coup ? Les robots à connexion automatique (Otter, Fireflies, Granola, Read AI, tl;dv) sont faits pour ça, et plusieurs proposent une offre gratuite. Vous voulez capturer vos propres notes, claires et à la voix, pendant ou juste après l'appel, sans qu'un tiers enregistre la salle ? C'est un outil différent, et c'est là que Whisper trouve sa place. Cet article classe la catégorie en ces deux types, nomme les robots qui valent la peine d'être connus, et vous dit lequel je choisirais dans chaque cas. La plupart des e-mails de support que je lis viennent de gens qui ont acheté le mauvais type dès le premier jour, alors j'ai tout intérêt à bien faire la distinction.

Je fais Whisper, alors soyons clairs sur sa place avant d'aller plus loin. Whisper n'est pas un robot de réunion. Il ne rejoint pas votre appel. C'est un outil de dictée : vous appuyez sur un raccourci, vous parlez, et le texte se pose là où se trouve votre curseur. C'est donc le mauvais outil pour « transcrire un point d'équipe à quatre auquel je n'assiste qu'à moitié », et le bon outil pour « rédiger mes propres notes et actions à la voix sans téléverser toute la réunion ». Les deux besoins sont réels. La plupart des articles font comme s'il n'y en avait qu'un.

Un outil de notes de réunion par IA transforme la parole en notes exploitables

Espace de travail avec un ordinateur portable, un carnet et un stylo sur un bureau en bois, avec un tableau blanc flou en arrière-plan

Retirez le marketing et chaque outil de cette catégorie fait trois choses. Il capture l'audio. Il transcrit cet audio en texte. Puis un modèle de langage compresse le texte en un résumé, une liste de décisions et un ensemble d'actions. L'aperçu IA que Google affiche pour cette recherche dit la même chose avec plus de mots.

Ce qui distingue les outils, c'est l'étape de capture, et c'est précisément la partie que les pages d'accueil escamotent. Un robot à connexion automatique capture en envoyant un participant dans votre appel vidéo. Vous l'avez déjà vu : ce participant supplémentaire nommé « Otter.ai » ou « Fireflies Notetaker » assis dans la grille. Un outil de bureau sans robot capture plutôt l'audio qui sort de votre ordinateur, si bien qu'aucun invité supplémentaire n'apparaît dans la salle. Un outil de dictée comme Whisper ne capture que ce que vous dites au micro quand vous maintenez un raccourci. Même catégorie sur le papier. Trois choses différentes dans la salle.

Cela compte pour une question de consentement et de confidentialité, pas de fonctionnalités. Quand un robot rejoint l'appel, un tiers enregistre tout le monde, souvent sans avertissement clair. Quand vous dictez vos propres notes, la seule voix capturée est la vôtre, et en mode local rien ne quitte votre machine. Nous y reviendrons. D'abord, voyons comment fonctionnent les robots.

Comment fonctionnent les preneurs de notes à connexion automatique

Les outils à connexion automatique vivent dans votre agenda. Vous connectez Google Calendar ou Outlook, et quelques minutes avant le début de chaque réunion, l'outil dépêche un robot qui demande à rejoindre l'appel comme participant. Fireflies, par exemple, peut « rejoindre automatiquement les réunions de votre agenda », ou vous pouvez inviter son robot dans une réunion en cours à la volée. L'argument de Read AI est qu'il « rejoint vos réunions, enregistre et livre un récapitulatif » sur Zoom, Google Meet et Microsoft Teams.

Une fois à l'intérieur, le robot enregistre l'appel, transcrit chaque intervenant, et après la réunion rédige un résumé assorti d'actions qu'il envoie par e-mail ou dépose dans un espace de travail. Certains de ces outils vous laissent ensuite faire une recherche dans toutes vos réunions passées et « poser » des questions sur ce qui a été dit.

Une seconde méthode, plus discrète, s'est développée au cours de l'année écoulée : la capture sans robot. Au lieu qu'un robot rejoigne l'appel, une application de bureau enregistre l'audio qui sort des propres haut-parleurs de votre ordinateur. Granola « transcrit directement l'audio de votre ordinateur, sans aucun robot de réunion rejoignant votre appel ». Fathom propose désormais les deux, avec ou sans robot, pour que vous puissiez « rester concentré sur la réunion » dans les deux cas. tl;dv met en avant un flux « SANS ROBOT REQUIS » sur son offre gratuite. Les notes couvrent toujours toute la réunion ; la différence, c'est qu'un invité visible apparaisse ou non dans la grille. L'enregistrement a quand même lieu. Il a simplement lieu sur votre ordinateur portable plutôt que dans le cloud.

Les deux types d'outils que personne ne vous aide à distinguer

Voici la distinction que les pages de catégorie refusent de tracer. Il y a l'outil qui écoute la salle, et il y a l'outil qui vous écoute, vous.

Les outils « salle », avec ou sans robot, capturent toute la conversation, chaque intervenant, par eux-mêmes. Vous vous installez et les notes apparaissent. Cela vaut son pesant d'or quand vous êtes dans une réunion à laquelle vous ne pouvez pas pleinement assister, ou quand toute l'équipe a besoin d'un compte rendu partagé. C'est aussi un enregistrement d'autres personnes, qui soulève des questions de consentement et de stockage dont vous êtes désormais responsable.

L'outil « vous » ne capture que ce que vous choisissez de dire. Vous maintenez un raccourci, vous dictez les trois décisions qui comptaient, et le texte nettoyé se pose dans votre appli de notes ou votre e-mail. Personne d'autre n'est enregistré. Rien de la réunion n'existe à part le résumé que vous avez dicté volontairement. Le travail est plus lent au sens où c'est à vous de faire la réflexion, mais la réflexion, c'est justement l'essentiel. Un résumé de 600 mots que vous avez dicté vaut plus qu'une transcription de 9 000 mots que personne ne lit.

La plupart des gens qui cherchent « outil de notes de réunion par IA » supposent qu'ils veulent l'outil « salle ». Environ la moitié d'entre eux, une fois qu'ils y réfléchissent, veulent l'outil « vous ». Ils ignoraient que c'était une catégorie. C'est toute la raison d'être de cet article.

Comment j'ai choisi les outils de ce comparatif

Un mot rapide sur la méthode, parce que la version honnête compte ici. Je n'ai pas mené d'essai en laboratoire. Je n'ai pas placé sept de ces robots côte à côte dans le même appel Zoom pour les chronométrer, et tout article qui prétend l'avoir fait, sans montrer l'enregistrement, fait des suppositions. Je ne vais donc pas inventer des pourcentages de précision ou des chiffres de vitesse pour des outils que je ne construis pas. Ce qui suit s'appuie sur deux choses : les capacités documentées de chaque outil (les affirmations sur leurs pages tarifaires et produit, citées au fil du texte), plus l'usage concret de la seule application que je construis et utilise tous les jours.

Les qualités que j'ai pesées, dans l'ordre où elles tendent à compter pour cette catégorie :

  • Ce qu'il capture. Toute la salle (connexion automatique ou sans robot) versus votre seule voix. C'est la bifurcation dont tout le reste découle.
  • Qui est enregistré. Un robot dans l'appel enregistre chaque participant ; la dictée ne vous enregistre que vous. C'est ce qui détermine la question du consentement et de la confidentialité.
  • Où va l'audio. Service cloud versus sur votre propre machine. La plupart des robots sont uniquement cloud ; un seul mode local fait exception.
  • Portée des plateformes. Quelles applis d'appel il rejoint (Zoom, Meet, Teams) et quels systèmes d'exploitation l'exécutent.
  • Couverture linguistique. Issue en source primaire de la page de chaque éditeur. Lorsqu'un éditeur n'indique aucun chiffre, je le dis plutôt que de deviner.
  • Forme du coût. Offre gratuite, abonnement par utilisateur ou freemium. Les vrais montants en dollars figurent sur la page de chaque outil et sur la page tarifaire ; je ne vais pas les citer en plein milieu d'une phrase ici.

Ce sont des critères de sélection, pas un verdict déguisé. Une fois énoncés, voici la catégorie en un seul tableau.

Les outils en un coup d'œil

Chaque case ci-dessous vient des affirmations documentées de chaque outil (citées au fil du texte dans la section suivante) ou, pour Whisper, de la façon dont l'application est livrée. Aucun chiffre de précision ou de vitesse n'apparaît, car aucun éditeur ici ne publie de tests vérifiés et je ne vais pas les inventer.

Les six premières lignes, c'est la salle. La dernière ligne, c'est vous.
OutilPlateformes rejointesLocal ou cloudFonctionne hors ligneForme de tarificationLangues (annoncées)Idéal pour
Otter.aiZoom, Teams, MeetCloudNonOffre gratuite + par utilisateur6Équipes très Zoom dans l'une de ses langues
Fireflies.aiZoom, Meet, Teams, +autresCloudNonGratuit à vie + par utilisateur100+Une archive cherchable de chaque appel
GranolaZoom, Meet, Webex, Slack, TeamsCloud (capture locale sans robot)NonFreemiumNon préciséDes notes de toute la réunion sans robot visible
Read AIZoom, Meet, TeamsCloudNonOffre gratuite + payant20+Tester l'idée sur une offre gratuite sans carte
tl;dvMeet, Zoom, TeamsCloud (option sans robot)NonGratuit à vie + payant30+L'offre gratuite la plus généreuse
Notion AI Meeting NotesNon préciséCloudNonInclus dans les offres payantes de NotionNon préciséLes équipes qui vivent déjà dans Notion
Whisper by RemskillNe rejoint rien (vous dictez)Local ou cloud (à votre choix)Oui (mode local)Offre locale gratuite + Pro pour le cloud99 (local multilingue)Rédiger vos propres notes à la voix, en privé

Lisez le tableau comme un outil de tri, pas comme un classement. Les six premières lignes, c'est la salle. La dernière ligne, c'est vous. Choisissez votre ligne et le reste de cet article vous dira quel nom y choisir.

Les robots de réunion qui valent la peine d'être connus

Weekly sync · 4 participants
YYou
PPriya
MMarcus
recordingNotetaker
Un robot de réunion à connexion automatique, recréé — le participant supplémentaire nommé « Notetaker » assis dans la grille de votre appel, en train d'enregistrer. Ce n'est pas Whisper ; c'est le genre d'interface que Whisper évite délibérément.

Si c'est l'outil « salle » qu'il vous faut, voici les cinq qui valent votre temps. Toutes les affirmations ci-dessous viennent des pages de chaque outil.

Otter.ai est le nom par défaut dans ce domaine. Il rejoint Zoom, Microsoft Teams et Google Meet pour rédiger et partager des notes, avec transcription et sous-titres en direct. Son offre gratuite Basic vous donne 300 minutes de transcription par mois. Le bémol à connaître : sa page tarifaire liste six langues, à savoir l'anglais, l'espagnol, le français, l'allemand, le japonais et le chinois. En dehors de celles-ci, cherchez ailleurs. Si vous pesez Otter face à la dictée, l'article alternative à Otter.ai approfondit la distinction réunion versus rédaction.

Fireflies.ai rejoint automatiquement les réunions de l'agenda sur Zoom, Meet, Teams et d'autres, et annonce une transcription dans plus de 100 langues. Il propose une offre gratuite à vie avec 800 minutes de stockage par utilisateur. Il penche vers les équipes qui veulent une archive cherchable de chaque appel.

Granola est celui sans robot. Il enregistre l'audio de votre ordinateur, sans robot dans la grille, et fonctionne aux côtés de Zoom, Meet, Webex, Slack et Teams, avec une application iPhone. Si c'est la gêne du robot visible qui vous rebute, Granola la supprime tout en capturant quand même toute la réunion.

Read AI arrivait en tête des résultats de recherche que j'ai consultés. Il rejoint, enregistre et livre un récapitulatif sur Zoom, Meet et Teams, avec des applications sur Windows, macOS, Android, iPhone et Chrome, plus de 20 langues. Son offre gratuite propose 5 réunions par mois sans carte bancaire.

tl;dv est l'option gratuite la plus agressive. Son offre Free Forever annonce des enregistrements et transcriptions illimités dans plus de 30 langues avec des résumés IA, et s'intègre à Meet, Zoom et Teams. Si « gratuit » est votre seule exigence ferme, commencez ici.

Un de plus qui mérite une mention : Notion AI Meeting Notes transcrit et résume à l'intérieur de Notion sans robot séparé, inclus dans les offres Business et Enterprise de Notion. Bon à savoir si vous vivez déjà dans Notion, même si sa page ne précise pas quelles plateformes d'appel il rejoint ni combien de langues il couvre.

Où Whisper trouve sa place : vous dictez, il tape, rien ne rejoint l'appel

Pasted
L'overlay de Whisper finalisant une note dictée — son état complet. Aucun robot n'a rejoint l'appel ; la seule voix capturée est la vôtre.

Whisper est l'outil « vous ». Vous appuyez sur un raccourci (Ctrl+Space sous Windows, ou vous maintenez Command+Option sous macOS en accord de type push-to-talk), puis vous parlez, et vos mots se collent en texte là où se trouve le curseur, dans n'importe quelle application. Aucun robot ne rejoint votre appel. Aucun invité supplémentaire n'apparaît dans la grille Zoom. Le seul audio capturé est ce que vous dites dans votre propre micro, volontairement.

Cela change le déroulé. Au lieu d'une transcription de 9 000 mots de toute la réunion, vous dictez la partie qui compte (les trois décisions, les deux responsables, l'unique échéance) directement dans votre document de notes pendant que l'appel est encore frais. En mode cloud, l'assistant IA peut la nettoyer, résumer un paragraphe, extraire les actions de ce que vous avez dicté, ou rédiger l'e-mail de suivi, collé au curseur. Dites « Hey whisper » avant votre instruction pour déclencher l'étape IA.

Vous choisissez le moteur. Whisper en local fait tourner huit modèles sur votre machine et couvre 99 langues sur ses variantes multilingues ; les versions anglais seul .en ne gèrent que l'anglais. NVIDIA Parakeet est l'option locale la plus rapide, 5 à 10× plus rapide que Whisper sur CPU, couvrant 25 langues (l'anglais plus 24 langues européennes), le tout sur l'appareil. Ou le mode cloud utilise votre propre clé OpenAI : gpt-4o-mini-transcribe ou gpt-4o-transcribe pour la transcription, gpt-5-mini pour l'amélioration. En mode local, tout tourne hors ligne après un téléchargement de modèle unique ; rien n'est envoyé nulle part pendant la transcription. Si faire tourner tout sur votre propre machine est ce qui compte pour vous, le guide de la reconnaissance vocale hors ligne détaille plus en profondeur les moteurs locaux. Whisper est livré sur Windows et macOS (Apple Silicon) ; Linux n'est pas pris en charge.

Le compromis honnête : les outils « salle » vous épargnent de l'attention, et Whisper vous épargne un enregistrement dont vous n'aviez pas besoin. Si vous rédigez surtout des choses (e-mails, documents, notes après un appel), le flux de dictée gagne sa place dans votre journée bien au-delà des réunions. C'est le même argument que je défends dans l'article plus large sur l'application de synthèse vocale, et c'est pourquoi Whisper est conçu autour de la dictée d'abord et des réunions ensuite.

Maintenant la seule opinion que je défends fermement ici, dite sans détour : la dictée uniquement cloud est un désastre de confidentialité qui n'attend que d'être transcrit. Une équipe avec laquelle j'ai travaillé a un jour laissé un prestataire bâtir un prototype interne de « dictée IA » qui appelait un modèle cloud à chaque énoncé et tournait sur chaque ordinateur portable. Le manager a ouvert le tableau de bord des coûts en fin de trimestre et a trouvé une facture à cinq chiffres, en grande partie due à une équipe qui transcrivait quatre fois de suite des enregistrements de points d'équipe parce que la logique de « nouvelle tentative intelligente » était trop agressive. Le prestataire a dit « il faudrait optimiser le prompt ». La directrice financière a dit « ou bien ne pas payer pour téléverser des réunions qui ont déjà des notes ». La salle est devenue très silencieuse. Les chiffres de salaire de votre patron, l'e-mail à l'école de votre enfant, le brouillon juridique que vous dictez : rien de tout cela n'a besoin de vivre dans les journaux d'un éditeur sous prétexte que vous vouliez taper à la voix. En mode local de Whisper, votre audio est traité sur votre ordinateur et rien n'est envoyé à aucun serveur, jamais.

Quand un robot de réunion l'emporte sur Whisper

Maintenant la partie honnête. Si votre vrai travail est « capturer un appel à quatre auquel je peux à peine assister, et envoyer le récapitulatif à tout le monde », Whisper est le mauvais outil et je ne vous le vendrais pas. Il vous faut un outil « salle ». Tournez-vous vers Otter si vous vivez dans Zoom et parlez l'une de ses six langues, ou tl;dv si vous voulez des enregistrements illimités sur une offre gratuite dans plus de 30 langues, ou Granola si vous voulez capturer toute la réunion sans robot visible dans la grille. L'offre gratuite de Read AI à 5 réunions par mois est un bon moyen de tester l'idée sans carte.

Il y a un dernier cas qui mérite d'être nommé : si la valeur que vous recherchez est celle du robot qui rejoint et résume tout seul pendant que vous vous concentrez ailleurs, un robot de notes de réunion dédié l'emporte nettement sur la dictée, car la connexion automatique plus le résumé automatique sont exactement ce qu'il fait et ce que Whisper, délibérément, ne fait pas. Whisper ne rejoint pas les appels, ne transcrit pas les autres intervenants, et ne produit pas de récapitulatif multi-locuteurs. Il capture ce que vous dites. Si vous avez besoin de la salle, utilisez l'outil « salle ». Je préfère perdre la vente que lire l'e-mail de remboursement.

Tarifs

Whisper est gratuit pour tout le monde pour l'ensemble du pipeline local : transcription locale, amélioration IA via Ollama, historique, préréglages, raccourci personnalisé, sans moyen de paiement à l'inscription. Whisper Pro ajoute la surface cloud : transcription cloud OpenAI, amélioration IA dans le cloud et recherche web vocale. Les chiffres complets figurent sur la page tarifaire. Les robots se facturent par utilisateur : l'offre gratuite Basic d'Otter donne 300 minutes par mois, Fireflies est gratuit à vie avec 800 minutes de stockage par utilisateur, l'offre Free Forever de tl;dv est illimitée, et l'offre gratuite de Read AI est de 5 réunions par mois. Si « gratuit pour un usage personnel » est le critère, presque tout ici le remplit.

S'il faut retenir une seule chose de tout ceci : décidez si vous avez besoin de la salle ou seulement de votre propre voix avant de vous inscrire à quoi que ce soit. Les robots sont bons à être la salle, alors laissez-les faire. Mais la prochaine fois que vous terminez un appel et que vous saisissez le clavier pour écrire les trois choses qui comptaient, essayez plutôt de maintenir un raccourci et de les dire. Les notes s'écrivent dans le temps qu'il faut au robot pour envoyer son récapitulatif par e-mail, et la seule personne sur l'enregistrement, c'est vous. Ma cadette a compris ça plus vite que moi. Elle n'a pas encore de réunions.

Besoin de la salle, ou juste de votre propre voix ?

Si ce sont vos propres notes que vous visez, téléchargez Whisper, maintenez le raccourci et dictez les trois choses qui comptaient. Le pipeline local est gratuit, sans carte à l'inscription.

Dictée locale gratuite pour tout utilisateur connecté. Pro ajoute les fonctions cloud lors d'un essai distinct.

Photo de Denys Medvediev

Denys Medvediev

Je suis celui qui lit nos e-mails de support, très probablement en dictant les réponses.

Pour aller plus loin