Guide
Les applis de transcription de cours, décryptées
Capture en direct ou auto-dictée, d'où vient l'audio, et la question local-ou-cloud que les étudiants devraient peser bien plus sérieusement qu'ils ne le font.
Dernière mise à jour : juin 2026

Une appli de transcription de cours transforme les cours oraux en texte consultable, soit en capturant l'audio en direct, soit en transcrivant un enregistrement après coup. Certains outils enregistrent la salle dans le cloud. D'autres, comme Whisper, transcrivent ce que vous dictez localement grâce à un raccourci push-to-talk. Le bon choix dépend de qui parle et de l'endroit où l'audio est traité.
Le printemps dernier, un étudiant m'a envoyé l'enregistrement d'un cours de chimie organique d'une heure et demie et m'a demandé pourquoi son outil de transcription avait transformé « énantiomère » en « en anti-mère ». Question légitime. La réponse honnête, c'est que la plupart des applis de cours font la même chose difficile : transformer un amphithéâtre bruyant avec un seul professeur discret en texte propre, et ce qui les distingue, c'est l'endroit où l'audio aboutit et qui peut le conserver. Un cours d'une heure et demie, c'est le pire scénario audio qui soit : la distance, l'écho, le jargon, et un micro conçu pour les appels vidéo.
Les étudiants rêvent d'une transcription fiable de leurs cours depuis des années, et les applis de prise de notes intégrées sont restées à peine utiles pour les courts extraits. En 2026, l'écart s'est comblé. Plusieurs applis peuvent maintenant transformer un cours entier en transcription consultable accompagnée d'un résumé, et quelques-unes tournent entièrement sur votre ordinateur sans rien envoyer à l'extérieur. Cet article explique la différence entre enregistrer un cours en direct et dicter ses propres notes, d'où vient l'audio, et la ligne local-ou-cloud que les étudiants devraient évaluer bien plus sérieusement qu'ils ne le font. À la fin, vous saurez quel type d'outil correspond à votre cours. Je lis la plupart des emails de support que les étudiants nous envoient, et la vérité sans détour, c'est que la majorité vient de personnes qui ont choisi la mauvaise catégorie d'appli dès le premier jour. Cette pile de tickets est, quelque part, la raison pour laquelle cet article existe.
Trois types d'étudiants cherchent une appli de transcription de cours : celui dont la main est en crampe au bout de 20 minutes de notes, celui qui décroche et veut un filet de sécurité, et celui qui étudie dans une langue qui n'est pas la sienne. Tous les trois résolvent le même problème : suivre le rythme d'un être humain qui parle. Et tous les trois vont découvrir que « appli de transcription » recouvre deux réalités bien distinctes.
Enregistrer le cours, obtenir du texte propre. C'est tout le travail.
Retirez le marketing et chaque appli de transcription de cours fait une seule chose. Elle prend l'audio d'une personne qui parle et vous rend du texte que vous pouvez rechercher, citer et réviser. Le professeur parle, l'appli écoute, les mots atterrissent sur la page. Les différences entre les outils sont toutes en aval de ça : si l'audio est capturé en direct ou après coup, s'il est traité sur un serveur ou sur votre machine, et comment l'appli nettoie le résultat.
Whisper by Remskill s'occupe du volet dictée de ce travail. Vous maintenez un raccourci, vous parlez, et la transcription est collée au curseur dans l'appli où vous tapez, que ce soit Notion, Word, un Google Doc ou un email. Sur Windows, le raccourci par défaut est Ctrl+Space. Sur macOS, c'est le raccourci push-to-talk Command+Option : maintenez pour enregistrer, relâchez pour arrêter. Après avoir relâché, le micro reste ouvert pendant un buffer de 500 millisecondes afin que le dernier mot ne soit pas coupé. Il n'y a pas d'étape « rejoindre la réunion » ni d'attente après envoi. Vous parlez, et une ou deux secondes plus tard, le texte est là.
Cette distinction compte davantage pour les cours que pour la plupart des cas d'usage — c'est le prochain point à clarifier.
Capturer un cours en direct et dicter ses propres notes, ce n'est pas pareil

Voilà la distinction qui embrouille la plupart des étudiants. Certaines applis sont conçues pour capturer un cours en direct : elles enregistrent la salle, ou rejoignent un appel Zoom, et transcrivent la voix du professeur pour vous. D'autres sont conçues pour que vous dictiez, de votre propre voix, les notes et résumés que vous souhaitez. Les deux produisent une transcription. Mais elles ne sont pas interchangeables.
Whisper appartient au second camp. Il transcrit ce que son micro entend pendant que vous parlez. C'est excellent pour la partie de l'étude qui vient après le cours : dicter votre résumé pendant qu'il est encore frais, passer en revue un exercice à voix haute, réexpliquer un concept dans vos propres mots, ou rédiger un email à votre groupe de travail. Ce n'est pas un bot qui s'installe dans la salle et capte le professeur pour vous. Si vous voulez capturer automatiquement un cours en direct, un enregistreur dédié est le bon outil — je citerai des noms plus loin dans la section honnête.
La vérité sans détour, c'est que la transcription la plus précise que vous puissiez obtenir d'un cours, c'est celle où la parole se passe près d'un bon micro. Quand vous dictez votre propre résumé, votre bouche est à 20 centimètres du micro. Quand vous enregistrez un professeur, sa bouche est à 20 mètres, derrière un pupitre, en lutte avec la ventilation. Même logiciel, deux univers de résultats.
D'où vient l'audio du cours

Toute transcription commence par un micro, et un amphithéâtre est l'endroit où les bons micros vont souffrir. L'audio peut venir de trois endroits. Le premier, c'est le micro intégré de votre ordinateur, réglé pour la personne assise juste devant lui : parfait pour dicter vos propres notes, beaucoup moins adapté à un professeur au fond d'une salle de 200 places. Le deuxième, c'est l'audio loopback du système — le son qui sort de vos haut-parleurs — ce qu'on capture lors d'un cours Zoom en direct ou d'un cours en ligne enregistré. Le troisième, c'est un micro externe dédié placé près de la source.
Le positionnement du micro est de loin le facteur le plus important pour la précision — pas le modèle d'IA. Un micro USB à 20 dollars fait plus pour une transcription que n'importe quelle mise à niveau vers un modèle plus grand. J'ai vu des étudiants s'angoisser sur quelle appli est « la plus précise » tout en dictant dans le micro de leur laptop dans un café. L'appli n'a jamais été le problème. C'était l'audio.
Pour un cours en ligne ou un cours Zoom, capturer l'audio loopback fonctionne parce que la parole passe déjà par des canaux numériques propres. Pour un grand amphi en présentiel, la réponse réaliste, c'est d'enregistrer près de la source — asseyez-vous près du devant ou utilisez un micro-cravate — et transcrivez après. Aucune appli ne transforme un enregistrement brouillon en transcription parfaite. Elles transforment un bon audio en excellent texte, et un mauvais audio en « en anti-mère ».
Transcription locale et cloud tracent une ligne de confidentialité que les étudiants devraient voir
La plupart des comparatifs d'applis de cours passent cette partie sous silence — c'est pourtant celle qui m'importe le plus en tant qu'étudiant. Où l'audio est-il traité ? Deux réponses. Les outils cloud envoient votre enregistrement sur un serveur, le transcrivent là-bas, et vous renvoient le texte. Les outils locaux font tout sur votre ordinateur, sans que rien ne quitte la machine.
Entre nous, la transcription cloud d'un cours est une décision de confidentialité que les gens prennent sans même s'en rendre compte. Un enregistrement de votre professeur, ses paroles, ses recherches non publiées, le commentaire en passant sur le prochain examen — tout ça qui dort dans les logs d'un prestataire, c'est anodin jusqu'au jour où ça ne l'est plus. Local d'abord, ou abstenez-vous. C'est une position plus tranchée que j'ai l'habitude de défendre, et j'assume : quand un enregistrement reste uniquement sur votre ordinateur, aucune fuite de serveur ne peut le divulguer, aucune mise à jour des conditions d'utilisation ne peut accorder des droits d'entraînement à votre insu, aucun compte oublié ne traîne.
Whisper exécute la transcription locale en Rust pur, sans sidecar Python, en utilisant deux moteurs au choix. Le moteur local Whisper propose plusieurs tailles de modèles, d'un modèle Base d'environ 140 Mo à un Large v3 multilingue d'environ 3 Go, et les variantes multilingues couvrent 99 langues avec traduction vers l'anglais. NVIDIA Parakeet est un seul modèle d'environ 600 Mo, couvre l'anglais plus 24 langues européennes soit 25 au total, et tourne 5 à 10 fois plus vite que Whisper sur CPU, mais ne peut pas traduire ni gérer les langues asiatiques. Si vous voulez la meilleure qualité et un accès web, il existe aussi un mode Cloud qui utilise votre propre clé OpenAI. Le pipeline local complet est gratuit pour tout utilisateur connecté, sans carte à l'inscription ; le Cloud est un supplément payant. Le tout fonctionne aussi sans connexion internet, et vous trouverez un guide plus détaillé dans notre guide de la reconnaissance vocale hors ligne si c'est votre principale préoccupation.
Les autres applis de cours à connaître
Whisper est un outil de dictée, pas un bot qui enregistre la salle, donc pour la capture d'un cours en direct, la démarche honnête est de vous orienter vers des applis conçues pour ça. Voici comment les options courantes se différencient, avec de vrais chiffres lorsqu'une source primaire les a fournis.
| Appli | Conçue pour | Où l'audio est traité | Réalité du niveau gratuit | Langues |
|---|---|---|---|---|
| Whisper by Remskill | Dicter vos propres notes et résumés | Local (Whisper ou Parakeet) ou Cloud avec votre propre clé | Pipeline local complet gratuit, sans carte | 99 avec Whisper multilingue ; 25 avec Parakeet |
| Otter | Enregistrer et résumer des réunions/cours en direct | Cloud | 300 min/mois, plafond de 30 min par enregistrement | Non précisé par la source |
| Apple Voice Memos | Enregistrer un cours, puis lire la transcription | Apple (intégré) | Intégré à macOS | Non précisé par la source |
| Notta | Prise de notes IA cloud pour réunions/cours | Cloud | Tarif non vérifié | Des dizaines, selon le propre décompte de Notta |
Quelques lignes méritent un mot d'explication. Le forfait Basic gratuit de Otter vous donne 300 minutes de transcription par mois avec un plafond de 30 minutes par enregistrement, ce qui veut dire qu'un cours de 90 minutes ne tient pas dans un seul enregistrement gratuit. Apple Voice Memos peut enregistrer de l'audio puis afficher une transcription, ce qui en fait une vraie option « enregistre le cours, lis-le plus tard » pour les utilisateurs Mac, déjà installée sur la machine. Notta annonce la prise en charge de dizaines de langues, mais je n'ai pas pu accéder à sa page de tarifs pour vérifier les limites de minutes — traitez donc les détails de ses forfaits comme à vérifier avant de vous engager.
Quand éviter Whisper pour les cours
Si votre vrai besoin est de poser un outil devant un professeur en direct et de repartir avec ses paroles, passez votre chemin avec Whisper. Nous transcrivons ce que vous dictez, pas ce que quelqu'un dit de l'autre côté de la salle. Pour la capture automatique en direct, prenez un enregistreur conçu pour ça. Sur Mac, Apple Voice Memos enregistre la pièce et vous affiche une transcription gratuitement, déjà installé. Si vous voulez capturer une réunion en direct avec des étiquettes de locuteurs et des résumés, Otter est fait pour ça. Son niveau gratuit couvre 300 minutes par mois, mais le plafond de 30 minutes par enregistrement signifie qu'un cours complet nécessite le forfait payant. Utilisez Whisper pour l'étude qui se passe après le cours : le résumé que vous dictez, le problème que vous verbalisez, l'email que vous envoyez en préparant le dîner.
Transcription locale gratuite, Pro pour le cloud
Voilà la partie que les étudiants demandent le plus : le coût. Toute la partie locale de Whisper — les deux moteurs, le nettoyage IA via un modèle local, l'historique, le raccourci personnalisé, les téléchargements de modèles — est gratuite pour tout utilisateur connecté, sans moyen de paiement requis à l'inscription. C'est un choix délibéré. La transcription locale tourne sur le CPU de votre propre ordinateur. Facturer un abonnement mensuel pour une puissance de calcul que vous avez déjà payée n'avait aucun sens.
Le niveau payant, Whisper Pro, ajoute le Cloud : transcription cloud OpenAI, amélioration IA cloud, et recherche web par la voix. C'est la partie avec un coût à l'usage du côté OpenAI et un serveur dans la boucle, qui est donc réservée à un abonnement avec un court essai Cloud. Les tarifs exacts se trouvent sur la page de tarifs. Pour la pure dictée de révision de cours, la plupart des étudiants ne quittent jamais le niveau local gratuit. C'est l'idée.
Un mardi soir du dernier trimestre, je préparais des lunch-boxes (sandwich, fruit, le yaourt que la petite refuse de manger) quand ma fille aînée avait besoin d'une réponse à envoyer à une enseignante à propos d'une sortie scolaire. J'ai attrapé l'ordinateur d'une main, maintenu le raccourci et dicté l'email entre deux tranches de concombre : pause pour demander comment s'orthographie le nom de l'enseignante, pause encore quand la petite a demandé pourquoi la lune n'est parfois pas là, puis on continue. L'email est parti. Les lunch-boxes ont été faits. Mon écriture, soit dit en passant, n'aurait produit ni l'un ni l'autre. C'est ça, la transcription qui s'adapte à une vraie vie : pas un bot dans un amphithéâtre, mais une voix qui suit quand vos mains sont occupées. Choisissez l'outil qui correspond à la tâche, puis allez réviser. Voir comment fonctionne Whisper.
Envie de l'essayer pour votre prochaine session de révision ?
Téléchargez Whisper, maintenez le raccourci et dictez votre résumé de cours pendant qu'il est encore frais. Le pipeline local complet est gratuit.
Transcription locale gratuite pour tout compte connecté — sans carte à l'inscription.



