Von Denys Medvediev

Leitfaden

So bekommst du ein Zoom-Transkript

Das beste Tool für ein Zoom-Meeting-Transkript ist meistens Zoom selbst: Cloud-Aufzeichnungen in einem kostenpflichtigen Tarif erzeugen automatisch ein Text-Transkript, das nach Fertigstellung per E-Mail kommt und im Web-Portal bearbeitet werden kann. Für laufende Anrufe kann ein Meeting-Bot beitreten und in Echtzeit mitschreiben.

Zuletzt aktualisiert: Juni 2026

Aufgeräumter Schreibtisch im Homeoffice mit Laptop, Kopfhörern und einem Notizbuch, eingerichtet zum Durchsehen eines Zoom-Meeting-Transkripts

Das beste Tool für ein Zoom-Meeting-Transkript ist meistens Zoom selbst. In einem kostenpflichtigen Zoom-Tarif erzeugen Cloud-Aufzeichnungen automatisch ein Audio-Transkript, gespeichert im VTT-Format und bearbeitbar im Web-Portal unter Aufzeichnungen und Transkripte. Für laufende Anrufe tritt ein Meeting-Bot wie Otter oder Fireflies bei und schreibt in Echtzeit mit. Whisper kommt im Schritt danach: ein Diktier-Tool per Tastenkürzel, mit dem du aus dem rohen Transkript saubere Notizen machst, die du tatsächlich verschicken würdest.

Vor ein paar Wochen fragte mich jemand, welches Zoom-Transkript-Tool er kaufen solle. Die ehrliche Antwort überraschte ihn: wahrscheinlich keines, zumindest nicht als Erstes. Wenn dein Konto in einem kostenpflichtigen Zoom-Tarif liegt, zeichnet Zoom deine Meetings bereits auf und transkribiert sie für dich, ohne zusätzliche Software und ohne ein zweites Abo.

Das Internet verkauft das als ein Problem, das ein Start-up gelöst hat. Meistens ist es ein Häkchen, das du nur noch nicht gesetzt hast. Das ist die langweilige Wahrheit, und sie ist einen Absatz wert, bevor jemand zum Geldbeutel greift.

Meeting-Transkripte sind seit einem Jahrzehnt fast gut genug, und die Leute zahlen weiter dafür, eine Lücke zu schließen, die schmaler ist, als das Marketing vermuten lässt. Im Moment gibt es drei echte Wege, und welcher der richtige ist, hängt davon ab, ob du das Meeting steuerst, ob du es aufzeichnen kannst und was du danach mit den Worten vorhast.

Dieser Artikel geht alle drei durch (Zooms eigenes Transkript, einen Echtzeit-Meeting-Bot und das Transkribieren einer Aufnahmedatei, die du bereits hast) und zeigt, wo ein Diktier-Tool per Tastenkürzel wie Whisper passt und wo nicht. Die meisten Support-Mails, die ich zu diesem Thema bekomme, stammen von Leuten, die ein Tool gekauft haben, um etwas zu tun, was ihr Konto schon konnte. Das schnellste Transkript ist das, für das du nichts installieren musst, also fangen wir damit an.

Das schnellste Zoom-Transkript ist das, das Zoom dir schon erstellt

Niemand fängt mit diesem Teil an. Wenn du ein Zoom-Meeting in einem Pro-, Business-, Education- oder Enterprise-Konto in die Cloud aufzeichnest, erzeugt Zoom automatisch ein Audio-Transkript und schickt dir eine E-Mail, sobald es fertig ist. Das Transkript wird im VTT-Format gespeichert und liegt im Zoom-Web-Portal unter Aufzeichnungen und Transkripte. Keine Erweiterung, kein Bot, kein Aufwand.

Der Haken ist der Konto-Tarif. Die Transkription von Cloud-Aufzeichnungen braucht sowohl die Cloud-Aufzeichnung als auch die Audio-Transkription eingeschaltet, und beides gibt es im kostenlosen Basic-Tarif nicht. Die Frage „Gibt es eine kostenlose KI, um Zoom-Meetings zu transkribieren?" hat also eine etwas nervige Antwort: Zooms eigenes Transkript ist in dem Sinne kostenlos, dass es nichts extra kostet, sobald du ohnehin für Zoom bezahlst, und überhaupt nicht kostenlos, wenn du im Basic-Tarif bist.

Die Sprachabdeckung ist ordentlich. Zooms Support-Dokumente listen rund 19 Sprachen für Transkripte von Cloud-Aufzeichnungen auf, darunter Englisch, Spanisch, Französisch, Deutsch, Chinesisch, Japanisch, Ukrainisch und Rumänisch. Für die meisten internen Meetings reicht das locker. Wenn du im selben Anruf Koreanisch neben Polnisch brauchst, prüf die aktuelle Liste, bevor du dich darauf verlässt, denn Zoom erweitert sie im Lauf der Zeit.

So bekommst du ein Zoom-Transkript, Schritt für Schritt

zoom.us · Aufzeichnungen & Transkripte
Cloud-Aufzeichnungen · 1 Ergebnis
Wöchentliches Sync — 2026-06-02Transkript bereit · VTT
Stiftsymbol = Satz bearbeiten Häkchen = speichern
Zooms eigenes Web-Portal: das Panel Aufzeichnungen und Transkripte, wo ein fertiges VTT-Transkript erscheint und direkt bearbeitet werden kann.

Der eingebaute Ablauf ist kurz. Hier ist das Ganze.

1

Zeichne das Meeting in die Cloud auf. Starte während des Anrufs eine Cloud-Aufzeichnung, keine lokale. Das Transkript wird nur für Cloud-Aufzeichnungen erzeugt.

Die Aufzeichnung taucht im Portal auf, nicht nur auf deiner Festplatte.

2

Warte auf zwei E-Mails. Nach dem Meeting schickt dir Zoom eine E-Mail, dass die Aufzeichnung fertig ist, und dann eine zweite, dass das Audio-Transkript verfügbar ist.

Die zweite E-Mail kommt an, meist innerhalb von Minuten nach der ersten.

3

Öffne das Zoom-Web-Portal. Melde dich an und klicke im Navigationsmenü auf Aufzeichnungen und Transkripte, dann öffne den Tab Cloud-Aufzeichnungen.

Dein Meeting wird aufgelistet.

4

Öffne die Aufzeichnung und lies das Transkript. Klicke auf die Aufzeichnung, um das Transkript neben der Wiedergabe zu sehen.

Du siehst Zeilen mit Zeitstempeln.

5

Korrigiere alles, was falsch ist. Fahre mit der Maus über einen Satz, klicke auf das Stiftsymbol, korrigiere ihn und klicke dann auf das Häkchen, um zu speichern.

Die korrigierte Zeile bleibt auch nach einem Neuladen korrigiert.

Das war's. Kein Tool zu kaufen, insgesamt ein paar Minuten, sobald die E-Mail da ist. Wenn du hergekommen bist, um ein Zoom-Meeting-Transkript-Tool zu finden, bist du vielleicht gerade fertig geworden.

Live-Untertitel vs. Cloud-Aufzeichnungs-Transkript: welches du willst

Blick von oben auf einen offenen Laptop neben einem leeren Spiral-Notizbuch, der Live-Untertitel mit einem gespeicherten Transkript gegenüberstellt

Das sind zwei verschiedene Dinge, und die Leute werfen sie durcheinander. Die Live-Transkription zeigt während des Meetings Untertitel auf dem Bildschirm, praktisch für Barrierefreiheit oder wenn jemandes Audio rauscht, aber sie ist weg, sobald der Anruf endet, es sei denn, du speicherst sie. Das Cloud-Aufzeichnungs-Transkript ist das Dokument für danach: die durchsuchbare, bearbeitbare VTT-Datei, die du später liest.

Entscheide nach dem Moment, in dem du die Worte brauchst. Live mitlesen heißt, du willst Untertitel. Eine Aufzeichnung brauchen, um sie zusammenzufassen, zu durchsuchen oder in eine Folge-E-Mail einzufügen, heißt, du willst das Cloud-Aufzeichnungs-Transkript. Die meisten, die „Transkript" sagen, meinen das zweite und greifen aus Versehen zum ersten.

Eine ehrliche Lücke: Zoom bewirbt auch einen AI Companion, der Meeting-Zusammenfassungen schreibt, und welche Tarife genau das freischalten, ändert sich mit der Zeit. Ich nenne keine Zahl, die ich nicht an Zooms aktuellen Dokumenten festmachen kann. Wenn du eine Zusammenfassung auf Autopilot suchst, prüf heute, was dein Zoom-Tarif enthält, bevor du davon ausgehst, dass sie da ist.

Wo Whisper passt: das Transkript in saubere, nutzbare Notizen verwandeln

Jetzt der Teil, bei dem ich vorsichtig sein muss, weil es leicht wäre, zu viel zu versprechen. Whisper tritt deinem Zoom-Anruf nicht bei. Es hat keinen Zoom-Bot, es tritt Meetings nicht automatisch bei, und es nimmt niemals das Audio anderer Teilnehmer auf. Wenn du etwas willst, das im Meeting sitzt und zuhört, ist Whisper das falsche Tool, und ich verweise dich gleich auf die richtigen.

Whisper
Die echte Whisper-Desktop-App — klick dich durch die Einstellungen, um die Panels für lokale und Cloud-Transkription zu sehen.

Was Whisper macht, ist der Schritt, nachdem du ein Transkript hast. Du drückst ein Tastenkürzel (Ctrl+Space unter Windows, Command+Option gehalten als Push-to-Talk auf macOS), sprichst, und deine Worte werden an der Cursorposition in die App eingefügt, in der du gerade bist. Sobald Zoom dir also diese rohe VTT-Textwand übergibt, öffnest du das Dokument, in dem die Nachbereitung steht, und diktierst die Version, die ein Mensch liest: die drei Entscheidungen, die zwei Verantwortlichen, die eine Deadline.

Im Cloud-Modus geht der KI-Assistent einen Schritt weiter. Sag „Hey Whisper" und du kannst ihn bitten, einen Absatz zusammenzufassen, Aufgaben aus Meeting-Notizen zu extrahieren oder die Antwort zu entwerfen, und das aufbereitete Ergebnis landet an deinem Cursor. Cloud-Funktionen sind Teil von Whisper Pro; die lokale Diktier-Pipeline ist für jeden mit Konto kostenlos, ohne Zahlungsmethode bei der Anmeldung. Das Transkript ist das Rohmaterial. Whisper formt daraus etwas, das du verschicken würdest.

Eine Zoom-Aufnahmedatei transkribieren, die du schon hast

Was, wenn du das Meeting als lokale Datei gespeichert und nie ein Zoom-Transkript bekommen hast, das Basic-Tarif-Problem? Du hast eine Aufnahme, nur nicht den Text.

CancelTranscribing
Whisper verwandelt eine vorhandene Aufnahme in Text — der Transkribier-Zustand des Overlays.

Whispers Cloud-Weg kann eine Audiodatei, die dir gehört, mit deinem eigenen OpenAI-Schlüssel transkribieren, und OpenAIs Speech-to-Text-API unterstützt mp3, mp4, m4a, wav und webm. Die eine Zahl, die du im Kopf behalten solltest: Uploads zu dieser API sind auf 25 MB begrenzt. Ein langes Meeting sprengt das, also würdest du das Audio vorher aufteilen. Die lokalen Engines haben dieses API-Limit nicht, weil sie auf deinem Rechner laufen: reine Rust-Transkription, nichts verlässt den Laptop.

Ein Vorbehalt, den ich dir schulde: Ich habe die genaue Bezeichnung des Datei-Import-Ablaufs der Desktop-App nicht unabhängig bestätigt, also nimm „Aufnahme reinziehen und los" als Absicht, nicht als garantierten Ein-Klick-Button. Für eine saubere, selbst aufgenommene Datei unter dem Größenlimit erledigt der Cloud-Weg das. Für das tägliche Diktieren und Notizen-Aufräumen ist das Tastenkürzel die Hauptsache.

Wann du Whisper überspringst und stattdessen einen Meeting-Bot nimmst

Das ist der Abschnitt, den KI-Tools nie schreiben, also hier ganz klar: Wenn du tatsächlich etwas brauchst, das dem Anruf beitritt und alles mitschreibt, nimm nicht Whisper. Nimm einen Meeting-Bot.

Otter verbindet sich mit deinem Google- oder Microsoft-Kalender, tritt deinen Zoom-Meetings automatisch bei, schreibt in Echtzeit Notizen, erfasst geteilte Folien und postet eine Diskussions-Zusammenfassung in den Zoom-Chat. Fireflies betreibt einen Notetaker-Bot, der Kalender-Meetings automatisch beitritt, um aufzuzeichnen, zu transkribieren und zusammenzufassen, mit Aufgaben nach jedem Anruf, und wirbt mit über 100 Sprachen. Tactiq geht den anderen Weg: eine Chrome-Erweiterung, die Zoom in Echtzeit transkribiert, ohne dass ein Bot beitritt, mit einem kostenlosen Kontingent für deine ersten 10 Meeting-Transkriptionen ohne Karte und Zusammenfassungen per Klick. Drei verschiedene Mechanismen, die alle die Erfassung im Meeting machen, die Whisper bewusst nicht macht.

Das ist die Meinung, zu der ich stehe: Otter ist fürs Meeting, Whisper ist fürs Schreiben. Andere Kategorie, und mir ist lieber, du nimmst das Richtige, als dass du fürs Falsche zu viel zahlst. Whisper macht das Schreiben per Stimme schnell. Es sitzt nicht in deinem Standup.

Diese Unterscheidung zählt mehr, als sie aussieht, und die Geschichte mit der Cloud-Rechnung zeigt, warum. Ein Team, mit dem ich gearbeitet habe, ließ einen Auftragnehmer einen internen KI-Diktier-Prototyp bauen, der für jede Äußerung ein Cloud-Modell aufrief, auf jedem Laptop. Zum Quartalsende öffnete der Manager das Kosten-Dashboard und fand eine fünfstellige Rechnung. Das meiste davon war ein Team, das Standup-Aufnahmen viermal hintereinander transkribierte, weil die Retry-Logik zu aggressiv war. Die Lösung des Auftragnehmers war „den Prompt optimieren". Die des CFO war „oder aufhören, dafür zu zahlen, Meetings zu transkribieren, die schon Notizen haben". Ein Meeting-Bot, den du brauchst, ist sein Geld wert. Ein Meeting-Bot, den du gekauft hast, um zu tun, was dein Zoom-Konto schon tut, ist diese fünfstellige Rechnung, die nur darauf wartet zu passieren.

Was ein Zoom-Transkript kostet

Zooms Cloud-Aufzeichnungs-Transkript kostet nichts über den kostenpflichtigen Zoom-Tarif hinaus, den du ohnehin hast; es ist hinter dem Pro-Tarif aufwärts freigeschaltet, nicht im kostenlosen Basic-Tarif. Whispers lokale Diktier-Pipeline ist für jeden mit Konto kostenlos, ohne erforderliche Zahlungsmethode zum Start. Die Cloud-Funktionen (OpenAI-Transkription, KI-Aufbereitung und Websuche) sind Teil von Whisper Pro. Die genauen Zahlen stehen auf der Whisper-Preisseite, damit sie immer aktuell sind. Bot-Tools wie Otter, Fireflies und Tactiq haben jeweils ihre eigene Preisgestaltung; prüf ihre Seiten direkt, denn Meeting-Bot-Preise ändern sich ständig.

Whisper läuft unter Windows und macOS auf Apple Silicon, und die lokale Pipeline funktioniert nach einem einmaligen Modell-Download vollständig offline. Wenn du zuerst ein Gefühl für den Diktier-Ablauf willst, behandeln die Übersicht zur Voice-to-Text-App und der Vergleich der Otter.ai-Alternative das Schreiben per Stimme ausführlicher.

Die meisten Suchen nach einem Zoom-Transkript-Tool enden gleich: Jemand entdeckt, dass das Transkript längst in seinem Zoom-Portal lag, schaltet die Cloud-Aufzeichnung ein und macht mit seinem Tag weiter. Das Tool, das du brauchtest, war ein Häkchen. Was danach bleibt, eine Wand aus Zeitstempeln in die zwei Sätze zu verwandeln, die dein Team lesen wird, ist der Teil, der sich per Stimme lohnt. Ich habe den Großteil dieses Artikels zwischen Schulabholung und einer Support-Mail diktiert, ausgerechnet darüber, wo man ein Zoom-Transkript findet. Meine Tochter fragte, was ich da schreibe. Ich sagte: wie man ein Zoom-Transkript bekommt. Sie fragte, ob das ein richtiger Job sei. Berechtigt.

Weiterführende Lektüre

Bereit, deine Meeting-Notizen per Stimme aufzuräumen?

Hol dir dein Transkript von Zoom, lade dann Whisper herunter und diktiere die Version, die dein Team wirklich liest.

Kostenloser lokaler Modus für jedes angemeldete Konto. Keine Karte zum Start nötig.

Foto von Denys Medvediev

Denys Medvediev

Ich bin derjenige, der unsere Support-Mails liest, höchstwahrscheinlich, indem ich die Antworten diktiere.