Ratgeber
Vorlesungstranskription App
„Vorlesungstranskriptions-App" meint eigentlich zwei verschiedene Dinge. Erstens: Eine aufgezeichnete Vorlesung in Text umwandeln – das ist Dateitranskription. Zweitens: Eigene Lernnotizen per Sprache festhalten, während man den Stoff wiederholt. Whisper by Remskill erledigt das Zweite, systemweit, auf Windows und Mac.
Zuletzt aktualisiert: Juni 2026

Eine Vorlesungstranskriptions-App löst zwei unterschiedliche Aufgaben. Eine aufgezeichnete Vorlesung in Text umwandeln ist Dateitranskription – dafür gibt es eigene Dienste. Eigene Gedanken und Zusammenfassungen per Sprache in eine Notizen-App übertragen ist Diktat – dafür eignet sich ein systemweites Tool wie Whisper: Hotkey drücken, sprechen, Text erscheint am Cursor.
Wer nach „Vorlesungstranskriptions-App" sucht, meint damit zwei völlig verschiedene Dinge – und landet trotzdem in denselben Suchergebnissen. Die einen haben eine neunzigminütige Vorlesung aufgenommen und wollen das Audio in ein lesbares Transkript verwandeln. Die anderen haben die Vorlesung durchgesessen, den Großteil verstanden und wollen jetzt ihre eigenen Notizen schreiben, ohne eine Stunde lang zu tippen. Das sind zwei verschiedene Aufgaben – und ein einzelnes Tool löst selten beide gut.
Ich sage klar, worüber dieser Artikel wirklich handelt. Whisper by Remskill ist ein Diktierwerkzeug. Es schreibt, was man sagt, direkt an den Cursor in jede beliebige App. Es sitzt nicht im Hintergrund eines Hörsaals, nimmt den Professor auf und liefert ein Transkript. Für diese Aufgabe verweise ich weiter unten auf die richtigen Tools. Wer aber eigene Lernnotizen schnell per Sprache erfassen will, ist genau hier richtig – und darum geht es im Großteil dieses Ratgebers.
Hier liegt der Unterschied, den das Suchwort verschleiert. Eine Vorlesung transkribieren bedeutet: eine Audiodatei – eine Aufnahme von jemand anderem – nachträglich in Text umwandeln. Das ist ein Aufzeichnungs- und Transkriptions-Workflow mit eigenen Tools. Diktat ist das genaue Gegenteil: Man spricht bewusst ins Mikrofon, und die Wörter erscheinen dort, wo der Cursor ist – live.
Die entscheidende Frage ist also: Auf welcher Seite dieser Linie steht man? Wer die Worte des Professors aus einer Aufnahme transkribieren will, braucht einen Transkriptionsdienst und sollte den entsprechenden Ratgeber lesen. Wer eigene Wiederholungsnotizen, Zusammenfassungen und Lernkarten per Sprache statt Tastatur erstellen will, braucht einen systemweiten Diktat-Hotkey. Ich erkläre beide Wege ehrlich, zeige, wie man das Diktat in zwei Minuten einrichtet, und sage genau, wann man damit an Grenzen stößt.
Zwei Aufgaben, ein Suchbegriff

Aufgabe eins: Aufgezeichnete Vorlesung transkribieren. Man hat auf Aufnahme gedrückt, oder der Professor hat das Audio online gestellt – und jetzt liegt eine Datei vor. Man will sie in durchsuchbaren Text verwandeln, den man lesen, überfliegen und zitieren kann. Die Eingabe ist vorhandenes Audio. Die Arbeit ist das Umwandeln einer Aufnahme. Das ist Dateitranskription – eine legitime Kategorie mit eigens dafür entwickelten Tools.
Aufgabe zwei: Lernnotizen per Sprache. Man wiederholt den Stoff – liest die Folien durch, arbeitet sich durch das Lehrbuch, läuft nach der Vorlesung nach Hause, solange alles noch frisch ist – und will die eigenen Gedanken festhalten, ohne zu tippen. Man spricht; die Wörter erscheinen in der Notizen-App. Die Eingabe ist die eigene Stimme, bewusst eingesetzt, in Echtzeit. Das ist Diktat – ein völlig anderer Mechanismus. Eines verarbeitet eine Aufnahme von jemand anderem; das andere tippt, während man denkt.
Whisper by Remskill löst die zweite Aufgabe. Es zeichnet keinen Raum still auf und erstellt kein Transkript – das ist die Aufgabe eines Aufzeichnungstools, nicht eines Diktierwerkzeugs. Was es tut: Es nimmt die Tastatur aus dem Teil des Arbeitsprozesses heraus, in dem man Dinge aufschreibt. Für viele Studierende ist es genau diese zweite Aufgabe, die den Abend verschlingt – deshalb lohnt es sich, sie ernst zu nehmen.
Hotkey drücken, sprechen, Notizen schreiben sich selbst
Die Funktionsweise ist simpel – was auch der Punkt ist. Man drückt einen Hotkey, spricht, lässt los, und das Transkript wird am Cursor eingefügt – in Notion, in einem Google Doc, in OneNote, in der Notizen-App, in jedem Textfeld, das den Fokus hat. Whisper hält nach dem Loslassen noch kurz nach, damit das letzte Wort nicht abgeschnitten wird. Da der Text auf Betriebssystemebene eingefügt wird, ist jede Notizen-App schlicht „irgendein Textfeld". Es braucht kein Plugin und es ist egal, in welcher App man sich befindet.
Für Studierende bedeutet das konkret: Man schließt eine Lektüre ab, fasst das Kapitel laut in eigenen Worten zusammen, und die Zusammenfassung landet in den Notizen – viel schneller als getippt. Man verwandelt eine Folie in eine Frage, die man sich später selbst stellt. Man diktiert das Wesentliche einer Vorlesung ins eigene Dokument, solange es noch frisch ist. Während man spricht, erscheint eine kleine Kapsel, die zeigt, dass aufgezeichnet wird:
Der Hotkey ist das Einzige, das man von Anfang an richtig einstellen sollte. Auf Windows ist es Ctrl+Space, auf Mac Command+Option – ein Modifier-only-Push-to-Talk, das man beim Sprechen gedrückt hält. Beide lassen sich in den Einstellungen ändern, falls es zu Konflikten mit anderen Apps kommt. (Meine jüngere Tochter sagte mir einmal, ein Hotkey „funktioniere nicht" in ihrer Zeichen-App. Es war ein Konflikt, kein Fehler – so lernte ich, dass die meisten Menschen nicht wissen, was ein Hotkey-Konflikt überhaupt ist. Deshalb ist jetzt jeder Hotkey anpassbar.) Wer schon Diktiersoftware für Studierende kennt, hat dasselbe Muskelgedächtnis – nur jetzt auf die eigenen Notizen gerichtet.
Einrichtung in zwei Minuten (Windows oder Mac)
Man braucht einen Mac mit Apple Silicon oder einen Windows-PC ab Windows 10, ein funktionierendes Mikrofon und eine offene Notizen-App. Die komplette lokale Pipeline ist für jeden angemeldeten Account kostenlos – keine Zahlungsmethode bei der Anmeldung erforderlich. So läuft es ab.
Schritt 1 — Whisper installieren und anmelden.
Von der Download-Seite herunterladen, installieren und ein kostenloses Konto erstellen. Keine Kreditkarte. Die komplette lokale Transkriptions-Pipeline ist sofort verfügbar.
Wenn das Tray-Icon der App erscheint und der Einrichtungsassistent die Modellauswahl anbietet, hat alles geklappt.
Schritt 2 — Transkriptionsmodus wählen.
Die App trifft keine Vorauswahl. Es gibt drei Optionen: Cloud (OpenAI, eigener Schlüssel), Local Parakeet oder Local Whisper. Für private Lernnotizen zunächst lokal starten – mehr dazu in zwei Abschnitten.
Wenn ein Modell fertig heruntergeladen ist und als bereit angezeigt wird, hat alles geklappt.
Schritt 3 — Hotkey bestätigen.
Windows-Standard ist Ctrl+Space, Mac ist Command+Option als Push-to-Talk. Auf dem Mac die Bedienungshilfen-Berechtigung erteilen, wenn danach gefragt wird – ohne sie kann der Text nicht in andere Apps eingefügt werden.
Wenn eine Testaufnahme in ein beliebiges Textfeld eingefügt wird, hat alles geklappt.
Schritt 4 — Cursor in die Notizen setzen und sprechen.
Die Notizen-App öffnen, an die gewünschte Stelle klicken, Hotkey halten, einen Satz sagen, loslassen. Das Transkript erscheint dort, wo der Cursor war.
Wenn die gesprochene Zusammenfassung als sauberer Text in den Notizen steht, hat alles geklappt.
Das Langwierigste ist der Modell-Download, nicht die Einrichtung selbst. Alles andere sind die vier Schritte oben. Sobald es läuft, wird das Aufschreiben einer Vorlesung zur Sprechaufgabe statt zur Tippaufgabe – eine viel bessere Verwendung der halben Stunde nach dem Unterricht.
Ein Lernnotizen-Workflow ums Sprechen herum
Was für Studierende wirklich funktioniert, ist nicht „die gesamte Vorlesung wortwörtlich diktieren". Es ist das laute Wiederholen. Nach einer Vorlesung oder Lektüre erklärt man den Stoff in einfachen Worten für sich selbst – und die Erklärung landet in den Notizen. Das Aussprechen ist schon halb das Lernen; es aufzuschreiben ist die andere Hälfte – und beides passiert gleichzeitig, ohne Tastatur. Die schlichte Wahrheit: Das beste Lernmittel ist oft einfach das Durchsprechen des Stoffs. Mit Sprachtippen werden aus flüchtigen Gedanken echte Notizen.
Ein paar konkrete Ansätze. Jeden Abschnitt eines Kapitels in zwei bis drei gesprochenen Sätzen zusammenfassen – so sind die Notizen die eigene Paraphrase, kein abgekupferter Text. Selbsttest-Fragen diktieren und später zu Lernkarten machen. Einen schwierigen Absatz lesen und die Verwirrung laut aussprechen – „Ich verstehe nicht, warum Schritt zwei von Schritt eins abhängt" – damit das eigene Dokument echte Fragen enthält, nicht nur Fakten. Eine neunzigminütige Vorlesung kann in wenigen Minuten Sprache zu einer 600-Wörter-Zusammenfassung werden – das ist ein anderer Abend als Zeile für Zeile zu tippen.
Wer mit Fachbegriffen arbeitet – Anatomie, Gesetzestexte, organisch-chemische Verbindungsnamen – kann bei lokalem Whisper eigenes Vokabular und Hotwords hinterlegen, damit die Engine auf diese Wörter bevorzugt reagiert. Das macht Whisper nicht zu einem klinischen oder rechtlichen Tool und bescheinigt nichts; es sorgt nur dafür, dass „Myokardium" nicht als „mein Kardium" endet. Wörter schnell per Sprache erfassen – Struktur wie Überschriften, Aufzählungen und Links dann mit den gewohnten Tasten anlegen, denn ein Diktiertool liefert Wörter, nicht das Layout der Notizen-App.
Lokal oder Cloud: Welcher Modus für Lernnotizen
Für Lernnotizen zunächst den lokalen Modus ausprobieren. Halbfertige Gedanken zu einem Thema, Vermutungen darüber, was in der Prüfung drankommt, Vorlesungen, denen man nur halb gefolgt ist – all das muss den eigenen Laptop nicht verlassen. Mac mit Apple Silicon oder ein neuerer PC bewältigen alltägliches Diktat ohne Probleme, und die Cloud wird zum Ausweg statt zur Standardoption. Außerdem ist es kostenlos – was als Studierende:r mehr zählt als anderswo.
So unterscheiden sich die drei Optionen – die App zwingt zur Wahl, und eine informierte Entscheidung lohnt sich:
- Local Parakeet — NVIDIAs TDT-Engine, ca. 600 MB, die schnellste lokale Option – 5 bis 10 Mal schneller als Whisper auf der CPU. Unterstützt Englisch und 24 weitere europäische Sprachen, insgesamt 25. Keine Übersetzung ins Englische. Wer auf Englisch oder einer anderen europäischen Sprache lernt, hat hier eine schnelle, vollständig offline verfügbare Wahl.
- Local Whisper — Auf demselben Gerät langsamer als Parakeet, aber die mehrsprachigen Versionen unterstützen 99 Sprachen, können ins Englische übersetzen und ermöglichen eigenes Vokabular sowie Hotwords für Fachbegriffe. Die englischsprachigen Versionen sind auf Englisch beschränkt – nicht 99. Für Chinesisch, Japanisch, Koreanisch, Übersetzungsaufgaben oder terminologielastige Fächer empfehlenswert. Das Standard-Englisch-Modell ist ca. 480 MB groß.
- Cloud (OpenAI, BYOK) — Beste Genauigkeit und Webzugriff, über den eigenen OpenAI-Schlüssel, direkt von OpenAI abgerechnet. Transkription läuft standardmäßig über gpt-4o-mini-transcribe. Benötigt Internet – der einzige Modus, der das Gerät verlässt. Der Cloud-Bereich ist Teil von Whisper Pro.
Für den Text, den die meisten Studierenden diktieren – Zusammenfassungen, Fragen, eigene Paraphrasen – reicht lokal völlig aus. Beide lokalen Engines laufen vollständig auf dem eigenen Gerät, ohne etwas an einen Server zu senden. Die Cloud zahlt sich aus, wenn man Top-Genauigkeit bei einer schwierigen Aufnahme will oder das Modell mitten im Satz eine Tatsache aus dem Web abrufen soll. Für den Alltag: lokal starten und erst dann zur Cloud wechseln, wenn lokal nicht mehr ausreicht.
Überarbeiten und strukturieren: Aus einer gesprochenen Zusammenfassung echte Notizen machen
Rohes Diktat kommt als Bandwurmsatz heraus. Man sagt „also das Mitochondrium ist der Teil der Energie macht ATP und hat seine eigene DNA was irgendwie seltsam ist, Prüfung fragt wahrscheinlich danach", und das ist die zeichenlose Textwand, die jede Sprachengine liefert. Beim Überarbeiten trennen sich die Wege.
Windows-Spracheingabe fügt beim Sprechen Satzzeichen ein, und macOS-Diktat behandelt einfache Interpunktion, wenn man „Komma" oder „Punkt" sagt. Für gründlichere Bereinigung – „Ähms" entfernen, Bandwurmsätze aufbrechen, aus einem gesprochenen Gedankenstrom etwas Überarbeitbares machen – kann Whisper einen KI-Durchlauf ausführen. Man sagt die Aktivierungsphrase „Hey whisper", und der Text wird vor dem Einfügen überarbeitet. Auf einem lokalen Modell läuft das über Ollama; im Cloud-Modus ist standardmäßig gpt-5-mini aktiv.
also das mitochondrium ist der teil der energie macht atp und hat seine eigene dna was irgendwie seltsam ist prüfung fragt wahrscheinlich danach
Das Mitochondrium produziert Energie (ATP) und besitzt eine eigene DNA, was ungewöhnlich ist. Wahrscheinlich ein Prüfungsthema.
Für die eigene Struktur der Notizen-App – Überschriften, verschachtelte Aufzählungen, Tags, Links – gilt: Sprache liefert den Text, die App liefert die Struktur. Zusammenfassung diktieren, dann Überschrift, Aufzählung oder Link so hinzufügen wie immer. Kein Diktiertool zaubert auf Befehl ein Gliederungsformat herbei; wer das verspricht, verkauft eine Demo, keinen Alltag. Wörter schnell per Sprache erfassen, Notizen mit den gewohnten Tasten strukturieren.
Derselbe Sprich-dann-überarbeite-Ablauf lohnt sich weit über das Lernen hinaus – man kann auch Sprache für jede Art von Notizen in sauberen Text verwandeln – mit demselben Hotkey, egal wo der Cursor gerade ist.
Wann man wirklich Vorlesungsaudio transkribieren muss

Hier ist die Grenze, die ich deutlich ziehen wollte. Wenn die Aufgabe lautet „Ich habe eine Aufnahme der Vorlesung und will den gesamten Inhalt in Text umwandeln", ist ein Diktiertool die falsche Kategorie – das wäre keine faire Empfehlung. Whisper by Remskill schreibt, was man am Cursor sagt; es nimmt keine Audiodatei eines Professors entgegen und erstellt daraus kein Transkript. Dafür braucht man einen Aufzeichnungs- und Transkriptions-Workflow, den ein eigener Ratgeber beschreibt.
Wann ein echter Transkriptionsdienst für Vorlesungsaudio die richtige Wahl ist: wenn man die genauen Worte des Dozenten braucht – Zitate für eine Arbeit, ein wörtliches Protokoll eines Gastreferenten, eine verpasste Stunde, von der nur Audio existiert. Diese Tools nehmen eine Audio- oder Videodatei entgegen und geben Text zurück, oft mit Zeitstempeln und manchmal mit Sprechermarkierungen. Das ist eine grundlegend andere Maschine als ein Diktat-Hotkey – und die richtige, wenn die Eingabe eine Aufnahme ist statt die eigene Stimme. Wie man eine aufgezeichnete Vorlesung transkribiert zeigt den Workflow, der für diese Aufgabe wirklich passt.
Und für kleine Dinge ist das richtige Tool manchmal das kostenlose, das bereits auf dem Rechner ist. Für eine kurze Erinnerung in den Notizen reichen Windows-Spracheingabe (Windows-Taste + H) und macOS-Diktat aus – beide tippen in das aktive Feld, wobei die Windows-Version eine Internetverbindung benötigt. Ein eigenes systemweites Tool lohnt sich, wenn die Notizen länger werden, das Fach mehrsprachig oder terminologielastig ist oder man einen Hotkey will, der in Notizen, E-Mail und Aufsatz gleich funktioniert. Darunter: das Kostenlose nutzen. Für eine einzeilige Erinnerung braucht man keine App zu installieren.
Wer hauptsächlich Aufsätze und Abgaben schreibt statt kurzer Notizen, findet in schneller mit der Stimme tippen die gleiche Logik – denn der Hotkey macht keinen Unterschied, ob der Cursor in einer Notizen-App oder einem Textverarbeitungsprogramm steht.
Eine Vorlesungstranskriptions-App ist eigentlich zwei Tools in einem Suchbegriff. Wer eine Aufnahme hat, transkribiert sie mit einem Transkriptionsdienst. Wer das eigene Verständnis und eine leere Seite hat, spricht es aus und lässt die Wörter dort landen, wo der Cursor steht. Ich habe den Großteil dieses Ratgebers in ein Textfeld diktiert, das nicht meine Notizen-App war – mit einem Tool, dem es egal ist, welches Feld es ist – und dann alles in meine Gliederung eingefügt. Das Lernen selbst muss leider noch immer im eigenen Kopf stattfinden.
Die nächste Vorlesung per Sprache aufschreiben
Hotkey halten, Stoff laut zusammenfassen, loslassen. Der Text landet in der Notizen-App, in der der Cursor steht – und in jeder anderen App auch.
Lokaler Modus kostenlos für jeden angemeldeten Account. Keine Kreditkarte erforderlich.



