Ratgeber
Rechtstranskription – ehrlich erklärt
„Legal transcription software“ bedeutet meistens beglaubigte Gerichts- und Zeugenaussagen-Protokolle. Whisper by Remskill ist das nicht. Es ist ein Diktierwerkzeug für Anwälte und Rechtsanwaltsfachangestellte – für eigene Texte wie Notizen, Briefe und Fallberichte, per Sprache, in jeder App, mit einem lokalen Offline-Modus.
Zuletzt aktualisiert: Juni 2026

„Legal transcription software“ bezeichnet meistens beglaubigte Protokolle von Gerichtsverhandlungen, Zeugenaussagen und Anhörungen. Whisper by Remskill ist keine beglaubigte Transkription und gibt keine Compliance- oder Vertraulichkeitsgarantien. Es ist ein Diktierwerkzeug für eigene Texte – Memos, Briefe und Fallnotizen per Sprache in jeder App – mit einem lokalen Offline-Modus, der den Text auf dem Gerät behält.
Ich möchte mit dem anfangen, was die meisten Seiten zum Thema „Legal transcription software“ überspringen. Der Begriff hat zwei sehr unterschiedliche Bedeutungen, und wer sie verwechselt, verliert echtes Geld. Die eine Bedeutung ist beglaubigte Transkription – ein Gerichtsstenograf oder ein Transkriptionsdienst, der eine aufgezeichnete Zeugenaussage, Anhörung oder ein Interview in ein wörtliches Protokoll überträgt, das eingereicht oder zitiert werden kann. Die andere Bedeutung ist Diktat – ein Anwalt, der spricht statt tippt, um den ersten Entwurf eines Memos oder Briefs schneller zu Papier zu bringen.
Whisper ist eindeutig das Zweite. Es ist kein beglaubigter Transkriptionsdienst, es erstellt keine gerichtsverwertbaren Protokolle und gibt keinerlei Compliance-, Vertraulichkeits- oder Genauigkeitsgarantien. Wer das Erste sucht, findet am Ende dieses Ratgebers Hinweise auf die richtige Art von Dienst. Wer viele eigene Erstentwürfe schreibt und genug von der Tipperei hat, für den ist der mittlere Teil gedacht.
Hier ist die ehrliche Einordnung. Ein Diktierwerkzeug transkribiert keine Verhandlung. Es fügt das Gesprochene an der Cursorposition in das aktive Textfeld ein – in ein Word-Dokument, eine E-Mail, eine Aktennotiz oder eine Abrechnungszeile. Es weiß nicht, dass es sich um „Rechtliches“ handelt. Es wandelt Sprache einfach in Text um – in der App, die gerade geöffnet ist.
Die eigentliche Frage lautet also nicht: „Ist das Legal-Transkriptionssoftware?“ Für beglaubigte Protokolle lautet die Antwort nein, und ich sage das klar. Die eigentliche Frage ist: „Kann ich eigene Texte per Sprache verfassen, statt sie zu tippen?“ Und da lautet die Antwort ja – offline wenn gewünscht, mit einer eigenen Wortliste für Namen und Fachbegriffe, die täglich vorkommen. Ich erkläre die Einrichtung, den Diktatworkflow, die Entscheidung zwischen lokal und Cloud – und genau den Punkt, ab dem man besser einen beglaubigten Dienst beauftragt.
Was es ist – und was nicht

Ich ziehe die Linie klar, weil sie hier wichtiger ist als in den meisten Bereichen. Whisper ist Diktiersoftware. Man spricht, und die Wörter landen als bearbeitbarer Text an der Cursorposition. Es ist keine beglaubigte Transkription. Es erstellt kein wörtliches, bestätigungsfähiges Protokoll einer Zeugenaussage, Anhörung oder eines Interviews. Es ist nicht gerichtstauglich und gibt keine Compliance-, Vertraulichkeits- oder Überlieferungsgarantien. Wenn ein Dokument beglaubigt oder als genaue Aufzeichnung des Gesagten eingereicht werden muss, ist das schlicht das falsche Werkzeug.
Wofür es gut ist: eigene Erstentwürfe. Das Memo, das man sonst Satz für Satz mühsam tippen würde. Der Mandantenbrief, die Gesprächsnotiz nach einem Telefonat, die interne Zusammenfassung eines Falles, der grobe Argumentationsrahmen vor dem Feinschliff. Dabei ist man selbst Autor – der einzige Maßstab ist: „Hat es das eingefangen, was ich meinte?“ Sprechen ist dabei schneller als Tippen: grob 145 Wörter pro Minute gesprochen gegenüber etwa 40 getippt, nach eigener Erfahrung – und der Text lässt sich vor der Weitergabe noch bearbeiten.
Noch eine ehrliche Anmerkung zum lokalen Modus, weil er anderswo gerne übertrieben dargestellt wird. Whispers lokale Engines laufen vollständig auf dem eigenen Gerät, sodass Audio und der entstehende Text den Computer nie verlassen. Das ist für sensible Inhalte ein echter Vorteil. Allein ist das jedoch keine Vertraulichkeits- oder Compliance-Garantie – die eigenen Systeme, Richtlinien und Pflichten gelten weiterhin für die Datei. Ich bevorzuge ein klares Bild vor einem Satz, der wie ein Versprechen klingt.
Hotkey drücken, sprechen, Text landet im Entwurf
Die Bedienung ist simpel – und simpel ist der Punkt. Man drückt einen Hotkey, spricht, lässt los, und die Transkription wird an der Cursorposition eingefügt, wo immer der Fokus liegt. Whisper hält nach dem Loslassen noch einen kurzen Moment nach, damit das letzte Wort nicht abgeschnitten wird. Da die Eingabe über den Betriebssystem-Cursor erfolgt, ist die Aktennotiz in Word für die App schlicht „ein Textfeld“ – genauso wie der E-Mail-Client oder das Kanzleiverwaltungssystem. Kein Plugin für eine bestimmte Rechtsanwendung, keine Integration zu autorisieren.
Das ist der Teil, den Landing Pages meist überkomplizieren. Der Cursor ist im Entwurf, man spricht, die Wörter erscheinen im Entwurf. Eine kleine Kapsel erscheint während des Sprechens, damit man weiß, dass die App zuhört:
Der Hotkey ist das Einzige, das man von Anfang an richtig einrichten sollte. Unter Windows ist es Ctrl+Space, auf dem Mac Command+Option – ein reiner Modifikatortasten-Drücken-und-Halten zum Sprechen. Beide lassen sich in den Einstellungen ändern, falls sie mit einer vorhandenen Tastenkombination kollidieren. (Meine jüngere Tochter sagte mir einmal, ein Hotkey „funktioniere nicht“ in ihrer Zeichenapp. Es war ein Konflikt, kein Fehler – so habe ich gelernt, dass die meisten Menschen keine Ahnung haben, was ein Hotkey-Konflikt überhaupt ist. Deshalb ist jetzt jeder Hotkey anpassbar.) Wer bereits Diktat unter Windows oder auf dem Mac eingerichtet hat, kennt den Muskelgedächtnis-Ablauf – nur jetzt auf die eigenen Entwurfs-Apps ausgerichtet.
Einrichtung in zwei Minuten (Windows oder Mac)
Man benötigt einen Mac mit Apple Silicon oder einen Windows-10-PC (oder neuer), ein funktionierendes Mikrofon und die bevorzugte Schreib-App geöffnet und bereit. Die gesamte lokale Pipeline ist für jedes angemeldete Konto kostenlos – kein Zahlungsmittel beim Anmelden erforderlich. So geht es.
Schritt 1 – Whisper installieren und anmelden.
Von der Download-Seite herunterladen, installieren und ein kostenloses Konto erstellen. Keine Kreditkarte. Die gesamte lokale Transkriptionspipeline steht sofort bereit.
Es hat funktioniert, wenn das Tray-Icon der App erscheint und der Einrichtungsassistent ein Modell zur Auswahl anbietet.
Schritt 2 – Transkriptionspfad wählen.
Die App trifft keine Wahl für einen. Es stehen drei Optionen bereit: Cloud (OpenAI, eigener Schlüssel), lokales Parakeet oder lokales Whisper. Für sensible Inhalte empfiehlt sich der lokale Start – mehr dazu zwei Abschnitte weiter.
Es hat funktioniert, wenn ein Modell den Download abgeschlossen hat und als bereit angezeigt wird.
Schritt 3 – Hotkey bestätigen.
Windows-Standard ist Ctrl+Space, Mac ist Command+Option (halten zum Sprechen). Auf dem Mac die Bedienungshilfen-Berechtigung erteilen, wenn sie angefordert wird; ohne sie kann die Texteingabe an der Cursorposition andere Apps nicht erreichen.
Es hat funktioniert, wenn eine Testaufnahme in ein beliebiges Textfeld eingefügt wird.
Schritt 4 – Cursor in den Entwurf setzen und sprechen.
Memo, Brief oder Fallnotiz öffnen, an die gewünschte Stelle klicken, Hotkey halten, einen Satz sagen, loslassen. Die Transkription erscheint an der Cursorposition.
Es hat funktioniert, wenn der gesprochene Satz als Text im Dokument steht.
Der langsamste Teil ist der Modell-Download, nicht die Einrichtung. Alles andere sind die vier Schritte oben. Ist die App am Laufen, ist einen Gedanken zu Papier bringen keine Tipp-Aufgabe mehr, sondern eine Sprech-Aufgabe.
Memos, Briefe und Fallnotizen per Sprache verfassen
So sieht der Alltag konkret aus – das ist nützlicher als eine Featureliste. Man beendet ein Mandantengespräch und möchte die Notizen festhalten, bevor man sie vergisst. Cursor in die Aktennotiz, Hotkey halten, den Gesprächsverlauf in normalen Sätzen aussprechen, loslassen. Zwei Minuten später hat man einen Absatz zum Überarbeiten statt einer leeren Seite. Derselbe Ablauf funktioniert für den Erstentwurf eines Memos, eines Begleitschreibens, einer Fallzusammenfassung, einer Abrechnungszeile – für alles, bei dem man selbst Autor ist und die Wörter zuerst einem selbst gehören.
Diktat spielt seinen Vorteil besonders bei längeren Texten aus. Ein zweiseitiges Memo bedeutet viel Tippen und wenig Nachdenken, wenn man schon weiß, was man sagen will. Gesprochen kommt es in der Reihenfolge heraus, in der man es mündlich argumentieren würde – was oft auch die richtige Lesereihenfolge ist. Man transkribiert niemanden – man bringt das eigene Argument in Sprechgeschwindigkeit zu Papier und kürzt es dann. Das Redigieren bleibt die eigene Aufgabe. Die Sprache entfernt die Tastatur, nicht den Anwalt. (Derselbe Diktat-Workflow bewährt sich auch in anderen Berufen, die viel in Dokumenten arbeiten – er ähnelt dem, was ich für Diktiersoftware für Berater beschrieben habe, wo das Ergebnis ein Bericht statt eines Memos ist.)
Ein weiterer stiller Gewinn: die Hände. Wer nach einem Jahrzehnt Schreibarbeit an den Handgelenken leidet, empfindet es als echte Erleichterung, den Erstentwurf zu sprechen und die Tastatur nur noch fürs Redigieren zu nutzen. Das sei kein medizinischer Anspruch – das ist es nicht. Es sind schlicht weniger Tastendrücke für dasselbe Ergebnis, was die meisten, die beruflich schreiben, gerne annehmen.
Lokal oder Cloud: welcher Modus für sensible Inhalte
Für juristische Texte empfiehlt sich der lokale Modus als Ausgangspunkt. Der Grund ist einfach: Ein halbfertiges Argument, der Name eines Mandanten, die Fakten einer laufenden Sache – dieser Text muss das eigene Gerät nicht verlassen, um ein Entwurf zu werden. Whispers lokale Engines laufen vollständig auf dem eigenen Computer, sodass Audio und Text dort bleiben. Das ist ein echter Vorteil für sensible Arbeit – auch wenn es, wie oben gesagt, eine Eigenschaft des Verarbeitungsorts und kein Compliance-Zertifikat ist. Auf einem Mac mit Apple Silicon oder einem PC aus den letzten Jahren bewältigt der lokale Modus das alltägliche Diktat problemlos.
Hier sind die Unterschiede zwischen den drei Pfaden, weil die App eine Wahl verlangt und man diese gut treffen sollte:
- Lokales Parakeet — NVIDIAs TDT-Engine, ca. 600 MB, die schnellste lokale Option – 5- bis 10-mal schneller als Whisper auf der CPU. Englisch plus 24 weitere europäische Sprachen, insgesamt 25. Kein Übersetzen ins Englische, keine benutzerdefinierte Vokabelliste. Wer auf Englisch arbeitet und Geschwindigkeit ohne Internetverbindung möchte, greift hier zu.
- Lokales Whisper — Langsamer als Parakeet auf demselben Gerät, aber die Engine, die eine eigene Vokabelliste akzeptiert – das ist hier entscheidend: Parteinamen, lateinische Fachbegriffe und täglich verwendete Wendungen lassen sich hinterlegen. Die mehrsprachigen Modelle unterstützen 99 Sprachen und können ins Englische übersetzen; die englischsprachigen Modelle sind auf Englisch beschränkt. Das Standard-Englischmodell ist ca. 480 MB groß. Das ist die lokale Wahl, wenn Terminologiegenauigkeit zählt.
- Cloud (OpenAI, BYOK) — Beste Genauigkeit und Webzugriff, mit eigenem OpenAI-Schlüssel, der direkt von OpenAI abgerechnet wird. Die Transkription läuft standardmäßig über gpt-4o-mini-transcribe. Internetverbindung erforderlich – das ist der einzige Pfad, bei dem Text das eigene Gerät verlässt. Sensible Inhalte sollte man gut abwägen, bevor man sie darüber leitet. Die Cloud-Oberfläche ist Teil von Whisper Pro.
Die nüchterne Wahrheit: Für Erstentwürfe eigener Texte reicht lokal vollkommen aus – und für sensible Inhalte ist es der naheliegende Ausgangspunkt. Beide lokalen Engines laufen vollständig auf dem eigenen Gerät, ohne etwas an einen Server zu senden. Die Cloud bewährt sich, wenn man bei einer schwierigen Aufnahme höchste Genauigkeit braucht oder mitten im Satz eine Information aus dem Web benötigt – und der Inhalt nicht so sensibel ist, dass er auf dem Gerät bleiben muss. Lokal starten; Cloud nur dann, wenn Lokal nicht ausreicht.
Rechtsbegriffe, Parteinamen und den Entwurf bereinigen
Rohes Diktat kommt als Fließtext heraus. Man sagt: „Okay Notiz für die Akte wir haben mit dem Mandanten gesprochen wegen des Grunddienstbarkeitsstreits sie wollen vor der Verhandlung einigen erinnere mich Donnerstag den Brief zu entwerfen“ – und bekommt exakt diese unpunktuierte Textwand zurück, die jede Sprach-Engine liefert. Zwei Dinge helfen.
Erstens: Terminologie. Lokales Whisper akzeptiert eine eigene Vokabelliste, auf die man die Engine hinlenkt. Parteinamen, lateinische Fachbegriffe und kanzleispezifische Abkürzungen, die täglich vorkommen, lassen sich hinterlegen – und die Engine hört auf, bei ihnen zu raten. Diese Funktion ist nur bei lokalem Whisper verfügbar; Parakeet und die Cloud-Transkriptionsmodelle nehmen keine eigene Wortliste. Zweitens: Bereinigung. Um die „Ähs“ herauszufiltern, Fließtexte zu strukturieren und aus einem gesprochenen Absatz etwas Lesbares zu machen, kann Whisper einen KI-Durchlauf starten. Man sagt die Aktivierungsphrase „Hey whisper“, und der Text wird vor der Ausgabe aufbereitet. Bei einem lokalen Modell läuft das über Ollama; im Cloud-Modus ist standardmäßig gpt-5-mini zuständig.
okay notiz für die akte wir haben mit dem mandanten gesprochen wegen des grunddienstbarkeitsstreits sie wollen vor der verhandlung einigen äh erinnere mich donnerstag den brief zu entwerfen
Notiz für die Akte: Wir haben mit dem Mandanten wegen des Grunddienstbarkeitsstreits gesprochen. Sie wollen vor der Verhandlung einigen. Erinnere mich, den Brief Donnerstag zu entwerfen.
Ein Hinweis, der in diesem Bereich mehr gilt als anderswo: Die KI-Bereinigung korrigiert Grammatik und Füllwörter – sie ist kein Lektorat und erst recht keine Rechtsprüfung. Sie formt auch aus etwas falsch Gesprochenem einen klaren, zuversichtlichen Satz. Alles lesen, bevor es in die Nähe eines Mandanten oder einer Akte kommt. Sprache bringt die Wörter schnell zu Papier; das Urteilsvermögen leistet den Rest.
Derselbe Sprech-und-Bereinigen-Ablauf zahlt sich weit über juristische Texte hinaus aus – man kann auch saubere Prosa in jede App diktieren mit einem einzigen Hotkey, sodass aus einem langen Absatz ein paar gesprochene Sätze werden, statt ihn auszutippen.
Wann man einen beglaubigten Transkriptionsdienst braucht

Das ist der wichtigste Abschnitt, also direkt gesagt: Wer wirklich ein Protokoll des Gesagten braucht – eine Zeugenaussage, eine Anhörung, ein aufgezeichnetes Interview, eine Befragung – das als genaues, bestätigungsfähiges Transkript vorliegen haben muss, sollte kein Diktierwerkzeug und nicht Whisper verwenden. Dafür braucht es einen beglaubigten Gerichtsstenografen oder einen beglaubigten Rechtstranskriptionsdienst. Das ist eine andere Kategorie mit anderen Anforderungen: wörtliche Genauigkeit, Beglaubigung und die Verantwortlichkeit, die ein eingereichtes Protokoll verlangt. Whisper gibt keine dieser Garantien – das sage ich offen.
Dasselbe gilt für compliance-pflichtige Arbeiten, bei denen das Werkzeug selbst einen Standard erfüllen muss – eine dokumentierte Überlieferungskette, eine vertraglich vereinbarte Genauigkeitsschwelle, ein Prüfpfad für den Umgang mit dem Audio. Whisper ist ein persönliches Schreibwerkzeug. Es trägt keine Zertifizierungen, und Text auf dem eigenen Gerät zu behalten ist eine Eigenschaft des lokalen Modus, kein Compliance-Attest. Wenn eine Vorschrift, ein Gericht oder ein Mandant eine beglaubigte Ausgabe fordert, ist die ehrliche Antwort: ein beglaubigter Dienst. Das richtige Werkzeug für den eigenen Standard.
Whisper passt für das Schreiben, das man ohnehin selbst tippen würde: das Memo, den Brief, die Fallnotiz, den ersten Argumentationsdurchlauf. Wenn man viel schreibt und die Hände es einem danken würden – passt es. Wenn man ein Transkript produzieren muss, auf das jemand als offiziellen Bericht verlässt – passt es nicht, und ein Diktierwerkzeug wird das nie können. Zu wissen, auf welcher Seite dieser Linie man steht, ist die ganze Entscheidung.
Wer weniger an juristischer Arbeit im Speziellen interessiert ist und mehr daran, private Erstentwürfe ohne Server in der Leitung zu erstellen, findet in privatem, offlinebasiertem Sprache-zu-Text dieselbe Logik – denn beides läuft darauf hinaus, den Text auf dem Gerät zu behalten, auf dem er entsteht.
Also: keine beglaubigte Transkription, kein Gerichtsprotokoll, keine Compliance-Versprechen. Ein Diktierwerkzeug für eigene Entwürfe, offline wenn gewünscht, mit einer Wortliste für täglich verwendete Fachbegriffe. Den größten Teil dieses Ratgebers habe ich gesprochen und das Ergebnis redigiert – genau der Workflow, den ich beschreibe. Und genau nichts davon hat mit der Erstellung eines Zeugenaussagen-Protokolls zu tun, für das ich jemand Qualifizierten beauftragen würde. Das richtige Werkzeug für die eigene Seite der Linie.
Nächstes Memo per Sprache verfassen
Hotkey halten, sprechen, loslassen. Der Erstentwurf landet dort, wo der Cursor ist – im Editor, in der E-Mail oder in den Fallnotizen.
Lokaler Modus kostenlos für jedes angemeldete Konto. Keine Kreditkarte zum Starten erforderlich.



