Von Denys Medvediev

Vergleich

Whisper vs. Parakeet

Whisper und Parakeet sind die beiden lokalen Sprach-Engines in Whisper by Remskill, und die Wahl läuft auf einen einzigen Kompromiss hinaus. Parakeet ist auf einer CPU 5- bis 10-mal schneller als Whisper, beherrscht aber nur Englisch plus 24 europäische Sprachen. Whisper ist langsamer, deckt dafür 99 Sprachen ab, übersetzt ins Englische und gibt dir feine Kontrolle.

Zuletzt aktualisiert: Juni 2026

Bunte Audio-Wellenformen auf einem dunklen Bearbeitungsbildschirm, die zwei Sprach-Engines andeuten

Whisper und Parakeet sind beide kostenlos in Whisper by Remskill enthalten, und du wechselst zwischen ihnen über ein Dropdown-Menü. Parakeet ist auf einer CPU 5- bis 10-mal schneller und deckt Englisch plus 24 europäische Sprachen ab. Whisper ist langsamer, beherrscht aber 99 Sprachen, übersetzt ins Englische und bietet dir individuelles Vokabular und Beam-Steuerung. Schnell gegen flexibel, nicht gut gegen schlecht.

Whisper und Parakeet sind die beiden lokalen Sprach-Engines in Whisper by Remskill, und die Wahl läuft auf einen einzigen Kompromiss hinaus. Parakeet ist auf einer CPU 5- bis 10-mal schneller als Whisper, beherrscht aber nur Englisch plus 24 europäische Sprachen. Whisper ist langsamer, deckt dafür 99 Sprachen ab, übersetzt ins Englische und gibt dir feine Kontrolle.

Wir liefern beide, also ist das kein Verkaufsgespräch

Die meisten "X vs. Y"-Artikel stammen von jemandem, der X verkauft. Dieser hier ist anders. Wir liefern beide Engines in derselben App. Du wählst die gewünschte über ein Dropdown-Menü, lädst sie einmal herunter und wechselst jederzeit.

Das heißt, ich habe keinen Grund, dir die falsche aufzuschwatzen. Wenn Parakeet das Richtige für dich ist, will ich, dass du Parakeet nutzt. Wenn du Whisper brauchst, will ich, dass du bei Whisper bleibst. Die App entscheidet nicht für dich, und ich tue es auch nicht. Ich lege einfach offen, worin jede der beiden wirklich gut ist.

Beide laufen vollständig offline. Beide sind für jeden angemeldeten Nutzer kostenlos. Keine Kreditkarte, keine Cloud-Abrechnung pro Minute, kein Aufpreis für die zweite Engine.

Parakeet ist die schnelle

Parakeet ist das TDT-Modell von NVIDIA. TDT steht für Token-and-Duration Transducer – ein FastConformer-Encoder, gekoppelt an einen Decoder, der sowohl die Wörter als auch ihre jeweilige Dauer vorhersagt. Du musst dir nichts davon merken. Worauf es ankommt, steht im nächsten Satz.

Es ist auf einer ganz normalen CPU 5- bis 10-mal schneller als Whisper. Keine GPU nötig, kein Warten. Du lässt die Tastenkombination los, und der Text ist im Grunde schon da.

Das ausgelieferte Modell ist Parakeet v3, rund 600 MB auf der Festplatte, und es deckt Englisch plus 24 weitere europäische Sprachen ab, also 25 insgesamt. Die Qualität ist gut. Nicht ganz so gut wie Whisper-large, aber mehr als genug für die tägliche Diktierarbeit: E-Mails, Notizen, Nachrichten – das Zeug, das die meisten von uns den ganzen Tag tippen.

Was Parakeet nicht kann: Es übersetzt deine Sprache nicht ins Englische, und es nimmt kein individuelles Vokabular oder Hotword-Hinweise an. Wenn du auf Französisch diktierst, bekommst du französischen Text. Genau das wollen die meisten französischsprachigen Nutzer, also ist das nur dann ein Problem, wenn Übersetzung der einzige Grund ist, warum du hier bist.

Whisper ist die gründliche

Whisper ist das offene Modell von OpenAI, und in unserer App kommt es in acht Varianten. Vier nur für Englisch und vier mehrsprachige, von einem rund 140 MB großen Base-Modell bis zu einem rund 3 GB großen Large v3. Du wählst die Größe, die zu deinem Rechner und deiner Geduld passt.

Die mehrsprachigen Modelle decken 99 Sprachen ab, nicht 25. Darunter Chinesisch, Japanisch, Koreanisch und Arabisch – genau die, die Parakeet komplett auslässt. Whisper übersetzt jede davon außerdem in einem Schritt ins Englische, was Parakeet nicht kann.

Und Whisper gibt dir Kontrolle, die Parakeet nicht bietet: individuelles Vokabular, Beam-Size-Einstellungen und Hotword-Gewichtung, damit es den Namen deiner Kollegin oder deines Produkts nicht mehr verstümmelt. Wenn du den ganzen Tag Fachbegriffe diktierst, ist diese Kontrolle der Unterschied zwischen sauberem Text und einer mühsamen Suchen-und-Ersetzen-Aktion.

Der Preis dafür ist Geschwindigkeit. Auf derselben CPU ist Whisper langsamer, bei den größeren Modellen manchmal deutlich langsamer. Die nüchterne Wahrheit ist: Die meisten, die sich für Whisper entscheiden, wählen nicht so sehr Genauigkeit gegenüber Parakeet, sondern Sprachen und Kontrolle gegenüber Geschwindigkeit.

Whisper
Der echte Modellauswähler von Whisper by Remskill – beide Engines wählbar in der echten App, kein Screenshot.

Der ehrliche Vergleich, in einer Tabelle

Hier ist die ganze Entscheidung in sieben Zeilen. Keine Dollarbeträge darin – beide Engines sind in derselben Stufe kostenlos.

Funktionsvergleich zwischen Parakeet und Whisper in Whisper by Remskill
FunktionParakeetWhisper
EngineNVIDIA TDT (FastConformer + Token-and-Duration Transducer)OpenAI Whisper
Download-Größe~600 MB (ein Modell)~140 MB bis ~3 GB (8 Modelle)
Sprachen25, Englisch + 24 europäische99 (mehrsprachige Modelle)
Ins Englische übersetzenNeinJa
Geschwindigkeit auf CPU5- bis 10-mal schnellerLangsamer
Individuelles Vokabular / Hotwords / Beam-SteuerungNeinJa
Am besten fürSchnelles Diktieren auf Englisch / in EU-Sprachen auf einer CPU99 Sprachen, Übersetzung, feine Kontrolle

Beide sind lokal, beide laufen offline, beide sind in derselben Stufe kostenlos. Die Tabelle ist kein "gut gegen schlecht". Sie ist "schnell gegen flexibel".

Welche solltest du tatsächlich nehmen

Das ist der Teil, um den sich die meisten Vergleichsartikel drücken, also hier ganz direkt.

Für die meisten englischsprachigen Nutzer: nimm Parakeet. Geschwindigkeit gewinnt im Alltag. Du diktierst Dutzende Male am Tag, und der Unterschied zwischen "Text erscheint sofort" und "Text erscheint nach einem Moment" ist der Unterschied zwischen im Gedankenfluss bleiben und ihn verlieren. Alles über rund zwei Sekunden, und dein Gehirn beschäftigt sich wieder mit der App, in der du warst, und du vergisst, was du sagen wolltest. Dass Parakeet auf einer CPU 5- bis 10-mal schneller ist, ist kein Datenblatt-Geprahle. Es ist das, was du hundertmal am Tag spürst.

Nimm Whisper, wenn du eines von drei Dingen brauchst, die Parakeet dir nicht geben kann: eine Sprache außerhalb der 25 europäischen (Chinesisch, Japanisch, Koreanisch, Arabisch), Übersetzung ins Englische oder die Kontrolle über individuelles Vokabular und Hotwords für Namen und Fachjargon.

Ich bin der Typ, der das Architekturdiagramm zeichnet, bevor er die Runtime installiert, also lautet mein Instinkt immer "nimm das leistungsfähigere Werkzeug". Dieser Instinkt liegt hier falsch. Das leistungsfähigere Werkzeug ist Whisper, aber das richtige Werkzeug für das tägliche englische Diktieren ist meist das schnellere. Leistung, die du nicht nutzt, ist nur Download-Größe.

CancelTranscribing
Das echte, ausgelieferte Aufnahme-Overlay mitten im Diktat – dieselbe Tastenkombination und dasselbe Overlay, egal welche Engine du wählst.

Ein echter Fall, in dem Whisper gewinnt

Ganz am Anfang, in Woche drei nach dem Start, schrieb mir ein Nutzer per E-Mail und fragte, ob die App mitten im Satz von Ukrainisch ins Englische übersetzen könne. Er las Nachrichten aus Kyiv in Echtzeit und wechselte alle paar Wörter die Sprache. Ich hatte angenommen, "mehrsprachig" bedeute, sich pro Sitzung für eine Sprache zu entscheiden. Er meinte echtes Code-Switching, in einer Sprache, die Parakeets 25 für diesen Workflow nicht einmal vollständig abdecken. Whispers mehrsprachiges Modell hat es bewältigt: 99 Sprachen, automatische Erkennung, Übersetzung ins Englische im selben Durchgang. Er hat sich nie zurückgemeldet, um das zu bestätigen. Ich beschließe, das als gutes Zeichen zu deuten.

Das ist die ganze Regel in einer Geschichte. Wenn dein Tag wie seiner aussieht, hilft dir Parakeets Geschwindigkeit nicht, weil Parakeet die Aufgabe überhaupt nicht erledigen kann. Für alle, deren Tag aus dem Diktieren englischer E-Mails zwischen Meetings besteht, ist die Geschwindigkeit der entscheidende Punkt.

So wechselst du zwischen ihnen

Du musst dich nicht festlegen. Öffne den Modellauswähler, wähle Parakeet oder ein beliebiges Whisper-Modell, und es wird einmal heruntergeladen. Wechsle zurück, wann immer sich die Arbeit ändert: Parakeet für den morgendlichen E-Mail-Schwung, Whisper Large v3 an dem Nachmittag, an dem du ein japanisches Interview transkribierst.

Dieselbe Tastenkombination, dasselbe Overlay, dieselben Einstellungen in beiden Fällen. Unter Windows ist die Voreinstellung Ctrl+Space. Auf dem Mac ist es eine Command+Option-Push-to-talk-Kombination, die sich neu belegen lässt, falls sie mit etwas kollidiert. Die Engine ist ein Dropdown, keine Neuinstallation.

Wenn du dir nur eine Sache merkst

Parakeet für Geschwindigkeit und Englisch. Whisper für 99 Sprachen, Übersetzung und Kontrolle. Du musst dich bei der Installation nicht entscheiden, denn beide werden in derselben App ausgeliefert, und der Wechsel ist ein Dropdown, keine Download-Entscheidung, an die du gebunden bist.

Wenn du das größere Bild dazu willst, warum es besser ist, das auf deinem eigenen Rechner laufen zu lassen, als Audio an einen Server zu schicken, habe ich darüber unter Offline-Spracherkennung geschrieben. Und wenn du uns gegen eine bestimmte kostenpflichtige App abwägst, behandelt der Beitrag superwhisper-Alternative genau diesen direkten Vergleich.

Installiere beide Engines und lass den ersten Nachmittag entscheiden

Lade die App herunter, installiere Parakeet und ein Whisper-Modell – beide sind kostenlos – und lass deinen eigenen ersten Nachmittag die Sache klären.

Beide lokalen Engines sind für immer kostenlos. Keine Zahlungsmethode bei der Anmeldung. Die 7-tägige Cloud-Testphase fragt erst beim Upgrade nach einer Karte.

Foto von Denys Medvediev

Denys Medvediev

Ich bin der, der unsere Support-E-Mails liest – höchstwahrscheinlich, indem ich die Antworten diktiere.

Weiterführende Lektüre