Von Denys Medvediev

Vergleich

superwhisper auf Windows

superwhisper liefert jetzt auch eine Windows-App — die alte Antwort („nur Mac, leider“) stimmt nicht mehr. Die eigentliche Frage ist: Welches Diktierwerkzeug passt zu deinem Windows-Rechner? Hier ist ein ehrlicher Blick auf superwhisper auf Windows und die nächste lokale Alternative.

Zuletzt aktualisiert: Juni 2026

Windows-Laptop auf einem dunklen Schreibtisch mit einem Mikrofon daneben, als Sinnbild für Desktop-Diktat

superwhisper für Windows ist jetzt Realität. Ab 2026 bietet superwhisper.com eine downloadbare App für Windows 10 und 11 — mit On-Device-KI-Diktat, offline, in jedem Eingabefeld. Die nächste lokale Alternative ist Whisper by Remskill: ebenfalls Windows-nativ, die lokale Pipeline kostenlos, mit systemweitem Push-to-Talk-Hotkey und einem KI-Bereinigungsdurchlauf.

Lange Zeit war „superwhisper für Windows“ eine Suche mit trauriger Antwort. superwhisper begann als Mac-App, kam dann auf iOS, und Windows-Nutzer fragten im Feedback-Board immer wieder, wann sie dran wären. Wer das letztes Jahr gegoogelt hat, hat überall dasselbe gelesen: nur Mac, hier ist ein Ersatz, tut uns leid.

Diese Antwort ist inzwischen veraltet. superwhisper.com hat eine Windows-Seite und einen Windows-Download — Windows 10 und 11, x64 und ARM64, On-Device-Transkription offline. Die Frage lautet also nicht mehr „Bekomme ich das überhaupt?“, sondern „Ist es das Richtige für meinen Windows-Rechner, oder passt etwas anderes besser?“ Ich nutze Diktat auf Windows täglich, ich werde fair über superwhispers tatsächliche Stärken berichten — und ich sage dir, wo Whisper by Remskill stattdessen reinpasst.

Hier ist der Punkt, den die älteren Artikel falsch hatten — und den man klar sagen sollte, damit du keine Zeit mit einem Workaround verschwendest, den du gar nicht brauchst. superwhisper ist nicht mehr nur für Mac. Der Windows-Build ist eine echte, veröffentlichte App auf ihrer eigenen Website — kein Beta-Anmeldeformular. Wenn superwhisper das war, was du wolltest, kannst du es heute installieren.

Damit hat sich das Problem „Wie kriege ich die Mac-App auf Windows?“ in eine ganz normale Werkzeugentscheidung verwandelt. Zwei solide lokale Diktier-Apps laufen jetzt beide auf Windows. Der Rest dieses Guides ist der ehrliche Vergleich: Was superwhisper ist, warum Leute trotzdem noch schauen, wie die beiden abschneiden — und in welchen Fällen superwhisper oder die eingebaute Windows-Option die klügere Wahl ist.

Was superwhisper ist und für wen es gedacht ist

Desktop-Mikrofon neben einer Tastatur, als Illustration für Sprachdiktat am Arbeitsplatz

superwhisper ist eine KI-Diktier-App. Du sprichst, sie transkribiert, und fertiger Text landet in der App, in der du gerade arbeitest — E-Mail, Chat, Code-Editor. Laut eigener Beschreibung funktioniert sie systemweit in jeder Anwendung, setzt Zeichensetzung und Formatierung selbstständig und unterstützt über 100 Sprachen mit automatischer Spracherkennung. Sie transkribiert außerdem Audio- und Videodateien, nicht nur Live-Sprache. Das ist ein wirklich gutes Funktionspaket, und ich werde nicht so tun, als wäre es das nicht.

Worauf superwhisper am stärksten setzt, ist Datenschutz. Die Windows-Seite sagt es direkt: „On-device AI models. Your audio never leaves your machine and you don’t need internet.“ Das ist der richtige Ansatz für ein Diktierwerkzeug — und derselbe Gedanke steckt hinter Whisper by Remskill. Wer schon mal einer Cloudabrechnung beim Wachsen zugeschaut hat, weiß, warum Lokalverarbeitung wichtig ist. (Ich habe mal erlebt, wie ein Team in einem Quartal eine fünfstellige Cloud-KI-Rechnung angeholt hat — hauptsächlich weil Standup-Aufnahmen viermal neu transkribiert wurden, weil ein „Smart Retry“ zu eifrig war. Als der CFO das Dashboard mitten in der Review öffnete, war es still im Raum.) On-Device-Diktat umgeht diese ganze Kategorie von Problemen.

Für wen ist es also gedacht? Für jemanden, der eine ausgereifte, moderne Diktier-App möchte, der die Auswahl aus verschiedenen KI-Modellen zur Bereinigung schätzt und entweder auf einem Mac arbeitet oder auf den neuen Windows-Build gewechselt ist. superwhisper ist auf macOS groß geworden — dort ist es eine starke, gut angesehene Wahl. Die Windows-App ist das neuere Mitglied der Familie. Das ist kein Vorwurf — es ist einfach der Stand der Dinge, und das spielt beim Vergleich weiter unten eine Rolle.

„Warum gibt es das nicht für Windows“ — und warum sich das endlich geändert hat

Jahrelang war die ehrliche Antwort auf „superwhisper für Windows“: „Das gibt es nicht — es ist eine Mac- und iPhone-App.“ Mac-first ist ein üblicher Weg für unabhängige Entwicklerwerkzeuge — eine Plattform zu unterstützen, enge OS-Integration, weniger Fehlerquellen. Windows ist schwieriger. Allein die Eingabe-Infrastruktur ist rauer. Ich habe mehr über das Windows-Eingabemethoden-Framework gelernt, als mir lieb war, damals als unser eigener Hotkey den Aufnahme-Stop-Callback sechsmal pro Tastendruck auslöste, auf Rechnern mit aktivierter Spracheingabe. Ein 300-ms-Debounce hat das behoben. Auf dem Mac gab es den Bug nie.

Diese Lücke hat Leute dazu gebracht, nach Alternativen zu suchen — und deshalb wird dieser Begriff noch immer getippt. Alte Gewohnheiten, alte Artikel und die Tatsache, dass der Windows-Build noch so neu ist, dass viele Leute noch gar nicht mitbekommen haben, dass er da ist. Die Mechanik, die beide Tools teilen, ist der einfache Teil: Hotkey drücken, sprechen, loslassen — und die Wörter landen am Cursor. Während du sprichst, erscheint eine kleine Kapsel, damit du weißt, dass das Tool zuhört.

Cancel
Das Aufnahme-Overlay: eine kleine Kapsel, die erscheint, während du sprichst — damit du weißt, dass das Tool zuhört.

Bei Whisper by Remskill ist der Push-to-Talk-Hotkey auf Windows Ctrl+Space — gehalten während du sprichst, und in den Einstellungen änderbar, falls er mit etwas kollidiert. (Meine jüngere Tochter sagte mir einmal, ein Hotkey „funktioniere nicht“ in ihrer Zeichen-App. Es war ein Konflikt, kein Bug — so habe ich gelernt, dass der Durchschnittsmensch keine Ahnung hat, was ein Hotkey-Konflikt ist. Deshalb ist jetzt jeder Hotkey anpassbar.) Wer schon mal Diktat auf Windows eingerichtet hat, kennt diese Handbewegung bereits.

Whisper auf Windows in zwei Minuten einrichten

Wenn du die Alternative neben superwhisper ausprobieren möchtest, hier ist die komplette Einrichtung. Du brauchst einen PC mit Windows 10 oder neuer, ein funktionierendes Mikrofon und ein paar Minuten. Die gesamte lokale Pipeline ist für jeden angemeldeten Account kostenlos — ohne Zahlungsmittel bei der Registrierung.

Schritt 1 — Whisper installieren und anmelden.

Lade es von der Download-Seite herunter, installiere es und erstelle ein kostenloses Konto. Keine Kreditkarte. Die gesamte lokale Transkriptions-Pipeline steht sofort zur Verfügung.

Es hat geklappt, wenn das Tray-Icon erscheint und der Einrichtungsassistent anbietet, ein Modell auszuwählen.

Schritt 2 — Transkriptionspfad wählen.

Die App wählt nicht für dich. Du bekommst drei Optionen: Cloud (OpenAI, eigener Schlüssel), Local Parakeet oder Local Whisper. Für private Arbeit: starte lokal — mehr dazu zwei Abschnitte weiter unten.

Es hat geklappt, wenn ein Modell fertig heruntergeladen ist und als bereit angezeigt wird.

Schritt 3 — Hotkey bestätigen.

Windows-Standard ist Ctrl+Space, gehalten als Push-to-Talk. In den Einstellungen änderbar, falls es mit etwas kollidiert, das du schon verwendest.

Es hat geklappt, wenn eine Testaufnahme in ein beliebiges Textfeld eingefügt wird.

Schritt 4 — Cursor irgendwo setzen und sprechen.

Klicke in ein beliebiges Textfeld — E-Mail, Dokument, Chat — halte den Hotkey, sag einen Satz, loslassen. Das Transkript erscheint dort, wo der Cursor steht.

Es hat geklappt, wenn dein gesprochener Satz als Text im Feld erscheint.

Whisper
Die echte Whisper-Desktop-App auf dem Einstellungsbildschirm, mit geöffneten Bereichen für Transkription und KI.

Der langsame Teil ist der Modell-Download, nicht die Einrichtung. Alles andere sind die vier Schritte oben. Sobald es läuft, wird das Diktieren in ein Feld keine Tipp-Aufgabe mehr, sondern eine Sprech-Aufgabe. Das gilt genauso nach der Installation von superwhisper — beide Tools sind einen Hotkey und ein Mikrofon vom Einsatz überall entfernt.

Wie superwhisper und Whisper im Vergleich abschneiden — ehrlich

Beide laufen jetzt auf Windows, beide transkribieren auf dem Gerät, beide funktionieren in jeder App, beide unterstützen eine lange Liste von Sprachen. Das ist viel Überschneidung — lieber gestehe ich das ein, als so zu tun, als gäbe es eine riesige Kluft. Der Unterschied liegt im Detail. superwhisper bietet eine Auswahl an Bereinigungsmodellen — die Website listet Optionen wie GPT, Claude, Llama, Grok, Gemini und Mistral — sowie ein System aus benutzerdefinierten „Modi“ zur Tongestaltung. Wer viele Einstellmöglichkeiten liebt, findet das wirklich ansprechend, und superwhisper macht das genuinen gut.

Whisper by Remskill ist etwas anders aufgebaut. Es wählt keine Transkriptions-Engine für dich — es legt dir drei Pfade vor und lässt dich wählen: eine schnelle lokale Engine, eine mehrsprachige lokale Engine, die auch ins Englische übersetzen kann, oder eine Cloud-Option mit eigenem OpenAI-Schlüssel. Auf Windows ist der Push-to-Talk-Hotkey Ctrl+Space, anpassbar. Die lokale Pipeline — alle lokalen Modelle, KI-Bereinigung durch ein lokales Modell, Verlauf, Vorlagen, eigener Hotkey, drei Geräte — ist für jeden angemeldeten Account kostenlos, ohne Kreditkarte bei der Registrierung. Die kostenpflichtige Stufe fügt nur die Cloud-Oberfläche hinzu. Das ist eine andere Form als ein einfaches Freemium-plus-Pro-Modell.

Der einzige ehrliche Vorbehalt gegenüber superwhisper auf Windows ist Reife, nicht Leistungsfähigkeit. Die Windows-App ist jünger als ihr macOS-Geschwister, und neuere Desktop-Software auf Windows hat eine Weile lang tendenziell rauere Kanten — das ist einfach der Preis der Eingabe-Infrastruktur-Probleme, die ich vorhin erwähnt habe. Wenn du die Version mit der längsten Geschichte willst: das ist macOS für superwhisper — und Windows-und-Mac-von-Anfang-an für Whisper. Wenn du zufriedener Mac-superwhisper-Nutzer bist und neugierig auf Windows bist, probiere es; erwarte nur keine Day-one-Parität mit der Plattform, auf der es aufgewachsen ist.

Lokal oder Cloud: welcher Whisper-Modus auf Windows

Wenn du den Whisper-Weg gehst, probiere zuerst den lokalen Modus. Die meisten Dinge, die Leute diktieren — eine E-Mail, eine halbfertige Notiz, eine Nachricht, die du nie in den Logs eines Anbieters sehen möchtest — haben keinen Grund, deinen Laptop für einen einzigen Absatz Text zu verlassen. Wenn dein PC aus den letzten Jahren stammt, bewältigt der lokale Modus alltägliches Diktat ohne Probleme, und die Cloud wird zum Notausgang statt zur Standardeinstellung. So unterscheiden sich die drei Pfade — denn die App lässt dich wählen, und ich möchte, dass du gut wählst.

Die Wahl hängt von Geschwindigkeit, Sprachabdeckung oder höchster Genauigkeit ab.

  • Local ParakeetNVIDIAs TDT-Engine, etwa 600 MB, und die schnellste lokale Option — 5 bis 10 Mal schneller als Whisper auf der CPU. Unterstützt Englisch plus 24 weitere europäische Sprachen, insgesamt 25. Kein Übersetzen ins Englische. Wenn du hauptsächlich Englisch oder eine andere europäische Sprache sprichst, ist das die schnelle, vollständig offline verfügbare Wahl.
  • Local Whisperlangsamer als Parakeet auf demselben Rechner, aber die mehrsprachigen Builds unterstützen 99 Sprachen und können ins Englische übersetzen. Die Englisch-only-Builds sind nur für Englisch, nicht 99 Sprachen. Wähle diesen für Chinesisch, Japanisch, Koreanisch oder jede Übersetzungsarbeit, die Parakeet nicht kann. Standard-Englisch-Modell ist etwa 480 MB.
  • Cloud (OpenAI, BYOK)beste Genauigkeit und Web-Zugang, mit eigenem OpenAI-Schlüssel, der direkt von OpenAI abgerechnet wird. Transkription läuft standardmäßig über gpt-4o-mini-transcribe. Braucht Internet — das ist der einzige Pfad, der deinen Rechner verlässt. Die Cloud-Oberfläche ist Teil von Whisper Pro.

Die nüchterne Wahrheit ist: Für das meiste, was Leute auf einem Windows-Rechner diktieren, reicht lokal völlig aus. Beide lokalen Engines laufen vollständig auf eigener Hardware, ohne dass etwas an einen Server gesendet wird — dasselbe On-Device-Versprechen, das superwhisper macht. Die Cloud verdient ihren Platz, wenn du höchste Genauigkeit bei einer schwierigen Aufnahme brauchst oder das Modell mitten im Satz eine Information aus dem Web ziehen soll. Fange lokal an; greife zur Cloud nur dann, wenn lokal nicht reicht.

Der KI-Bereinigungsdurchlauf, der Redeschwall in Prosa verwandelt

Rohtranskripte sind ein einziger Schwall. Du sagst „okay also die Architekturdoku reviewen als Projekt Alpha taggen und mich donnerstag erinnern“ — und das ist die zeichensetzungslose Wand, die jede Spracherkennungs-Engine dir zuerst liefert. Was du mit dieser Wand machst, ist der Punkt, an dem die Tools ihren Wert beweisen.

superwhisper führt Bereinigungen über seine Modellauswahl und benutzerdefinierte Modi durch. Whisper by Remskill macht ebenfalls einen KI-Durchlauf: Sag die Aktivierungsphrase „Hey whisper“ und der Text wird aufbereitet, bevor er landet — Füllwörter gestrichen, Schachtelsätze geglättet, der gesprochene Absatz in etwas verwandelt, das du tatsächlich abschicken würdest. Bei einem lokalen Modell läuft dieser Durchlauf über Ollama, vollständig offline; im Cloud-Modus ist es standardmäßig gpt-5-mini. In beiden Fällen ist das Ziel dasselbe — du redest locker, der Text kommt ordentlich an.

Thinking...
Roh

okay also die architekturdoku reviewen als projekt alpha taggen und mich donnerstag erinnern um vor dem standup

Bereinigt

Okay, also die Architekturdoku reviewen, als Projekt Alpha taggen und mich Donnerstag vor dem Standup erinnern.

Der Bereinigungsdurchlauf ist der Unterschied zwischen Diktat, das du noch nachbearbeiten musst, und Diktat, das du direkt abschicken kannst. Es ist auch der Punkt, an dem die Frage lokal vs. Cloud am meisten zählt: Ein Bereinigungsmodell, das auf deinem Rechner läuft, sieht nie einen Server — das ist genau der Grund, lokal zu diktieren. Wenn du nur rohe Transkripte brauchst, wirst du es nicht vermissen. Sobald du echte E-Mails per Sprache verschickst, ist es das Feature, das du nicht mehr bemerkst — weil es einfach funktioniert.

Genau dieser Sprechen-dann-Bereinigen-Ablauf macht Sprache schneller als die Tastatur — du kannst mit deiner Stimme schneller tippen in jeder App, sodass ein langer Absatz zu ein paar gesprochenen Sätzen wird, statt zu fünf Minuten Tippen.

Wenn du einen Mac hast

Geöffnetes MacBook auf einem Holzschreibtisch in weichem Licht, als Darstellung von macOS-Diktat

Sei ehrlich zu dir selbst, was deine Hardware angeht — denn die richtige Antwort ändert sich dadurch. Wenn du das hier auf einem Mac liest, ist superwhisper eine starke Wahl, und das würde ich dir auch direkt sagen. Es hat auf macOS angefangen, wurde dort jahrelang verfeinert, und auf Apple Silicon laufen seine On-Device-Modelle gut. Für einen Mac-Nutzer, der eine ausgereifte, native Diktier-App mit umfangreicher Modellauswahl möchte, hat superwhisper die Empfehlung wirklich verdient. Ich werde niemanden von einem guten Tool wegschicken, nur um einen Punkt zu machen.

Gut zu wissen: Whisper by Remskill läuft auch auf dem Mac, auf Apple Silicon, mit derselben lokal-first-Pipeline und einem command+option Push-to-Talk-Hotkey, der gehalten wird, während du sprichst. Die Wahl auf einem Mac ist also nicht superwhisper-oder-nichts — es sind zwei solide lokale Optionen, und welche besser passt, hängt davon ab, ob du superwhispers Modell-und-Modi-Ansatz bevorzugst oder Whispers Drei-Wege-Wählen-Ansatz. Beide behalten dein Audio auf deinem Gerät. Probier die aus, deren Form dir gefällt — keine davon ist ein Fehler.

Und wenn du einen 30-Wörter-Text schickst, installiere gar nichts. macOS Dictation ist eingebaut, in den Systemeinstellungen unter Tastatur, und kann auf Apple Silicon allgemeinen Text auf dem Gerät verarbeiten. Auf Windows öffnet die eingebaute Sprachtippen-Leiste mit Windows key + H überall, wo der Cursor ist — sie setzt Zeichensetzung selbständig und ist für kurze Eingaben in Ordnung, leitet aber über Microsofts Server weiter und braucht Internet, ist also keine Offline-Option. (Falls Win+H mal aufhört zu funktionieren, liegen die üblichen Ursachen in diesem Fix für Win+H funktioniert nicht.) Greife zu einem dedizierten Tool, wenn die Einbauwerkzeuge nicht mehr ausreichen — bei langen Notizen, Offline-Datenschutz oder wenn du überall denselben Hotkey möchtest.

Wenn du von der alten Generation der Diktierprogramme hierher gekommen bist, gilt dieselbe Vergleichslogik für die moderne Dragon-Alternative — lokal, kein Training nötig, gebaut für die Art, wie Menschen heute tatsächlich diktieren.

„superwhisper für Windows“ war früher eine Sackgasse. Das ist es nicht mehr — die App ist auf Windows, sie macht ihren Job gut, und wenn du sie wolltest, kannst du sie einfach herunterladen. Der einzige Grund, über den Installationsknopf hinauszulesen, ist sicherzustellen, dass du das Tool gewählt hast, das zu deinem Gerät und deinen Datenschutzanforderungen passt — nicht einfach das, das zuerst in den Suchergebnissen stand. Den größten Teil dieses Vergleichs habe ich auf einem Windows-Laptop diktiert, mit einem Tool, das überall einfügt, wo der Cursor gerade ist — und dann abgeschickt. Die Tastatur stand unbenutzt da, was der ganze Sinn der Sache ist.

Lokales Diktat auf deinem Windows-PC ausprobieren

Hotkey halten, sprechen, loslassen. Das Transkript landet dort, wo der Cursor ist — in jeder App, vollständig auf deinem Gerät.

Lokaler Modus kostenlos für jeden angemeldeten Account. Keine Kreditkarte zum Starten erforderlich.

Foto von Denys Medvediev

Denys Medvediev

Ich bin derjenige, der unsere Support-E-Mails liest — die Antworten diktiere ich höchstwahrscheinlich.

Weiterführende Quellen