Vergleich
Dragon vs. Windows Spracherkennung
Dragon und Windows-Spracherkennung sind die zwei verbreitetsten Wege zum Diktieren auf einem Windows-PC. Dragon ist ein kostenpflichtiges Profiprodukt mit bis zu 99 % Erkennungsgenauigkeit und umfassender Sprachsteuerung. Die Windows-Spracherkennung ist kostenlos und integriert, geöffnet mit Win+H, braucht aber eine Internetverbindung. Ein dritter Weg, Whisper by Remskill, läuft kostenlos und offline auf Windows und Mac.
Zuletzt aktualisiert: Juni 2026

Dragon ist eine kostenpflichtige, reine Windows-Profilösung mit bis zu 99 % Genauigkeit und echter Sprachsteuerung des PCs. Die Windows-Spracherkennung ist kostenlos und in Windows 11 integriert, geöffnet mit Win+H, braucht aber eine Internetverbindung. Whisper by Remskill ist der dritte Weg: Die gesamte lokale Pipeline ist kostenlos, läuft vollständig offline und ist für Windows und Mac verfügbar.
Erst kurz zum Interessenkonflikt. Dieser Artikel vergleicht zwei Diktierprogramme, die ich nicht gebaut habe, und erwähnt dann ein drittes, das ich gebaut habe. Ich werde konkret sagen, wo jede Windows-Option besser abschneidet – auch dort, wo sie mein eigenes Produkt schlägt.
Was Dragon heute wirklich ist
Die nüchterne Wahrheit: Diese beiden spielen nicht wirklich in derselben Liga. Dragon ist eine kostenpflichtige Profidiktier-Suite. Die Windows-Spracherkennung ist das kostenlose Feature, das Microsoft in Windows 11 eingebaut hat, damit man aufhört zu fragen. Das eine kostet Geld und kann viel. Das andere kostet nichts und erledigt die Grundlagen. Wer nach "Dragon vs. Windows-Spracherkennung" sucht, will wissen, welches sich lohnt – und ob überhaupt eines davon.
Dragon, von Nuance entwickelt, ist ein reines Windows-Profi-Diktierprodukt. Die aktuelle Desktop-Version ist Dragon Professional v16, optimiert für Windows 11 und abwärtskompatibel mit Windows 10. Falls Sie noch "Dragon NaturallySpeaking" oder Dragon für Mac kennen: Das ist Geschichte. Die aktuelle Dragon-Website listet Professional, Legal, Law Enforcement und die Anywhere-Linie. Alles Windows oder mobil – keine Heimanwender-Edition, keine Mac-Desktop-Version.
Das zentrale Versprechen: bis zu 99 % Erkennungsgenauigkeit direkt beim ersten Einsatz. Wo Dragon wirklich glänzt, ist die Sprachsteuerung. Nicht nur Wörter diktieren, sondern den ganzen PC per Sprache bedienen: navigieren, bearbeiten, Befehle ausführen – ganz ohne Hände. Das ist der echte Wettbewerbsvorteil, dem ich später noch Gerechtigkeit widerfahren lasse.
Der Haken ist der Preis – und der Haken ist, dass es keinen Preis gibt. Dragon hat keine öffentliche Preisliste. Es ist ein Kontakt-zu-Sales-Profi- und Unternehmensprodukt. Einen "Jetzt kaufen"-Button wie bei einer normalen App werden Sie nicht finden. Für viele Menschen endet die Evaluierung genau da, wo "Angebot anfordern" steht.
Was die Windows-Spracherkennung wirklich ist
Die Windows-Spracherkennung ist in Windows 11 integriert. Mit Win+H auf einer physischen Tastatur öffnen Sie sie, und sie tippt das Gesprochene in das gerade aktive Textfeld. Sie ist kostenlos, es gibt nichts zu installieren, und sie ist bereits auf Ihrem Rechner. Das ist ein echtes Angebot für null Euro.
Eine wichtige Sache sollten Sie vorher wissen. Die Windows-Spracherkennung verwendet Online-Spracherkennung, angetrieben von Azure Speech Services. Sie braucht eine Internetverbindung. Ihr Audio wird in Microsofts Cloud umgewandelt. Im Flugzeug, in einem Bahntunnel oder mit einer wackeligen Hotelverbindung ist das der Unterschied zwischen Diktieren und dem Starren auf einen blinkenden Cursor.
Der Funktionsumfang ist bewusst einfach gehalten. Sie können automatische Interpunktion aktivieren, die Kommas und Punkte basierend auf dem Gesprochenen einfügt. Zum Stoppen sagen Sie einen Befehl wie "Zuhören beenden" oder drücken die Mikrofontaste im Spracherkennungsmenü. Das war's im Wesentlichen. Kein eigenes Vokabular, keine Modellauswahl, kein Offline-Modus. Saubere Grundfunktionen, kostenlos.
Was Whisper by Remskill zusätzlich bietet
Hier beschreibe ich die dritte Option – das Urteil überlasse ich Ihnen anhand der Tabelle.
Whisper by Remskill ist eine Desktop-Diktier-App, bei der die gesamte lokale Pipeline für jeden angemeldeten Nutzer kostenlos ist – ohne Zahlungsmittel bei der Registrierung. Sie erhalten 8 Whisper-Transkriptionsmodelle, die Parakeet-Engine, Offline-KI-Nachbearbeitung über Ollama, Transkriptionsverlauf, Presets, Hotwörter, Hardware-Beschleunigung, Modell-Downloads und einen eigenen Hotkey. Konto erstellen, App herunterladen, Hotkey drücken, sprechen. Keine Lizenz beantragen, keine Toolbar andocken.
Der große Unterschied zu beiden Windows-Optionen: Die App läuft offline. Sobald ein Modell heruntergeladen ist, wird keine Internetverbindung mehr benötigt, und Ihr Audio verlässt den Rechner nie. Das ist das genaue Gegenteil von Win+H, das Azure braucht.
Sie wählen die lokale Engine nach Ihrem Bedarf. Whisper bietet 99 Sprachen, Übersetzung ins Englische, eigenes Vokabular, Beam-Size-Kontrolle und Hotword-Biasing – auf Kosten der Geschwindigkeit. Parakeet ist die NVIDIA-TDT-Engine, etwa 600 MB groß, und läuft auf der CPU 5- bis 10-mal schneller als Whisper – für Englisch und 24 weitere europäische Sprachen. Die lokale Genauigkeit liegt typischerweise zwischen 95 % und 99 %, alles auf Ihrer CPU, ohne GPU. Die App selbst belegt etwa 25 MB auf der Festplatte.
Wer die Cloud möchte, kann sie nutzen – mit eigenem Schlüssel. Der Pro-Tarif fügt OpenAI-Cloud-Transkription hinzu: Sie tragen Ihren eigenen OpenAI-Schlüssel ein, wir nehmen keinen Aufschlag auf OpenAIs Tarif. Die Pro-Preise finden Sie auf der Preisseite; ich zitiere sie hier nicht mitten im Artikel. Der Standard-Hotkey ist Ctrl+Space auf Windows, frei belegbar, und ein Konto deckt bis zu 3 Geräte ab.
Die ehrliche Plattform-Bilanz: Die App läuft auf Windows und macOS auf Apple Silicon. Das ist ein Betriebssystem mehr als Dragon, das nur Windows unterstützt.
Dragon vs. Windows-Spracherkennung vs. Whisper by Remskill im direkten Vergleich
Die Tabelle, die sonst niemand mit echten Zeilen füllt. Keine Preisangaben darin – die finden Sie auf den jeweiligen Preisseiten.
| Funktion | Dragon | Windows-Spracherkennung | Whisper by Remskill |
|---|---|---|---|
| Plattformen | Nur Windows | Windows 11 (integriert) | Windows und Mac (Apple Silicon) |
| Preis | Keine öffentliche Preisliste, Anfrage erforderlich | Kostenlos, in Windows integriert | Lokale Pipeline kostenlos; optionales Pro für Cloud |
| Offline-Betrieb | Ja, lokale Erkennung | Nein, benötigt Azure online | Ja, lokale Pipeline läuft offline |
| Wie man startet | Installierte App | Win+H | Push-to-Talk-Hotkey (Ctrl+Space auf Windows, frei belegbar) |
| Genauigkeitsversprechen | Bis zu 99 % ab dem ersten Einsatz | Einfache Cloud-Erkennung | Typischerweise 95–99 % lokal |
| Sprachbefehle / PC-Steuerung | Ja, das Kernmerkmal | Eingeschränkt (Start/Stopp-Befehle) | Nein, Diktat – keine OS-Steuerung |
| Eigenes Vokabular / Hotwörter | Ja | Nein | Ja, bei Whisper-Modellen |
| Sprachen | Englisch-fokussiertes Profiprodukt | Dutzende (online) | 99 mehrsprachig Whisper, 25 Parakeet |
| Übersetzung ins Englische | Nicht der Fokus | Nein | Ja, bei Whisper-Modellen |
| Eigenen OpenAI-Schlüssel mitbringen | Nein | Nein | Ja, Cloud ist BYOK, kein Aufschlag |
Ein paar ehrliche Lesarten dieser Tabelle. Dragons Sprachsteuerung ist das echte Ding; den ganzen PC per Sprache zu bedienen, ist etwas, das weder Win+H noch wir bieten. Die Windows-Spracherkennung gewinnt bei "ist schon da und kostenlos". Überall, wo es um Offline-Nutzung, Mehrsprachigkeit, eigenes Vokabular oder plattformübergreifenden Support geht, liegt der Vorteil bei der lokalen Pipeline.
Wer mehr als diese drei Kandidaten im Blick haben möchte, findet hier eine vollständige Rangliste der Spracheingabe-Tools.
Offline und kostenlos – das überrascht die meisten
Das ist, wofür die meisten hierher gekommen sind – also konkret.
Die Windows-Spracherkennung ist kostenlos, was gut ist, aber sie läuft in der Cloud. Dragon läuft lokal, ist aber ein Kontakt-zu-Sales-Profiprodukt. Was die meisten nicht erwarten, ist ein Tool, das gleichzeitig kostenlos und offline ist. Mit der lokalen Pipeline von Whisper by Remskill lädt das Modell in Ihren Arbeitsspeicher, Ihr Mikrofon speist es, und der Text erscheint – auch im Flugzeugmodus, in einem Tunnel oder in einem Gebäude ohne Signal. Keine Verbindung, kein Minutenzähler, kein Audio, das den Raum verlässt.
Das ist die einzige Meinung, die ich in diesem Artikel investiere. Wenn Ihr Diktiertool verlangt, dass Sie es "trainieren", ist es 1999. Gegen Ende des letzten Jahrhunderts hatte ein Verwandter Dragon NaturallySpeaking auf einem Windows-98-Desktop mit 64 MB RAM. Die Einrichtung bedeutete ein 45-minütiges Trainingsritual: eine Wortliste vorlesen, damit das Ding kalibriert wird. Dann funktionierte es – irgendwie, bei vielleicht 70 % Genauigkeit, mit vier Sekunden Verzögerung pro Satz. Einen Absatz eines Weihnachtsbriefs zu diktieren dauerte fünfzehn Minuten. Das Headset flog quer durchs Zimmer. Das Headset überlebte; das Experiment nicht. Das heutige Dragon ist deutlich besser, um fair zu sein. Aber die Lektion blieb. Die Ära, in der man ein Mikrofon stundenlang kalibrieren musste, bevor es einen verstand, ist vorbei. Whisper-basierte Tools funktionieren direkt aus der Box in 99 Sprachen, kein Trainingsbildschirm. Fünfundzwanzig Jahre nach dem Headset-Wurf kann ein Kind in neunzig Sekunden eine vollständige E-Mail diktieren – ohne Einrichtung. Das ist die Lücke, die das letzte Jahrzehnt tatsächlich geschlossen hat.
(Ihr PC hat bereits ein Mikrofon und eine CPU. Für einen Absatz braucht er kein Verkaufsgespräch und keinen Server dazwischen.)
Wann Dragon oder Win+H die richtige Wahl ist
Dieser Abschnitt rechtfertigt den Rest des Artikels. Es gibt echte Gründe, jede der beiden Windows-Optionen zu wählen – das werde ich nicht verschweigen.
Dragon wählen, wenn man den ganzen PC freihändig steuern will
Das ist das Entscheidende. Dragons Sprachsteuerung – navigieren, bearbeiten, Befehle ausführen, Anwendungen vollständig per Sprache bedienen – ist seine echte Stärke, die weit über das hinausgeht, was Win+H oder wir bieten. Wer Barrierefreiheitsbedarf hat, eine Verletzung hat oder einen Beruf rund um die Diktatworkflows von Dragon aufgebaut hat, für den ist dieses Profiprodukt genau richtig. Der Kontakt-zu-Sales-Preis spiegelt ein Profiwerkzeug wider, kein Gelegenheitstool.
Windows-Spracherkennung wählen, wenn man kostenlos, sofort und unkompliziert will
Sie ist bereits in Windows 11 drin, man öffnet sie mit Win+H, und es gibt nichts zu installieren oder anzumelden. Wer eine stabile Internetverbindung hat und nur ab und zu eine kurze Nachricht diktieren möchte, ohne groß darüber nachzudenken, bekommt das für null Aufwand. Zahlen Sie nicht für das, was Microsoft Ihnen schon gegeben hat – solange die Cloud-Abhängigkeit kein Problem ist.
Für alle anderen – wer offline arbeitet, sensible Texte diktiert, eine Sprache braucht, die Win+H nicht gut beherrscht, eigenes Vokabular möchte oder einfach keinen Kontakt-zu-Sales-Prozess will – fangen Sie mit dem kostenlosen lokalen Tarif an und schauen Sie, ob Sie je an eine Grenze stoßen. Einen breiteren Windows-Überblick habe ich in unserem Artikel über Sprache-zu-Text auf Windows zusammengestellt.
Wenn Sie nur eine Sache behalten
Die meisten Diktiervergleiche enden mit dem Versprechen, Ihren Arbeitsablauf zu transformieren. Dieser endet kleiner. Dragon ist der leistungsstarke, kostenpflichtige, reine Windows-Profi ohne öffentlichen Preis und mit echter Sprachsteuerung. Die Windows-Spracherkennung ist kostenlos und sofort verfügbar, braucht aber Internet und bleibt grundlegend. Whisper by Remskill ist der dritte Weg: lokal kostenlos, offline, genau, auf Windows und Mac, ohne Lizenz und ohne Toolbar. Wenn Sie den PC per Sprache steuern müssen: Dragon. Wenn Sie null Aufwand wollen und online sind: Win+H. Wenn Ihre Wörter kostenlos auf Ihrem Rechner bleiben sollen, dafür sind wir gebaut worden. Für eine tiefere Analyse gibt es auch unseren Dragon-Alternativenvergleich.
Zuerst die kostenlose lokale Pipeline ausprobieren
Whisper by Remskill herunterladen, Konto ohne Kreditkarte erstellen, Hotkey drücken und diktieren. Läuft vollständig offline auf Windows und Mac. Wer den Cloud-Tarif nie braucht, zahlt nie.
Lokale Transkription dauerhaft kostenlos. Kein Zahlungsmittel bei der Registrierung. Der 7-tägige Cloud-Test verlangt eine Karte nur beim Upgrade.



