Ratgeber
Die moderne Diktier-App
Eine Diktier-App verwandelt gesprochene Worte in getippten Text. Die guten Desktop-Apps machen das live: Du drueckst eine Taste, redest, und die Woerter erscheinen genau dort, wo dein Cursor blinkt - in der App, die du gerade offen hast. Kein Upload, kein Kopieren, kein separates Fenster. Du sprichst, der Text landet.
Zuletzt aktualisiert: Juni 2026

Eine Diktier-App verwandelt Sprache in getippten Text an deinem Cursor. Dieser Ratgeber erklaert, wie die Taste-druecken-reden-einfuegen-Mechanik funktioniert, welche kostenlosen Diktierwerkzeuge dein Betriebssystem bereits mitbringt, wann eine dedizierte App ihren Platz verdient, einen ehrlichen Einzeiler zu den wichtigsten Apps und wann du ueberhaupt keine eigene App brauchst.
Das ist die ganze Kategorie in einem Satz. Der Rest dieses Artikels ist der Teil, den dir niemand erzaehlt. Wie es wirklich funktioniert, warum das Diktierwerkzeug, das bereits in deinem Computer steckt, manchmal voellig ausreicht - und wann eine dedizierte App ihren Platz verdient, wenn das eingebaute Tool an seine Grenzen stoesst.
Ich sollte gleich zu Beginn sagen: Ich entwickle selbst eine dieser Apps. Sie heisst Whisper by Remskill, und ich bin ehrlich darueber, wo sie passt und wo nicht - einschliesslich der Stelle, an der ich dir sage, das kostenlose Tool deines Betriebssystems zu nutzen.
Fangen wir an.
Taste druecken, reden, Text landet am Cursor
Das ist die Mechanik, die eine Desktop-Diktier-App ausmacht. Du drueckst eine Taste - standardmaessig Ctrl+Space unter Windows, eine frei belegbare Push-to-Talk-Taste. Du sprichst einen Satz. Du laesst die Taste los. Eine Sekunde spaeter erscheint der Text genau dort, wo dein Cursor geblinkt hat.
Das "am Cursor, in jeder App" ist das, was eine echte Diktier-App von einer Transkriptionswebsite unterscheidet. Ein Transkriptionstool nimmt eine aufgenommene Datei und gibt dir eine Textwand zurueck, die du anschliessend irgendwo einfuegen musst. Eine Diktier-App ueberspringt die Datei vollstaendig. Der Text erscheint direkt dort, wo du tippst. Das ist der Unterschied zwischen Diktieren und dem Transkribieren einer Aufnahme von sich selbst.
Die Geschwindigkeit ist wichtiger, als die meisten erwarten. Tippen laeuft fuer die meisten von uns bei etwa 40 Woertern pro Minute. Sprechen bei etwa 145. Das ist grob dreieinhalb Mal schneller - weshalb ein Werkzeug, das du eine Sekunde drueckst, dir einen echten Nachmittagsblock sparen kann. Der E-Mail-Rueckstand, die Meeting-Notizen, die zwoelf Kaltakquise-Varianten vor dem Mittagessen.
Dein Computer hat bereits eines - und manchmal reicht das
Bevor du irgendetwas installierst: Du besitzt hoechstwahrscheinlich bereits ein Diktierwerkzeug. Beide grossen Betriebssysteme liefern eines kostenlos mit.
Unter Windows 11 drueckst du die Windows-Taste + H, und eine Spracheingabeleiste erscheint. Sie funktioniert - mit einem Haken: Sie nutzt Azure-gestuetzte Online-Spracherkennung und braucht dafuer eine Internetverbindung. Kein Internet, kein Diktat. Interpunktion kann sie automatisch einfuegen, wenn du das aktivierst.
Auf dem Mac steckt Apple Dictation in den Systemeinstellungen unter "Tastatur" und laesst sich mit der Mikrofontaste oder einer selbst gewaehlten Tastenkombination starten. Apples Version kann nach dem Herunterladen des Sprachmodells vollstaendig auf dem Geraet laufen - also offline, ohne dass deine Stimme das Geraet verlaesst. Sie unterstuetzt Dutzende Sprachen. Apple listet 54 online und 43 offline verfuegbare Sprachen auf seiner Feature-Availability-Seite. Was sie nicht kann: benutzerdefiniertes Vokabular, KI-Bereinigung deiner Formulierungen oder die Wahl des Transkriptionsmodells.
Die nuechterne Wahrheit ist: Fuer kurzes, lockeres Diktat - ein 30-Woerter-Text, eine schnelle Suche, eine einzeilige Antwort - reicht das eingebaute Tool wirklich aus. Es ist kostenlos, es ist schon da, und du brauchst kein viertes Symbol in deiner Menuleiste, um deiner Mutter eine Nachricht zu schicken. Wenn das alles ist, was du machst, schliess diesen Tab und drueck Win+H oder die Diktiertaste deines Macs. Ernst gemeint.
Falls du auch auf einem Telefon oder Tablet diktierst, welche Spracheingabe-App zu welchem Geraet passt erklaert die Wahl Plattform fuer Plattform.
Wann eine dedizierte Diktier-App ihren Platz verdient
Ab wann reicht das Eingebaute nicht mehr? Meistens sind es drei Dinge. Erstens: Offline, das wirklich privat ist. Windows-Spracheingabe braucht die Cloud. Eine dedizierte App kann alles auf deiner eigenen CPU erledigen - die E-Mail an die Schule deines Kindes oder der Rechtsentwurf, den du gerade tippst, verlaesst dabei niemals dein Geraet. Zweitens: Genauigkeit und Kontrolle - ein groesseres Modell waehlen, benutzerdefinierte Woerter hinzufuegen, die es immer wieder falsch versteht, Formulierungen automatisch aufpolieren lassen. Drittens: Das, was die eingebauten Tools leise ueberspringen - naemlich in jeder App auf dieselbe Weise zu funktionieren, jedes Mal, ohne Ueberraschungen.
Genau in diese Luecke passt Whisper by Remskill. Es ist eine Desktop-App fuer Windows und macOS auf Apple Silicon. Die gesamte lokale Pipeline ist kostenlos fuer alle, die sich einloggen - kein Zahlungsmittel bei der Anmeldung. Das umfasst die lokalen Transkriptionsmodelle, KI-Bereinigung, Verlauf, benutzerdefinierte Woerter und die Registrierung von bis zu drei eigenen Geraeten.
Beim Modell wirst du nicht vor eine Standardwahl gestellt und musst damit leben. Du waehlst selbst. Lokales Parakeet ist die schnellste Option: etwa 600 MB, 5 bis 10 Mal schneller als Whisper auf einer CPU, unterstuetzt Englisch und 24 weitere europaeische Sprachen. Lokales Whisper ist langsamer, unterstuetzt aber 99 Sprachen, kann Sprache ins Englische uebersetzen und bietet benutzerdefiniertes Vokabular sowie feinere Kontrolle; das groesste Modell ist etwa 3 GB. Und wenn du OpenAIs neueste Cloud-Modelle und Live-Web-Antworten moechtest, gibt es eine optionale Pro-Cloud-Oberflaeche, bei der du deinen eigenen API-Schluessel mitbringst - Remskill erhaelt keinen Anteil. Drei Wege, du entscheidest nach dem, was dir wichtiger ist: Geschwindigkeit, Sprachunterstuetzung oder die neueste Cloud-Qualitaet.
Die ehrliche Meinung: Die meisten "KI-Diktier"-Apps sind ein Aufschlag, kein Modell
Das ist meine einzige starke These, und ich belege sie mit einer Zahl. Viele der Diktier-Apps, die in den letzten zwei Jahren auf den Markt gekommen sind, sind unter der Haube dasselbe: ein Sprachmodell, das du selbst betreiben koenntest, ein sauberes Interface obendrauf und eine Monatsrechnung, die mit den tatsaechlichen Rechenkosten wenig zu tun hat. Der Marktpreis fuer dieses Arrangement liegt bei den teureren Anbietern bei etwa dreissig Dollar im Monat.
Das Pitch-Deck sagt "Powered by AI." Mein Kreditantrag auch. Der Satz hat aufgehoert, irgendetwas zu bedeuten. Was du in einer Cloud-only-App tatsaechlich bezahlst, ist der Komfort, dass jemand anderes ein Modell betreibt - plus die Datenschutzkosten dafuer, dass dein Audio den Laptop verlaesst. Wenn die Arbeit sensibel ist, ist das kein Komfort, sondern ein Risiko.
Genau deshalb bestehe ich darauf, dass kostenlos lokal der Boden ist - nicht das Upsell. Dein Laptop hat ein Mikrofon und eine CPU. Fuer einen Absatz Diktat braucht er keinen Server im Hintergrund.
Ein kurzer, ehrlicher Rundgang durch die anderen Diktier-Apps
Du solltest den Markt kennen, bevor du dich entscheidest. Hier sind die erwaehnenswerten Apps - eine Zeile pro App, Lob wo es verdient ist.
superwhisper — ausgereift und plattformuebergreifend (Mac, Windows, iOS), bietet Live-Diktat plus Datei-Transkription und funktioniert offline mit lokalen Modellen. Eine wirklich starke Option; wenn du als zahlender Nutzer zufrieden bist, gibt es keinen Grund zu wechseln.
Apple Dictation — kostenlos, in macOS integriert, auf dem Geraet und offline, sobald das Modell heruntergeladen ist. Kein benutzerdefiniertes Vokabular und keine KI-Bereinigung - aber fuer kurze Texte ist es fuer die meisten Menschen genug.
Windows-Spracheingabe (Win+H) — kostenlos, in Windows 11 integriert, mit Win+H geoeffnet, aber eine Online-Verbindung zu Azure ist erforderlich. Gut wenn du online bist, nutzlos im Flugzeug.
Dragon (Nuance) — der alte Platzhirsch, mittlerweile ein reines Windows-Profiprodukt (Dragon Professional v16), das ueber Vertriebskontakt verkauft wird. Fuehrt weiterhin bei freihaendigen Sprachbefehlen und gibt bis zu 99 % Genauigkeit an. Wer den gesamten Computer per Stimme steuern moechte, ist hier in einer eigenen Kategorie.
Wispr Flow — schick, cloudbasiert und im Preisbereich von etwa dreissig Dollar im Monat, ueber den ich gerade gemeckert habe. Gute Marketing-Website.
Ein paar habe ich ausgelassen. Es geht nicht darum, eine Liste auswendig zu lernen. Der Punkt ist: "Diktier-App" ist ein ueberfuellter Begriff, der kostenlose eingebaute Tools, Open-Source-Projekte, hochwertige Abonnements und unternehmensweite Sprachbefehlssuiten abdeckt. Entscheide nach dem, was du wirklich machst - nicht nach dem, wessen Startseite du zuerst gesehen hast.
Warum "einfach eine Taste druecken" schwieriger ist als es klingt
Eine kurze Geschichte, weil sie der Grund ist, warum mich die langweiligen Details interessieren. Ich habe die App an einem Samstag meiner juengeren Tochter gegeben - sie ist sieben. Eine Demonstration: druecken, reden, loslassen, einfuegen. Sie schrieb eine 90-Woerter-E-Mail an ihre Oma ueber einen ausgefallenen Zahn, den Wechselkurs der Zahnfee und den Tanzkurs - ohne eine einzige Frage.
Zwei Tage spaeter kam sie zurueck: "Die Taste funktioniert nicht in meiner Zeichen-App." Der Durchschnittsmensch weiss nicht, was ein Hotkey-Konflikt ist. Er weiss nur, dass es nicht mehr funktioniert. In dieser Nacht habe ich die anpassbaren Hotkey-Einstellungen geliefert. Eine Diktier-App steht und faellt mit den kleinen Dingen: dem Konflikt, den du nicht vorhergesehen hast, dem Phantomtasten-Ereignis unter Windows, das meinen Handler einmal sechs Mal pro Tastendruck ausloeste und mich mehrere Tage und einen 300ms-Debounce zur Behebung kostete. Ich habe einen Master-Abschluss. Der Debounce hat mich trotzdem demütig gemacht.
Wann du keine Diktier-App brauchst
Das ist der Teil, den die meisten Artikel ueberspringen - daher hier, klar und direkt: Du brauchst keine dedizierte Diktier-App, wenn eines davon zutrifft.
- Du diktierst nur kurze, lockere Dinge. Nachrichten, Suchanfragen, die gelegentliche einzeilige Antwort. Das eingebaute Tool erledigt das kostenlos.
- Du bist immer online und hast nie etwas Sensibles zu diktieren. Dann sind die eingebauten Cloud-Tools oder eine rein cloudbasierte App in Ordnung - du gewinnst durch lokal kaum etwas.
- Du diktierst immer nur an einem Ort, z. B. in einem einzelnen Browser-Tab. Eine Browser-Erweiterung deckt das ab, ohne eine systemweite App zu benoetigen. Voice In ist zum Beispiel eine Chrome-Erweiterung, die nur im Browser funktioniert.
- Du moechtest deinen gesamten Computer freihaendig steuern - nicht nur Text eingeben. Das ist Sprachbefehl-Territorium, und Dragon macht das besser als jedes Diktat-fokussierte Tool.
Eine dedizierte App faengt an, sich zu lohnen, wenn du laengere, haeufigere, privatere und mehrsprachige Diktate machst - grob ab dem Punkt, an dem du taeglich echte Absaetze diktierst und lieber moechtest, dass sie dein Geraet nicht verlassen. Unterhalb dieser Grenze: Spar dein Geld. Fuer einen umfassenderen Vergleich der kostenlosen Optionen gibt es einen Ratgeber zu kostenloser Diktiersoftware, einen breiteren Blick auf Spracheingabe-Software, und falls du von einer bestimmten App hierher gekommen bist, den superwhisper-Alternative-Vergleich.
Wenn du nur eine Sache behaeltst
Eine Diktier-App ist einfach "Taste druecken, reden, Text erscheint, wo du tippst." Die eingebaute auf deinem Computer macht die einfache Version bereits kostenlos. Eine dedizierte App lohnt sich, wenn du Offline-Privatsphaere, echte mehrsprachige Genauigkeit oder konsistentes Verhalten in jeder App brauchst - und sie lohnt sich nicht, wenn das nicht der Fall ist.
Whisper by Remskill haelt die gesamte lokale Pipeline genau deshalb kostenlos: Du solltest herausfinden koennen, wo deine Grenze liegt, ohne zuerst zu zahlen. Die Preise fuer das optionale Cloud-Pro-Tier findest du auf der Preisseite. Meine Siebenjaehrige hat ihre Grenze an einem Samstag gefunden. Du wirst wahrscheinlich schneller sein.
Probier es aus: Diktiere deinen naechsten Absatz, statt ihn zu tippen
Lade Whisper by Remskill herunter, erstelle ein Konto ohne Zahlungsmittel, drueck die Taste und red einfach. Die gesamte lokale Pipeline ist kostenlos - finde heraus, wo deine Grenze liegt, bevor du jemals zahlst.
Kostenloses lokales Diktat, kein Zahlungsmittel bei der Anmeldung.



