Vergleich
Eine SpeechTexter-Alternative, die außerhalb des Browsers funktioniert
SpeechTexter lebt in einem einzigen Chrome-Tab und braucht die Cloud zum Zuhören. Die bessere Alternative für die meisten ist eine Desktop-Diktiersoftware, die per Tastenkürzel startet, offline transkribiert und den Text direkt in jede App einfügt, in der man gerade arbeitet.
Zuletzt aktualisiert: Juni 2026

Die beste SpeechTexter-Alternative für die meisten Menschen ist eine Desktop-Diktiersoftware mit systemweitem Tastenkürzel, denn SpeechTexter lebt in einem einzigen Chrome-Tab und endet an dessen Rand. Whisper drückt ein Tastenkürzel, transkribiert offline auf dem Rechner und fügt den Text überall ein, wo der Cursor steht – Word, Slack, E-Mail, überall – statt nur in einem Browserfenster.
Ich habe SpeechTexter an einem Dienstagabend ausprobiert, um eine innere Debatte zu beenden. Mikrofon anklicken, sprechen, Wörter erscheinen. Kein Download, kein Konto, kostenlos. Ein wirklich aufgeräumtes kleines Tool. Dann wollte ich einen Satz in eine Slack-Nachricht einfügen – und fiel auf die Hürde herein: Es tippt nur auf der eigenen Seite. SpeechTexter sagt auf der eigenen Homepage, die Desktop-Web-App brauche das neueste Chrome und sonst nichts. Die Reibung liegt nicht am Diktieren. Die Reibung liegt an den Wänden drumherum.
Genau diese Lücke ist der Grund, warum Menschen nach einer Alternative suchen. Sprachdiktat hat meinen samstäglichen E-Mail-Berg in etwas verwandelt, das ich beim Wäschefalten erledigen kann – die Wäschequalität hat sich nicht verbessert, aber das Tippen schon. Das Problem mit einem browsergefesselten Tool: Der eigene Alltag ist nicht browsergefesselt. Man schreibt in einem Desktop-E-Mail-Client, in einer Chat-App, in einer Notiz-App, in einem Code-Editor. Ein Tool, das nur ein Web-Textfeld befüllt, zwingt einen jedes Mal zum Kopieren und Einfügen. Die Lösung ist keine bessere Webseite. Die Lösung ist Diktat, das dem Cursor folgt.
Tab öffnen, sprechen, zusehen wie es tippt. Das ist SpeechTexter.

Anerkennung, wo sie verdient ist: SpeechTexter erledigt eine Aufgabe sauber. Es ist eine kostenlose mehrsprachige Sprache-zu-Text-Web-App, mit der man Notizen, Dokumente, Berichte oder Blogbeiträge per Stimme eingeben kann – "mit der Stimme tippen", wie die Seite es nennt. Man öffnet die Seite, klickt auf das Mikrofon, und sie transkribiert in Echtzeit über Googles Browser-Spracherkennung, die Web Speech API, die serverseitig bei Google läuft. Mehr als 70 Sprachen stehen auf der Liste.
Das eine Feature, das SpeechTexter hat und die meisten anderen Browser-Diktiertools nicht, ist eine anpassbare Sprachbefehlsliste. Man kann #newparagraph, #newline, #undo oder #redo sprechen, dazu eigene Befehle zum Einfügen von Satzzeichen, Phrasen oder zum Auslösen einer Aktion – alles per Stimme. Außerdem wird automatisch großgeschrieben, es gibt ein umschaltbares Vorschaufenster und Export als .doc oder .txt. SpeechTexters eigene Genauigkeitsaussage lautet: "Mehr als 90 % sind zu erwarten." Das ist ihre Zahl, keine, die ich selbst gemessen habe.
Wer immer nur in diesen einen Editor diktiert und das Ergebnis dann herauskopiert, kann damit leben. Die Probleme beginnen in dem Moment, in dem das Schreiben woanders stattfindet.
Wo SpeechTexter aufhört: ein Chrome-Tab, kein Offline, keine anderen Apps

Drei Wände – und die meisten stoßen gegen alle drei.
Die erste ist der Browser. Auf dem Desktop braucht SpeechTexter das neueste Google Chrome – andere Browser werden nicht unterstützt – auf Windows, Mac oder Linux. Wer in Firefox oder Safari zuhause ist, muss den Browser wechseln, um zu diktieren. Die zweite Wand ist der Tab selbst: Der Text landet auf SpeechTexters Seite, nicht in der App, in der man eigentlich schreibt. Kein systemweites Einfügen in Word, Slack, Teams, den E-Mail-Client oder einen Code-Editor. Die dritte Wand ist das Netzwerk. Es läuft auf Googles Cloud-Sprachengine und braucht deshalb eine Internetverbindung – die eigene Fehlerbehebungsseite nennt einen "Netzwerkfehler" bei schlechter Verbindung, und es gibt keinen Offline-Modus für das Web-Produkt. Die Android-App, die einmal Offline-Support hatte, wird nicht mehr unterstützt.
Das sind keine Bugs. Das ist, was ein Browser-Diktiertool eben ist. Eine Webseite kann technisch nicht in Desktop-Apps greifen, und ein Web-Speech-Tool kann ohne Serververbindung nicht transkribieren. Wer nie gegen diese drei Wände stößt, braucht keine Alternative. Wer sich aber dabei ertappt, in SpeechTexter zu diktieren und dann in die eigentlich gemeinte App zu kopieren – dieser Kopier-Schritt ist das Klopfen der Alternative. Wer feststeckt, weil das Diktieren in Chrome gar nicht startet, ist in einem anderen Kaninchenbau – ich habe die häufigen Lösungen für nicht funktionierendes Sprachtippen in Chrome aufgeschrieben, für den Fall, dass die Mikrofon-Berechtigung oder die Engine selbst das Problem ist.
Ein Tastenkürzel drücken, in jede App diktieren
Hier ist der Kategorieunterschied in einer Bewegung. Whisper ist eine Desktop-App, keine Webseite. Man drückt ein Tastenkürzel, spricht, lässt los – und der Text erscheint an der Cursorposition in der gerade geöffneten App: ein Word-Dokument, ein Slack-Thread, eine Discord-Nachricht, ein Teams-Chat, VS Code, Notion, Obsidian, ein E-Mail-Entwurf, ein Browserfeld, überall wo man tippen kann. Das Standard-Tastenkürzel ist Ctrl+Space auf Windows und Command+Option auf dem Mac.
Es gibt keinen Tab, in dem man sein muss. Die App, in der man gerade ist, bleibt die App, in der man ist. Kein Kopieren, kein Einfügen, kein vorheriges Wechseln zu Chrome. Ich habe eine peinlich lange Zeit damit verbracht, das Einfügen-an-der-Cursorposition zum Laufen zu bringen – das ist die Art von Ding, das in fünf Sekunden demonstriert ist und einen Monat braucht, um zuverlässig in jeder App zu funktionieren. Ich habe einen Masterabschluss.
Das ist der Teil, den die meisten unterschätzen, bis sie ihn spüren. Bei SpeechTexter ist Diktieren ein Ort, zu dem man hingeht. Mit einem systemweiten Tastenkürzel ist Diktieren etwas, das man dort tut, wo man schon ist. Meine jüngere Tochter – sieben Jahre alt – hat das besser getestet als jedes Datenblatt. Ich habe es ihr einmal gezeigt: drücken, sprechen, loslassen, einfügen. Sie hat eine 90-Wörter-E-Mail an ihre Oma in der Ukraine über einen ausgefallenen Zahn und den Wechselkurs der Zahnfee geschrieben. Kein einziges Mal hat sie nach dem Tool gefragt. Zwei Tage später kam sie mit der einzigen Beschwerde, die zählt: "Es funktioniert nicht in meiner Zeichen-App." Sie wusste nicht, was ein Tastenkürzel-Konflikt ist. Sie wusste nur, dass die Wörter landen sollten, wo sie hinschaute. Wir haben konfigurierbare Tastenkürzel noch am selben Abend veröffentlicht. Das ist die ganze Messlatte: Der Text geht dahin, wo man ist.
Es funktioniert in mehr als 90 Sprachen in lokalen und Cloud-Modi, und die mehrsprachige Modellreihe erreicht speziell 99+ Sprachen mit automatischer Erkennung – die englischsprachigen Modellvarianten bleiben Englisch, die zählen hier nicht dazu. Die mehrsprachigen Modelle können Sprache auch live auf Englisch übersetzen, was eine Browser-Web-Speech-Engine nicht kann.
Offline und auf dem eigenen Rechner – nicht auf Googles Servern

Hier ist meine klare Meinung: Diktat ohne Offline-Option – wo die Cloud der einzige Weg ist, keine Wahl – ist eine Datenschutzkatastrophe, die nur noch transkribiert werden muss. Die Gehaltstabelle des Chefs, die E-Mail an die Schule des Kindes, die rechtliche Notiz, die man im Zug tippt – nichts davon muss durch die Server eines Anbieters wandern, nur weil man mit der Stimme schreiben möchte. Cloud-Transkription, die man nach Bedarf einschalten kann, ist in Ordnung. Cloud-Transkription, die man nicht ausschalten kann, ist das Problem. SpeechTexter ist ehrlich über sein Cloud-Fundament; es nutzt Googles Spracherkennung und braucht eine Verbindung. Für eine Einkaufsliste kein Problem. Für alles, was man nicht laut in einem Großraumbüro vorlesen würde, ist das eine härtere Sache.
Whispers lokaler Modus läuft vollständig offline – während der Transkription ist keine Internetverbindung erforderlich. Die einzige Verbindung, die es braucht, ist der einmalige Modell-Download: je nach gewähltem Modell irgendwo zwischen etwa 140 MB und 3 GB. Die zugrundeliegende lokale Engine ist dieselbe quelloffene OpenAI Whisper-Modellfamilie, die einen Großteil dieser Kategorie antreibt. Danach bleibt jedes Wort auf dem eigenen Rechner. Im Flugzeug, auf einem gesperrten Arbeits-Laptop ohne Netz, in einem Raum, wo das WLAN rein theoretischer Natur ist – es tippt trotzdem.
Ich habe einem Team zugeschaut, das in einem einzigen Quartal eine fünfstellige Cloud-Rechnung angehäuft hat – mit dem Diktieren von Stand-up-Aufzeichnungen, größtenteils weil eine "Smart-Retry"-Schleife dieselbe Aufnahme viermal transkribiert hat. Der CFO öffnete das Dashboard beim Quartalsbericht, und es wurde sehr still im Raum. Die Cloud hat ihren Platz. Sie sollte eine bewusste Entscheidung sein, nicht der einzige Weg.
Kostenlos ohne Konto – aber "kostenlos" bedeutet hier verschiedene Dinge
Beide Tools sind kostenlos nutzbar, aber das Wort tut in jedem Fall andere Arbeit. SpeechTexter ist kostenlos im reinsten Sinne: kein Download, keine Installation, keine Registrierung – man klickt auf das Mikrofon und diktiert. Nichts einzurichten, nichts anzumelden. Das ist ein echter Vorteil, und ich werde nicht so tun, als wäre er keiner.
Whispers lokale Pipeline ist ebenfalls kostenlos, aber kostenlos bedeutet hier: Desktop-App herunterladen, ein Whisper-Konto erstellen und beim ersten Mal ein Modell laden. Ein paar Minuten Aufwand statt null. Was man dafür bekommt: das systemweite Tastenkürzel, Offline-Transkription und das Cursor-folgt-einem-Verhalten. Die Cloud-Ebene – OpenAI-Funktionen, eigener API-Schlüssel – ist das separate kostenpflichtige Pro-Abo; das sollte man nicht mit der kostenlosen lokalen App verwechseln. Die vollständige Aufschlüsselung gibt es auf der Preisseite. Kurzversion: Lokales Diktieren kostet nichts und läuft unbegrenzt.
Die ehrliche Einschätzung ist also ein Tausch. SpeechTexter nimmt null Einrichtungsaufwand und kein Konto – und behält einen dafür in einem Cloud-Tab. Whisper nimmt einen Download und eine Registrierung – und gibt dafür jede App und Offline-Betrieb. Man wählt die Kosten, die man lieber zahlt.
Wann SpeechTexter trotzdem die bessere Wahl ist

In ein paar realen Situationen würde ich die Desktop-App komplett weglassen – und SpeechTexter gewinnt diese klar.
Auf einem gesperrten Rechner, auf dem man keine Software installieren darf – ein Bibliothekscomputer, ein Schulpool, ein Firmen-Laptop mit Admin-Sperre – läuft SpeechTexter in einem Browser-Tab und fragt niemanden um Erlaubnis. Wer nur gelegentlich diktiert, einen Absatz hier und da, dem ist das Null-Installation-Null-Konto-Modell ehrlich gesagt weniger umständlich als irgendetwas herunterzuladen. Wer die anpassbare Sprachbefehlsliste wirklich nutzt – #newparagraph und #undo spricht, um während des Diktierens zu formatieren – hat einen spezifischen Arbeitsablauf, für den SpeechTexter gebaut wurde und den ein Desktop-Tastenkürzel-Tool nicht genauso abbildet. Und wer sowieso meist in einem Web-Editor schreibt und selten herauskopiert, für den ist der Tab keine Wand, sondern einfach der eigene Arbeitsplatz. In all diesen Fällen: speechtexter.com öffnen, auf das Mikrofon klicken, nicht zu viel nachdenken. Das Ziel ist, zum richtigen kostenlosen Tool zu schicken, wenn es das richtige ist.
Andere Diktiertools, die es wert sind zu kennen
SpeechTexter und Whisper sind nicht die einzigen zwei. Ein schneller, ehrlicher Überblick über das Feld:
- Speechnotes — ein weiteres kostenloses browserbasiertes Diktiernotizbuch, dasselbe tab-gebundene Prinzip wie SpeechTexter. Wer es auch abwägt, findet hier den Speechnotes-Alternativenvergleich.
- Dictation.io / Dictanote — kostenlose Chrome-basierte Sprachdiktiertools; dieselbe Browser-Tab-Decke, kein systemweites Einfügen.
- Speechify — ein KI-Lese- und Sprachprodukt, das auch Sprachtippen bietet; positioniert sich als SpeechTexter-Alternative.
- LilySpeech — ein Windows-Diktiertool, das eine Chrome-basierte Engine nutzt, um in Apps zu tippen; praktisch unter Windows, aber an dieses Setup gebunden.
- Apple Dictation — in macOS und iOS integriert, kostenlos, für kurze Eingaben ausreichend, plattformgebunden.
- Windows-Sprachtypisierung (Win+H) — in Windows integriert, diktiert systemweit in die meisten Textfelder, kostenlos, kein Install. Wer Probleme hat, findet im Win+H-Alternativenratgeber Alternativen und Lösungen.
Die Aufteilung ist einfach. Browser-Tools (SpeechTexter, Speechnotes, Dictation.io) sind kostenlos und ohne Installation, aber tab-gebunden und cloud-abhängig. Betriebssystem-Diktat (Win+H, Apple) ist systemweit und kostenlos, aber plattformgebunden und variiert in der Qualität. Desktop-Apps wie Whisper sind systemweit, offline-fähig und plattformübergreifend – zum Preis eines Downloads.
Also: Was ich tatsächlich wählen würde
Wer das schnellstmögliche Diktieren auf einem Rechner braucht, auf dem man nichts installieren kann, bleibt bei SpeechTexter – kostenlos, sofort einsatzbereit, und die Sprachbefehlsliste ist ein schönes Extra. Für alles andere – Schreiben quer durch die eigenen Apps, offline arbeiten, sensible Texte auf dem eigenen Rechner behalten – würde ich zu einem Desktop-Tool mit systemweitem Tastenkürzel greifen. Diktat läuft bei etwa 145 Wörtern pro Minute, Tippen bei rund 40 – der Engpass waren nie die Finger, sondern die Wände um die Wörter. Man wählt das Tool mit den wenigsten Wänden für das, was man tut. Wer den Unterschied spüren möchte, kann hier sehen, wie Sprachtippen in jeder App tatsächlich funktioniert.
SpeechTexter ist ein gutes kostenloses Tool, das genau das tut, was es verspricht – in einem Chrome-Tab. Der Tag, an dem das eigene Schreiben diesen Tab verlässt – in die E-Mails, den Chat, den Editor, die Notizen – ist der Tag, an dem man möchte, dass das Diktat mitkommt. Das ist der einzige echte Unterschied, und er ist groß. Meine Siebenjährige hat das in zwei Tagen und einem Bug-Report herausgefunden. Der Rest von uns schafft das vermutlich auch.
Den Unterschied selbst erleben
SpeechTexter ist ein sauberes kostenloses Tool, das in einem Chrome-Tab lebt. Der Tag, an dem das eigene Schreiben in E-Mails, Chat, Editor oder Notizen wandert, ist der Tag, an dem man möchte, dass das Diktat mitkommt. Whisper herunterladen, Tastenkürzel halten und zusehen, wie die Transkription in der gerade geöffneten App landet.
Lokale Transkription dauerhaft kostenlos. Kein Zahlungsmittel bei der Registrierung. Der 7-tägige Cloud-Test verlangt eine Karte erst beim Upgrade.



