Von Denys Medvediev

Tutorial

Sprache zu Text in WordPress: 3 Wege

WordPress bringt keine eingebaute Diktierfunktion mit, deshalb kommt Sprache zu Text immer von einem Werkzeug, das du selbst hinzufügst: eine Browser-Erweiterung, ein Plugin, die Diktierfunktion deines Betriebssystems oder eine Desktop-App wie Whisper mit einem systemweiten Tastenkürzel, das offline funktioniert und in jeder App läuft.

Zuletzt aktualisiert: Juni 2026

Aufgeschlagenes Notizbuch und Stift neben einem Laptop auf einem Holzschreibtisch, eine Schreibumgebung zum Verfassen von WordPress-Beiträgen per Stimme

Sprache zu Text in WordPress kommt immer von einem Werkzeug eines Drittanbieters, denn WordPress liefert keine eingebaute Diktierfunktion mit. Die drei realen Wege sind eine Browser-Erweiterung auf Basis der Cloud-Web-Speech-API, ein WordPress-Diktierplugin oder die Diktierfunktion des Betriebssystems, die in den fokussierten Block tippt. Eine Desktop-App wie Whisper fügt einen vierten hinzu: ein systemweites Tastenkürzel, offline und app-übergreifend, ohne Plugin.

Hier ist der Teil, den niemand auf die Marketingseite schreibt: Öffne eine frische WordPress-Installation, klicke in einen Gutenberg-Block und suche nach einer Mikrofon-Schaltfläche. Es gibt keine. WordPress treibt seit Jahren rund 40 % des Webs an und verlangt trotzdem, dass du jedes Wort von Hand tippst. Spracherkennung ist seit 2022 gut genug für echte Arbeit. Der Editor hat die Nachricht nie bekommen. Jede Option unten ist also etwas, das du selbst dranschraubst.

Erst eine kurze Weggabelung. Suche nach "Sprache zu Text in WordPress" und die meisten Ergebnisse betreffen die andere Art von Stimme — Text-to-Speech-Plugins, die deinen veröffentlichten Beitrag den Besuchern vorlesen. Das ist Audioausgabe. Dieser Artikel ist das Gegenteil: Diktieren, bei dem du sprichst und die Wörter im Editor landen. Wenn du Vorlesen wolltest, falscher Tab. Wenn du Beiträge mit deiner Stimme schreiben willst — genauso, wie du vielleicht eine Diktiersoftware für Blogger für jede andere Plattform wählen würdest — lies weiter.

WordPress hat keine eingebaute Diktierfunktion. Das bedeutet Folgendes.

Nahaufnahme von Händen, die auf einer Laptop-Tastatur tippen, die manuelle Eingabe, die der Block-Editor noch immer erwartet

Ich habe im offiziellen Plugin-Verzeichnis nachgeschaut, um sicherzugehen, dass mir keine Einstellung entgeht, die drei Menüs tief vergraben ist. (War sie nicht. Das ist selten der Fall, aber ich prüfe immer, denn das eine Mal, das ich es nicht tue, ist genau das Mal, in dem sie da ist.) Suche im WordPress.org-Plugin-Verzeichnis nach "dictation" und du bekommst eine Wand voller Drittanbieter-Plugins — "Dictation (Speech Recognition)", "Dictate Button" und Konsorten. Keines davon ist im Kern enthalten. WordPress selbst hat null Spracheingabe. Das ist der ehrliche Befund, und er verändert, wie du über jedes Werkzeug unten denken solltest.

Weil es keine native Engine gibt, bringt jeder Weg seine eigene mit. Die meisten WordPress-Diktierplugins und die beliebten Browser-Erweiterungen kapseln die Web-Speech-API des Browsers — Googles Cloud-Spracherkennung. Dein Entwurfsabsatz wird also an einen Server geschickt, um transkribiert zu werden. Es funktioniert. Es ist aber auch nur online und meist nur in Chrome oder Edge. Die nüchterne Wahrheit ist, dass "WordPress-Diktat" größtenteils ein dünnes Etikett auf dem Cloud-Mikrofon eines anderen ist.

Die eine Ausnahme von der Cloud-Regel ist das Diktieren, das auf deinem eigenen Rechner läuft — die eingebaute Funktion deines Betriebssystems oder eine Desktop-App. Zu beidem kommen wir noch.

Die drei Wege, in WordPress zu diktieren, und der Kompromiss, den jeder eingeht

Es gibt genau drei Kategorien, plus den Desktop-App-Weg. Jeder verschafft dir etwas und kostet dich etwas anderes.

Weg eins: eine Browser-Erweiterung. Voice In von Dictanote ist die übliche Wahl. Du installierst sie aus dem Chrome Web Store, klickst in ein Feld und diktierst. Sie läuft über die Web-Speech-API des Browsers, ist also cloudbasiert und lebt im Browser-Tab. Kostenlos zum Loslegen, schnell installiert. Der Haken: Sie funktioniert nur in diesem Tab. Wechsle zu Slack oder zu deiner E-Mail und das Mikrofon ist weg. Und dein Audio läuft so oder so über Googles Cloud.

Weg zwei: ein WordPress-Plugin. Plugins wie "Dictation (Speech Recognition)" oder Listener fügen eine Mikrofon-Schaltfläche direkt in den Editor ein. Die meisten kapseln ebenfalls Web Speech, erben also dieselben Grenzen: nur online, nur Chrome-freundlich. Der Vorteil: Es lebt in WordPress, du musst sonst nichts verwalten. Wähle das, wenn du ausdrücklich eine Schaltfläche im Editor willst und mit der Cloud einverstanden bist.

Weg drei: die Diktierfunktion des Betriebssystems. Windows hat die Spracheingabe (drücke Win + H). macOS hat das Diktat in den Systemeinstellungen. Beide tippen in das gerade fokussierte Feld, einschließlich eines Gutenberg-Blocks im Browser. Kostenlos, keine Installation, schon auf deinem Computer. Die Qualität schwankt und es ist auf eine Plattform beschränkt, aber für einen schnellen Absatz ist es ehrlich gesagt völlig in Ordnung. Wenn du an einem PC sitzt, deckt die vollständige Übersicht zu Sprache zu Text unter Windows den Win + H-Weg ausführlicher ab.

Dann gibt es den Desktop-App-Weg, in dem Whisper angesiedelt ist. Dieselbe Idee wie beim OS-Diktat — ein Tastenkürzel, das in das fokussierte Feld einfügt — aber plattformübergreifend, offlinefähig und nicht an den Browser-Tab gebunden. Der nächste direkte Konkurrent hier ist Blurt, eine Mac-Menüleisten-App, die in jedes WordPress-Feld diktiert. Ein sauberes Werkzeug. Es ist aber auch nur für macOS, nur in der Cloud und nur für die ersten 1.000 Wörter kostenlos, danach kostet es $10 im Monat oder $99 im Jahr. Gut zu wissen, wenn du an einem Mac sitzt und die Cloud nicht stört.

Einen Beitrag mit einem Tastenkürzel in den Block-Editor diktieren

Hier ist der tatsächliche Ablauf, Schritt für Schritt, mit einem Desktop-Tastenkürzel-Werkzeug. Es sind dieselben fünf Handgriffe, egal ob du im Web-Editor oder auf einer selbst gehosteten Seite arbeitest.

Cancel
Das Aufnahme-Overlay: eine kleine Kapsel, die erscheint, während du sprichst, damit du weißt, dass Whisper zuhört.
  1. Öffne deinen Beitrag im Block-Editor. WordPress im Web in einem beliebigen Browser oder selbst gehostet — es spielt keine Rolle, denn das Tastenkürzel arbeitet auf Ebene des Betriebssystems, nicht innerhalb eines Plugins.
  2. Klicke in den Block, den du füllen willst. Ein Absatzblock, der Beitragstitel, ein Auszug, ein Yoast- oder Rank-Math-Meta-Feld — überall dort, wo der Cursor blinkt.
  3. Halte das Tastenkürzel und sprich. Unter Windows ist das Ctrl+Space; unter macOS ist es Command+Option, als Push-to-talk gehalten. Sprich deinen Absatz so, wie du ihn laut sagen würdest.
  4. Loslassen. Der Text erscheint am Cursor, in dem Block, den du angeklickt hast. Das war's.
  5. Klicke in den nächsten Block und wiederhole. Tastatur oder Maus, um zwischen Blöcken zu wechseln, Tastenkürzel, um jeden zu füllen.

Ein ehrlicher Vorbehalt, denn zu viel zu versprechen hilft niemandem. Das Werkzeug diktiert in den fokussierten Block. Es versteht die Block-Struktur von Gutenberg nicht. Es erstellt keinen neuen Überschriften-Block, teilt deinen Absatz nicht in zwei und springt nicht zum nächsten Block, wenn du "nächster" sagst. Du steuerst die Blöcke; das Tastenkürzel füllt sie. Jedes Diktierwerkzeug in dieser Kategorie funktioniert genauso — Blurt und Voice In eingeschlossen. Die Stimme schreibt die Wörter. Die Möbel stellst du trotzdem selbst auf.

Die ganze App, live

Whisper
Die echte Whisper-Desktop-App — klicke dich durch, wähle einen Transkriptionsweg und sieh zu, wie der Text am Cursor landet.

Das ist die echte Desktop-App, oben eingebettet, kein Screenshot. Klick dich durch. Was sie in WordPress zum Laufen bringt, ist zugleich das, was sie langweilig zu beschreiben macht: Es ist ein systemweites globales Tastenkürzel, das die Transkription am Cursor in jede App einfügt, in der du tippen kannst. WordPress-Block-Editor, ein Kommentarfeld, eine WooCommerce-Produktbeschreibung, deine E-Mail, Slack, dein Code-Editor — dieselbe Taste, dasselbe Verhalten. Kein Plugin pro App.

Das ist der praktische Unterschied zu den Suchergebnissen. Eine Browser-Erweiterung endet am Rand des Tabs. Das hier nicht. Du diktierst die Meta-Beschreibung in Yoast, dann die Antwort auf den Kommentar eines Lesers, dann wechselst du zu deinem Posteingang und diktierst auch das, ohne das Werkzeug zu wechseln. Dasselbe Tastenkürzel funktioniert, wenn du auch anderswo veröffentlichst — der Ghost-Editor und der Substack-Editor nehmen Diktate genau auf dieselbe Weise entgegen.

Das Diktat automatisch aufräumen

Thinking...

Rohes Diktat hat seine Macken. Du sagst "ähm", du beginnst einen Satz zweimal, du vergisst das Komma. Whisper hat einen optionalen KI-Aufräumschritt, der Groß- und Kleinschreibung sowie Zeichensetzung korrigiert und Füllwörter entfernt, bevor der Text im Block landet. Im kostenlosen lokalen Modus läuft er vollständig auf deinem Rechner; in Pro läuft er in der Cloud. Er ist optional, kein Zauber — schalte ihn aus und du bekommst die wortgetreue Mitschrift, falls du lieber selbst bearbeitest.

Bei einem Blogbeitrag spart das echt Zeit. Ein diktierter Absatz, der seine Kommas schon an der richtigen Stelle hat, ist einer, den du vor dem Veröffentlichen nicht mehr aufräumen musst. Derselbe Ablauf überträgt sich auf andere Schreibwerkzeuge — so würdest du überall in einem Entwurf mit deiner Stimme schneller tippen, nicht nur in WordPress.

Offline und privat

Ein blaues Vorhängeschloss sichert ein Tor bei Tageslicht und veranschaulicht privates Diktieren direkt auf dem Gerät

Hier ist die eine starke Meinung, die ich mir in diesem Artikel leiste: Diktieren, das nur in der Cloud funktioniert, ohne Offline-Option, ist ein Datenschutz-Desaster, das nur darauf wartet, transkribiert zu werden. Jeder Browser-Erweiterungs- und die meisten Plugin-Wege auf dieser Seite schicken deinen Entwurf an einen Server, um daraus Text zu machen. Bei einem öffentlichen Blogbeitrag ist dir das vielleicht egal. Bei dem halbfertigen Beitrag über deinen Arbeitgeber oder der Kommentarantwort, in der du dich Luft machst, bevor du sie löschst — dein Laptop hat schon ein Mikrofon und eine CPU. Er braucht keinen Server in der Schleife, um einen Absatz zu tippen.

Whispers lokaler Modus läuft vollständig offline. Das Audio verlässt nie den Rechner; das Einzige, was das Internet braucht, ist der einmalige Modell-Download, irgendwo zwischen 140 MB und 3 GB, je nachdem, welches Modell du wählst. Blurt, Voice In und die Web-Speech-Plugins sind allesamt von Haus aus nur online. Das ist eine echte, überprüfbare Grenze zwischen ihnen und einer lokalen Desktop-App — kein Werbespruch.

Sie läuft außerdem unter Windows und Mac und unterstützt über 90 Sprachen (die mehrsprachige Modellreihe erreicht konkret 99; die rein englischen Builds beherrschen eine Sprache gut), was zählt, wenn du in mehr als einer bloggst.

Wann du Whisper überspringen und einfach das Windows- oder Mac-Diktat nutzen solltest

Ich mache das, was die Marketingseiten nicht tun. Wenn du nur gelegentlich in WordPress diktierst — hier ein Absatz, dort ein Kommentar — spar dir den Download und nutze, was du schon hast. Unter Windows drücke Win + H, um die Spracheingabe zu öffnen, und sprich in den fokussierten Block. Auf einem Mac aktiviere das Diktat in den Systemeinstellungen und mach dasselbe. Kostenlos, keine Installation, schon da.

Wenn du in einem einzigen Browser lebst und es dir nichts ausmacht, dass dein Text durch die Cloud läuft, ist eine Browser-Erweiterung oder ein Plugin im Editor eine vernünftige, mehr oder weniger kostenlose Wahl. Greif nur dann zu einer Desktop-App wie Whisper, wenn du es offline willst, dasselbe Tastenkürzel in jeder App statt in einem Tab willst, Windows- und Mac-Abdeckung willst oder das optionale KI-Aufräumen willst. Wenn nichts davon auf dich zutrifft, ist der kostenlose OS-Weg die richtige Antwort, und mir ist lieber, du nutzt ihn, als dass du zu viel kaufst.

Kostenlos für die lokale Pipeline. Pro fügt die Cloud hinzu.

Ein minimalistischer Arbeitsplatz mit einem Laptop, leerem Papier und Bleistift auf einem weißen Tisch, der den einfacheren Weg abwägt

Die gesamte lokale Pipeline — Diktat und das optionale KI-Aufräumen — ist für angemeldete Nutzer kostenlos, ohne Karte bei der Registrierung. Du installierst die Desktop-App, meldest dich an und diktierst in WordPress, ohne irgendetwas zu zahlen. Pro fügt die Cloud-Ebene für alle hinzu, die die neuesten OpenAI-Modelle wollen, und kommt mit einer kurzen Cloud-Testphase, die erst beim Upgrade-Schritt nach einer Karte fragt, nie bei der ersten Registrierung. Der Offline-Weg, den du tatsächlich zum Verfassen von Beiträgen nutzen würdest, kostet also nichts. Die vollständigen Zahlen stehen auf der Preisseite; ich werde sie nicht mitten im Absatz zitieren.

Zur Einordnung: Der nächste kostenpflichtige Konkurrent — Blurt — gibt dir 1.000 Wörter gratis, bevor es $10 im Monat oder $99 im Jahr kostet. Ein mittellanger Blogbeitrag hat rund 1.000 Wörter. Das ist also etwa ein Beitrag, und dann läuft die Uhr.

Letzten Dienstag habe ich beim Vorbereiten der Brotdosen drei Dinge in WordPress diktiert — einen Absatz für einen Entwurf, eine Antwort auf einen Kommentar und eine Meta-Beschreibung, der ich eine Woche lang ausgewichen war. Gurke in der einen Hand, das Tastenkürzel unter der anderen. Die Kinder haben die Hälfte davon übertönt; der Aufräumschritt hat klammheimlich die Stelle weggelassen, an der das jüngere fragte, warum der Mond manchmal nicht da ist. Das waren früher fünfzehn Minuten einhändiges Tippen. Jetzt dauert es so lange wie das Schmieren eines Brots. (Das Brot, fürs Protokoll, kam trotzdem schief raus. Der Aufräumschritt richtet keine Brotdosen.)

Wenn du nur ab und zu eine Zeile diktierst, macht dein Betriebssystem das schon gratis, und du solltest es nutzen. Wenn du es offline, überall und aufgeräumt willst, probier es bei deinem nächsten Beitrag aus. So oder so: Hör auf, die Teile zu tippen, die du einfach sagen könntest.

Diktiere deinen nächsten WordPress-Beitrag

Klicke in den Block, halte die Taste, sprich, lass los. Die Mitschrift landet dort, wo dein Cursor steht — in WordPress und in jeder anderen App genauso.

Kostenloser lokaler Modus für jedes angemeldete Konto. Keine Karte zum Loslegen nötig.

Foto von Denys Medvediev

Denys Medvediev

Ich bin derjenige, der unsere Support-E-Mails liest, höchstwahrscheinlich indem ich die Antworten diktiere.