Von Denys Medvediev

Anleitung

Sprache in Text im Substack-Editor

Der Beitragseditor von Substack hat keine eingebaute Diktierfunktion. Seine Audio-Funktionen lesen einen fertigen Beitrag vor; beim Schreiben helfen sie nicht. Die Lösung ist ein systemweites Werkzeug: Hotkey drücken, sprechen, und deine Worte landen direkt am Cursor im Editor.

Zuletzt aktualisiert: Juni 2026

Eine Autorin am Laptop an einem dunklen Schreibtisch mit einer Tasse Kaffee, die einen Beitrag durch Sprechen verfasst

Sprache in Text im Substack-Editor funktioniert über ein systemweites Werkzeug, nicht über Substack selbst. Der Substack-Beitragseditor hat keine Diktierfunktion; seine Audio-Optionen lesen nur fertigen Text vor. Ein Werkzeug wie Whisper löst das: Hotkey drücken, sprechen, und das Transkript wird am Cursor im Editor eingefügt – danach räumt ein KI-Durchgang das Geplapper auf.

Ich schreibe einen kleinen Newsletter, und die meisten meiner besten Absätze entstehen beim Gassigehen mit dem Hund, nicht am Schreibtisch. Also habe ich nach einem Weg gesucht, einen Entwurf direkt in den Substack-Editor zu sprechen. Ich fand jede Menge Seiten über Substacks Voiceover-Funktion. Keine davon ging um das, was ich eigentlich wollte – nämlich genau das Gegenteil.

Hier ist der Punkt, an dem fast jedes Suchergebnis stolpert. Substack macht aus deinem fertigen Beitrag gerne Audio. Es macht aus deinem Audio aber keinen Beitrag. Das sind entgegengesetzte Richtungen, und für die zweite – das Diktieren des Entwurfs – gibt es nirgendwo im Editor einen Knopf. Die Lösung liegt außerhalb von Substack, ist in rund zwei Minuten eingerichtet und funktioniert genauso in jeder anderen App, in der du schreibst.

Hier ist das, was die Voiceover-Artikel verschweigen. Der Substack-Beitragseditor ist ein Rich-Text-Feld im Browser, dieselbe Art wie ein Gmail-Schreibfenster oder ein Google Doc. Diktieren, das am Cursor einfügt, ist es egal, in welches Feld es tippt.

Die eigentliche Frage ist also nicht "Wie schalte ich das Diktieren in Substack ein." Es gibt keinen Schalter, und das Audio-Menü, das du immer wieder findest, macht genau das Gegenteil. Die Frage lautet "Welches Diktierwerkzeug lasse ich über dem Substack-Editor laufen", und die Antwort hängt davon ab, ob du gratis-und-eingebaut willst oder einen einzigen, offline funktionierenden Hotkey, der sich überall gleich verhält. Ich gehe alles durch, richte eines in zwei Minuten ein und sage dir, wann du den dedizierten Weg überspringen kannst.

Hat der Substack-Editor eine Diktierfunktion?

Eine Person, die nachdenklich am Laptop spricht und damit das Verfassen per Stimme statt per Tastatur veranschaulicht

Nein. Der Substack-Beitragseditor hat keine eingebaute Spracherkennung, Diktierfunktion oder Spracheingabe, um deinen Entwurf per Stimme zu verfassen. Es gibt keinen Mikrofon-Knopf, der für dich tippt, keinen Sprachbefehl, keine versteckte Einstellung. Wenn du die Editor-Symbolleiste danach durchsuchst, kannst du aufhören. Sie ist nicht da.

Was es gibt – und was dir jedes Suchergebnis stattdessen unterjubelt – ist das Audio-Menü hinter dem Kopfhörer-Symbol. Das ist Voiceover und Text-to-Speech. Mit Voiceover kannst du dich selbst dabei aufnehmen, wie du einen bereits geschriebenen Beitrag vorliest, oder eine Audiodatei hochladen, damit Abonnenten zuhören können. Text-to-Speech, in manchen Publikationen verfügbar, lässt eine synthetische Stimme deinen fertigen Beitrag vorlesen. Beide nehmen Text und erzeugen Audio. Diktieren macht genau das Gegenteil: Es nimmt deine Stimme und erzeugt Text. Die Leute verwechseln das, weil bei beidem ein Mikrofon und das Wort "Stimme" im Spiel ist, und diese Verwechslung kostet einen ganzen Nachmittag voller Suchen. Diesen Nachmittag würde ich dir lieber ersparen.

Der Unterschied ist wichtig, weil er dir sagt, wo du suchen musst. Du wirst innerhalb von Substack keine Diktierfunktion finden, egal wie lange du auf das Audio-Panel starrst, denn sie wurde dort nie eingebaut. Der Editor ist ein Textfeld, das Tippen erwartet. Um deine Stimme hineinzubekommen, brauchst du ein Werkzeug, das über dem Browser sitzt und Text dorthin liefert, wo der Cursor steht. Es gibt zwei ehrliche Wege, und der Rest dieser Anleitung deckt beide ab.

Hotkey drücken, sprechen, die Worte erscheinen im Editor

Das ist der ganze Mechanismus, und er ist im besten Sinne langweilig. Du drückst einen Hotkey, du sprichst, du lässt los, und das Transkript wird an deinem Cursor eingefügt – in welchem Textfeld auch immer der Fokus liegt. Whisper hält noch einen kurzen Moment nach dem Loslassen der Taste, damit dein letztes Wort nicht abgeschnitten wird. Weil es am Cursor des Betriebssystems einfügt, ist der Substack-Editor einfach "irgendein Textfeld". Ein Web-Editor ohne API zum Anbinden, ohne Plugin-Steckplatz – und das spielt keine Rolle, denn das Diktieren rührt Substacks Code nie an. Es tippt dort, wo du ohnehin schon tippst.

Das ist der Teil, den die Landingpages unnötig kompliziert machen. Es gibt nichts, was in Substack zu installieren wäre, kein Token, das du in deine Publikationseinstellungen einfügen müsstest, keine Integration, die freizugeben wäre. Dein Cursor steht im Editor, du sprichst, die Worte erscheinen im Editor. Während du sprichst, taucht eine kleine Kapsel auf, damit du weißt, dass zugehört wird:

Cancel
Das Aufnahme-Overlay: eine kleine Kapsel, die erscheint, während du sprichst, damit du weißt, dass Whisper zuhört.

Der Hotkey ist die eine Sache, die man gleich zu Beginn richtig machen sollte. Unter Windows ist es Ctrl+Space; auf dem Mac ist es Command+Option, eine reine Modifier-Taste zum Gedrückthalten beim Sprechen. Beide lassen sich in den Einstellungen ändern, falls sie mit etwas kollidieren, das du schon nutzt. (Meine jüngere Tochter hat mir mal erzählt, ein Hotkey "funktioniere nicht" in ihrer Zeichen-App. Es war ein Konflikt, kein Fehler – so habe ich gelernt, dass der Durchschnittsmensch keine Ahnung hat, was ein Hotkey-Konflikt überhaupt ist. Deshalb ist jetzt jeder Hotkey anpassbar.) Wenn du je Diktieren unter Windows oder auf dem Mac eingerichtet hast, ist das dieselbe Muskelerinnerung, nur auf deinen Newsletter gerichtet.

In zwei Minuten einrichten (Windows oder Mac)

Du brauchst einen Mac mit Apple Silicon oder einen Windows-10-oder-neuer-PC, ein funktionierendes Mikrofon und Substack im Browser geöffnet, mit einem Beitragsentwurf auf dem Bildschirm. Die gesamte lokale Pipeline ist für jedes angemeldete Konto kostenlos, ohne dass bei der Anmeldung nach einer Zahlungsmethode gefragt wird. Hier ist der Ablauf.

Schritt 1 — Whisper installieren und anmelden.

Lade es von der Download-Seite herunter, installiere es und erstelle ein kostenloses Konto. Keine Karte. Die gesamte lokale Transkriptions-Pipeline steht sofort bereit.

Du weißt, dass es geklappt hat, wenn das Tray-Symbol der App erscheint und der Einrichtungsassistent anbietet, ein Modell auszuwählen.

Schritt 2 — Wähle einen Transkriptionsweg.

Die App entscheidet das nicht für dich. Du hast drei: Cloud (OpenAI, eigener Schlüssel), Local Parakeet oder Local Whisper. Zum Verfassen von Beiträgen auf deinem eigenen Rechner fängst du lokal an – mehr dazu zwei Abschnitte weiter unten.

Du weißt, dass es geklappt hat, wenn ein Modell fertig heruntergeladen ist und als bereit angezeigt wird.

Schritt 3 — Bestätige deinen Hotkey.

Windows nutzt standardmäßig Ctrl+Space, der Mac Command+Option zum Gedrückthalten als Push-to-Talk. Auf dem Mac musst du die Bedienungshilfen-Berechtigung erteilen, wenn du danach gefragt wirst; ohne sie kann das Einfügen am Cursor deinen Browser nicht erreichen.

Du weißt, dass es geklappt hat, wenn eine Testaufnahme in ein beliebiges Textfeld eingefügt wird.

Schritt 4 — Setze deinen Cursor in den Substack-Editor und sprich.

Öffne einen Entwurf, klicke in den Textkörper, halte den Hotkey, sprich einen Satz, lass los. Das Transkript erscheint dort, wo der Cursor steht, im Editor.

Du weißt, dass es geklappt hat, wenn dein gesprochener Satz als Text im Substack-Entwurf steht.

Whisper
Die echte Whisper-Desktop-App im Einstellungsbildschirm, mit geöffneten Panels für Transkription und KI.

Das Langsame ist der Modell-Download, nicht die Einrichtung. Alles andere sind die vier Schritte oben. Sobald es läuft, ist das Erstellen eines Entwurfs auf der Seite keine Tipp-Aufgabe mehr, sondern eine Sprech-Aufgabe – und das ist bei einem Newsletter der größte Teil der Arbeit.

Sprache in Text unter Windows · auf dem Mac

Warum ein Browser-Editor ein systemweites Werkzeug braucht

Der Substack-Editor läuft in deinem Browser, und das bestimmt, was überhaupt möglich ist. Die meisten Apps, in die du diktieren möchtest, haben eine Desktop-Version mit tiefen Anknüpfungspunkten; ein Web-Rich-Text-Editor hat davon nichts. Es gibt keinen Plugin-Marktplatz, keinen Erweiterungspunkt, den Substack zum Schreiben in einen Beitrag bereitstellt. Die Integration kann also nicht von innen aus Substack kommen. Sie muss aus einer Schicht über dem Browser kommen.

Ein systemweiter Hotkey ist genau diese Schicht. Er fügt am Cursor des Betriebssystems ein, egal welchem Fenster der gehört, sodass dieselbe Taste, die deinen Substack-Entwurf füllt, auch dein Gmail-Schreibfeld, eine Slack-Nachricht und eine Commit-Nachricht füllt. Ein Werkzeug, jedes Textfeld, unter Windows wie unter Mac. Du musst nichts neu lernen, wenn du vom Verfassen eines Beitrags zum Beantworten der E-Mail eines Lesers wechselst – es ist überall dasselbe Drücken-Sprechen-Loslassen.

Genau deshalb wäre eine Browser-Erweiterung, die nur in Substack funktioniert, die falsche Form für das Problem. Autoren leben nicht in einem einzigen Tab. Du verfasst in Substack, recherchierst in einem anderen Fenster, antwortest auf Kommentare in der App, notierst die nächste Idee, wo immer sie auftaucht. Ein Werkzeug, das auf eine einzige Seite begrenzt ist, löst einen Ausschnitt; ein Werkzeug, das am Cursor ansetzt, löst das Ganze. Ich wechsle ungefähr vierzigmal pro Stunde die App und will mir nicht vierzig verschiedene Diktier-Knöpfe merken müssen.

Lokal oder Cloud: welcher Modus zum Verfassen von Beiträgen

Für einen Newsletter-Entwurf probierst du zuerst den lokalen Modus. Ein halbfertiger Beitrag ist dein eigenes Rohdenken – Meinungen, die du noch nicht ganz ausgeformt hast, ein Absatz, den du vielleicht streichst, das, von dem du noch nicht sicher bist, ob du es überhaupt veröffentlichen willst. Es wäre eine seltsame Entscheidung, jeden ungeschliffenen Satz durch irgendeine Cloud zu schicken, nur um ihn auf deinen eigenen Bildschirm zu bringen. Wenn dein Mac Apple Silicon hat oder dein PC aus den letzten Jahren stammt, bewältigt lokal das alltägliche Diktieren ohne Murren, und die Cloud wird zur Notluke statt zur Voreinstellung.

So unterscheiden sich die drei Wege, denn die App lässt dich wählen, und ich möchte, dass du gut wählst:

  • Local ParakeetNVIDIAs TDT-Engine, rund 600 MB, und die schnellste lokale Option – 5- bis 10-mal schneller als Whisper auf der CPU. Deckt Englisch plus 24 weitere europäische Sprachen ab, 25 insgesamt. Kein Übersetzen ins Englische. Wenn du deinen Newsletter auf Englisch oder in einer anderen europäischen Sprache schreibst, ist das die schnelle, vollständig offline laufende Wahl.
  • Local Whisperlangsamer als Parakeet auf demselben Rechner, aber die mehrsprachigen Builds decken 99 Sprachen ab und können ins Englische übersetzen. Die englisch-only Builds sind englisch-only, nicht 99. Wähle dies für Chinesisch, Japanisch, Koreanisch oder jede Übersetzungsarbeit, die Parakeet nicht kann. Das standardmäßige englische Modell ist rund 480 MB groß.
  • Cloud (OpenAI, BYOK)beste Genauigkeit und Webzugriff, mit deinem eigenen OpenAI-Schlüssel, der direkt von OpenAI abgerechnet wird. Die Transkription läuft standardmäßig über gpt-4o-mini-transcribe. Braucht Internet, ist also der eine Weg, der deinen Rechner verlässt. Die Cloud-Funktion ist Teil von Whisper Pro.

Die nüchterne Wahrheit ist, dass für die Art Prosa, die die meisten Newsletter-Autoren zu Papier bringen, lokal völlig reicht. Beide lokalen Engines laufen vollständig auf deinem Rechner, ohne dass etwas an einen Server geht. Die Cloud verdient sich ihren Platz, wenn du Spitzen-Genauigkeit bei einer unsauberen Aufnahme willst oder wenn das Modell beim Verfassen eine Tatsache aus dem Web holen soll. Für eine regelmäßige Schreibgewohnheit fängst du lokal an und greifst erst dann zur Cloud, wenn dir lokal nicht mehr genügt.

Aus einem gesprochenen Geplapper einen sauberen Absatz machen

Rohes Diktat kommt als einziger Bandwurmsatz heraus. Du sprichst so, wie du denkst, in einem langen, unpunktierten Atemzug, und das ist die Textwand, die dir jede Sprach-Engine reicht. Für eine fertige E-Mail ist das ärgerlich. Für einen Beitrag, den du unter deinem eigenen Namen veröffentlichen wirst, ist es ein Problem – niemand möchte einen Absatz veröffentlichen, der sich wie ein Transkript liest. Das Aufräumen ist die Stelle, an der sich der wahre Wert des Verfassens per Stimme zeigt.

Windows Voice Typing setzt Satzzeichen, während du sprichst, und macOS Dictation kümmert sich um grundlegende Zeichensetzung, wenn du "Komma" oder "Punkt" sagst. Für gründlicheres Aufräumen – die "Ähs" entfernen, die Bandwurmsätze auflösen, ein gesprochenes Geplapper in einen Absatz verwandeln, den du tatsächlich veröffentlichen würdest – kann Whisper einen KI-Durchgang laufen lassen. Sag die Aktivierungsphrase "Hey whisper", und der Text wird verbessert, bevor er landet. Bei einem lokalen Modell läuft das über Ollama; im Cloud-Modus ist es standardmäßig gpt-5-mini. Das Vorher-Nachher ist der ganze Pitch:

Thinking...
Roh

also die sache die ich diese woche sagen wollte ist dass die meisten produktivitätstipps eigentlich nur tipp-tipps in verkleidung sind ähm also du brauchst keine bessere app du musst einfach aufhören so viel zu tippen

Aufgeräumt

Die Sache, die ich diese Woche sagen wollte, ist, dass die meisten Produktivitätstipps eigentlich nur Tipp-Tipps in Verkleidung sind. Du brauchst keine bessere App. Du musst einfach aufhören, so viel zu tippen.

Die ehrliche Grenze sollte man benennen, denn die Demos tun es nicht. Die Stimme verschafft dir die Worte; sie verschafft dir nicht die Formatierung. Substacks Überschriften, Fettschrift, Blockzitate, Links und diese kleine Trennlinie kommen allesamt aus der eigenen Symbolleiste und den Tastenkürzeln des Editors. Diktiere den Satz, greif dann zur Symbolleiste, um die H2 zu machen oder den Link einzufügen, so wie du es immer tust. Kein Diktierwerkzeug zaubert auf Kommando ein Substack-Pull-Quote herbei. Bring die Prosa schnell per Stimme aufs Papier, forme den Beitrag dann mit dem Editor, den du längst kennst.

Derselbe Sprich-dann-Aufräumen-Ablauf zahlt sich weit über deinen Newsletter hinaus aus – du kannst mit dem einen Hotkey auch saubere Prosa in jede App diktieren, sodass ein langer Block zu ein paar gesprochenen Sätzen wird statt zu einem Absatz, den du dir von Hand abringst.

Wann du für Substack auf ein Diktierwerkzeug verzichten solltest

Zwei mit Kreide auf den Asphalt gemalte Pfeile, die in verschiedene Richtungen zeigen und damit eine Werkzeugwahl veranschaulichen

Manchmal ist das richtige Werkzeug das kostenlose, das ohnehin schon auf deinem Rechner ist, und etwas anderes zu behaupten wäre unehrlich. Wenn du immer nur eine kurze Zeile in den Editor wirfst – eine Notiz aus einem Satz, eine schnelle Antwort in den Kommentaren – deckt dein Betriebssystem das gratis ab.

Unter Windows drückst du Windows-Taste + H, und die eingebaute Spracheingabe-Leiste öffnet sich dort, wo dein Cursor steht, den Substack-Editor eingeschlossen. Sie setzt selbst Satzzeichen und ist für kurze Schübe in Ordnung. Der Haken: Sie läuft über Microsofts Server und braucht eine Internetverbindung, ist also keine Offline-Option. Auf dem Mac kannst du mit Dictation überall Text eingeben, wo du tippen kannst, eingerichtet in den Systemeinstellungen unter Tastatur, und auf Apple Silicon kann allgemeiner Text on-device verarbeitet werden. Für einen schnellen Satz in einen Entwurf ist beides wirklich völlig in Ordnung, und ich werde dir gratis nicht ausreden.

Greif zu einem dedizierten, systemweiten Werkzeug, wenn die eingebauten anfangen wehzutun: Beiträge in voller Länge, der KI-Aufräum-Durchgang, der ein Geplapper in veröffentlichungsreife Prosa verwandelt, mehrsprachiges Schreiben, Offline-Verfassen oder der Wunsch nach einem Hotkey, der sich in Substack, deiner E-Mail und deiner Notizen-App gleich verhält. Ein Newsletter ist der Langform-Fall, also überschreiten die meisten Autoren diese Linie schnell – aber darunter nimmst du das, was gratis ist. Ich werde dir nicht sagen, dass du für eine einzeilige Kommentarantwort eine App installieren sollst.

Derselbe Kompromiss taucht überall dort auf, wo du schreibst – die Logik beim Diktieren in Gmail ist identisch, denn beide sind Browser-Textfelder, in denen der Cursor, nicht ein Plugin, die eigentliche Integration ist.

Weiterlesen

Substack liest deinen fertigen Beitrag vor, und das macht es gut. Es hilft dir nur nicht, das Ding überhaupt erst zu schreiben, und nachdem ich das geschrieben habe, bin ich ziemlich sicher, dass es das nie vorhatte. Das ist in Ordnung, denn der Cursor ist die Integration. Sprich in den Editor, hol dir Text, räum ihn mit einem KI-Durchgang auf, forme den Beitrag mit der Symbolleiste, die du längst kennst. Den größten Teil dieser Anleitung habe ich per Stimme in ein Feld diktiert, das nicht Substack war, mit einem Werkzeug, dem es egal ist, welches Feld es ist, und dann das Ganze in einen Entwurf eingefügt. Das ist der ganze Trick.

Probier es bei deinem nächsten Substack-Entwurf aus

Hotkey halten, sprechen, loslassen. Das Transkript landet im Editor dort, wo dein Cursor steht – dann macht ein KI-Durchgang aus dem Geplapper einen Absatz, den du veröffentlichen würdest.

Kostenloser lokaler Modus für jedes angemeldete Konto. Keine Karte zum Loslegen nötig.

Foto von Denys Medvediev

Denys Medvediev

Ich bin derjenige, der unsere Support-E-Mails liest – höchstwahrscheinlich, indem ich die Antworten diktiere.