Von Denys Medvediev

Anleitung

So diktierst du Satzzeichen

Du kannst Satzzeichen laut aussprechen — „Komma,“ „Punkt,“ „neuer Absatz“ — und sie landen als Symbol, nicht als Wort. Oder du lässt das alles weg, redest wie ein Mensch und lässt eine KI die Kommas und Punkte für dich setzen. Beides funktioniert. Hier erfährst du, wann du was nutzen solltest.

Zuletzt aktualisiert: Juni 2026

Nahaufnahme von Satzzeichen auf einer mechanischen Tastatur – als Symbol fürs Diktieren von Kommas und Punkten per Sprache

Um Satzzeichen zu diktieren, nennst du den Namen des Zeichens während des Sprechens: „Komma“ setzt ein Komma, „Punkt“ setzt einen Punkt, „Fragezeichen“ setzt ein Fragezeichen, „neue Zeile“ bricht die Zeile um, und „neuer Absatz“ beginnt einen neuen Absatz. Sowohl Windows-Spracheingabe als auch macOS Diktat erkennen diese gesprochenen Befehle.

Als ich das erste Mal eine E-Mail diktiert habe, kam ein einziger langer Satz ohne Luft heraus. Ich wusste, dass man „Komma“ sagen kann, um ein Komma zu bekommen — die meisten kommen innerhalb einer Minute darauf. Was einem niemand sagt: wie seltsam es sich anfühlt, vierzig Mal hintereinander laut „Punkt“ zu sagen, als würde man ein Telegramm aus dem Jahr 1910 vorlesen.

Diese Anleitung tut also zwei Dinge. Erstens erklärt sie die gesprochenen Satzzeichenbefehle ehrlich — die, die in Windows-Spracheingabe und macOS Diktat wirklich funktionieren, ohne erfundene Zauberwörter. Dann zeigt sie den anderen Weg: einen KI-Durchlauf, der deinen Redefluss liest und die Satzzeichen für dich einfügt, damit du aufhören kannst, Kommas zu kommentieren, und einfach reden kannst.

Hier ist die Aufteilung, die die meisten Seiten nicht offen darlegen. Es gibt zwei Wege, Satzzeichen in diktierten Text zu bringen. Du sagst sie manuell — „Komma,“ „Punkt,“ „neuer Absatz“ — und das Diktiersystem setzt das Symbol genau dort, wo du es gesagt hast. Oder du sagst gar nichts davon, und etwas bereinigt den Text danach.

Der manuelle Weg gibt dir genaue Kontrolle: Du entscheidest, wo jedes Komma steht. Der automatische Weg gibt dir Fluss: Du redest wie ein Mensch und lässt die Software die Satzzeichen erraten. Keiner ist abstrakt „bebesser“ — es kommt darauf an, ob du ein Komma an einer ganz bestimmten Stelle brauchst oder ob der Absatz einfach lesbar sein soll. Ich erkläre die Befehle, zeige die KI-Alternative und sage dir, wofür ich mich entscheide.

Warum diktierter Text wie ein einziger langer Atemzug klingt

Rote Korrekturzeichen und Satzzeichenkorrekturen auf einem ausgedruckten Text – als Illustration für das Bereinigen von Fliesstexten

Ein Spracherkennungssystem hört Laute und schreibt Wörter. Es hört die Pause nicht, wo du normalerweise ein Komma setzen würdest, und es sieht den Punkt am Ende deines Gedankens nicht. Wenn du ihm nichts anderes sagst, liefert es genau das, was es gehört hat: eine Wand aus Wörtern ohne Zeichen. „okay also prüf das dok schick es an maria und erinner mich donnerstag“ — das ist die rohe Form von Diktat, und sie ist auf jedem Tool gleich.

Es gibt zwei ehrliche Lösungen, und der Rest dieser Anleitung besteht genau aus diesen beiden. Du kannst die Satzzeichen selbst sprechen und jeden Zeichennamen nennen, während du redest — das unterstützen sowohl Windows als auch macOS von Haus aus. Oder du lässt eine Software die Zeichen nachträglich einfügen — die Betriebssysteme machen das in einer einfachen Version, und ein dediziertes Tool kann einen vollständigen Bereinigungsdurchlauf starten, der die Satzzeichen zusammen mit Füllwörtern korrigiert.

Die meisten fangen mit den gesprochenen Befehlen an, weil sie eingebaut sind und sofort funktionieren, sobald man das Diktat einschaltet. Deshalb fangen wir auch dort an. Dann zeige ich dir den Teil, der mich dazu gebracht hat, „Punkt“ nicht mehr laut zu sagen — was ich fast ein Jahr lang wie ein Gerichtsprotokollant gemacht hatte.

Das Zeichen sagen und es landet als Symbol

Die Methode mit gesprochenen Befehlen ist einfach, sobald man sie einmal gemacht hat. Während des Diktierens nennst du den Namen des Satzzeichens, und das System schreibt das Symbol statt des Wortes. Sag „Hallo Komma wie geht es dir Fragezeichen“ und du bekommst „Hallo, wie geht es dir?“ Der Trick dabei: Das Zeichen landet genau dort, wo du es gesagt hast — du setzt Satzzeichen also in Echtzeit, während du sprichst.

Das funktioniert genauso, egal ob du ein eingebautes Diktiertool oder einen systemweiten Hotkey verwendest, der an deiner Cursorposition einfügt. Taste drücken, sprechen, Zeichen nennen, loslassen. Eine kleine Kapsel erscheint, während du sprichst, damit du weißt, dass es zuhört — und der Text landet überall dort, wo dein Cursor ist: in einer E-Mail, einem Dokument, einem Chat — überall:

Cancel
Die Aufnahme-Einblendung: eine kleine Kapsel, die beim Sprechen erscheint, damit du weißt, dass das System zuhört, während du deine Satzzeichen nennst.

Die eine Gewohnheit, die man aufbauen muss: das Zeichen ohne Pause davor nennen. Sag „das Meeting ist donnerstag Punkt“ als eine einzige Phrase, nicht „das Meeting ist donnerstag … Punkt“ — sonst schreiben manche Systeme das Wort „Punkt“ statt des Symbols. Das fühlt sich etwa einen Tag lang unnatürlich an, dann speichert das Gehirn es weg, genauso wie es irgendwann aufgehört hat, gegen den Hotkey für Diktat unter Windows anzukämpfen. Danach denkt man nicht mehr daran. Die vollständige Liste, welche Wörter welchen Zeichen entsprechen, folgt zwei Abschnitte weiter unten.

Einen KI-Durchlauf die Satzzeichen setzen lassen

Der andere Weg überspringt die gesprochenen Befehle vollständig. Du redest in normalen Sätzen, und ein KI-Bereinigungsdurchlauf liest das Transkript und fügt die Kommas, Punkte und Absatzumbrüche für dich ein. Mit Whisper ist das ein eingebauter Schritt, den du per Sprache auslöst. Du brauchst einen Mac mit Apple Silicon oder einen PC mit Windows 10 oder neuer, ein funktionierendes Mikrofon und ein paar Minuten. Die gesamte lokale Pipeline ist für jedes angemeldete Konto kostenlos — keine Zahlungsmethode wird bei der Registrierung verlangt. So läuft die Abfolge ab.

Schritt 1 — Whisper installieren und anmelden.

Lade die App von der Download-Seite herunter, installiere sie und erstelle ein kostenloses Konto. Keine Kreditkarte nötig. Die lokale Transkriptionspipeline öffnet sich sofort.

Du weißt, dass es geklappt hat, wenn das Tray-Symbol der App erscheint und der Einrichtungsassistent anbietet, ein Modell auszuwählen.

Schritt 2 — Einen Transkriptionspfad wählen.

Die App wählt nicht für dich. Du bekommst drei Optionen: Cloud (OpenAI, eigener Schlüssel), Local Parakeet oder Local Whisper. Für private Texte fang mit Lokal an — mehr dazu zwei Abschnitte weiter unten.

Du weißt, dass es geklappt hat, wenn ein Modell den Download abgeschlossen hat und als bereit angezeigt wird.

Schritt 3 — Deinen Hotkey bestätigen.

Windows verwendet standardmäßig Ctrl+Space, Mac nutzt Command+Option als Push-to-Talk. Auf dem Mac: Erteile die Bedienungshilfen-Berechtigung, wenn du dazu aufgefordert wirst — ohne sie kann das Einfügen an der Cursorposition andere Apps nicht erreichen.

Du weißt, dass es geklappt hat, wenn eine Testaufnahme in ein beliebiges Textfeld eingefügt wird.

Schritt 4 — „Hey whisper“ sagen und normal sprechen.

Hotkey gedrückt halten, mit dem Aktivierungssatz „Hey whisper“ beginnen, dann in normalen Sätzen ohne gesprochene Zeichen sprechen. Der KI-Durchlauf setzt die Satzzeichen, bevor der Text an deiner Cursorposition landet.

Du weißt, dass es geklappt hat, wenn ein von dir gesprochener Fliesssatz mit bereits eingefügten Kommas und Punkten ankommt.

Whisper
Die echte Whisper-Desktop-App auf dem Einstellungsbildschirm, mit geöffneten Panels für Transkription und KI.

Das ist das gesamte Versprechen des automatischen Weges: Du hörst auf, Protokollant zu sein, und bist wieder einfach jemand, der redet. Der Haken — und den gibt es immer — ist, dass die KI entscheidet, wo die Zeichen stehen, nicht du. Für die meisten Texte ist das völlig in Ordnung. Für die Fälle, wo es das nicht ist, sind die manuellen Befehle jederzeit verfügbar — der letzte Abschnitt erklärt genau, wann man sie einsetzt.

Die gesprochenen Satzzeichenbefehle, die wirklich funktionieren

Hier sind die Befehle, bei denen ich sicher bin — weil sie von Microsoft und Apple dokumentiert sind und auf beiden Systemen gleich funktionieren. Sag „Komma“ für ein Komma, „Punkt“ für einen Punkt und „Fragezeichen“ für ein Fragezeichen. Für Umbrüche: „neue Zeile“ bewegt den Cursor eine Zeile nach unten — wie einmal Return drücken — und „neuer Absatz“ beginnt einen neuen Absatz, wie zweimal Return drücken. Diese fünf decken den weitaus größten Teil des alltäglichen Schreibens ab.

Ein paar ehrliche Einschränkungen, weil hier die Listicles gerne übertreiben. Beide Betriebssysteme unterstützen eine viel längere Liste von Zeichen — Ausrufezeichen, Doppelpunkt, Anführungszeichen, Gedankenstriche — aber ich verweise dich lieber auf Microsofts und Apples eigene Befehlsseiten für die vollständige Liste, statt eine auswendig aufzusagen, die sich zwischen OS-Versionen verschieben kann. Die Befehlswörter können auch je nach Sprache und Region leicht variieren. Wenn du in einer anderen Sprache als US-Englisch diktierst, prüfe die Diktierhilfe deines Betriebssystems für die lokalisierten Befehlswörter — „period“ auf Englisch ist in anderen Sprachen kein gültiger Befehl.

Noch etwas Wichtiges: Sowohl Windows-Spracheingabe als auch macOS Diktat haben inzwischen eine Einstellung für automatische Satzzeichen, die grundsätzliche Kommas und Punkte einfügt, während du sprichst — ohne Befehle. Auf dem Mac findest du das unter Systemeinstellungen → Tastatur → Diktat, wo du die automatische Zeichensetzung aktivieren kannst. Bei Windows gibt es diese Option ebenfalls in den Einstellungen der Spracheingabe. Selbst die eingebauten Tools geben dir also einen Vorgeschmack auf den handfreien Ansatz. Der dedizierte KI-Durchlauf geht weiter — er korrigiert auch Füllwörter und Fliesstexte — aber für eine schnelle Notiz kann das Einschalten der OS-Automatik schon ausreichen.

Lokal oder Cloud: Welcher Modus übernimmt die Bereinigung

Wenn du den KI-Satzzeichen-Weg gehst, ist die nächste Frage, wo die Arbeit stattfindet. Transkription und Bereinigungsdurchlauf können beide vollständig auf deinem eigenen Gerät laufen oder in der Cloud über deinen eigenen OpenAI-Schlüssel. Für die meisten Texte — E-Mails, Notizen, Entwürfe — würde ich erst lokal ausprobieren. Es läuft offline, nichts verlässt deinen Laptop, und eine private Nachricht über die Schule deines Kindes oder das Budget deines Chefs hat im Protokoll eines Anbieters nichts zu suchen, nur weil du Satzzeichen wolltest. Hier sind die Unterschiede der drei Pfade, weil die App dich wählen lässt — und ich möchte, dass du gut wählst:

Die drei Optionen, klar dargelegt:

  • Local ParakeetNVIDIAs TDT-Engine, etwa 600 MB — die schnellste lokale Option, 5- bis 10-mal schneller als Whisper auf der CPU. Unterstützt Englisch plus 24 weitere europäische Sprachen, insgesamt 25. Keine Übersetzung ins Englische. Wenn du auf Englisch oder einer anderen europäischen Sprache schreibst, ist das die schnelle, vollständig offline arbeitende Wahl.
  • Local WhisperLangsamer als Parakeet auf demselben Gerät, aber die mehrsprachigen Builds unterstützen 99 Sprachen und können ins Englische übersetzen. Die rein englischen Builds sind ausschließlich für Englisch — nicht für 99 Sprachen. Wähle das für Chinesisch, Japanisch, Koreanisch oder jede Übersetzungsarbeit, die Parakeet nicht leisten kann. Das Standard-Englisch-Modell ist etwa 480 MB groß.
  • Cloud (OpenAI, BYOK)Beste Genauigkeit und Web-Zugang mit deinem eigenen OpenAI-Schlüssel, direkt von OpenAI abgerechnet. Transkription läuft standardmäßig über gpt-4o-mini-transcribe. Benötigt Internet — das ist der einzige Weg, bei dem Daten dein Gerät verlassen. Die Cloud-Funktion ist Teil von Whisper Pro.

Für die KI-Bereinigung konkret: Der lokale Durchlauf läuft über Ollama auf deinem eigenen Gerät, der Cloud-Durchlauf nutzt standardmäßig gpt-5-mini. Die schlichte Wahrheit ist: Für das Einfügen von Kommas und Punkten in gewöhnliche Texte erledigt das Lokal problemlos. Cloud macht sich bezahlt, wenn du erstklassige Genauigkeit bei einer schwierigen Aufnahme willst oder wenn das Modell mitten im Satz eine Tatsache aus dem Web abrufen soll. Für Satzzeichen allein: fang lokal an.

Was der KI-Bereinigungsdurchlauf wirklich mit deinem Text macht

Das ist der Teil, der mich dazu gebracht hat, „Komma“ nicht mehr laut zu sagen. Rohes Diktat kommt als Fliesstext heraus — du sagst „okay also prüf das architektur-dok tagge es projekt alpha und erinner mich donnerstag äh vor dem standup,“ und das ist die zeichenlose Textwand, die dir jedes Spracherkennungssystem liefert. Der Bereinigungsdurchlauf liest das und setzt es zu etwas zusammen, das du tatsächlich abschicken würdest.

Mit Whisper löst du das aus, indem du mit dem Aktivierungssatz „Hey whisper“ beginnst — dann wird der Text verbessert, bevor er an deiner Cursorposition landet. Der Durchlauf fügt Kommas und Punkte ein, bricht den Fliesstext in Sätze auf und entfernt die „Ähs“ und Fehlstarts, die du nicht behalten wolltest. Auf einem lokalen Modell läuft das über Ollama; im Cloud-Modus ist es standardmäßig gpt-5-mini. Du hast keinen einzigen Satzzeichenbefehl gesagt — du hast einfach geredet.

Thinking...
Roh

okay so review the architecture doc tag it project alpha and remind me thursday um before the standup

Bereinigt

Okay, so review the architecture doc, tag it Project Alpha, and remind me Thursday before the standup.

Die ehrliche Einschränkung: Die KI errät deine Absicht. Sie ist gut darin — bei gewöhnlichen Texten würde ich ihr neun von zehn Mal vertrauen — aber sie trifft eine Entscheidung darüber, wo dein Satz endet und wo das Komma hingehört. Das ist der richtige Kompromiss für eine E-Mail oder einen Entwurf, wo die Bedeutung ein Komma an einer etwas anderen Stelle überlebt. Es ist der falsche Kompromiss, wenn die Position des Kommas die Bedeutung ändert — davon handelt der nächste Abschnitt.

Derselbe Ablauf aus Sprechen und Bereinigen zahlt sich weit über Satzzeichen hinaus aus — du kannst auch in jeder App per Sprache schneller tippen, sodass ein Absatz, den du getippt hättest, zu ein paar gesprochenen Sätzen wird, die bereits bereinigt ankommen.

Wann du die Satzzeichen selbst aussprechen solltest

Zwei Pfeile in unterschiedliche Richtungen – als Illustration der Wahl zwischen dem Aussprechen von Satzzeichen und dem KI-gestützten Einfügen

Manchmal ist der manuelle Befehl die richtige Wahl — so zu tun, als würde die KI alles regeln, wäre unehrlich. Die Faustregel: Wenn die genaue Position eines Zeichens Bedeutung trägt, sag es selbst. Die KI rät gut, aber sie rät — und es gibt Stellen, an denen man kein Raten will.

Drei Fälle, in denen ich die Zeichen laut benenne. Erstens: alles, wo Satzzeichen die Bedeutung verändern — eine Vertragsklausel, eine medizinische Anweisung, der Unterschied zwischen „Wir essen jetzt, Oma“ und der Version, in der Oma auf dem Speiseplan steht. Zweitens: Code und strukturierter Text, wo ein Komma oder ein Doppelpunkt Syntax ist, kein Stilmittel, und die KI keine Ahnung hat, dass du eine Konfigurationsdatei schreibst. Drittens: bestimmte Symbole, die die Automatik nicht von selbst setzt — ein Doppelpunkt vor einer Liste, ein Ausrufezeichen, das du wirklich willst, ein Fragezeichen bei einem grammatikalisch als Aussage formulierten Satz. An diesen Stellen ist der gesprochene Befehl schneller und sicherer als diktieren, das Ergebnis lesen und korrigieren.

Für kurze Texte reichen die eingebauten Tools völlig aus. Wenn du eine zweizellige Nachricht abschickst, fügen Windows-Spracheingabe (Windows-Taste + H) und macOS Diktat selbstständig grundsätzliche Satzzeichen ein — du musst nichts installieren. Das Problem mit Windows-Spracheingabe: Sie läuft über Microsofts Server und braucht eine Internetverbindung, ist also keine Offline-Option. Greif zu einem dedizierten Tool, wenn der Text länger, mehrsprachig oder vertraulich wird — oder wenn du das Wort „Punkt“ einfach nie wieder laut sagen willst.

Derselbe Kompromiss zeigt sich auf dem Mac, wo die eingebaute Zeichensetzung von Diktat kurze Notizen abdeckt — die Logik bei Sprache zu Text auf dem Mac ist dieselbe: Zeichen benennen, wenn die Platzierung wichtig ist; das Tool entscheiden lassen, wenn nicht.

Das ist das Ganze. Sag „Komma,“ „Punkt,“ „Fragezeichen,“ „neue Zeile,“ „neuer Absatz,“ wenn du das Zeichen an einer genauen Stelle willst — und lass einen KI-Durchlauf es für dich erledigen, wenn du einfach reden und einen lesbaren Text haben willst. Ich habe den größten Teil dieser Anleitung auf dem zweiten Weg diktiert, habe „Hey whisper“ gesagt statt vierhundert Kommas zu kommentieren — und bin nur dann zu den manuellen Befehlen gegriffen, als ich die Beispielsätze aufgeschrieben habe. Der einzige Moment in dieser Anleitung, in dem „Punkt“ laut sagen tatsächlich der Sinn der Sache war.

Hör auf, „Punkt“ laut zu sagen

Sprich in normalen Sätzen, sag „Hey whisper,“ und lass den KI-Durchlauf die Kommas und Punkte einfügen, bevor der Text an deiner Cursorposition landet.

Lokaler Modus kostenlos für jedes angemeldete Konto. Keine Kreditkarte zum Starten nötig.

Foto von Denys Medvediev

Denys Medvediev

Ich bin derjenige, der unsere Support-E-Mails liest — höchstwahrscheinlich, indem ich die Antworten diktiere.

Weiterführende Quellen