Von Denys Medvediev

Anleitung

Sprache zu Text in PowerPoint, ehrlich erklärt

PowerPoint kann Ihnen zuhören – über Diktieren, eine eingebaute Schaltfläche auf der Registerkarte Start. Der Haken liegt darin, wo das Zuhören passiert. Hier erfahren Sie, wie Diktieren funktioniert, plus ein Offline-Tastenkürzel, das in jede App diktiert und das Microsoft-365-Abo überspringt.

Zuletzt aktualisiert: Juni 2026

Leerer Konferenzraum mit einer blanken Leinwand, bereit für eine Folienpräsentation

Sprache zu Text in PowerPoint funktioniert über Diktieren, eine eingebaute Microsoft-Funktion auf der Registerkarte Start, erkennbar am Mikrofon-Symbol. Sie tippt gesprochene Wörter in Folientextfelder, Referentennotizen und Kommentare. Diktieren läuft in der Cloud und braucht daher ein Mikrofon und eine stabile Internetverbindung, und die Schaltfläche im Desktop-Programm erscheint nur mit einem Microsoft-365-Abo.

Ja, PowerPoint kann Ihnen also zuhören. Der Haken liegt darin, wo das Zuhören passiert. Jedes gesprochene Wort wandert zu den Servern von Microsoft und kommt als Text zurück. Bei einer öffentlichen Konferenzagenda ist das in Ordnung, bei den Q3-Zahlen, die Sie noch nicht verkündet haben, schon weniger. Es gibt eine systemweite Tastenkürzel-Alternative, die offline läuft und das Abo komplett überspringt. Dazu kommen wir noch. Zuerst zeige ich Ihnen die Schaltfläche, die längst in Ihrer Menüleiste steckt.

Eine kurze Anmerkung vorab. Ein paar Leute, die nach diesem Begriff suchen, wollen eigentlich das Gegenteil: eine Stimme, die ihre Folien vorliest. Das ist Laut vorlesen, nicht Diktieren, und darum geht es in diesem Artikel nicht. Hier geht es darum, dass aus Ihrer Sprache getippter Folieninhalt wird.

Hat PowerPoint Sprache zu Text? Ja, mit einem Haken

Desktop-Monitor auf einem Bürotisch, der eine digitale Folienpräsentation zeigt

PowerPoint hat tatsächlich eine Diktierfunktion. Gehen Sie auf Start, suchen Sie die Schaltfläche Diktieren, die wie ein Mikrofon aussieht, melden Sie sich auf einem Gerät mit Mikrofon bei Ihrem Microsoft-Konto an und legen Sie los. Der erkannte Text landet in dem Feld, in dem Ihr Cursor gerade steht, und Sie können einen Tippfehler über die Tastatur korrigieren, ohne das Mikrofon auszuschalten.

Hier ist der Haken, in drei Teilen. Diktieren ist cloudbasiert und braucht daher jedes einzelne Mal ein Mikrofon und eine zuverlässige Internetverbindung, weil Ihre Sprache an Microsoft geschickt wird, um den Text zu erzeugen. Es ist auf dem Desktop ans Abo gekoppelt, wo die Schaltfläche nur für Microsoft-365-Abonnenten unter Windows auftaucht. Und es lebt innerhalb von PowerPoint: Sobald Sie zu Word oder zum Browser wechseln, fangen Sie wieder von vorne an, mit dem, was die jeweilige App bietet.

Wo Sie es wirklich nutzen können: PowerPoint im Web, kostenlos mit einem Microsoft-Konto, und das Windows-Desktop-Programm, das zu einem Microsoft-365-Abo gehört. Bei einer eigenständigen Lizenz für Office 2016, 2019 oder 2021 ohne 365 ist die Schaltfläche Diktieren nicht da. Das ist kein Fehler. So sieht das Angebot von Microsoft aus. Die Internetpflicht ist die, die man am ehesten vergisst, und im briefmarkengroßen Hotel-WLAN macht dieser Cloud-Umweg genau so viel Spaß, wie es klingt.

Noch eine Klarstellung vor der Anleitung. Diktieren tippt Ihre Worte in das Feld, in dem Ihr Cursor steht. Es gestaltet nicht die Folie, wählt kein Layout und baut Ihnen keine Präsentation. Das sind andere PowerPoint-Funktionen mit anderen Namen, Designer, Präsentationscoach, Copilot, und keine davon ist Sprache zu Text. Sprache zu Text heißt, dass aus Ihrer Sprache Text in einem einzigen, fokussierten Feld wird. Das ist die ganze Aufgabe. Die Hälfte der Verwirrung im Netz kommt daher, dass eine Funktion den Mantel einer anderen trägt: Laut vorlesen spricht Ihre Folien an, Diktieren hört zu, Designer ordnet Kästchen neu an. Es ist wie mit dem Bürodrucker, von dem alle annehmen, er könne mehr, als er kann, bis sie wirklich auf den Knopf drücken.

Mit einem systemweiten Tastenkürzel in Folien und Referentennotizen diktieren

Hier ist der andere Weg, Sprache in PowerPoint zu bekommen. Whisper ist eine Desktop-App für Windows und macOS, die das Diktieren auf ein globales Tastenkürzel legt. Taste halten, sprechen, loslassen, und der Text wird an Ihrem Cursor eingefügt, in welcher App auch immer gerade vorne ist.

Das Standard-Tastenkürzel ist Ctrl+Space unter Windows und Command+Option unter macOS. Dasselbe Kürzel funktioniert im PowerPoint-Desktop-Programm, in einem Folientextfeld, im Bereich für Referentennotizen, in einem Kommentar, und arbeitet weiter, wenn Sie zu Word, Slack, Ihrem Browser oder Ihrer E-Mail wechseln. Ein Tastenkürzel, jede App, statt einer Schaltfläche, die in einem einzigen Programm eingesperrt ist.

Cancel
Das Aufnahme-Overlay: eine kleine Kapsel, die beim Sprechen erscheint, damit Sie wissen, dass Whisper zuhört.

Der Umfang ist identisch mit Diktieren, und das will ich ganz offen sagen. Whisper fügt in das eine fokussierte Feld ein, immer in eines zugleich, wo auch immer der Cursor steht. Es ordnet Ihre Folien genauso wenig an oder baut per Sprache eine Präsentation, wie Diktieren das tut. Würde ein Tool versprechen, Ihre Präsentation zu gestalten, während Sie reden, würde ich nachsehen, ob es nicht auch verspricht, Ihre Steuererklärung zu machen. Das ist dieselbe Ein-Tastenkürzel-überall-Idee, die auch hinter dem schnelleren Tippen mit der Stimme in jeder App steckt, die Sie öffnen.

Die ganze App, live

Whisper
Die echte Whisper-Desktop-App – klicken Sie sich durch, wählen Sie ein Modell und sehen Sie den Aufnahmeablauf, bevor Sie irgendetwas installieren.

Das ist die echte App, kein Screenshot davon. Klicken Sie sich durch. Wählen Sie ein Modell, öffnen Sie die Einstellungen, sehen Sie, wie der Aufnahmeablauf aussieht, bevor Sie irgendetwas installieren. Ich habe zwei Abende gebraucht, um diese Einbettung zum Laufen zu bringen, und mein Elfjähriger hat zweimal draufgeklickt und gefragt, warum es kein Video ist. Verständlich.

Beachten Sie: Hier ist nichts an PowerPoint angeschraubt. Whisper ist eine native Desktop-App, kein PowerPoint-Add-in und keine Browser-Erweiterung. Es sitzt auf Betriebssystemebene, und genau deshalb erreicht dasselbe Tastenkürzel ein Folientextfeld, eine Referentennotiz und die E-Mail, die Sie dreißig Sekunden später schreiben. Und weil es nicht auf der Technik von Microsoft aufbaut, läuft es ohne Microsoft-365-Abo.

Das Diktat automatisch aufräumen

Thinking...
Der Verbesserungs-Modus: ein optionaler KI-Durchlauf räumt Füllwörter weg und behebt offensichtliche Versprecher, bevor der Text landet.

Rohes Diktat ist roh. Man stottert, setzt einen Satz neu an, sagt öfter „äh", als man denkt. Whisper kann einen optionalen KI-Durchlauf über den Text laufen lassen, der die Füllwörter aufräumt und die offensichtlichen Versprecher behebt, bevor der Text auf Ihrer Folie landet. Im kostenlosen lokalen Modus läuft diese Bereinigung über Ollama auf Ihrem eigenen Rechner; in Pro läuft sie über OpenAI, das außerdem Antworten aus dem Web ergänzt.

PowerPoints Diktieren hat keinen vergleichbaren Durchlauf. Es fügt den erkannten Text plus die Satzzeichen ein, die Sie gesprochen haben, und das ist, was Sie bekommen. Satzzeichen sind bei Diktieren übrigens nicht automatisch: Sie sprechen sie aus, „Komma", „Punkt", „neue Zeile", wobei Microsoft Tabellen für Symbole und Währungen bereitstellt. Gut genug für eine schnelle Beschriftung, weniger gut für einen Notizenbereich, der sich wie ein Fließtext lesen soll.

Offline und privat, ohne Microsoft 365

Blaues Zahlenschloss, Sinnbild für privates Diktieren direkt auf dem Gerät

Das ist der Teil, der mir am wichtigsten ist, deshalb sage ich meine Meinung klar. Reines Cloud-Diktat ist eine Datenschutzkatastrophe, die nur darauf wartet, transkribiert zu werden. Ihr unverkündeter Umsatz, das Übernahmeziel auf Folie neun, die Gehaltsspanne, die Sie dem Vorstand präsentieren, nichts davon sollte Ihren Laptop verlassen, nur weil Sie mit der Stimme tippen wollten. PowerPoint Diktieren schickt jede Äußerung an Microsoft, um den Text zurückzubekommen. Für eine öffentliche Agenda in Ordnung. Für eine vertrauliche Präsentation überlegen Sie es sich zweimal.

Whisper im lokalen Modus läuft komplett offline. Während der Transkription wird zu keinem Zeitpunkt Internet benötigt, und das Audio verlässt nie den Rechner. Eine Verbindung brauchen Sie nur einmalig, für den Modell-Download, irgendwo zwischen etwa 140 MB und 3 GB, je nachdem, welches Modell Sie wählen. Danach können Sie im Flugzeug bei ausgeschaltetem WLAN eine Vorstandspräsentation diktieren, und nichts berührt einen Server. Dasselbe Offline-Argument gilt, ob Sie nun Folien diktieren oder allgemeiner Sprache zu Text unter Windows machen, und es ist einer der Gründe, warum Menschen lieber dazu greifen als zu den eingebauten Windows-11-Sprache-zu-Text-Werkzeugen.

Noch zwei ehrliche Unterschiede. Whisper braucht kein Microsoft-365-Abo, um zu funktionieren, weil es nicht auf der Technik von Microsoft läuft. Wenn Ihr Office eine eigenständige Dauerlizenz ohne Diktieren-Schaltfläche ist, gibt Ihnen Whisper trotzdem Sprache in PowerPoint. Bei den Sprachen: Whisper unterstützt über 90 im lokalen wie im Cloud-Modus und erreicht 99 in seiner mehrsprachigen Modellreihe (die englischsprachigen .en-Versionen sind ausschließlich Englisch). PowerPoint Diktieren listet nach Microsofts eigener Zählung 15 vollständig unterstützte gesprochene Sprachen plus 25 weitere in der Vorschau, wobei Vorschau geringere Genauigkeit oder eingeschränkte Satzzeichen bedeutet. Whisper deckt also mehr ab, aber ehrlich gesagt ist die Zahl die kleinere Geschichte. Wo das Diktat läuft und was sein Betrieb kostet, zählt mehr als die Größe des Sprachmenüs. Wenn Sie auch in einer anderen Office-App diktieren, trägt dieselbe Logik zu Sprache zu Text in Google Docs.

Wann PowerPoints eigenes Diktieren genügt

Minimalistischer Schreibtisch mit Laptop und Notizbuch, um das richtige Werkzeug zu wählen

Lassen Sie mich Ihnen ausreden, irgendetwas zu installieren. Wenn Sie an einer Web-Präsentation mit stabilem WLAN arbeiten, Microsoft 365 ohnehin schon bezahlen, nur eine schnelle Textzeile brauchen und es Ihnen nichts ausmacht, dass die Sprache durch Microsofts Cloud geht, dann drücken Sie einfach auf Start und dann auf Diktieren. Dafür brauchen Sie uns nicht. Es ist eingebaut, es funktioniert, und bei guter Verbindung ist der Umweg unsichtbar.

Greifen Sie zu Whisper, wenn eine dieser Bedingungen kippt. Sie wollen, dass das Audio offline auf Ihrem Gerät bleibt. Sie haben kein Microsoft-365-Abo oder wollen keines bezahlen. Oder Sie haben genug von einer Schaltfläche, die nur in einer App funktioniert, und wollen ein einziges Tastenkürzel, das in PowerPoint und Word und Slack und Ihren Browser diktiert, ohne für jedes eine neue Geste zu lernen. Die lokale Pipeline ist kostenlos, ohne Karte bei der Anmeldung, also kostet der Versuch des Offline-Wegs einen Download und zehn Minuten. Die Preise für die Cloud-Funktionen finden Sie auf der Preisseite, wenn Sie das Gesamtbild wollen.

Weiterführende Quellen

PowerPoints Diktieren ist echt, es ist eingebaut, und bei guter Verbindung erledigt es die Aufgabe für eine schnelle Folientextzeile. Der Preis dafür: Es lebt in der Cloud, versteckt sich auf dem Desktop hinter einem Microsoft-365-Abo und bleibt in einer einzigen App. Wenn das zu Ihrem Tag passt, haben Sie schon, was Sie brauchen. Wenn Sie lieber möchten, dass Ihre Folien auf Ihrem Laptop bleiben, oder eine Taste wollen, die mit jeder App spricht, die Sie öffnen, dann ist das die Lücke, die Whisper füllt. Meine jüngere Tochter hat das Tastenkürzel in einer einzigen Vorführung gelernt und diktiert nun die E-Mails ihrer Großmutter schneller, als ich die richtige Menüregisterkarte finde. Die Latte lag nicht hoch.

Eine Menüleiste, ein Tastenkürzel

Laden Sie Whisper herunter und diktieren Sie in PowerPoint, offline, auf Ihrer eigenen Hardware. Tastenkürzel halten, sprechen, loslassen, und der Text landet an Ihrem Cursor.

Kostenloser lokaler Modus für jedes angemeldete Konto. Keine Karte für den Start nötig.

Foto von Denys Medvediev

Denys Medvediev

Ich bin derjenige, der unsere Support-E-Mails liest, höchstwahrscheinlich, indem ich die Antworten diktiere.