Anleitung
Sprache zu Text in Coda
Coda hat keine eingebaute Diktierfunktion. Die Lösung ist ein systemweites Werkzeug: Tastenkürzel drücken, sprechen, und der Text wird an deiner Cursorposition eingefügt – in jedem Coda-Dokument, jeder Tabellenzelle oder auf jedem Canvas. Auch das Diktat deines Betriebssystems funktioniert, für kurze Notizen.
Zuletzt aktualisiert: Juni 2026

Sprache zu Text in Coda funktioniert über ein systemweites Werkzeug, nicht über Coda selbst. Coda hat keine eingebaute Diktierfunktion. Die Lösung ist ein Werkzeug wie Whisper: Tastenkürzel drücken, sprechen, und der Text wird an der Cursorposition eingefügt – in jedem Dokument, jeder Tabellenzelle oder auf jedem Canvas. Auch das Diktat deines Betriebssystems funktioniert, für kurze Notizen.
Ich führe ein paar Tracker in Coda – ein Lesetagebuch und ein Board für ein Nebenprojekt mit genau den verschachtelten Tabellen, in denen Coda wirklich gut ist. Das Einzige, was ich mir immer wieder gewünscht habe: eine Zeile in eine Tabelle zu sprechen, statt sie zu tippen. Also habe ich nach der Diktiereinstellung gesucht. Es gibt keine Diktiereinstellung. Coda hat keinen Mikrofon-Button, und nach einigem Stöbern in der Dokumentation und der Maker-Community bin ich mir sicher: Es versteckt sich auch keiner.
Leute suchen nach „Sprache zu Text in Coda“, finden in der App nichts und nehmen an, sie hätten einen Schalter übersehen. Haben sie nicht. Der Schalter wurde nie gebaut. Die gute Nachricht: Die Lösung dauert etwa zwei Minuten, läuft auf Wunsch komplett offline und funktioniert als Bonus in jeder anderen App, die du öffnest.
Hier ist der Punkt, den die meisten Seiten, die um dieses Stichwort herumtanzen, nicht klar aussprechen. Ein Coda-Dokument, eine Tabellenzelle, der Canvas-Text – das sind alles nur Textfelder, genau wie Gmail oder eine Suchleiste. Ein Diktat, das an deiner Cursorposition einfügt, ist es egal, in welcher App der Cursor gerade steht.
Die eigentliche Frage lautet also nicht „Wie schalte ich die Spracheingabe in Coda ein.“ Es gibt keinen Schalter. Die Frage lautet „Welches Diktierwerkzeug betreibe ich zusätzlich zu Coda“, und die Antwort hängt davon ab, ob du eine kostenlose Browser-Erweiterung, das Diktat deines Betriebssystems oder ein Offline-Tastenkürzel willst, das sich im Browser und in der Desktop-App gleich verhält. Ich gehe alles durch, richte eines in zwei Minuten ein und sage dir, wann du auf den dedizierten Weg verzichten kannst.
Hat Coda eine eingebaute Diktierfunktion?

Nein. Coda hat keine eingebaute Sprache-zu-Text-, Diktier- oder Spracheingabe-Funktion, um per Stimme in ein Dokument zu schreiben. Es gibt keinen Mikrofon-Button an einer Zeile, keinen Sprachbefehl, keine versteckte Einstellung. Wenn du die Einstellungen danach durchforstest, kannst du aufhören. Sie ist nicht da, und die Maker-Community fragt seit 2021 danach, ohne dass sie ausgeliefert wurde.
Was es gibt, ist ein Coda-Pack namens ElevenLabs Voice AI, und genau hier verlaufen sich die Leute. Dieses Pack geht in die andere Richtung – es verwandelt den Text in deinem Dokument in gesprochenes Audio. Es ist Text-zu-Sprache, nicht Sprache-zu-Text. Nützlich, wenn du dir dein Dokument vorlesen lassen willst; nutzlos, wenn du eine Zeile in eine Tabelle sprechen willst. Sie klingen wie dieselbe Funktion und sind exakte Gegenteile – die Art von Namensverwechslung, die einen ganzen Nachmittag kostet. Diesen Nachmittag würde ich dir lieber ersparen.
Das Bild rund um die Browser-Erweiterung ist einen Absatz wert, damit du nicht ins falsche Setup gerätst. Es gibt eine beliebte Chrome- und Edge-Erweiterung, Voice In, die in Webseiten diktiert, einschließlich der Browser-Version von Coda. Sie funktioniert, mit einem strukturellen Haken: Es ist eine Browser-Erweiterung, also erreicht sie Coda nur, wenn Coda ein Tab ist. Öffne die Coda-Desktop-App, und die Erweiterung kann sie nicht sehen. Mehr dazu zwei Abschnitte weiter unten. Der Punkt für jetzt: Nichts innerhalb von Coda tut das. Du brauchst ein Werkzeug, das obendrauf sitzt.
Tastenkürzel drücken, sprechen, Text landet in der Zelle
Das ist der ganze Mechanismus, und er ist langweilig im allerbesten Sinne. Du drückst ein Tastenkürzel, du sprichst, du lässt los, und der Text wird an deiner Cursorposition eingefügt – in genau dem Textfeld, das gerade den Fokus hat. Whisper hält nach dem Loslassen der Taste einen kurzen Moment nach, damit dein letztes Wort nicht abgeschnitten wird. Weil es an der Cursorposition des Betriebssystems einfügt, ist eine Coda-Tabellenzelle einfach „irgendein Textfeld“. Browser-Tab oder Desktop-App, gleiches Verhalten.
Genau diesen Teil verkomplizieren die Landingpages unnötig. Es gibt kein Pack, das man in Coda installiert, kein API-Token zum Einfügen, keine Automatisierung zum Beaufsichtigen. Dein Cursor steht in einer Zelle, du sprichst, die Wörter erscheinen in der Zelle. Während du sprichst, taucht eine kleine Kapsel auf, damit du weißt, dass zugehört wird:
Das Tastenkürzel ist die eine Sache, die man von Anfang an richtig machen sollte. Unter Windows ist es Ctrl+Space; auf dem Mac ist es Command+Option, ein reines Modifier-Push-to-Talk, das du beim Sprechen gedrückt hältst. Beide lassen sich in den Einstellungen ändern, falls sie mit etwas kollidieren, das du bereits verwendest. (Meine jüngere Tochter erzählte mir einmal, ein Tastenkürzel „funktioniere nicht“ in ihrer Zeichen-App. Es war ein Konflikt, kein Fehler – so habe ich gelernt, dass der Durchschnittsmensch keine Ahnung hat, was ein Tastenkürzel-Konflikt überhaupt ist. Deshalb ist jetzt jedes Tastenkürzel anpassbar.) Wenn du jemals das Diktat unter Windows oder auf dem Mac eingerichtet hast, ist das dasselbe Muskelgedächtnis, nur auf eine andere App gerichtet.
In zwei Minuten einrichten (Windows oder Mac)
Du brauchst einen Mac mit Apple Silicon oder einen Windows-PC ab Windows 10, ein funktionierendes Mikrofon und Coda geöffnet – entweder in der Desktop-App oder in einem Browser-Tab. Die gesamte lokale Pipeline ist für jedes angemeldete Konto kostenlos, ohne dass bei der Anmeldung nach einer Zahlungsmethode gefragt wird. Hier ist der Ablauf.
Schritt 1 – Whisper installieren und anmelden.
Lade es von der Download-Seite herunter, installiere es und erstelle ein kostenloses Konto. Keine Karte. Die gesamte lokale Transkriptions-Pipeline steht dir sofort offen.
Du erkennst, dass es geklappt hat, wenn das Tray-Symbol der App erscheint und der Einrichtungsassistent anbietet, ein Modell auszuwählen.
Schritt 2 – Einen Transkriptionsweg wählen.
Die App entscheidet nicht für dich. Du hast drei Optionen: Cloud (OpenAI, eigener Schlüssel), lokales Parakeet oder lokales Whisper. Für alltägliche Coda-Notizen fang lokal an – mehr dazu zwei Abschnitte weiter unten.
Du erkennst, dass es geklappt hat, wenn ein Modell fertig heruntergeladen ist und als bereit angezeigt wird.
Schritt 3 – Dein Tastenkürzel bestätigen.
Windows verwendet standardmäßig Ctrl+Space, der Mac Command+Option als Push-to-Talk gehalten. Auf dem Mac erteilst du die Bedienungshilfen-Berechtigung, wenn du dazu aufgefordert wirst; ohne sie kann das Einfügen an der Cursorposition andere Apps nicht erreichen.
Du erkennst, dass es geklappt hat, wenn eine Testaufnahme in ein beliebiges Textfeld eingefügt wird.
Schritt 4 – Setze deinen Cursor in eine Coda-Zelle und sprich.
Öffne dein Dokument, klicke in eine Zelle oder eine Zeile Canvas-Text, halte das Tastenkürzel, sag einen Satz, lass los. Der Text erscheint dort, wo der Cursor steht.
Du erkennst, dass es geklappt hat, wenn dein gesprochener Satz als Text in der Coda-Zelle steht.
Der langsame Teil ist der Modell-Download, nicht die Einrichtung. Alles andere sind die vier Schritte oben. Sobald es läuft, ist das Füllen einer Zeile in einer Coda-Tabelle keine Tipp-Aufgabe mehr, sondern eine Sprech-Aufgabe.
Coda im Browser vs. die Desktop-App
Coda kommt in zwei Varianten – eine Browser-Version und eine Desktop-App für Mac und Windows – und welcher Diktierweg funktioniert, hängt davon ab, welche du nutzt. Die meisten Seiten, die für dieses Stichwort ranken, weisen dich direkt auf Voice In, die Chrome- und Edge-Erweiterung. Sie ist eine gute Wahl mit einer strukturellen Grenze: Es ist eine Browser-Erweiterung, also erreicht sie Coda nur, wenn Coda ein Tab in diesem Browser ist. Starte die Coda-Desktop-App, und die Erweiterung kann das Fenster schlicht nicht sehen.
Ein systemweites Tastenkürzel umgeht das. Es fügt an der Cursorposition des Betriebssystems ein, egal welches Fenster sie besitzt, sodass dieselbe Taste, die im Browser eine Coda-Zelle füllt, auch eine Zelle in der Coda-Desktop-App, dein Gmail-Verfassen-Feld, eine Slack-Nachricht und eine Commit-Nachricht füllt. Ein Werkzeug, jedes Textfeld, der Browser und die native App. Du lernst beim Wechseln nichts neu und brauchst keine andere Lösung, je nachdem, wie du Coda heute gerade geöffnet hast.
Wenn du Coda ausschließlich in einem Browser-Tab und nie in der Desktop-App nutzt, ist die Erweiterung eine saubere, fokussierte Option und einen Blick wert. In dem Moment, in dem du die Coda-Desktop-App verwendest oder denselben Ablauf in jedem Programm willst, das du öffnest, gewinnt der systemweite Weg. Ich würde zum einen Tastenkürzel greifen, weil ich ungefähr vierzigmal pro Stunde die App wechsle und mir nicht vierzig verschiedene Diktier-Buttons merken will.
Lokal oder Cloud: welcher Modus für deine Dokumente
Für die meiste Coda-Arbeit probier zuerst den lokalen Modus. Vieles, was in einem Coda-Dokument landet, ist genau die Art von Inhalt, die du lieber nicht durch die Protokolle eines Anbieters laufen lässt – ein Projektplan, eine Kundennotiz, eine halb ausgegorene Idee in einer Tabelle. Wenn dein Mac Apple Silicon hat oder dein PC aus den letzten Jahren stammt, bewältigt lokal das alltägliche Diktat ohne Murren, und die Cloud wird zum Notausgang statt zum Standard.
So unterscheiden sich die drei Wege, denn die App lässt dich wählen, und ich hätte lieber, dass du gut wählst:
- Lokales Parakeet — NVIDIAs TDT-Engine, etwa 600 MB, und die schnellste lokale Option – 5- bis 10-mal schneller als Whisper auf der CPU. Deckt Englisch plus 24 weitere europäische Sprachen ab, 25 insgesamt. Keine Übersetzung ins Englische. Wenn du auf Englisch oder einer anderen europäischen Sprache arbeitest, ist das die schnelle, vollständig offline laufende Wahl.
- Lokales Whisper — langsamer als Parakeet auf derselben Maschine, aber die mehrsprachigen Builds decken 99 Sprachen ab und können ins Englische übersetzen. Die rein englischen Builds sind nur Englisch, nicht 99. Wähle das für Chinesisch, Japanisch, Koreanisch oder jede Übersetzungsarbeit, die Parakeet nicht leisten kann. Das englische Standardmodell ist etwa 480 MB groß.
- Cloud (OpenAI, BYOK) — beste Genauigkeit und Web-Zugriff, über deinen eigenen OpenAI-Schlüssel, direkt von OpenAI abgerechnet. Die Transkription läuft standardmäßig über gpt-4o-mini-transcribe. Braucht Internet, also ist es der eine Weg, der deine Maschine verlässt. Die Cloud-Oberfläche ist Teil von Whisper Pro.
Die langweilige Wahrheit ist: Für die Art von Text, die die meisten Leute in Coda schreiben, reicht lokal völlig aus. Beide lokalen Engines laufen vollständig auf deiner Maschine, ohne dass etwas an einen Server gesendet wird. Die Cloud verdient sich ihren Platz, wenn du bei einer schwierigen Aufnahme erstklassige Genauigkeit willst oder das Modell mitten im Satz einen Fakt aus dem Web ziehen soll. Für die tägliche Dokumentenroutine fang lokal an und greif nur zur Cloud, wenn dich lokal im Stich lässt.
Zeichensetzung, Aufräumen und Coda-Formatierung per Stimme
Rohes Diktat kommt als ein einziger Bandwurmsatz heraus. Du sagst „okay also füge eine zeile hinzu prüfe das launch-dokument verantwortlich bin ich fällig donnerstag status blockiert“, und das ist die ungesetzte Wand, die dir jede Sprach-Engine reicht. Beim Aufräumen gehen die Wege auseinander.
Die Windows-Spracheingabe fügt beim Sprechen Zeichensetzung hinzu, und das macOS-Diktat beherrscht einfache Zeichensetzung, wenn du „Komma“ oder „Punkt“ sagst. Für gründlicheres Aufräumen – die „Ähs“ entfernen, die Bandwurmsätze auflösen, einen gesprochenen Satz in etwas verwandeln, das du tatsächlich in einem Dokument behalten würdest – kann Whisper einen KI-Durchgang laufen lassen. Sag die Aktivierungsphrase „Hey whisper“, und der Text wird verbessert, bevor er landet. Auf einem lokalen Modell läuft das über Ollama; im Cloud-Modus ist es standardmäßig gpt-5-mini.
okay also füge eine zeile hinzu prüfe das launch-dokument verantwortlich bin ich fällig donnerstag ähm vor dem standup
Okay, also füge eine Zeile hinzu: das Launch-Dokument prüfen, verantwortlich bin ich, fällig Donnerstag vor dem Standup.
Bei Codas eigener Struktur – eine Tabelle bauen, einen Spaltentyp festlegen, eine Auswahloption hinzufügen, eine Formel schreiben – ist die ehrliche Antwort: Die Stimme liefert dir den Text, und Codas eigene Oberfläche liefert dir die Struktur. Diktiere den Zelleninhalt, dann bau die Tabelle und setz die Spaltentypen so, wie du es immer machst. Kein Diktierwerkzeug zaubert auf Befehl ein Coda-Tabellenschema herbei; wer dir „sag neue Tabelle mit drei Spalten und schau zu, wie sie gebaut wird“ verspricht, verkauft dir eine Demo, keinen Dienstag. Bring die Wörter schnell per Stimme zu Papier, forme das Dokument mit den Steuerelementen, die du bereits kennst.
Genau dieser Sprich-dann-Bereinige-Ablauf zahlt sich weit über deine Dokumente hinaus aus – du kannst auch sauberen Fließtext in jede App diktieren mit dem einen Tastenkürzel, sodass ein langer Absatz zu ein paar gesprochenen Sätzen wird statt zu etwas, das du ausschreiben musst.
Wann du für Coda auf ein Diktierwerkzeug verzichten solltest

Manchmal ist das richtige Werkzeug das kostenlose, das bereits auf deiner Maschine ist, und etwas anderes zu behaupten wäre unehrlich. Wenn du nur kurze Notizen in Coda ablegst – eine schnelle Zeile, einen Zwei-Wort-Status – deckt dein Betriebssystem das umsonst ab.
Unter Windows drückst du Windows-Taste + H, und die eingebaute Spracheingabe-Leiste öffnet sich dort, wo dein Cursor steht, eine Coda-Zelle eingeschlossen. Sie setzt von selbst Satzzeichen und ist für kurze Einsätze in Ordnung. Der Haken: Sie läuft über Microsofts Server und braucht eine Internetverbindung, ist also keine Offline-Option. Auf dem Mac kannst du mit dem Diktat überall sprechen, wo du tippen kannst; eingerichtet wird es in den Systemeinstellungen unter Tastatur, und auf Apple Silicon kann allgemeiner Text auf dem Gerät verarbeitet werden. Und wenn du Coda nur in einem Browser-Tab verwendest, ist die Voice-In-Erweiterung eine fokussierte, kostenlose Option, die genau dafür gebaut ist.
Greif zu einem dedizierten, systemweiten Werkzeug, wenn die eingebauten anfangen wehzutun: lange Notizen, mehrsprachige Arbeit, Offline-Privatsphäre unter Windows, die Coda-Desktop-App statt eines Tabs, oder der Wunsch nach einem Tastenkürzel, das sich in Coda, deiner E-Mail und deinem Editor gleich verhält. Unterhalb dieser Schwelle nutz, was kostenlos ist. Ich werde dir nicht sagen, du sollst für ein einzeiliges Status-Update eine App installieren.
Derselbe Kompromiss taucht auf, wenn du auch in anderen Werkzeugen arbeitest – die Logik beim Diktieren in Google Docs ist identisch, denn auch dort ist der Cursor, nicht ein Plugin, die eigentliche Integration.
Weiterführende Lektüre
Coda hat nie einen Mikrofon-Button ausgeliefert, und nachdem ich das geschrieben habe, bin ich ziemlich sicher, dass es nie einen geben wird. Es braucht ihn auch nicht, denn der Cursor ist die Integration. Sprich in die Zelle, bekomm Text, forme das Dokument mit den Steuerelementen, die du bereits kennst. Ich habe den größten Teil dieser Anleitung in ein Textfeld diktiert, das nicht Coda war, mit einem Werkzeug, dem es egal ist, welches Feld es ist, und dann das Ganze in ein Dokument eingefügt. Das ist der ganze Trick.
Probier es in deinem nächsten Coda-Dokument
Tastenkürzel halten, sprechen, loslassen. Der Text landet in der Zelle, in der dein Cursor steht – und in jeder anderen App auch.
Kostenloser lokaler Modus für jedes angemeldete Konto. Keine Karte zum Start erforderlich.



