Von Denys Medvediev

Anleitung

Sprache zu Text in Google Keep: am Handy ja, im Web nein

Die Sprachnotiz von Google Keep ist kostenlos und funktioniert am Handy gut. Im Web gibt es überhaupt keine Mikrofon-Schaltfläche. Diese Anleitung erklärt die Handy-Funktion ehrlich, die Lösung für den Desktop per Tastenkürzel und wann du die zweite getrost weglassen kannst.

Zuletzt aktualisiert: Juni 2026

Aufgeschlagenes Notizbuch mit Stift neben einem Laptop auf einem Holztisch, Notizen werden von Hand und am Bildschirm festgehalten

Sprache zu Text in Google Keep funktioniert in den Android- und iOS-Apps, aber nicht im Web. Am Handy tippst du in einer Notiz auf das Mikrofon, und Keep transkribiert, während du sprichst, und speichert nebenbei den Audioclip. Auf keep.google.com im Desktop-Browser gibt es keine Mikrofon-Schaltfläche, also brauchst du am Computer ein separates Werkzeug zum Diktieren.

Ich habe das so herausgefunden, wie es den meisten passiert: in der Küche stehend, das Handy in einer Hand, und zehn Minuten später am Laptop denselben Trick versuchen, nur um festzustellen, dass die Schaltfläche weg ist. Ich entwerfe beruflich den ganzen Tag Systeme, und trotzdem bin ich davon ausgegangen, dass die Desktop-Version die Funktion hat, die das Handy hat. Hat sie nicht. Die Sprachnotiz von Google Keep ist am Handy wirklich gut. Im Web ist sie schlicht nicht vorhanden. Diese Lücke ist die ganze Geschichte hier, und sie hat eine saubere Lösung.

Kurz gesagt: Wenn deine Notizen auf dem Handy entstehen und du Empfang hast, ist die eingebaute Sprachnotiz von Keep kostenlos und funktioniert gut. Wenn du am Computer Notizen machst – oder wenn deine Stimme das Gerät am liebsten nie verlassen soll – brauchst du ein Desktop-Werkzeug, das in jedes Textfeld tippt, auch in eine Keep-Notiz, die du im Browser geöffnet hast. Diese Anleitung behandelt beides, ehrlich, und sagt dir, wann du die zweite Variante getrost weglassen kannst.

Aufs Mikro tippen, reden, Notiz bekommen. Zumindest am Handy

Schreibtisch von oben mit blauen Haftnotizen, einem Spiralblock und liniertem Papier für schnelle Erinnerungen

Das ist der Teil, den Google Keep richtig macht. In den Android- und iPhone-Apps öffnest du eine neue Notiz, tippst auf das Mikrofon-Symbol und sprichst. Keep transkribiert, während du redest, und setzt den Text direkt in die Notiz. Es speichert außerdem den ursprünglichen Audioclip unter dem Text, sodass du beides hast – die Worte und die Aufnahme – synchronisiert über alle Geräte, auf denen du angemeldet bist.

Du kannst etwa zehn Minuten am Stück sprechen. Das Transkript landet als schlichter, bearbeitbarer Text, sodass du alles korrigieren kannst, was Keep falsch versteht. Unter Android kannst du es auch freihändig mit "Ok Google" starten, was praktisch ist, wenn beide Hände gerade mit etwas anderem voll sind.

Die Sprache richtet sich nach deinen Tastatur- und Spracheingabe-Einstellungen, nicht nach einer Einstellung in Keep selbst. Das bringt viele aus dem Konzept – sie suchen ein Sprach-Dropdown in der Notiz, und das gibt es nicht. Du änderst sie dort, wo du auch deine Tastatursprache änderst.

Für schnelles Festhalten unterwegs ist das kaum zu schlagen. Es ist kostenlos, eingebaut und speichert das Audio, falls das Transkript ein Wort verschluckt hat. Ehre, wem Ehre gebührt.

Der Haken: Im Web hat Keep keine Sprach-Schaltfläche

Jetzt der Teil, den die Marketing-Seiten überspringen. Öffne keep.google.com in Chrome, Edge, Firefox oder Safari am Computer und suche dieses Mikrofon. Es ist nicht da. Die Desktop- und Web-Version von Google Keep hat kein eingebautes Diktieren und keine Schaltfläche für Audionotizen. Das Top-Ergebnis für genau diese Suche sagt es unverblümt: Sprache zu Text gibt es in der mobilen App, aber nicht in der Web-Version von Google Keep.

Viele verwechseln das mit Google Docs, was nachvollziehbar ist – beides ist Google, in beidem tippt man. Aber Docs hat unter "Tools" seine eigene Desktop-Spracheingabe, und Keep nicht. Es sind getrennte Produkte. Keep im Web bleibt bei Maus und Tastatur.

Wenn du also die meisten deiner Notizen am Schreibtisch machst, trifft die native Funktion, von der du gelesen hast, auf dich nicht zu. Du hast drei ehrliche Möglichkeiten, am Computer in Keep zu diktieren: eine Browser-Erweiterung, die nur innerhalb eines Chrome- oder Edge-Tabs funktioniert, die eingebaute Diktierfunktion deines Betriebssystems oder ein systemweites Desktop-Werkzeug. Zu allen dreien komme ich gleich.

Und selbst am Handy läuft die Sprachnotiz von Keep in der Cloud – sie braucht eine Internetverbindung und funktioniert nicht offline. "Funktioniert die Sprache-zu-Text-Funktion von Google Keep offline?" ist eine der häufigsten Fragen, und die ehrliche Antwort ist nein. Zwei weitere Eigenheiten: Sie setzt keine Satzzeichen und keine Formatierung, du bekommst also einen rohen Wortblock, den du selbst zeichensetzen musst, und der ursprüngliche Audioclip wird immer neben dem Transkript gespeichert, ob du die Aufnahme wolltest oder nicht. Nichts davon ruiniert eine Einkaufsliste. Es fängt an, eine Rolle zu spielen, sobald du etwas diktierst, das du lieber für dich behalten würdest.

Hier setze ich eine Flagge: reines Cloud-Diktieren ist ein Datenschutz-Desaster, das nur darauf wartet zu passieren. Die Nachricht an die Lehrerin deines Kindes, der halbgare Gedanke über deinen Chef, die Adresse, die du laut vorgelesen hast – nichts davon muss eine Rundreise über einen Server machen, nur weil dir gerade nicht nach Tippen war. Dein Laptop hat bereits ein Mikrofon und einen Prozessor. Für einen Absatz braucht er nichts weiter im Spiel.

Mit einem Tastenkürzel am Computer in Google Keep diktieren

Hier die Desktop-Lösung. Whisper ist eine native App für Windows und macOS, die dir ein einziges globales Tastenkürzel gibt: drücken, sprechen, loslassen, und deine Worte erscheinen an der Cursorposition – in welchem Feld der Cursor auch gerade steht. Dazu gehört eine Keep-Notiz, die du im Browser geöffnet hast, der Titel oder der Textkörper, ein Feld nach dem anderen.

Cancel
Das Aufnahme-Overlay: eine kleine Kapsel, die erscheint, während du sprichst, damit du weißt, dass Whisper zuhört.

Der Ablauf ist kurz. Öffne keep.google.com, klicke in den Textkörper einer neuen Notiz, halte das Tastenkürzel, sprich deinen Satz, lass los. Der Text wird eingefügt. Unter Windows ist das Standard-Kürzel Ctrl+Space; unter macOS hältst du Command+Option zusammen und lässt los, um zu stoppen. Du kannst es in den Einstellungen ändern, falls es mit etwas anderem kollidiert.

Weil das Tastenkürzel auf Betriebssystem-Ebene lebt, ist es nicht an Keep oder an einen Browser-Tab gebunden. Dieselbe Taste diktiert in Gmail, Slack, deinen Code-Editor, ein Word-Dokument und die Suchleiste. Keep ist nur einer der Orte, an denen es zufällig landet. Das ist der Unterschied zu einer Browser-Erweiterung wie Voice In, die nur innerhalb eines Chrome- oder Edge-Tabs funktioniert und den Browser nie verlässt.

Eine ehrliche Einschränkung: Whisper tippt Text. Es nimmt keine Audiodatei auf und hängt keine an, wie es die mobile Notiz von Keep tut. Wenn du ausdrücklich die gespeicherte Aufnahme willst, ist das ein Grund, zur Handy-Funktion von Keep zu greifen, nicht zu dieser hier.

Die ganze App, live

Whisper
Die echte Whisper-Desktop-App – wähle einen Transkriptionsweg, drück das Tastenkürzel und sieh zu, wie der Text im Feld landet. Klick im Embed herum; es ist genau das, was du installieren würdest.

Das ist die tatsächliche App, kein Screenshot. Du wählst, wie die Transkription läuft – es gibt keinen erzwungenen Standard. Das lokale Whisper deckt über 90 Sprachen ab und läuft vollständig auf deinem Rechner. Die mehrsprachige Modellreihe erreicht konkret über 99 Sprachen mit automatischer Erkennung; die rein englischen Varianten beherrschen eine Sprache gut. Es gibt außerdem eine schnellere lokale Option fürs Diktieren auf Englisch und in europäischen Sprachen sowie einen Cloud-Weg, wenn du deinen eigenen OpenAI-Schlüssel mitbringst.

Du entscheidest nach deinem Bedarf: Geschwindigkeit, Sprachabdeckung oder Spitzenqualität. Die App stellt die Optionen vor und hält sich dann zurück. Klick oben im Embed herum – es ist genau das, was du installieren würdest.

Das Diktat automatisch aufräumen

Thinking...

Erinnerst du dich an das Problem mit den fehlenden Satzzeichen bei Keep? Hier wird es gelöst. Whisper kann auf dem rohen Transkript einen optionalen KI-Durchgang zum Aufräumen laufen lassen. Er setzt die Satzzeichen, korrigiert die offensichtlichen Stolperer und bringt den Text in Form, bevor er in deiner Notiz landet.

Dieses Aufräumen läuft im kostenlosen Modus lokal oder über deinen eigenen OpenAI-Schlüssel, wenn du die Cloud-Funktionen aktiviert hast. So oder so ist das, was in deiner Keep-Notiz ankommt, ein sauberer Absatz und keine Wand aus Kleinbuchstaben, in die du von Hand Kommas setzen musst. Bei längeren Notizen – einer Besprechungszusammenfassung, einem Tagebucheintrag, dem Entwurf einer E-Mail, den du in eine Notiz einfügst – spart dieser eine Durchgang die Korrekturzeit, die Diktieren sonst nach mehr Arbeit als Tippen aussehen lässt.

Offline und privat

Nahaufnahme eines Messing-Vorhängeschlosses in einer Hand, Sinnbild für private, lokal abgeschottete Verarbeitung

Der lokale Modus von Whisper läuft vollständig offline. Während der Transkription ist kein Internet nötig, und das Audio verlässt deinen Computer nie. Eine Verbindung brauchst du nur ein einziges Mal für den Modell-Download, der je nach gewähltem Modell zwischen etwa 140 MB und 3 GB liegt. Danach kannst du im Zug ohne Empfang in eine Keep-Notiz diktieren – die Worte gehen rein, die Stimme bleibt zu Hause.

Das ist die praktische Antwort auf den Datenschutzpunkt von vorhin. Die Sprachnotiz von Keep schickt deine Sprache jedes Mal an einen Server. Das lokale Whisper schickt sie nirgendwohin. Bei einer Einkaufsliste ist das egal. Bei allem, wofür du die Stimme senken würdest, ist es der Unterschied, der zählt.

Am stärksten fällt mir das in den banalen Momenten auf. Letzten Dienstag habe ich, in dieser Reihenfolge, eine E-Mail an die Lehrerin, eine Antwort auf eine Wohnungsanzeige und eine Einkaufsliste diktiert, während ich Brotdosen gepackt habe – Gurkenscheiben, der Joghurt, den die Jüngere ablehnen wird. Whisper hat die Übergänge bewältigt, samt der Pause, in der ich gefragt habe, wie man den Namen der Lehrerin schreibt. Die E-Mail ging raus, die Brotdosen waren fertig, und nichts davon hat je einen Server berührt. Früher hat das fünfzehn Minuten einhändiges Tippen gekostet.

Wann du lieber Keeps eigene Android-Sprachfunktion nutzt

Flatlay aus einem schwarzen Spiralblock, einem Smartphone und einem Bleistift auf einem hellen Schreibtisch für mobile Notizen

Hier sage ich dir, dass du mein Werkzeug weglassen sollst. Wenn du Google Keep ausschließlich am Handy nutzt und Empfang hast, nimm einfach die eingebaute Sprachnotiz. App öffnen, aufs Mikro tippen, reden, fertig. Sie ist kostenlos, schon installiert und speichert sogar den Audioclip, falls das Transkript etwas verpasst hat. Um einen Gedanken im Supermarktgang festzuhalten, schlägt keine Desktop-App das Handy, das du ohnehin schon in der Hand hast.

Greif zu einem Desktop-Werkzeug, wenn eines von drei Dingen zutrifft: Du machst Notizen am Computer, und die Web-Version von Keep lässt dich ohne Schaltfläche dastehen; du willst es offline nutzen, wobei das Audio auf deinem Gerät bleibt; oder du willst sauberen, mit Satzzeichen versehenen Text, ohne dass eine Aufnahme deiner Stimme mitkommt. Wenn nichts davon auf dich zutrifft, ist das Mikrofon des Handys die richtige Wahl.

Der Teil, der Keep Konkurrenz macht, ist kostenlos

Die Sprachnotiz von Google Keep ist kostenlos, am Preis entscheidet sich dieser Vergleich also nicht. Whispers lokale Pipeline – das Offline-Diktieren, das in jede App tippt, auch in Keep im Web – ist für angemeldete Nutzer kostenlos, ganz ohne Karte zum Start. Die Cloud-Funktionen, die deinen eigenen OpenAI-Schlüssel für Cloud-Transkription und Web-Antworten ergänzen, sind die kostenpflichtige Stufe. Die vollständigen Zahlen findest du auf der Whisper-Preisseite; ich nenne sie hier nicht, denn der Teil, der Keep Konkurrenz macht, ist der kostenlose Teil. Der eigentliche Unterschied zu Keep sind nicht die Kosten – es ist, wo es läuft und was es mit deinem Audio macht.

Weiterführende Quellen

Das Handy-Mikro von Keep ist das richtige Werkzeug für den Supermarktgang. Für den Schreibtisch – wo die Web-Version klammheimlich das Mikrofon weggelassen hat – brauchst du etwas, das in jedes Feld tippt und deine Stimme vom Server fernhält. Wenn du dir lieber zuerst die Mechanik ansiehst: Unser Leitfaden zur Spracheingabe unter Windows führt durch das Tastenkürzel, und wie du mit deiner Stimme schneller tippst behandelt die umfassendere Gewohnheit. Für den Docs-Cousin siehe Sprache zu Text in Google Docs, und Sprache zu Text fürs Notizenmachen behandelt Notizen über Keep hinaus. Meine jüngere Tochter hat eine 90-Wörter-E-Mail an ihre Großmutter geschrieben, bevor sie auch nur eine einzige Frage dazu gestellt hat, wie es funktioniert. Dasselbe würde ich gern über meine letzte Spesenabrechnung sagen.

Probier es da aus, wo du wirklich tippst

Lade Whisper herunter, öffne keep.google.com und diktiere deine erste Notiz im Browser. Das Transkript landet dort, wo dein Cursor steht – in Keep und in jeder anderen App genauso.

Kostenloser lokaler Modus für jedes angemeldete Konto. Keine Karte zum Start nötig.

Foto von Denys Medvediev

Denys Medvediev

Ich bin derjenige, der unsere Support-E-Mails liest – höchstwahrscheinlich, indem ich die Antworten diktiere.