Von Denys Medvediev

Anleitung

Sprache zu Text in ClickUp: Aufgaben, Docs und Kommentare diktieren

ClickUp kann dir auf zwei Wegen zuhören. Die eigene Funktion Talk to Text läuft über die Brain-MAX-App in der Cloud. Die kostenlose Offline-Alternative ist ein systemweiter Hotkey wie Whisper, der in jedes ClickUp-Feld diktiert – und in jede andere App ebenso.

Zuletzt aktualisiert: Juni 2026

Schreibtisch mit Laptop, Notizbüchern und farblich sortierten Checklisten, der an Aufgaben- und Projektarbeit erinnert

Sprache zu Text in ClickUp funktioniert auf zwei Wegen. ClickUp hat eine eigene Diktierfunktion, Talk to Text, die über die Brain-MAX-App läuft: Taste halten, sprechen, und KI-geschliffener Text landet dort, wo dein Cursor steht. Die kostenlose Offline-Alternative ist ein systemweiter Hotkey wie Whisper, der in jedes ClickUp-Feld diktiert – und in jede andere App ebenso.

Die Frage ist also nicht, ob ClickUp dich hören kann. Das kann es. Die Frage ist, welche Sprachmethode zur Aufgabe passt – und ob du willst, dass dein Audio dafür in die Cloud wandert. Letzten Dienstag habe ich einen Aufgabenkommentar diktiert, während ich Gurken für zwei Brotdosen geschnitten habe. Der Kommentar wurde geschrieben. Die Gurken, weniger sauber.

Das hier ist eine Anleitung. Ich zeige dir, wie du mit einem einzigen Hotkey in einen echten ClickUp-Aufgabennamen, eine Beschreibung, ein Doc und einen Kommentar diktierst, wo ClickUps eigenes Talk to Text passt, wo nicht, und in einem ehrlichen Abschnitt sage ich dir, wann du mein Tool besser ganz weglässt.

Hat ClickUp eine eingebaute Sprache-zu-Text-Funktion? Ja, mit einem Haken

Hände, die auf einer Tastatur an einem Holztisch mit Papieren und einer Maus tippen – der übliche Weg, Text in ein Aufgaben-Tool einzugeben

Räumen wir zuerst mit dem Mythos auf. ClickUp hat eine Diktierfunktion. Sie heißt Talk to Text und sie ist gut: Taste gedrückt halten, sprechen, und ClickUps KI bereinigt das Ergebnis und fügt es genau dort ein, wo dein Cursor steht. ClickUps eigene Produktseite bewirbt sie mit „einmal sprechen, überall tippen“ und sagt, sie funktioniere in jeder App, nicht nur in ClickUp. Sie läuft über eine Desktop-App für Mac und Windows sowie eine Brain-MAX-Erweiterung für Chrome. Sie beherrscht über 50 Sprachen, lernt ein persönliches Wörterbuch mit deinem Fachjargon und ist kontextbewusst genug, um die richtige Person, Aufgabe oder das richtige Doc per @-Erwähnung mit dem korrekten Link zu verlinken.

Hier ist der Haken. Talk to Text läuft über ClickUps Brain-MAX-App – ClickUps KI-Produkt, nicht den Basistarif. ClickUp bewirbt sie als „kostenlos testen, keine Kreditkarte nötig“, was eine Testversion des kostenpflichtigen KI-Add-ons ist und keine dauerhaft kostenlose Basisfunktion. Und es ist Cloud-KI – ein Offline-Modus wird nirgends auf der Produktseite erwähnt.

Verwechsle Talk to Text auch nicht mit den ClickUp Voice Clips. Ein Voice Clip ist eine Audioaufnahme, die du an einen Kommentar anhängst und die im Nachhinein transkribiert wird, wenn dein Workspace ClickUp Brain hat. Das ist erst aufnehmen, dann transkribieren. Talk to Text ist Live-Diktat direkt ins Feld. Genauso wie die Methode weiter unten.

In jedes ClickUp-Feld mit einem Hotkey diktieren

Der Weg auf Betriebssystemebene braucht überhaupt keine ClickUp-Oberfläche. Du installierst ein Desktop-Diktiertool, es belegt einen globalen Hotkey, und dieser Hotkey fügt transkribierten Text in das Feld ein, in dem gerade der Cursor steht – einen ClickUp-Aufgabennamen, eine Beschreibung, ein ClickUp-Doc, einen Kommentar. Dieselbe Taste funktioniert in Slack, in deinem E-Mail-Programm und in deinem Code-Editor, weil das Tool auf Betriebssystemebene sitzt und nicht in einem Browser-Tab.

Bei Whisper ist der Standard-Hotkey Ctrl+Space unter Windows und Command+Option unter macOS. Der Ablauf ist in jedem ClickUp-Feld gleich:

Cancel
Das Aufnahme-Overlay: eine kleine Kapsel, die erscheint, während du sprichst, damit du weißt, dass Whisper zuhört.
  1. Klicke in das gewünschte Feld – den Aufgabennamen, das Beschreibungsfeld, ein Doc oder die Kommentarzeile.
  2. Halte den Hotkey und sprich. Sag den Satz so, wie du ihn laut sagen würdest.
  3. Loslassen. Ein, zwei Sekunden später erscheint der Text am Cursor.
  4. Kurz drüberschauen, bei Bedarf ein Wort korrigieren, weitermachen.

Das war's. Kein „Diktat starten“-Dialog, kein separates Fenster, kein Kopieren und Einfügen aus einer anderen App. Du bleibst in dem ClickUp-Feld, in dem du ohnehin schon warst.

Ein ehrlicher Hinweis zum Umfang, weil er wichtig ist und sonst niemand ihn ausspricht: Whisper fügt in das eine fokussierte Feld ein, immer ein Feld nach dem anderen. Es füllt den Aufgabennamen oder die Beschreibung oder einen Kommentar – dort, wo der Cursor ist. Es füllt nicht ein ganzes mehrfeldriges Aufgabenformular in einem Atemzug. Das ist genau derselbe Umfang wie ClickUps eigenes Talk to Text. Wer dir „eine komplette Aufgabe auf einmal diktieren“ verspricht, verkauft dir eine Demo, keinen Arbeitsablauf.

Whisper
Die echte Whisper-Desktop-App – wähle einen Transkriptionsweg, drücke den Hotkey und sieh zu, wie der Text im Feld landet.

Diese Einbettung ist die echte App, kein Screenshot. Wähle einen Transkriptionsweg, drücke den Hotkey, sieh zu, wie der Text landet. ClickUp muss gar nicht wissen, dass das Tool existiert – für ClickUp sieht es genau so aus, als hättest du schnell getippt.

Es gibt drei Wege, und die App entscheidet nicht für dich. Der Cloud-Modus nutzt deinen eigenen OpenAI-Schlüssel für höchste Genauigkeit und Web-Antworten. Parakeet ist die schnellste lokale Option für Englisch und 24 europäische Sprachen. Whispers mehrsprachige Modelle decken über 99 Sprachen ab, inklusive automatischer Erkennung und Übersetzung ins Englische. Die meiste ClickUp-Arbeit besteht aus kurzen Schüben – ein Aufgabentitel, ein zweizeiliger Kommentar – sodass selbst die kleineren lokalen Modelle mithalten.

Das Diktat automatisch aufräumen

Thinking...

Rohes Diktat enthält das „äh“, den Fehlstart, die Stelle, an der du „nein, streich das“ gesagt hast. ClickUps Talk to Text bearbeitet das Transkript automatisch, bevor es eingefügt wird. Whisper bietet dieselbe Bereinigung als optionale Schicht an: ein lokaler KI-Durchlauf, der im kostenlosen Modus auf deinem eigenen Rechner läuft, oder ein Cloud-Durchlauf in Pro, wenn du deinen eigenen Schlüssel mitbringst. Schalte sie ein, und aus „äh schick das Deck bis Donnerstag an Maria ähm und nimm die Finanzabteilung mit rein“ wird eine saubere Aufgabenbeschreibung. Schalte sie aus, und du bekommst das wörtliche Transkript. Deine Entscheidung, bei jeder Aufnahme neu.

Der Brotdosen-Kommentar, den ich oben erwähnt habe – „Design bitten, den Hero bis Freitag neu zu machen, mir Bescheid geben, falls es hakt“ – ging im ersten Durchlauf sauber durch, während ich nach dem zweiten Joghurt griff, den die Kleine sowieso nie essen würde. Der Kommentar war raus. Der Joghurt kam unangetastet wieder nach Hause, wie vorhergesagt.

Lokal vs. Cloud: warum ich ClickUp offline diktiere

Nahaufnahme eines Messing-Vorhängeschlosses als Sinnbild für privates Diktieren direkt auf dem Gerät, das es nie verlässt

Hier ist meine eine feste Meinung, und ich stehe dazu: Diktieren ohne Offline-Option ist eine Datenschutzkatastrophe, die nur darauf wartet, transkribiert zu werden. Cloud ist in Ordnung, wenn du sie selbst wählst – Whisper hat auch einen Cloud-Weg, mit deinem eigenen Schlüssel. Das Problem entsteht, wenn Cloud der einzige Weg ist. Die Aufgabe, die du diktierst, könnte eine Gehaltsbewertung sein, eine juristische Notiz, der Name und die Nummer eines Kunden. Bei ClickUp Talk to Text und bei der Browser-Erweiterung Voice In wandert dieses Audio zu einem Server, um als Text zurückzukommen – beide sind reine Cloud-Lösungen, ohne lokalen Rückfall.

Whispers lokaler Modus läuft komplett auf deinem Rechner. Kein Internet während der Transkription, und das Audio verlässt den Laptop nie. Die einzige Verbindung, die du brauchst, ist der einmalige Modell-Download, irgendwo zwischen etwa 140 MB und 3 GB, je nach Modell. Danach kannst du im Flugzeug bei ausgeschaltetem WLAN die ClickUp-Kommentare eines ganzen Sprints diktieren.

Wie sehr das zählt, hängt davon ab, was in deinen Aufgaben steht. „Milch kaufen“ – das diktierst du überall. Alles, was du im Großraumbüro nur ungern laut vorlesen würdest, ist auf dem Gerät die langweilige, richtige Voreinstellung. Dieselbe Überlegung zieht sich durch unsere Anleitungen zum Diktieren in Notion und zum Sprache zu Text in Jira – das Projekt-Tool ändert sich, die Datenschutz-Rechnung nicht.

ClickUp Talk to Text vs. Voice In vs. Whisper vs. der ChatGPT-Trick

Es gibt vier echte Wege, deine Stimme in ClickUp zu bekommen. Sie sind nicht austauschbar.

MethodeWo es funktioniertOnline oder offlineWas es dich kostet
ClickUp Talk to TextJede App, über die Brain-MAX-Desktop-App oder die Chrome-ErweiterungNur CloudLäuft über ClickUps Brain-MAX-KI; „kostenlos testen, keine Karte“-Testversion eines kostenpflichtigen Add-ons
Whisper (Hotkey auf Systemebene)Die ClickUp-Desktop-App und jede andere native AppLokal/offline oder Cloud, deine WahlKostenlose lokale Stufe bei der Anmeldung, keine Karte; Pro ergänzt die Cloud
Voice In (Browser-Erweiterung)Nur die ClickUp-Web-App, innerhalb des Browser-TabsNur CloudKostenlose Stufe mit kostenpflichtigen Upgrades
Der ChatGPT-TrickÜberall, aber Kopieren-Einfügen, nicht direkt im FeldNur CloudWas auch immer du für ChatGPT zahlst

Der ChatGPT-Weg – in die ChatGPT-App diktieren, sie verfeinern lassen, kopieren, in ClickUp einfügen – ist der, mit dem sich die meisten „Sprache zu Text in ClickUp“-Anleitungen zufriedengeben. Er funktioniert, aber es sind drei Apps und eine Zwischenablage für einen einzigen Kommentar. Voice In ist sauberer, lebt aber nur im Browser-Tab und ist damit nutzlos in der ClickUp-Desktop-App oder irgendwo außerhalb von Chrome. Die Sprachanzahl ist nicht der entscheidende Faktor: ClickUp nennt über 50 Sprachen, Whisper deckt über 90 ab, beides ist reichlich. Die echten Achsen sind, wo es läuft, was es kostet und ob dein Audio das Haus verlässt.

Wann du lieber ClickUps eigenes Talk to Text nutzen solltest

Team beim Brainstorming an einem Whiteboard im Büro – die kollaborative Arbeit, zu der die eigenen Funktionen eines Projekt-Tools am besten passen

Ich tue nicht so, als würde Whisper jedes Mal gewinnen. Wenn du im Grunde in ClickUp lebst, ein Diktat willst, das automatisch die richtigen Teammitglieder, Aufgaben und Docs mit den korrekten Links per @-Erwähnung verlinkt, und du ClickUp Brain MAX ohnehin nutzt oder dafür zahlst, dann ist ClickUps eigenes Talk to Text die bessere Wahl. Dieses @-Erwähnungs-Bewusstsein ist ein echter „Ich wohne hier“-Vorteil, den kein allgemeines Diktiertool erreichen kann, weil es deinen Workspace mitliest. Greif stattdessen zu Whisper, wenn du willst, dass das Audio auf deinem Gerät bleibt, ein kostenloses Tool ohne KI-Add-on und ohne Karte, oder einen Hotkey, der in ClickUp, Slack, Gmail und deinem Editor gleich funktioniert – statt einer ClickUp-förmigen Oberfläche.

Was es kostet

ClickUp Talk to Text wird als „kostenlos testen, keine Kreditkarte“ beworben, was eine Testversion von ClickUps Brain-MAX-KI ist – ein kostenpflichtiges Add-on, nicht der dauerhafte Basistarif. Whispers gesamte lokale Pipeline ist bei der Anmeldung kostenlos, ohne Karte und ohne KI-Add-on. Whisper Pro ergänzt die Cloud-Oberfläche und kommt mit einer 7-tägigen Cloud-Testphase, bei der eine Karte nur für diesen Upgrade-Vorgang nötig ist, niemals bei der ersten Anmeldung. Wirf die beiden nicht in einen Topf: Das lokale Diktat, das deine ClickUp-Aufgaben erledigt, ist der kostenlose Teil. Die Zahlen findest du auf unserer Preisseite, falls du sie sehen willst.

Weiterlesen

Die meisten „Sprache zu Text in ClickUp“-Anleitungen hören am unangenehmen Teil auf – eine andere App öffnen, dort diktieren, kopieren, einfügen. Das musst du nicht. Ins Feld klicken, Taste halten, sprechen, und die Worte erscheinen dort, wo du ohnehin schon arbeitest. Meine jüngere Tochter hatte den Dreh nach einer Demo raus; sie ist sieben, und ihre Einkaufsliste war nie lesbarer als meine. Wenn du die komplett tastaturfreie Version willst, erfährst du hier, wie du mit der Stimme schneller schreibst unter Windows und Mac.

Diktier deinen nächsten ClickUp-Kommentar

Ins Feld klicken, Taste halten, sprechen, loslassen. Das Transkript landet dort, wo dein Cursor steht – in ClickUp und in jeder anderen App ebenso.

Kostenloser lokaler Modus für jedes angemeldete Konto. Keine Karte zum Starten nötig.

Foto von Denys Medvediev

Denys Medvediev

Ich bin der, der unsere Support-E-Mails liest – die Antworten höchstwahrscheinlich diktierend.