Anleitung
Sprache zu Text in HubSpot
HubSpot hat keine eingebaute Spracheingabe für Notizen, E-Mails oder Aufgaben. Die Lösung ist ein systemweites Tool: Tastenkürzel drücken, sprechen, und der Text wird in jedes HubSpot-Feld an der Cursorposition eingefügt. Die Diktierfunktion deines Betriebssystems funktioniert für kurze Eingaben ebenfalls.
Zuletzt aktualisiert: Juni 2026

Sprache zu Text in HubSpot funktioniert über ein systemweites Diktiertool, nicht über HubSpot selbst. Das HubSpot CRM hat keine eingebaute Spracheingabe für Notizen, E-Mails oder Aufgaben. Ein Tool wie Whisper behebt das: Tastenkürzel drücken, sprechen, und der Text wird im Browser an der Cursorposition in jedes HubSpot-Feld eingefügt. Die Diktierfunktion des Betriebssystems funktioniert für kurze Eingaben ebenfalls.
Ich beobachte seit fünfzehn Jahren, wie Vertriebsleute Anrufe protokollieren, und das Muster ändert sich nie. Der Anruf endet, der Mitarbeiter hat den Kopf voller Kontext, und dann starrt er auf den Kontaktdatensatz und tippt vielleicht ein Drittel davon, bevor der nächste Anruf beginnt. Die guten Details verflüchtigen sich. Also suchen die Leute nach einer Mikrofon-Schaltfläche in HubSpot. Es gibt keine. Ich habe nachgesehen, dann habe ich die Community-Foren durchforstet, und die Lücke ist real.
Die Leute suchen nach "Sprache zu Text in HubSpot", finden nichts im CRM und nehmen an, sie hätten irgendwo in der Editor-Symbolleiste eine Einstellung übersehen. Haben sie nicht. HubSpot hat das Diktieren nie in das Notizfeld, den E-Mail-Editor oder die Aufgabenbeschreibung eingebaut. Die gute Nachricht: Die Lösung dauert etwa zwei Minuten, läuft auf Wunsch offline und funktioniert als Bonus in jeder anderen App auf deinem Bildschirm.
Hier ist der Punkt, den die meisten Seiten, die auf dieses Stichwort abzielen, überspringen. Eine HubSpot-Notiz ist nur ein Textfeld in deinem Browser, genau wie Gmail oder eine Suchleiste. Eine Diktierfunktion, die an der Cursorposition einfügt, kümmert sich nicht darum, dass das Feld zufällig in einem CRM lebt.
Die eigentliche Frage ist also nicht "Wie schalte ich die Spracheingabe in HubSpot ein." Es gibt keinen Schalter. Die Frage lautet "Welches Diktiertool führe ich über HubSpot aus", und die Antwort hängt davon ab, ob du kostenlos-und-eingebaut willst oder ein offline funktionierendes Tastenkürzel, das sich in einer Deal-Notiz, im E-Mail-Editor und in einer Aufgabe gleich verhält. Ich erkläre dir, was HubSpot kann und was nicht, richte eines in zwei Minuten ein und sage dir, wann du den dedizierten Weg ganz überspringen kannst.
Hat HubSpot eine Sprache-zu-Text-Funktion?

Nicht fürs Tippen. Das HubSpot CRM hat keine eingebaute Diktier- oder Spracheingabefunktion, um per Stimme in eine Notiz, eine E-Mail oder eine Aufgabe zu schreiben. Es gibt keine Mikrofon-Schaltfläche im Notizeditor und keinen Sprachbefehl für den Editor. Es gibt auf HubSpots eigener Community-Plattform eine offene Idee, die genau danach fragt, und es existieren mindestens drei separate Tools, die das Diktieren von außen an HubSpot anbinden – was das deutlichstmögliche Signal dafür ist, dass das CRM das nicht von Haus aus kann. Wenn du in der Editor-Symbolleiste nach einem Mikrofon-Symbol gesucht hast, kannst du aufhören.
Jetzt der ehrliche Vorbehalt, denn hier verheddern sich die Leute. HubSpot hat durchaus Sprachfunktionen – sie gehören nur in eine andere Kategorie. HubSpot kann Vertriebsanrufe über seine Anrufaufzeichnung und Conversation-Intelligence-Tools aufnehmen und transkribieren. Das ist eine Meeting-artige Funktion: Sie erfasst einen Anruf, der bereits stattgefunden hat, und erzeugt danach ein Transkript. Es ist kein Live-Diktat. Du kannst nicht deinen Cursor in eine Deal-Notiz setzen, sprechen und zusehen, wie deine Worte im Feld erscheinen. Das eine zeichnet Anrufe auf; das andere tippt für dich, während du nachdenkst. Sie lösen unterschiedliche Probleme, und sie zu verwechseln kostet einen Nachmittag.
Whisper steht fest auf der Diktierseite dieser Trennlinie, und das möchte ich klarstellen: Whisper nimmt nicht an Anrufen teil, zeichnet keine Meetings auf und transkribiert kein Zoom. Es ist kein Meeting-Bot. Es diktiert an deiner Cursorposition. Du sprichst, die Worte landen in dem Feld, das gerade den Fokus hat. Wenn du ein Transkript eines einstündigen Vertriebsanrufs willst, ist HubSpots eigene Conversation Intelligence das richtige Werkzeug, und ich würde dich direkt dorthin verweisen. Wenn du die Zusammenfassung dieses Anrufs in dreißig Sekunden Sprechen als saubere Notiz protokollieren willst, ist das die Lücke, die diese Anleitung füllt.
Tastenkürzel drücken, sprechen, Text landet im Feld
Das ist die ganze Mechanik, und sie ist auf die beste Art langweilig. Du drückst ein Tastenkürzel, sprichst, lässt los, und der Text wird an deiner Cursorposition eingefügt, in welches Textfeld auch immer den Fokus hat. Whisper hält nach dem Loslassen der Taste noch einen kurzen Moment nach, damit dein letztes Wort nicht abgeschnitten wird. Weil es an der Cursorposition des Betriebssystems einfügt, ist eine HubSpot-Notiz einfach "irgendein Textfeld". Kontaktnotiz, Deal-Notiz, E-Mail-Editor, Aufgabenbeschreibung – überall dasselbe Verhalten.
Das ist der Teil, den der Erweiterungs-Marktplatz überkompliziert. Es gibt keine HubSpot-App zu autorisieren, keinen OAuth-Bereich zu genehmigen, keine Integration zu pflegen, wenn HubSpot ein UI-Update veröffentlicht. Dein Cursor steht im Feld, du sprichst, die Worte erscheinen im Feld. Eine kleine Kapsel taucht auf, während du sprichst, damit du weißt, dass es zuhört:
Das Tastenkürzel ist die eine Sache, die man von Anfang an richtig machen sollte. Unter Windows ist es Ctrl+Space; auf dem Mac ist es Command+Option, ein reines Modifikator-Push-to-Talk, das du beim Sprechen gedrückt hältst. Beide lassen sich in den Einstellungen ändern, falls sie mit etwas kollidieren, das du bereits nutzt. (Ein HubSpot-Mitarbeiter erzählte mir einmal, ein Tastenkürzel "funktioniere nicht" – es kollidierte mit einer Bildschirmaufzeichnungs-App, die er bei jedem Anruf laufen hatte. Es war ein Konflikt, kein Fehler, und so lernte ich, dass der Durchschnittsmensch keine Ahnung hat, was ein Tastenkürzel-Konflikt überhaupt ist. Deshalb ist jetzt jedes Tastenkürzel anpassbar.) Wenn du bereits das Diktieren unter Windows oder auf dem Mac eingerichtet hast, ist das dieselbe Muskelgedächtnis-Bewegung, nur auf einen anderen Tab gerichtet.
In zwei Minuten einrichten (Windows oder Mac)
Du brauchst einen Mac mit Apple Silicon oder einen PC mit Windows 10 oder neuer, ein funktionierendes Mikrofon und HubSpot im Browser geöffnet. Die gesamte lokale Pipeline ist für jedes angemeldete Konto kostenlos, ohne dass bei der Anmeldung nach einer Zahlungsmethode gefragt wird. Hier ist der Ablauf.
Schritt 1 – Whisper installieren und anmelden.
Von der Download-Seite herunterladen, installieren und ein kostenloses Konto erstellen. Keine Karte. Die gesamte lokale Transkriptions-Pipeline steht sofort zur Verfügung.
Du erkennst, dass es geklappt hat, wenn das Tray-Symbol der App erscheint und der Einrichtungsassistent anbietet, ein Modell auszuwählen.
Schritt 2 – Einen Transkriptionsweg wählen.
Die App entscheidet das nicht für dich. Du hast drei Optionen: Cloud (OpenAI, eigener Schlüssel), lokal Parakeet oder lokal Whisper. Für Kundendaten in einem CRM starte lokal – mehr dazu zwei Abschnitte weiter unten.
Du erkennst, dass es geklappt hat, wenn ein Modell fertig heruntergeladen ist und als bereit angezeigt wird.
Schritt 3 – Dein Tastenkürzel bestätigen.
Windows nutzt standardmäßig Ctrl+Space, der Mac Command+Option als Push-to-Talk gehalten. Erteile auf dem Mac bei Aufforderung die Bedienungshilfen-Berechtigung; ohne sie kann das Einfügen an der Cursorposition deinen Browser nicht erreichen.
Du erkennst, dass es geklappt hat, wenn eine Testaufnahme in irgendein Textfeld eingefügt wird.
Schritt 4 – Cursor in ein HubSpot-Feld setzen und sprechen.
Öffne einen Kontakt oder Deal, klicke in das Notizfeld, halte das Tastenkürzel, sage einen Satz, lass los. Der Text erscheint dort, wo der Cursor steht, im Feld.
Du erkennst, dass es geklappt hat, wenn dein gesprochener Satz als Text in der HubSpot-Notiz steht.
Der langsame Teil ist der Modell-Download, nicht die Einrichtung. Alles andere sind die vier Schritte oben. Sobald es läuft, hört das Protokollieren eines Anrufs auf, eine Tippaufgabe zu sein, und wird zu einer Sprechaufgabe – was für einen Vertriebler den Unterschied ausmacht zwischen einer Notiz, die geschrieben wird, und einer, die es nicht wird.
Notizen, E-Mail-Editor und Aufgabenbeschreibungen
Weil das Diktieren an der Cursorposition einfügt, ist jedes Textfeld in HubSpot freies Spiel, und das ist es wert, für einen Vertriebs-Workflow auszubuchstabieren. Die Notizfelder für Kontakte und Unternehmen, klar. Die Deal-Notiz, in der du festhältst, wo der Deal tatsächlich steht. Der E-Mail-Editor – diktiere den Text einer Nachfass-Mail, statt ihn zwischen Anrufen zu tippen. Aufgabenbeschreibungen, damit "Donnerstag wegen Preis-Einwand zurückrufen" festgehalten wird, solange es frisch ist, statt am Mittwoch falsch erinnert zu werden.
Am meisten zahlt sich die Zusammenfassung nach dem Anruf aus. Du legst auf, dein Cursor geht in die Deal-Notiz, du hältst das Tastenkürzel und sagst einfach, was passiert ist: mit wem du gesprochen hast, wo der Einwand lag, was du zugesagt hast, wann du nachfasst. Dreißig Sekunden Sprechen gegen drei Minuten, in denen du ein Drittel davon tippst. Das Detail, das normalerweise zwischen Anruf und Tastatur verdunstet, schafft es tatsächlich in den Datensatz. Das ist das ganze Argument – nicht schnelleres Tippen, sondern Notizen, die überhaupt existieren.
Nichts davon erfordert, dass HubSpot weiß, dass Whisper existiert. Es ist keine Integration, also bricht es nicht, wenn HubSpot den Editor ändert, und es funktioniert genauso in deinem Gmail-Editor, wenn du außerhalb des CRM einem Interessenten schreibst. Ein Tastenkürzel, jedes Feld, egal ob das Feld in HubSpot lebt oder nicht. Für einen Mitarbeiter, der über ein Dutzend Tabs verteilt arbeitet, ist diese "überall gleich"-Eigenschaft die eigentliche Funktion.
Lokal oder Cloud: welcher Modus für Kundendaten
Für ein CRM solltest du zuerst gründlich über den lokalen Modus nachdenken. Die Notizen, die du in HubSpot diktierst, sind Kundendaten – Namen, Deal-Größen, was ein Interessent über einen Wettbewerber gesagt hat, der Grund, warum jemand zögert. Manches davon ist genau die Art von Information, für die dein Unternehmen Regeln hat. Es wäre eine seltsame Wahl, jede gesprochene Anruf-Zusammenfassung durch eine Drittanbieter-Cloud zu leiten, nur um sie in einen Datensatz zu bekommen, den du gerade deshalb führst, weil er sensibel ist. Wenn dein Mac auf Apple Silicon läuft oder dein PC aus den letzten Jahren stammt, bewältigt der lokale Modus das alltägliche Diktieren ohne Murren, und die Cloud wird zum Notausgang statt zum Standard.
So unterscheiden sich die drei Wege, denn die App lässt dich wählen und ich hätte lieber, dass du gut wählst:
- Lokal Parakeet — NVIDIAs TDT-Engine, rund 600 MB, und die schnellste lokale Option – 5- bis 10-mal schneller als Whisper auf der CPU. Deckt Englisch plus 24 weitere europäische Sprachen ab, insgesamt 25. Keine Übersetzung ins Englische. Wenn deine Pipeline auf Englisch oder einer anderen europäischen Sprache läuft, ist das die schnelle, vollständig offline funktionierende Wahl.
- Lokal Whisper — langsamer als Parakeet auf derselben Maschine, aber die mehrsprachigen Versionen decken 99 Sprachen ab und können ins Englische übersetzen. Die rein englischen Versionen sind nur englisch, nicht 99. Wähle das, wenn du in chinesische, japanische oder koreanische Accounts verkaufst oder Übersetzung brauchst, was Parakeet nicht kann. Das englische Standardmodell ist rund 480 MB groß.
- Cloud (OpenAI, BYOK) — beste Genauigkeit und Web-Zugriff, mit deinem eigenen OpenAI-Schlüssel, direkt von OpenAI abgerechnet. Die Transkription läuft standardmäßig auf gpt-4o-mini-transcribe. Braucht Internet, also ist es der eine Weg, der deine Maschine verlässt. Die Cloud-Oberfläche ist Teil von Whisper Pro.
Die langweilige Wahrheit ist, dass für die Art von Notizen, die die meisten Mitarbeiter in HubSpot ablegen, lokal mehr als genug ist. Beide lokalen Engines laufen vollständig auf deiner Maschine, ohne dass etwas an einen Server gesendet wird, was genau das ist, was du für Kundendaten willst. Die Cloud verdient ihren Platz, wenn du Spitzengenauigkeit bei einem starken Akzent brauchst oder das Modell mitten in einer Notiz einen Fakt aus dem Web ziehen soll. Für das tägliche Anruf-Protokollieren starte lokal und greife nur dann zur Cloud, wenn dir lokal nicht reicht.
Eine gesprochene Anruf-Zusammenfassung in eine saubere Notiz verwandeln
Rohes Diktat kommt als Bandwurmsatz heraus. Du legst auf und sagst "okay also mit maria gesprochen sie macht sich sorgen wegen des migrationszeitplans will vor der unterschrift ein gespräch mit unserem solutions-team nachfassen freitag", und das ist die unpunktierte Wand, die dir jede Spracherkennung reicht. Das Aufräumen ist der Punkt, an dem die Wege auseinandergehen.
Windows-Spracheingabe fügt beim Sprechen Satzzeichen hinzu, und die macOS-Diktierfunktion setzt grundlegende Satzzeichen, wenn du "Komma" oder "Punkt" sagst. Für gründlicheres Aufräumen – die "ähs" entfernen, die Bandwurmsätze reparieren, einen hastigen Nach-Anruf-Wust in etwas verwandeln, das der nächste Mitarbeiter tatsächlich lesen kann – kann Whisper einen KI-Durchlauf machen. Sag den Aktivierungssatz "Hey whisper", und der Text wird verbessert, bevor er in der Notiz landet. Bei einem lokalen Modell läuft das über Ollama; im Cloud-Modus ist es standardmäßig gpt-5-mini.
okay also mit maria gesprochen sie macht sich sorgen wegen des migrationszeitplans will vor der unterschrift ein gespräch mit unserem solutions-team äh nachfassen freitag
Mit Maria gesprochen. Sie macht sich Sorgen wegen des Migrationszeitplans und möchte vor der Unterschrift ein Gespräch mit unserem Solutions-Team. Nachfassen am Freitag.
Eine ehrliche Einschränkung, denn jemand wird fragen. Das Diktieren bringt dir sauberen Text ins Notizfeld. Es füllt nicht HubSpots eigene Struktur für dich aus – es setzt nicht die Deal-Phase, verknüpft die Notiz nicht mit dem richtigen Kontakt und erstellt die Nachfass-Aufgabe nicht als echte Aufgabe. Du diktierst die Worte; du klickst die HubSpot-Steuerelemente, wie du es immer tust. Jeder, der "sag, ändere die Deal-Phase auf Geschäft gewonnen, und sieh zu, wie es passiert" verspricht, verkauft dir eine Demo, keinen Dienstag. Bring die Zusammenfassung schnell per Stimme zu Papier und nutze dann die eigenen Schaltflächen des CRM für die eigenen Felder des CRM.
Derselbe Sprich-dann-bereinige-Ablauf zahlt sich weit über das CRM hinaus aus – du kannst auch sauberen Text in jede App diktieren mit dem einen Tastenkürzel, sodass eine lange Nachfass-Mail aus ein paar gesprochenen Sätzen besteht statt aus einem Absatz, den du zwischen Anrufen tippst.
Wann du für HubSpot ein Diktiertool überspringen solltest

Manchmal ist das richtige Werkzeug das kostenlose, das bereits auf deiner Maschine ist, und etwas anderes zu behaupten wäre unehrlich. Wenn du nur kurze Eingaben in HubSpot ablegst – eine einzeilige Notiz, eine Aufgabe aus zwei Worten – deckt dein Betriebssystem das umsonst ab.
Unter Windows drückst du die Windows-Taste + H, und die eingebaute Spracheingabe-Leiste öffnet sich dort, wo dein Cursor steht, eine HubSpot-Notiz inbegriffen. Sie setzt selbst Satzzeichen und ist für kurze Eingaben in Ordnung. Der Haken: Sie läuft über Microsofts Server und braucht eine Internetverbindung, ist also keine Offline-Option – was mehr als sonst zählt, wenn der Text Kundendaten sind. Auf dem Mac lässt dich die Diktierfunktion überall dort per Stimme Text eingeben, wo du tippen kannst, eingerichtet in den Systemeinstellungen unter Tastatur, und auf Apple Silicon kann allgemeiner Text auf dem Gerät verarbeitet werden. Und wenn du eigentlich ein Transkript des Vertriebsanrufs selbst willst, überspringe das Diktieren ganz – dafür sind HubSpots eigene Anrufaufzeichnung und Conversation Intelligence genau gebaut.
Greife zu einem dedizierten, systemweiten Tool, wenn die eingebauten Funktionen anfangen wehzutun: lange Anruf-Zusammenfassungen, mehrsprachige Accounts, Offline-Datenschutz für Kundendaten unter Windows oder der Wunsch nach einem Tastenkürzel, das sich in einer HubSpot-Notiz, deiner E-Mail und deiner Aufgabenliste gleich verhält. Unterhalb dieser Schwelle nutze, was kostenlos ist. Ich werde dir nicht raten, eine App zu installieren, um eine einzeilige Erinnerung zu protokollieren.
Dieselbe Abwägung taucht auf, wenn dein Team Account-Notizen auch in einem separaten Tool führt – die Logik beim Diktieren in Notion ist identisch, denn auch dort ist der Cursor, nicht eine Integration, die eigentliche Verbindung zwischen deiner Stimme und dem Feld.
Weiterführende Links
HubSpot hat nie eine Mikrofon-Schaltfläche für sein Notizfeld ausgeliefert, und angesichts dessen, wie viel es stattdessen in die Anrufaufzeichnung investiert hat, bezweifle ich, dass es sich damit beeilen wird. Es muss auch nicht, denn der Cursor ist die Integration. Sprich ins Feld, bekomme sauberen Text, klicke für den Rest die eigenen Schaltflächen des CRM. Ich habe die Hälfte dieser Anleitung in ein Textfeld diktiert, das nicht HubSpot war, mit einem Tool, dem egal ist, welches Feld es ist, und dann das Ganze dorthin eingefügt, wo es hingehörte. Das ist der ganze Trick.
Protokolliere deinen nächsten Anruf, indem du sprichst
Tastenkürzel halten, sagen, was passiert ist, loslassen. Die Zusammenfassung landet in dem HubSpot-Feld, in dem dein Cursor steht – und in jeder anderen App auch.
Kostenloser lokaler Modus für jedes angemeldete Konto. Keine Karte zum Starten nötig.



