Alles, vollständig offline.
Lokale Transkription, lokale KI, null Wolke. Dieselben Funktionen — keine der Daten verlässt Ihr Gerät.
Lebenslange Lizenz · Einmalzahlung · kostenlose Updates
Warum Offline wichtig ist.
Medizinische Notizen, Rechtsentwürfe, NDAs, interner Code — es gibt Arbeitskategorien, bei denen 'in die Wolke senden' ein No-Go ist.
Der Offline-Modus hält jedes Byte auf Ihrem Gerät. Kein Audio hochgeladen, kein Text hochgeladen, keine Telemetrie zu Transkriptionsinhalten. Air-Gapped-Netzwerke, regulierte Branchen und paranoide Gründerinnen sind alle willkommen.
Zwei Engines, ein Hotkey.
Pro Sitzung aus Einstellungen → Modelle wählen. Whisper für Genauigkeit, Sprachen und KI-Funktionen. Parakeet für rohe Geschwindigkeit auf der CPU.
Derselbe Hotkey, dasselbe Overlay, dasselbe Wörterbuch. Sie ändern nur, welches Modell transkribiert.
Engine-Vergleich
Pro Sitzung wählen. Gleicher Hotkey, anderes Backend.
| Whisper (OpenAI, lokal) | Parakeet TDT 0.6B v3 (NVIDIA, lokal) | |
|---|---|---|
| Geschwindigkeit | Schnell auf GPU, moderat auf CPU | Bis zu ~10× schneller auf CPU — Echtzeit auf einem Laptop |
| Genauigkeit | Goldstandard — einstellbar über Modellgröße (Base → Large v3) | Parität mit Whisper bei europäischen Sprachen laut NVIDIA-Benchmarks |
| Sprachen | 90+ | 24 europäische Sprachen |
| Übersetzung | Jede Sprache sprechen → Englisch einfügen | Nur Transkription |
| Leistungsprofile | Schnell / Ausgewogen / Genau | Fest |
| KI-Presets + Triggerwort | (über Ollama) | Nur Transkription |
| Füllwortentfernung + Wörterbuch | ||
| Runtime | whisper.cpp mit CUDA- / Vulkan- / Metal-Beschleunigung | ONNX Runtime |
| Am besten geeignet für | Genauigkeit, Übersetzung, vollständiger KI-Funktionsumfang | Rohe Geschwindigkeit, reines Diktat, reine CPU-Geräte |
Schnell, Ausgewogen, Genau.
Der Whisper-Modus bietet drei Leistungsprofile. Jedes stellt Modellgröße, Chunking und GPU-Einstellungen ab — so tauschen Sie Geschwindigkeit gegen Genauigkeit explizit.
Alter Laptop im Akkubetrieb? Wählen Sie Schnell. Workstation mit GPU? Genau liefert schärfere Ergebnisse. Whisper erkennt automatisch CUDA, Vulkan und Metal.
Ollama für lokale KI-Umformulierungen.
Richten Sie Whisper auf eine Ollama-Instanz auf localhost aus, und Sie erhalten dasselbe Triggerwort, dieselben Presets, denselben Always-On-Modus — aber das LLM läuft auf Ihrem Gerät.
Wählen Sie ein beliebiges Modell, das Sie gepullt haben: Llama 3.1, Mistral, Qwen, was auch immer zu Ihrer Hardware passt. Einmal konfigurieren, überall nutzen, wo der Hotkey funktioniert.
Jede Sprache nativ ins Englische übersetzen.
Die mehrsprachigen Modelle von Whisper verfügen über eine integrierte Übersetzungsaufgabe. Sprechen Sie Japanisch, Ukrainisch, Polnisch oder eine der über 90 Sprachen — Englisch einfügen. Ein Durchgang, kein zusätzliches Modell, kein API-Aufruf.
Niemand sonst in dieser Kategorie liefert einen eingebauten Offline-Übersetzer. Schalten Sie 'Ins Englische übersetzen' in den Einstellungen um, und jedes Diktat wechselt den Modus.
Presets, lokal.
Jedes Preset aus dem Wolken-Modus funktioniert offline. Speichern Sie Anweisungen, stapeln Sie sie, wechseln Sie sie aus dem Overlay.
Sie laufen über Ollama statt über OpenAI — gleiche Form, gleiche Syntax, gleiche Ergebnisse.
Custom Words — deterministisch, universell.
Das Wörterbuch funktioniert offline genauso wie online. Einmal hinzufügen, auf jede Transkription angewendet, keine Token verbraucht.
Sprach- und modellunabhängig. Namen, Abkürzungen, Produktbegriffe — alle respektiert.
Füllwortentfernung, Nachbearbeitung.
Derselbe deterministische Füllwortreiniger läuft im Offline-Modus. Funktioniert mit jeder Engine. Funktioniert mit jeder Sprache.
Keine KI nötig — nur schnelles Pattern Matching, nachdem die Transkription fertig ist.
Schreiben Sie jede Auswahl per Stimme um.
Markieren Sie Text in jeder App — Slack, Gmail, Notion, Ihrem Editor. Drücken Sie Ihren Diktier-Hotkey, sagen Sie, was getan werden soll — „mach es förmlich," „streich das Geschwafel," „ins Englische übersetzen" — und die Auswahl wird an Ort und Stelle durch die umgeschriebene Version ersetzt.
Es ist derselbe Trick wie beim Polieren, nur ausgehend von Text, den Sie bereits geschrieben haben. Im lokalen Modus läuft die Umschreibung auf dem von Ihnen konfigurierten Ollama-Modell und verlässt nie Ihre Maschine. Kein zweiter Hotkey, kein Menü, kein Kopieren-und-Einfügen-Hin-und-Her.
Datenschutzhaltung, in einem Satz.
Kein Audio hochgeladen. Kein Text hochgeladen. Keine Telemetrie zu Transkriptionsinhalten.
Der einzige Netzwerkverkehr im Offline-Modus sind Lizenzverifizierung und Update-Prüfungen — beides lässt sich mit jedem Netzwerkmonitor überprüfen.
Kostenlos, sobald es Ihnen gehört.
Monatlich sind $9. Lebenslang ist eine Einmalzahlung — einmal kaufen, für immer besitzen, keine wiederkehrende Rechnung.
Modelle sind kostenlos. Inferenz ist kostenlos. Keine Kosten pro Minute, keine Kosten pro Token. Nur die App ist kostenpflichtig.
Häufige Fragen
Benötige ich eine NVIDIA-GPU für den Offline-Modus?
Wie groß sind die Modelle?
Hat der Offline-Modus wirklich keinen Internet-Verkehr?
Standardmäßig privat. Optional leistungsstark.
Lebenslange Lizenz bedeutet, Sie zahlen einmal und besitzen sie. Offline-Modus bedeutet, das Audio verlässt nie Ihr Gerät.