Offline-Modus

Alles, vollständig offline.

Lokale Transkription, lokale KI, null Wolke. Dieselben Funktionen — keine der Daten verlässt Ihr Gerät.

Lebenslange Lizenz · Einmalzahlung · kostenlose Updates

Warum Offline wichtig ist.

Medizinische Notizen, Rechtsentwürfe, NDAs, interner Code — es gibt Arbeitskategorien, bei denen 'in die Wolke senden' ein No-Go ist.

Der Offline-Modus hält jedes Byte auf Ihrem Gerät. Kein Audio hochgeladen, kein Text hochgeladen, keine Telemetrie zu Transkriptionsinhalten. Air-Gapped-Netzwerke, regulierte Branchen und paranoide Gründerinnen sind alle willkommen.

Ein reguliertes Dokument wird Ende-zu-Ende ohne Netzwerkaktivität entworfen.

Zwei Engines, ein Hotkey.

Pro Sitzung aus Einstellungen → Modelle wählen. Whisper für Genauigkeit, Sprachen und KI-Funktionen. Parakeet für rohe Geschwindigkeit auf der CPU.

Derselbe Hotkey, dasselbe Overlay, dasselbe Wörterbuch. Sie ändern nur, welches Modell transkribiert.

Der Wechsel zwischen Whisper und Parakeet erfordert zwei Klicks.

Engine-Vergleich

Pro Sitzung wählen. Gleicher Hotkey, anderes Backend.

	Whisper (OpenAI, lokal)	Parakeet TDT 0.6B v3 (NVIDIA, lokal)
Geschwindigkeit	Schnell auf GPU, moderat auf CPU	Bis zu ~10× schneller auf CPU — Echtzeit auf einem Laptop
Genauigkeit	Goldstandard — einstellbar über Modellgröße (Base → Large v3)	Parität mit Whisper bei europäischen Sprachen laut NVIDIA-Benchmarks
Sprachen	90+	24 europäische Sprachen
Übersetzung	Jede Sprache sprechen → Englisch einfügen	Nur Transkription
Leistungsprofile	Schnell / Ausgewogen / Genau	Fest
KI-Presets + Triggerwort	(über Ollama)	Nur Transkription
Füllwortentfernung + Wörterbuch
Runtime	whisper.cpp mit CUDA- / Vulkan- / Metal-Beschleunigung	ONNX Runtime
Am besten geeignet für	Genauigkeit, Übersetzung, vollständiger KI-Funktionsumfang	Rohe Geschwindigkeit, reines Diktat, reine CPU-Geräte

Engines können jederzeit über Einstellungen → Modelle gewechselt werden. Ihr Wörterbuch und Ihre Hotkeys bleiben gleich.

Schnell, Ausgewogen, Genau.

Der Whisper-Modus bietet drei Leistungsprofile. Jedes stellt Modellgröße, Chunking und GPU-Einstellungen ab — so tauschen Sie Geschwindigkeit gegen Genauigkeit explizit.

Alter Laptop im Akkubetrieb? Wählen Sie Schnell. Workstation mit GPU? Genau liefert schärfere Ergebnisse. Whisper erkennt automatisch CUDA, Vulkan und Metal.

Der Leistungsregler stellt die Engine spontan neu ein.

Ollama für lokale KI-Umformulierungen.

Richten Sie Whisper auf eine Ollama-Instanz auf localhost aus, und Sie erhalten dasselbe Triggerwort, dieselben Presets, denselben Always-On-Modus — aber das LLM läuft auf Ihrem Gerät.

Wählen Sie ein beliebiges Modell, das Sie gepullt haben: Llama 3.1, Mistral, Qwen, was auch immer zu Ihrer Hardware passt. Einmal konfigurieren, überall nutzen, wo der Hotkey funktioniert.

Hey Whisper → lokale Llama-Umformulierung → eingefügter Text. Kein Internet.

Jede Sprache nativ ins Englische übersetzen.

Die mehrsprachigen Modelle von Whisper verfügen über eine integrierte Übersetzungsaufgabe. Sprechen Sie Japanisch, Ukrainisch, Polnisch oder eine der über 90 Sprachen — Englisch einfügen. Ein Durchgang, kein zusätzliches Modell, kein API-Aufruf.

Niemand sonst in dieser Kategorie liefert einen eingebauten Offline-Übersetzer. Schalten Sie 'Ins Englische übersetzen' in den Einstellungen um, und jedes Diktat wechselt den Modus.

Ukrainisch sprechen mit aktiviertem 'Ins Englische übersetzen' fügt englischen Text ein.

Presets, lokal.

Jedes Preset aus dem Wolken-Modus funktioniert offline. Speichern Sie Anweisungen, stapeln Sie sie, wechseln Sie sie aus dem Overlay.

Sie laufen über Ollama statt über OpenAI — gleiche Form, gleiche Syntax, gleiche Ergebnisse.

Die Anwendung eines Presets leitet den Text durch Ihr lokales Ollama-Modell.

Custom Words — deterministisch, universell.

Das Wörterbuch funktioniert offline genauso wie online. Einmal hinzufügen, auf jede Transkription angewendet, keine Token verbraucht.

Sprach- und modellunabhängig. Namen, Abkürzungen, Produktbegriffe — alle respektiert.

Derselbe Wörterbucheintrag korrigiert die Transkription unter Whisper und Parakeet.

Füllwortentfernung, Nachbearbeitung.

Derselbe deterministische Füllwortreiniger läuft im Offline-Modus. Funktioniert mit jeder Engine. Funktioniert mit jeder Sprache.

Keine KI nötig — nur schnelles Pattern Matching, nachdem die Transkription fertig ist.

Äh, ähm, so — auf dem Weg nach draußen entfernt.

Schreiben Sie jede Auswahl per Stimme um.

Markieren Sie Text in jeder App — Slack, Gmail, Notion, Ihrem Editor. Drücken Sie Ihren Diktier-Hotkey, sagen Sie, was getan werden soll — „mach es förmlich," „streich das Geschwafel," „ins Englische übersetzen" — und die Auswahl wird an Ort und Stelle durch die umgeschriebene Version ersetzt.

Es ist derselbe Trick wie beim Polieren, nur ausgehend von Text, den Sie bereits geschrieben haben. Im lokalen Modus läuft die Umschreibung auf dem von Ihnen konfigurierten Ollama-Modell und verlässt nie Ihre Maschine. Kein zweiter Hotkey, kein Menü, kein Kopieren-und-Einfügen-Hin-und-Her.

Text markieren, Hotkey drücken, Umschreibung sprechen — derselbe Ablauf, vollständig lokal.

Datenschutzhaltung, in einem Satz.

Kein Audio hochgeladen. Kein Text hochgeladen. Keine Telemetrie zu Transkriptionsinhalten.

Der einzige Netzwerkverkehr im Offline-Modus sind Lizenzverifizierung und Update-Prüfungen — beides lässt sich mit jedem Netzwerkmonitor überprüfen.

Wireshark bestätigt: null Netzwerkverkehr während der Transkription.

Kostenlos, sobald es Ihnen gehört.

Monatlich sind $9. Lebenslang ist eine Einmalzahlung — einmal kaufen, für immer besitzen, keine wiederkehrende Rechnung.

Modelle sind kostenlos. Inferenz ist kostenlos. Keine Kosten pro Minute, keine Kosten pro Token. Nur die App ist kostenpflichtig.

Aufschlüsselung des Lebenslang-Angebots — verglichen mit Abonnements, die pro Minute berechnen.

Häufige Fragen

Benötige ich eine NVIDIA-GPU für den Offline-Modus?

Nein. Whisper läuft auf der CPU und auf allen gängigen GPUs (CUDA, Vulkan unter Windows, Metal unter macOS). Parakeet läuft allein auf der CPU schnell — trotz des Namens ist keine NVIDIA-Hardware erforderlich, um es zu nutzen.

Wie groß sind die Modelle?

Whisper-Modelle reichen von ~75 MB (Tiny, nur Englisch) bis ~3 GB (Large v3). Parakeet TDT 0.6B liegt bei etwa 1,2 GB. Die App lädt nur das Modell herunter, das Sie wählen; Sie können es jederzeit löschen oder tauschen.

Hat der Offline-Modus wirklich keinen Internet-Verkehr?

Während der Transkription: ja, null ausgehender Verkehr. Die App erreicht das Internet weiterhin für Lizenzverifizierung und Update-Prüfungen, die beim App-Start erfolgen, nicht während des Diktats. Sie können das mit jedem Netzwerkmonitor überprüfen.

Standardmäßig privat. Optional leistungsstark.

Lebenslange Lizenz bedeutet, Sie zahlen einmal und besitzen sie. Offline-Modus bedeutet, das Audio verlässt nie Ihr Gerät.

Jetzt herunterladen Über Wolken-Modus lesen

Whisper (OpenAI, lokal)

Parakeet TDT 0.6B v3 (NVIDIA, lokal)

Geschwindigkeit

Schnell auf GPU, moderat auf CPU

Bis zu ~10× schneller auf CPU — Echtzeit auf einem Laptop

Genauigkeit

Goldstandard — einstellbar über Modellgröße (Base → Large v3)

Parität mit Whisper bei europäischen Sprachen laut NVIDIA-Benchmarks

Sprachen

90+

24 europäische Sprachen

Übersetzung

Jede Sprache sprechen → Englisch einfügen

Nur Transkription

Leistungsprofile

Schnell / Ausgewogen / Genau

Fest

KI-Presets + Triggerwort

(über Ollama)

Nur Transkription

Füllwortentfernung + Wörterbuch

Runtime

whisper.cpp mit CUDA- / Vulkan- / Metal-Beschleunigung

ONNX Runtime

Am besten geeignet für

Genauigkeit, Übersetzung, vollständiger KI-Funktionsumfang

Rohe Geschwindigkeit, reines Diktat, reine CPU-Geräte

Häufige Fragen

Benötige ich eine NVIDIA-GPU für den Offline-Modus?

Wie groß sind die Modelle?

Hat der Offline-Modus wirklich keinen Internet-Verkehr?