Von Denys Medvediev

Vergleich

Die ehrliche Voice-In- Alternative

Voice In von Dictanote ist eine Chrome-Erweiterung, die deine Sprache auf jeder Website im Browser in Text verwandelt. Der Einstieg ist kostenlos, die Einrichtung einfach, und zum Laufen braucht sie eine Internetverbindung. Die ehrliche Alternative, wenn du in jeder Desktop-App und offline diktieren willst, ist Whisper by Remskill, dessen komplette lokale Pipeline kostenlos ist.

Zuletzt aktualisiert: Juni 2026

Ein Laptop mit einer geöffneten Suchseite neben einem Notizbuch auf einem Holzschreibtisch, sinnbildlich für Diktieren, das auf dem ganzen Desktop funktioniert, nicht nur im Browser

Voice In von Dictanote ist eine Chrome-Erweiterung, die deine Sprache auf jeder Website im Browser in Text verwandelt. Der Einstieg ist kostenlos, die Einrichtung einfach, und zum Laufen braucht sie eine Internetverbindung. Die ehrliche Alternative, wenn du in jeder Desktop-App und offline diktieren willst, ist Whisper by Remskill. Seine komplette lokale Pipeline ist kostenlos.

Voice In von Dictanote funktioniert nur in Chrome und braucht eine Internetverbindung, was völlig in Ordnung ist, wenn dein gesamtes Schreiben in Webseiten passiert. Whisper by Remskill ist eine Desktop-App: Es diktiert in jede App auf deinem Computer, läuft komplett offline, und seine gesamte lokale Pipeline ist kostenlos, ohne Kreditkarte bei der Anmeldung. Nimm das Tool, das zu dem Ort passt, an dem du tatsächlich schreibst.

Worum es bei diesem Vergleich geht und wer ihn geschrieben hat

Den Interessenkonflikt bringe ich gleich zu Beginn auf den Tisch. Das hier ist ein Vergleich, und eines der beiden Dinge, die verglichen werden, habe ich selbst gebaut. Also gebe ich Voice In vollen Respekt, wo er verdient ist, und werde dann ganz konkret bei der einen Stelle, an der die beiden Tools schlicht unterschiedliche Aufgaben erfüllen.

Die nüchterne Wahrheit ist: Voice In ist ein gutes kleines Tool. Es ist kostenlos, in etwa zehn Sekunden installiert, und wenn du immer nur in Gmail, ein Google Doc oder ein Textfeld auf irgendeiner Website tippst, erledigt es das gut. Wenn das deine ganze Welt ist, kannst du diesen Tab wahrscheinlich schließen. Das meine ich ernst. Es gibt weiter unten einen Abschnitt, der dir genau sagt, wann du bei Voice In bleiben solltest.

Für alle, die noch lesen: Die Lücke ist der Browser. Voice In lebt in Chrome und funktioniert nur dort. In dem Moment, in dem du in Word, Slack, deinen Code-Editor oder dein Terminal diktieren willst, hast du den einzigen Raum verlassen, in dem es dich hören kann.

Voice In funktioniert im Browser, und nur im Browser

Hier ist der Satz, auf den es ankommt, direkt von Dictanotes eigener Seite: Derzeit funktioniert Voice In nur innerhalb des Browsers. Es ist eine Chrome-Erweiterung. Du klickst die Erweiterung an, du sprichst, und der Text landet in dem Webfeld, das gerade den Fokus hat. Für ein kostenloses Tool ist das ein sauberes, ehrliches Konzept.

Aus "Browser-Erweiterung" folgen zwei Dinge, und beide solltest du kennen, bevor du dich festlegst.

Erstens braucht es das Internet. Voice In benötigt eine funktionierende Internetverbindung, um zu laufen. Deine Stimme geht hinaus, um erkannt zu werden, und kommt als Text zurück. Das ist in Ordnung im Hotel-WLAN und ein Problem im Zug durch einen Tunnel.

Zweitens ist die Anzahl der Sprachen wirklich unklar. Dictanotes Seite spricht an einer Stelle von "100+ Sprachen" und an einer anderen von "50+ Sprachen". Ich lege mich nicht auf eine Zahl fest, weil sie selbst sich nicht festgelegt haben. Es bewältigt offensichtlich viele Sprachen. Wie viele genau, da scheint sich das eigene Marketing nicht sicher zu sein.

Es gibt einen kostenlosen Tarif und eine kostenpflichtige Stufe namens Voice In Plus, die den volleren Funktionsumfang ergänzt: eigene Sprachbefehle, einen erweiterten Modus, Diktieren über mehrere Tabs hinweg. Ich nenne keinen Preis für Plus, weil Dictanote auf der Seite, die ich gelesen habe, keinen angibt. Wenn du es brauchst, schau auf ihrer Preisseite nach.

Was du außerdem mit Whisper by Remskill bekommst

Whisper by Remskill ist eine Desktop-App, keine Browser-Erweiterung. Du drückst eine Tastenkombination, unter Windows standardmäßig Ctrl+Space und auf alles Beliebige umlegbar, sprichst, lässt los, und der Text erscheint genau dort, wo dein Cursor schon steht. Word. Slack. Notion. Das Antwortfeld in deinem E-Mail-Programm. Eine Commit-Nachricht in deinem Terminal. Dieselbe Tastenkombination funktioniert in jedem davon, weil das Diktieren nicht in einer einzelnen App lebt. Es lebt im Betriebssystem.

Whisper
Die laufende Whisper-by-Remskill-App – Seitenleiste, Transkriptionspanel und KI-Anweisungskarten. Das ist die echte Oberfläche, kein Screenshot.

Die Pipeline ist kostenlos für alle, die sich registrieren, ohne Kreditkarte bei der Anmeldung. Dieser kostenlose Tarif deckt lokale Transkription mit acht Whisper-Modellen oder der Parakeet-Engine ab, KI-Textbereinigung über Ollama, deinen Diktatverlauf, Presets, eigene Hotwords und Modell-Downloads. Du kannst es auf bis zu drei Geräten nutzen.

Zwei lokale Engines bedeuten, dass du nach dem auswählst, was du tatsächlich brauchst. Whisper unterstützt 99 Sprachen und kann ins Englische übersetzen, mit feinerer Kontrolle wie eigenem Vokabular und Hotwords. Parakeet ist eine rund 600 MB große Engine, die Englisch plus 24 weitere europäische Sprachen abdeckt, 25 insgesamt, und auf einer einfachen CPU 5- bis 10-mal schneller läuft als Whisper. Für keine von beiden ist eine GPU nötig.

Wenn du überwiegend Code oder technische Dokumentation schreibst, verändert das Diktieren in deinen Editor statt in einen Browser-Tab den Arbeitstag. Mehr dazu habe ich in Voice-to-Text fürs Programmieren geschrieben, falls das auf dich zutrifft.

Es gibt außerdem eine Pro-Stufe, die OpenAI-Cloud-Transkription und Websuche mit deinem eigenen API-Schlüssel ergänzt. Du kannst dir die Tarife ansehen, falls Cloud dein Ding ist. Aber die lokale Pipeline, der Teil, der eine Browser-Erweiterung bei Reichweite und Datenschutz schlägt, kostet nichts.

Direkt nebeneinander: Browser-Tab gegen den ganzen Desktop

Hier ist die ehrliche Tabelle. Keine Sterne, keine "Gewinner"-Spalte. Nur was jedes Tool tut.

Funktionsvergleich zwischen Voice In (Dictanote) und Whisper by Remskill
FunktionVoice In (Dictanote)Whisper by Remskill
Wo es funktioniertNur im Chrome-BrowserJede Desktop-App, systemweit
Funktioniert offlineNein, braucht eine InternetverbindungJa, lokale Pipeline läuft auf dem Gerät
InstallationsgrößeChrome-ErweiterungDesktop-App von etwa 25 MB
Kostenloser TarifJa, kostenloser TarifJa, gesamte lokale Pipeline kostenlos
SprachenUnklar (Seite sagt 50+ und 100+)99 mit Whisper; 25 mit Parakeet
Übersetzung ins EnglischeNicht angegebenJa, mit der Whisper-Engine
Engine-AuswahlEin eingebauter WegWhisper oder Parakeet, du wählst
PlattformenÜberall, wo Chrome läuftWindows und macOS (Apple Silicon)

Das Muster ist nicht "Voice In ist schlecht". Das Muster ist, dass das eine Tool in einem Browser-Tab lebt und das andere auf deinem ganzen Rechner. Nimm das, das zu dem Ort passt, an dem du tatsächlich schreibst.

Offline zählt mehr, als die meisten denken

Das ist die eine starke Meinung, die ich mir in diesem Artikel leiste. Reines Cloud-Diktieren ist ein Datenschutz-Desaster, das nur darauf wartet, transkribiert zu werden.

Voice In braucht eine Internetverbindung, was bedeutet, dass deine Sprache deinen Rechner verlässt, um in Text verwandelt zu werden. Bei einer Einkaufsliste ist das egal. Bei der E-Mail an die Schule deines Kindes, dem Entwurf eines Vertrags oder einem Absatz über dein Gehalt willst du wahrscheinlich nicht, dass irgendetwas davon einen Umweg über einen Server nimmt, den du nicht kontrollierst.

Mit Whispers lokalem Modus verlässt das Audio deinen Laptop nie. Es wird auf deiner eigenen CPU transkribiert, in deinen eigenen Apps, ganz ohne Verbindung. Die Genauigkeit im lokalen Modus liegt typischerweise zwischen 95 und 99 Prozent, je nach Modell, das du wählst. Das ist nicht "gut genug fürs Offline-Arbeiten" als Trostpflaster. Das ist das Hauptmerkmal.

Pasted
Das ausgelieferte Overlay nach dem Diktieren – wie ein kostenloses, vollständig lokales Diktat aussieht, sobald es fertig ist.

Ich bin der Architekten-Typ, der ein System diagrammiert, bevor er die Laufzeitumgebung installiert, und das Diagramm ist beim zweiten Commit immer schon falsch. Ich habe eine Woche damit verbracht, den Offline-Weg zu überkonstruieren, bevor ich das Offensichtliche eingestand: Für einen Absatz Diktat hat dein Rechner bereits ein Mikrofon und eine CPU und braucht keinen Server in der Schleife.

Wann du bei Voice In bleiben solltest

Ich würde meinen Job schlecht machen, wenn ich jedem zum Wechsel raten würde. Manchmal ist Voice In das richtige Tool, und hier ist das ehrliche Argument fürs Bleiben.

Du diktierst nur jemals im Browser

Wenn dein Schreiben in Gmail, Google Docs, einem CMS, einem Webformular oder einem Chat-Tab passiert, und im Grunde nirgendwo sonst, dann erreicht Voice In bereits jeden Ort, an dem du tippst. Eine Desktop-App würde dir nichts geben, das du bemerken würdest.

Du willst eine Option ohne Installation auf dem Betriebssystem

Eine Chrome-Erweiterung rührt dein Betriebssystem nicht an. Auf einem abgesicherten Arbeitslaptop, auf dem du keine Desktop-Software installieren, aber eine Browser-Erweiterung hinzufügen darfst, ist das ein echter Vorteil, und Whisper kann dir dort nicht helfen.

Du bist sowieso immer online

Wenn du nie im Flugzeug, im Zug oder irgendwo ohne WLAN diktierst, ist die Internetanforderung für dich kein Thema.

Wenn zwei oder drei davon auf dich zutreffen, bleib bei Voice In. Es ist kostenlos und es funktioniert. An dem Tag, an dem dein Diktat den Browser-Tab verlassen muss, hinein nach Word, hinein nach Slack, hinein in deinen Editor, ist es Zeit, sich ein Desktop-Tool anzusehen. Nicht früher.

Wenn du dir nur eine Sache merkst

Voice In ist ein Browser. Whisper ist dein ganzer Desktop. Wenn dein Schreiben in Chrome lebt, ist Voice In eine gute, kostenlose Wahl. Wenn dein Schreiben in den Apps lebt, die Chrome nicht erreichen kann, und du es lieber offline halten würdest, dann ist das die Linie, an der du hinüberwechselst.

Wenn du das größere Bild davon willst, wie eine systemweite Diktier-App zusammenpasst, habe ich einen längeren direkten Vergleich in der ehrlichen superwhisper-Alternative geschrieben. Wenn du so weit bist, lade Whisper herunter, drück die Tastenkombination und diktiere in welche App auch immer vor dir ist, online oder offline.

Diktiere überall, nicht nur in einem Browser-Tab

Lade Whisper by Remskill herunter, erstelle ohne Kreditkarte ein Konto, drück die Tastenkombination und diktiere in jede App auf deinem Rechner, online oder offline.

Kostenlose lokale Pipeline. Keine Kreditkarte bei der Anmeldung. Die 7-tägige Cloud-Testphase fragt erst beim Upgrade nach einer Karte.

Foto von Denys Medvediev

Denys Medvediev

Ich bin derjenige, der unsere Support-E-Mails liest, höchstwahrscheinlich indem ich die Antworten diktiere.

Weiterführende Lektüre