Todo, totalmente sin conexión.
Transcripción local, IA local, cero nube. Las mismas funciones — pero los datos no salen de su máquina.
Licencia de por vida · pago único · actualizaciones gratuitas
Por qué importa el modo sin conexión.
Notas médicas, borradores legales, NDAs, código interno — hay categorías de trabajo en las que 'enviarlo a la nube' no es una opción.
El modo sin conexión mantiene cada byte en su máquina. Sin audio subido, sin texto subido, sin telemetría sobre el contenido de la transcripción. Redes air-gapped, industrias reguladas y fundadores paranoicos bienvenidos.
Dos motores, un atajo.
Elija por sesión desde Ajustes → Models. Whisper para precisión, idiomas y funciones de IA. Parakeet para velocidad pura en CPU.
Mismo atajo, mismo overlay, mismo diccionario. Solo cambia qué modelo transcribe.
Comparación de motores
Elija por sesión. Mismo atajo, backend distinto.
| Whisper (OpenAI, local) | Parakeet TDT 0.6B v3 (NVIDIA, local) | |
|---|---|---|
| Velocidad | Rápido en GPU, moderado en CPU | Hasta ~10× más rápido en CPU — tiempo real en una laptop |
| Precisión | Estándar de oro — ajustable por tamaño de modelo (Base → Large v3) | Paridad con Whisper en idiomas europeos según benchmarks de NVIDIA |
| Idiomas | Más de 90 | 24 idiomas europeos |
| Traducción | Hable cualquier idioma → pegue inglés | Solo transcripción |
| Perfiles de rendimiento | Rápido / Equilibrado / Preciso | Fijo |
| Presets de IA + palabra disparadora | (vía Ollama) | Solo transcripción |
| Eliminación de muletillas + diccionario | ||
| Runtime | whisper.cpp con aceleración CUDA / Vulkan / Metal | ONNX Runtime |
| Mejor para | Precisión, traducción, conjunto completo de funciones de IA | Velocidad pura, dictado puro, máquinas solo con CPU |
Rápido, Equilibrado, Preciso.
El modo Whisper expone tres perfiles de rendimiento. Cada uno ajusta el tamaño del modelo, el chunking y la configuración de GPU — así usted intercambia velocidad por precisión explícitamente.
¿Laptop vieja con batería? Elija Rápido. ¿Estación de trabajo con GPU? Preciso da resultados más nítidos. Whisper detecta automáticamente CUDA, Vulkan y Metal.
Ollama para reescrituras con IA local.
Apunte Whisper a una instancia de Ollama en localhost y obtendrá la misma palabra disparadora, los mismos presets, el mismo modo Always-On — pero el LLM corre en su máquina.
Elija cualquier modelo que haya descargado: Llama 3.1, Mistral, Qwen, el que se adapte a su hardware. Configúrelo una vez, úselo donde sea que funcione el atajo.
Traduzca cualquier idioma al inglés — de forma nativa.
Los modelos multilingües de Whisper tienen una tarea de traducción integrada. Hable japonés, ucraniano, polaco o cualquiera de más de 90 idiomas — pegue en inglés. Una sola pasada, sin modelo extra, sin llamada API.
Nadie más en esta categoría incluye un traductor offline integrado. Active 'Translate to English' en Ajustes y cada dictado cambia de modo.
Presets, de forma local.
Cada preset del modo en la nube funciona sin conexión. Guarde instrucciones, apílelas, cámbielas desde el overlay.
Corren a través de Ollama en lugar de OpenAI — misma forma, misma sintaxis, mismos resultados.
Palabras personalizadas — deterministas, universales.
El diccionario funciona igual offline que online. Agregue una vez, aplicado a cada transcripción, sin gasto de tokens.
Independiente del idioma y del modelo. Nombres, siglas, términos de producto — todos respetados.
Eliminación de muletillas, posprocesamiento.
El mismo limpiador determinista de muletillas corre en modo sin conexión. Funciona con cualquiera de los motores. Funciona con cualquier idioma.
Sin IA necesaria — solo coincidencia rápida de patrones después de terminada la transcripción.
Reescribe cualquier selección con la voz.
Selecciona texto en cualquier app — Slack, Gmail, Notion, tu editor. Pulsa tu atajo de dictado, di lo que quieres hacer — "hazlo formal", "quita la palabrería corporativa", "tradúcelo al alemán" — y la selección se reemplaza en el sitio por la versión reescrita.
Es el mismo truco que el pulido, pero partiendo de texto que ya has escrito. En modo local la reescritura corre en el modelo de Ollama que tengas configurado, sin salir nunca de tu máquina. Sin un segundo atajo, sin menús, sin el baile de copiar y pegar.
Postura de privacidad, en una línea.
Sin audio subido. Sin texto subido. Sin telemetría sobre el contenido de la transcripción.
El único tráfico de red en modo sin conexión es verificación de licencia y comprobación de actualizaciones — y ambos se pueden auditar con cualquier monitor de red.
Gratis, una vez que es suyo.
Mensual son $9. De por vida es un pago único — compre una vez, téngalo para siempre, sin factura recurrente.
Los modelos son gratuitos. La inferencia es gratuita. Sin costo por minuto, sin costo por token. Solo se paga la app.
Preguntas frecuentes
¿Necesito una GPU NVIDIA para el modo sin conexión?
¿Qué tamaño tienen los modelos?
¿El modo sin conexión realmente no tiene tráfico de internet?
Privado por defecto. Potente por elección.
Licencia de por vida significa que paga una vez y es suya. Modo sin conexión significa que el audio nunca sale de su máquina.