Por Denys Medvediev

Comparativa

superwhisper en Windows

superwhisper ya tiene app para Windows, así que la respuesta de siempre («solo para Mac, lo sentimos») ha quedado obsoleta. La pregunta real es qué herramienta de dictado encaja mejor con tu Windows. Aquí tienes una comparativa honesta de superwhisper en Windows y la alternativa local más parecida.

Última actualización: junio de 2026

Portátil con Windows sobre un escritorio oscuro con un micrófono cerca, evocando el dictado en el escritorio

superwhisper para Windows ya es una realidad. Desde 2026, superwhisper.com ofrece una app descargable para Windows 10 y 11 con dictado por IA en el dispositivo, sin conexión y en cualquier campo. La alternativa local más cercana es Whisper by Remskill, también nativa para Windows, gratuita en su pipeline local, con un atajo push-to-talk a nivel de sistema y un pase de limpieza por IA.

Durante mucho tiempo, «superwhisper para Windows» era una búsqueda con una respuesta decepcionante. superwhisper nació como app para Mac, luego llegó a iOS, y los usuarios de Windows seguían preguntando en el foro de sugerencias cuándo les tocaría a ellos. Si buscabas esto el año pasado, todas las páginas decían lo mismo: solo para Mac, aquí tienes una alternativa, lo sentimos.

Esa respuesta ya no es válida. superwhisper.com tiene una página para Windows y una descarga para Windows — Windows 10 y 11, x64 y ARM64, transcripción offline en el dispositivo. Así que la pregunta ya no es «¿puedo conseguirlo?», sino «¿es la mejor opción para mi Windows o hay algo que se adapte mejor?». Uso el dictado en Windows a diario; seré justo con los puntos fuertes reales de superwhisper y te diré dónde encaja Whisper by Remskill en su lugar.

Hay algo que los artículos más antiguos confundían, y vale la pena decirlo claro para que no pierdas tiempo buscando soluciones que ya no necesitas. superwhisper ya no es solo para Mac. La versión para Windows es una app real y publicada en su propio sitio, no un acceso anticipado. Si querías superwhisper, ya puedes instalarlo hoy.

Así que esto dejó de ser un problema de «¿cómo uso la app de Mac en Windows?» para convertirse en una elección normal entre herramientas. Ahora hay dos apps de dictado local sólidas que funcionan en Windows. El resto de esta guía es la comparativa honesta: qué es superwhisper, por qué la gente sigue buscando alternativas, cómo se comparan ambas y los casos en que superwhisper — o la opción integrada de Windows — es la decisión más inteligente.

Qué es superwhisper y para quién está pensado

Micrófono de escritorio junto a un teclado, ilustrando el dictado por voz en un puesto de trabajo

superwhisper es una app de dictado con IA. Hablas, transcribe y pega el texto formateado en la app que tengas abierta: un correo, un chat o un editor de código. Según su propia descripción, funciona a nivel de sistema en cualquier aplicación, gestiona la puntuación y el formato de forma automática, admite más de 100 idiomas con detección automática y también transcribe archivos de audio y vídeo, no solo voz en directo. Es un conjunto de funciones genuinamente bueno, y no voy a fingir lo contrario.

El argumento en el que más insiste superwhisper es la privacidad. Su página de Windows lo dice sin rodeos: «Modelos de IA en el dispositivo. Tu audio nunca sale de tu máquina y no necesitas internet.» Es el planteamiento correcto para una herramienta de dictado, y es el mismo que hay detrás de Whisper by Remskill. Quien haya visto crecer una factura en la nube sabe por qué el procesamiento local importa. (Una vez vi cómo un equipo acumulaba una factura de cinco cifras en un trimestre por volver a transcribir cuatro veces las grabaciones de sus reuniones diarias porque un «reintento inteligente» era demasiado agresivo. El responsable financiero abrió el panel a mitad de la revisión y el silencio fue total.) El dictado en el dispositivo evita por completo esa categoría de problemas.

¿Para quién es entonces? Para quien quiere una app de dictado pulida y moderna, le gusta elegir entre varios modelos de IA para la limpieza del texto y usa un Mac o ha pasado a la nueva versión para Windows. superwhisper creció en macOS, donde es una opción sólida y bien valorada. La app para Windows es la incorporación más reciente a la familia. Eso no es una crítica — simplemente es el punto en que se encuentra, y es relevante para la comparativa que sigue.

«¿Por qué no estaba en Windows?» — y por qué eso por fin cambió

Durante años, la respuesta honesta a «superwhisper para Windows» era «no está disponible, es una app para Mac e iPhone». Empezar por Mac es un camino habitual para herramientas indie: una sola plataforma que mantener, integración estrecha con el sistema operativo y menos cosas que pueden fallar. Windows es más complicado. Solo la capa de entrada es más engorrosa; yo aprendí más sobre el marco de métodos de entrada de Windows de lo que nunca quise saber, cuando nuestro propio atajo disparaba el callback de fin de grabación seis veces por pulsación en máquinas con un método de entrada de idioma activado. Hizo falta un debounce de 300ms para solucionarlo. En Mac ese error nunca existió.

Esa brecha fue lo que empujó a la gente a buscar alternativas, y por eso esta búsqueda sigue apareciendo. Viejos hábitos, artículos viejos y el hecho de que la versión para Windows es lo suficientemente reciente como para que mucha gente no sepa que ya existe. La mecánica que comparten ambas herramientas es la parte sencilla: pulsa un atajo, habla, suéltalo y las palabras se pegan donde tengas el cursor. Aparece una pequeña cápsula mientras hablas para que sepas que está escuchando.

Cancel
El indicador de grabación: una pequeña cápsula que aparece mientras hablas para que sepas que la herramienta está escuchando.

En Whisper by Remskill el atajo push-to-talk es Ctrl+Space en Windows, mantenido mientras hablas, y se puede cambiar en Ajustes si entra en conflicto con otra cosa. (Mi hija pequeña una vez me dijo que un atajo «no funcionaba» en su app de dibujo. Era un conflicto, no un error — así aprendí que la mayoría de la gente no sabe lo que es un conflicto de atajos. Por eso todos los atajos son personalizables.) Si ya has configurado el dictado en Windows antes, esta es exactamente la misma memoria muscular.

Cómo configurar Whisper en Windows en dos minutos

Si quieres probar la alternativa junto a superwhisper, aquí tienes toda la configuración. Necesitas un PC con Windows 10 o posterior, un micrófono que funcione y un par de minutos. El pipeline local completo es gratuito para cualquier cuenta registrada, sin necesidad de método de pago al registrarse.

Paso 1 — Instala Whisper e inicia sesión.

Descárgalo desde la página de descarga, instálalo y crea una cuenta gratuita. Sin tarjeta. El pipeline completo de transcripción local se abre de inmediato.

Sabrás que funcionó cuando aparezca el icono en la bandeja del sistema y el asistente de configuración te ofrezca elegir un modelo.

Paso 2 — Elige la ruta de transcripción.

La app no elige por ti. Tienes tres opciones: Cloud (OpenAI, con tu propia clave), Parakeet local o Whisper local. Para trabajo privado, empieza en local — más sobre esto dos secciones más abajo.

Sabrás que funcionó cuando un modelo termine de descargarse y aparezca como listo.

Paso 3 — Confirma tu atajo.

En Windows el valor predeterminado es Ctrl+Space, mantenido como push-to-talk. Cámbialo en Ajustes si entra en conflicto con algo que ya usas.

Sabrás que funcionó cuando una grabación de prueba se pegue en cualquier campo de texto.

Paso 4 — Coloca el cursor en cualquier lugar y habla.

Haz clic en cualquier cuadro de texto — un correo, un documento, un chat —, mantén el atajo, di una frase, suéltalo. La transcripción aparece donde está el cursor.

Sabrás que funcionó cuando la frase que dijiste aparezca como texto en el campo.

Whisper
La app de escritorio real de Whisper en la pantalla de ajustes, con los paneles de Transcripción e IA abiertos.

La parte lenta es la descarga del modelo, no la configuración. Todo lo demás son los cuatro pasos anteriores. Una vez en marcha, dictar en un campo deja de ser una tarea de teclear y se convierte en una tarea de hablar. Lo mismo ocurre después de instalar superwhisper — ambas herramientas están a un atajo y un micrófono de funcionar en cualquier lugar.

Cómo se comparan superwhisper y Whisper, sin rodeos

Ambas funcionan en Windows, ambas transcriben en el dispositivo, ambas funcionan en cualquier app y ambas cubren una larga lista de idiomas. Hay mucho solapamiento, y prefiero reconocerlo antes que fingir que existe un abismo. Donde difieren es en los detalles. superwhisper ofrece un catálogo de modelos de limpieza — su web enumera opciones como GPT, Claude, Llama, Grok, Gemini y Mistral — y un sistema de «modos» personalizados para dar forma al tono. Si te gusta tener tantos controles, eso es un atractivo real, y superwhisper lo hace genuinamente bien.

Whisper by Remskill está construido de forma algo diferente. No elige un motor de transcripción por ti — te pone tres rutas delante y te deja elegir: un motor local rápido, un motor local multilingüe que también puede traducir al inglés o una opción en la nube con tu propia clave de OpenAI. En Windows el atajo push-to-talk es Ctrl+Space, personalizable. El pipeline local — todos los modelos locales, limpieza por IA a través de un modelo local, historial, ajustes preestablecidos, atajo personalizado, tres dispositivos — es gratuito para cualquier cuenta registrada sin necesidad de tarjeta al registrarse. El nivel de pago solo añade la superficie en la nube. Eso tiene una forma diferente a una división simple en nivel gratuito más Pro.

La única advertencia honesta sobre superwhisper en Windows es de madurez, no de capacidad. La app para Windows es más reciente que su hermana de macOS, y el software de escritorio más nuevo en Windows suele tener aristas durante un tiempo — ese es simplemente el coste de los problemas de la capa de entrada que mencioné antes. Si quieres la versión con más trayectoria, esa es macOS para superwhisper y Windows-y-Mac-desde-el-principio para Whisper. Si eres un usuario satisfecho de superwhisper en Mac y tienes curiosidad por Windows, pruébalo; pero no esperes paridad desde el primer día con la plataforma en la que creció.

Local o en la nube: qué modo de Whisper elegir en Windows

Si optas por Whisper, prueba primero el modo local. La mayoría de lo que la gente dicta — un correo, una nota a medias, un mensaje que nunca querrías que quedara en los registros de un proveedor — no tiene ningún motivo para salir de tu portátil por un párrafo de texto. Si tu PC es de los últimos años, el modo local gestiona el dictado cotidiano sin problemas, y la nube se convierte en la válvula de escape en lugar del camino por defecto. Así es como difieren las tres rutas, porque la app te obliga a elegir y prefiero que elijas bien.

La elección depende de la velocidad, la cobertura de idiomas o la precisión máxima.

  • Parakeet localEl motor TDT de NVIDIA, unos 600 MB y la opción local más rápida — de 5 a 10 veces más rápido que Whisper en CPU. Cubre inglés más 24 idiomas europeos, 25 en total. Sin traducción al inglés. Si hablas principalmente inglés u otro idioma europeo, esta es la opción rápida y totalmente offline.
  • Whisper localmás lento que Parakeet en la misma máquina, pero las versiones multilingües cubren 99 idiomas y pueden traducir al inglés. Las versiones solo en inglés son solo en inglés, no 99. Elige este para chino, japonés, coreano o cualquier trabajo de traducción que Parakeet no puede hacer. El modelo en inglés por defecto pesa unos 480 MB.
  • Cloud (OpenAI, BYOK)la mejor precisión y acceso a la web, usando tu propia clave de OpenAI facturada directamente por OpenAI. La transcripción usa gpt-4o-mini-transcribe por defecto. Necesita internet, por lo que es la única ruta que sale de tu máquina. La superficie en la nube es parte de Whisper Pro.

La verdad, sin florituras, es que para la mayoría de lo que la gente dicta en un Windows, el modo local es más que suficiente. Ambos motores locales funcionan completamente en tu propio hardware sin enviar nada a un servidor — la misma promesa de procesamiento en el dispositivo que hace superwhisper. La nube gana su lugar cuando quieres la máxima precisión en una grabación difícil o necesitas que el modelo consulte un dato de la web a mitad de una frase. Empieza en local y recurre a la nube solo cuando el local se quede corto.

El pase de limpieza por IA que convierte lo que balbuceas en prosa

El dictado en bruto sale como un torrente. Dices «bueno pues revisa el documento de arquitectura etiquétalo proyecto alpha y recuérdame el jueves», y eso es el muro de texto sin puntuación que cualquier motor de voz te entrega primero. Lo que haces con ese muro es donde las herramientas demuestran su valor.

superwhisper hace la limpieza a través de su selector de modelos y modos personalizados. Whisper by Remskill también aplica un pase de IA: di la frase de activación «Hey whisper» y el texto se mejora antes de llegar — se eliminan las muletillas, se corrigen los párrafos sin puntuación y el fragmento hablado se convierte en algo que realmente enviarías. Con un modelo local ese pase funciona a través de Ollama, completamente offline; en modo cloud es gpt-5-mini por defecto. En cualquier caso el objetivo es el mismo — hablas sin cuidarte demasiado y el texto llega ordenado.

Thinking...
Original

bueno pues revisa el documento de arquitectura etiquétalo proyecto alpha y recuérdame el jueves eh antes del standup

Limpio

Revisa el documento de arquitectura, etiquétalo Proyecto Alpha y recuérdame el jueves antes del standup.

El pase de limpieza marca la diferencia entre un dictado que tienes que corregir y uno que puedes enviar directamente. También es donde más importa la línea entre el dispositivo y la nube: un modelo de limpieza que funciona en tu máquina nunca toca un servidor, que es la razón principal para dictar en local desde un principio. Si solo necesitas transcripciones en bruto, no lo echarás de menos. En el momento en que empiezas a enviar correos reales por voz, es la función que dejas de notar porque simplemente funciona.

Ese mismo flujo de hablar y limpiar es lo que hace que la voz sea más rápida que el teclado en primer lugar — puedes escribir más rápido con tu voz en cualquier app, de modo que un párrafo largo se convierte en unas pocas frases habladas en lugar de cinco minutos tecleando.

Si usas Mac

MacBook abierto sobre un escritorio de madera con luz suave, que representa el dictado en macOS

Sé honesto sobre tu hardware, porque la respuesta correcta cambia según el caso. Si estás leyendo esto desde un Mac, superwhisper es una opción sólida y te lo diría a la cara. Nació en macOS, lleva años pulido ahí y en Apple Silicon sus modelos en el dispositivo funcionan bien. Para un usuario de Mac que quiere una app de dictado nativa y madura con un selector de modelos amplio, superwhisper se ha ganado genuinamente la recomendación. No voy a alejarte de una buena herramienta para quedar bien.

Conviene saber que Whisper by Remskill también funciona en Mac con Apple Silicon, con el mismo pipeline que prioriza lo local y un atajo push-to-talk de command+option mantenido mientras hablas. Así que la elección en Mac no es superwhisper o nada — son dos opciones locales sólidas, y cuál encaja mejor depende de si prefieres el enfoque de modelos y modos de superwhisper o el enfoque de tres rutas a elegir de Whisper. Ambas mantienen tu audio en tu máquina. Prueba la que más te convenza; ninguna es una mala decisión.

Y si solo vas a enviar un mensaje de 30 palabras, no instales nada. El Dictado de macOS viene integrado, se configura en Ajustes del Sistema bajo Teclado y en Apple Silicon puede procesar texto general en el dispositivo. En Windows, la barra de Escritura por voz integrada se abre con la tecla Windows + H donde tengas el cursor — puntúa sola y está bien para fragmentos cortos, aunque pasa por los servidores de Microsoft y necesita internet, así que no es una opción offline para trabajo largo o privado. (Si alguna vez Win+H deja de abrirse, las causas habituales están en esta solución para cuando Win+H no funciona.) Recurre a una herramienta dedicada cuando las opciones integradas empiecen a quedarse cortas — notas largas, privacidad offline o querer el mismo atajo en todas partes.

Si llegaste aquí desde la vieja guardia del dictado, la misma lógica de comparativa se aplica a la alternativa moderna a Dragon — local, sin paso de entrenamiento y pensado para la forma en que la gente dicta hoy.

«superwhisper para Windows» antes era un camino sin salida. Ya no lo es — la app existe en Windows, hace bien lo que promete y si es lo que querías simplemente ve a instalarlo. La única razón para seguir leyendo más allá del botón de instalación es asegurarte de que elegiste la herramienta que encaja con tu máquina y tu nivel de privacidad, y no simplemente la que apareció primero. Dicté casi toda esta comparativa en un portátil con Windows, con una herramienta que pega el texto donde tengo el cursor, y después la envié. El teclado se quedó ahí quieto, que es exactamente de lo que se trata.

Prueba el dictado local en tu PC con Windows

Mantén el atajo, habla, suéltalo. La transcripción aparece donde tengas el cursor — en cualquier app, completamente en tu máquina.

Modo local gratuito para cualquier cuenta registrada. No se requiere tarjeta para empezar.

Foto de Denys Medvediev

Denys Medvediev

Soy quien lee el correo de soporte, casi siempre dictando las respuestas.

Lecturas adicionales