Comparativa
El mejor dictado por voz en Windows, clasificado
La mejor app de voz a texto para Windows depende de dónde escribas. Win+H es gratuita y viene integrada, pero necesita internet y solo funciona dentro de un cuadro de texto. Whisper funciona sin conexión, sirve en cualquier app y pega el texto justo donde está el cursor.
Última actualización: junio de 2026

La mejor app de voz a texto para Windows depende de dónde escribas. El dictado por voz de Windows (Win+H) es gratuito y viene integrado, pero necesita internet y solo funciona dentro de un cuadro de texto. Whisper by Remskill funciona sin conexión, sirve en cualquier app y pega el texto justo donde está el cursor. Es la mejor opción para escribir de verdad.
El fin de semana pasado mi hija pequeña le dictó a su abuela en Ucrania un correo de 90 palabras en unos 90 segundos. Sin teclado. Tiene siete años. Hace veinticinco años, la misma máquina en la misma familia tardaba quince minutos en dictar un párrafo de una carta navideña, y encima quedaba mal. El dictado por voz en Windows ha dejado de ser, sin hacer ruido, un experimento de laboratorio. La respuesta honesta es que tienes más opciones buenas de las que crees, y uno o dos nombres famosos que puedes saltarte.
La mayoría de las listas de "la mejor app de voz a texto para Windows" ordenan doce herramientas y recomiendan la que pagó por el enlace. Esto no es eso. Windows en 2026 trae una función de dictado gratuita que casi nadie encuentra, y el mercado de pago se ha dividido en herramientas que graban reuniones y herramientas que te ayudan a escribir. Esta guía clasifica las apps de voz a texto que vale la pena instalar en Windows 10 o posterior según cuatro cosas que importan: precisión, soporte sin conexión, dónde funciona y precio. Luego te dice, sin rodeos, cuándo la opción gratuita integrada es todo lo que necesitas. Al terminar sabrás cuál instalar hoy y qué nombre famoso dejar en la estantería. Yo leo los correos de soporte de la app que creo, así que casi todo lo que sé sobre dónde fallan estas herramientas viene de gente que me escribe para contarme que fallaron.
Una aclaración rápida sobre cómo leer lo que sigue. Yo creo una de las herramientas de esta lista, así que no voy a fingir que soy un árbitro neutral, pero sí voy a señalar los casos en los que una opción gratuita o un competidor son la elección correcta, porque esa es la única forma honesta de escribir esto. La clasificación va por caso de uso, no por un único ganador, porque no hay un único ganador. Quien manda tres mensajes de Slack al día y quien redacta un informe de 3.000 palabras por voz quieren herramientas distintas, y una lista que finja lo contrario te está vendiendo algo.
La respuesta corta: Win+H es gratis, pero aquí es donde se queda corta
Windows · Win + H
Pulsa la tecla del logotipo de Windows y la H en cualquier cuadro de texto y aparecerá una pequeña barra de herramientas en la parte superior de la pantalla. Empieza a hablar. Eso es el dictado por voz de Windows, y es gratuito y viene integrado en Windows 11. Para un mensaje rápido en una ventana de chat, es difícil ganarle a algo gratis y ya instalado.
Dos cosas lo frenan. Primera: necesita internet. El dictado por voz usa reconocimiento de voz en línea con la tecnología de los servicios Azure Speech de Microsoft, así que sin conexión no hay dictado. Segunda: el cursor tiene que estar dentro de un cuadro de texto para que funcione siquiera. Eso deja fuera muchos de los sitios donde quieres hablar: renombrar un archivo, una celda de hoja de cálculo que se te resiste, una app de escritorio que Windows no considera un "cuadro de texto".
Una tercera cosa, más pequeña, solo aparece tras unas semanas. Win+H es una función, no un flujo de trabajo. No guarda historial de lo que dictaste, no te da ningún sitio donde corregir una palabra que siempre sale mal y no ofrece forma de ajustar la puntuación a tu manera de hablar. Tienes un micrófono y una transcripción, y eso es todo. Para una respuesta de una línea es justo lo que necesitas. Para el cuarto correo de la mañana, empiezas a querer más.
Así que la verdadera pregunta no es "¿hay una opción gratuita?". La hay, y deberías probarla primero. La pregunta es qué usar cuando lo gratuito se queda corto: en un tren sin cobertura, en una app a la que Win+H se niega a entrar, o cuando la misma tarea vuelve por cuadragésima vez y quieres que la recuerde.
Cómo los elegí: precisión, sin conexión, funciona en todas partes, precio

Los clasifiqué según cuatro cosas, en este orden, porque es el orden en el que te muerden.
Precisión. Todo lo demás sobra si la transcripción está mal. El problema es que nadie publica una cifra justa de comparación directa. Nuance anuncia hasta un 99 % de precisión de reconocimiento para Dragon desde el primer uso. En modo local, nuestro propio rango publicado para Whisper es del 95 % al 99 %, y los modelos más grandes puntúan más alto. Ambas cifras son autoinformadas, así que trátalas como afirmaciones, no como un ranking. Ninguna fuente primaria publica un porcentaje de precisión verificable en comparación directa para Win+H, el dictado por voz de Google Docs ni Otter, así que cualquier lista que te ofrezca una cifra para cada herramienta se la está inventando. La verdad aburrida es que un micrófono USB de 20 dólares mueve tu precisión más que cualquier cambio de modelo. Si quieres gastar dinero en mejorar la transcripción, gástalo primero en el micrófono y después en el software.
Sin conexión. ¿Funciona con el Wi-Fi apagado? Win+H no. El dictado por voz de Google Docs tampoco. Una herramienta que se ejecuta en tu propia máquina sí, y eso importa para una hoja de cálculo de sueldos, un borrador legal o un correo al colegio de tu hijo que no tiene por qué quedar en los registros de un proveedor. También importa de la manera más tonta y cotidiana: trenes, aviones, sótanos, el asiento trasero del coche. El dictado en la nube es tan fiable como la peor rayita de cobertura que vayas a encontrar hoy.
Funciona en todas partes. ¿Escribe en cualquier app o solo en una? Esta es la línea que divide el terreno. Un atajo de teclado para todo el sistema pega allí donde esté tu cursor; una función del navegador solo funciona en esa pestaña del navegador. La prueba que uso es deliberadamente mundana. ¿Puede renombrar un archivo, rellenar un cuadro de búsqueda en una app de escritorio o escribir un mensaje de commit? La mayoría de las opciones "gratuitas" suspenden esa prueba en cuanto sales del navegador, y saldrás del navegador más de lo que crees.
Precio. Cifras claras, sin "desde". Gratis donde lo gratis es de verdad. No voy a rellenar una clasificación con una herramienta que cuesta más que una licencia de Windows para parecer exhaustivo, y te diré cuándo la opción gratuita integrada es todo lo que necesitas, que, para mucha gente, lo es.
Las apps de voz a texto para Windows que merecen tu tiempo
Whisper by Remskill: la mejor para escribir en cualquier app
Aviso de transparencia: yo creo esta, así que tenlo en cuenta. Lo que hace y que la opción integrada no: usa un atajo de teclado global, para todo el sistema, que funciona en cualquier aplicación donde puedas escribir, y pega tu texto transcrito allá donde esté el cursor. El atajo por defecto en Windows es Ctrl+Space: mantenlo pulsado, habla, suéltalo y el texto aterriza.
Funciona sin conexión. Toda la transcripción local está hecha en Rust puro y se queda en tu dispositivo; nada sale de la máquina una vez descargado el modelo. Tú eliges cómo se ejecuta. No hay un único modelo "recomendado" que la app te imponga, porque la elección correcta depende de tu máquina y de tus idiomas.
Whisper local incluye ocho modelos: cuatro solo para inglés, desde Base con unos 140 MB hasta Medium con cerca de 1,5 GB, y cuatro multilingües que llegan hasta Large v3 con unos 3 GB. Los multilingües cubren 99 idiomas; las versiones .en solo para inglés hacen inglés y nada más. Los modelos pequeños cargan rápido y funcionan en hardware modesto; los grandes piden más RAM y te recompensan con transcripciones más limpias. Un segundo motor, Parakeet de NVIDIA con unos 600 MB, va de 5 a 10 veces más rápido que Whisper en CPU y maneja inglés más 24 idiomas europeos, sin idiomas asiáticos y sin traducir al inglés. Si hablas sobre todo inglés y quieres velocidad, Parakeet es el carril rápido. Si necesitas 99 idiomas, traducción o un control más fino, Whisper es el que cargar.
Si quieres la última calidad de OpenAI y respuestas de la web en la misma herramienta, el modo Cloud usa tu propia clave de OpenAI, así que le pagas directamente a OpenAI y nosotros no nos llevamos comisión. Incluso puedes pedirle que busque algo en voz alta. Di la frase de activación "Hey whisper" y hará una búsqueda en la web y pegará la respuesta (le puse a la frase de activación el nombre del producto, lo cual, como me señaló mi mujer, es el tipo de cosa que solo le parece ingeniosa a quien crea software). Todo es ligero: la app en sí pesa unos 25 MB, sin necesidad de GPU dedicada, porque la transcripción local corre en la CPU. Se instala en Windows 10 o posterior. Repasamos la configuración inicial en detalle en nuestra guía de voz a texto en Windows.
Ideal para: cualquiera que escriba por voz en más de una app y quiera que funcione en un vuelo.
Dictado por voz de Windows (Win+H): la mejor opción gratuita e integrada
Ya está en tu PC, sin instalación, sin cuenta. Pulsa Win+H y habla en un cuadro de texto. El precio es la necesidad de internet y el límite de funcionar solo en cuadros de texto. Para mensajes cortos cuando ya estás conectado, es la primera elección correcta precisamente porque no cuesta nada. Microsoft ha añadido puntuación automática a Win+H, y está ahí mismo en cualquier instalación nueva de Windows 11. La mayoría de la gente que "no tiene voz a texto" ya la tiene y nunca ha pulsado esa combinación de teclas. Empieza aquí. Si te cubre el día, has terminado y no has gastado nada.
Ideal para: dictado rápido en un navegador o cuadro de chat, en línea, sin configurar nada.
Dragon Professional: la mejor para vocabulario especializado
El viejo rey del dictado en Windows. Nuance sigue anunciando hasta un 99 % de precisión desde el primer uso, optimizado para Windows 11 y compatible hacia atrás con Windows 10. Si dictas términos médicos o legales densos todo el día, la profundidad de vocabulario personalizado de Dragon es su razón de existir, con décadas de trabajo detrás para manejar la jerga que hace tropezar a los modelos de propósito general. Una advertencia honesta: cuando escribo esto, la tienda de Nuance estaba a medias de una migración y no pude confirmar un precio actual, ni si la versión vigente es una compra única o una suscripción, a partir de una fuente primaria. Históricamente Dragon era una licencia de pago único, pero no voy a publicar una cifra que no pueda sostener, así que compruébalo antes de comprar. La otra advertencia es de las que tengo opinión propia, y llegaré a ella más abajo: la era de entrenar tu software de dictado se acabó para casi todo el mundo, salvo en este caso profesional tan concreto.
Ideal para: profesionales con mucha jerga de dominio y un presupuesto.
Wispr Flow: la mejor opción pulida en la nube
Un competidor directo y de los elegantes. Wispr Flow anuncia más de 100 idiomas con detección automática y funciona de forma nativa en Windows, Mac, iOS y Android. La detección automática es su función estrella. Dice que cambia de idioma a mitad de frase igual que tú. No pude confirmar desde su página de inicio si la transcripción corre en el dispositivo o en la nube, así que, si trabajar sin conexión te importa, pregúntales directamente antes de comprometerte. Pulida, multiplataforma, merece un vistazo si la nube te vale y quieres la misma herramienta en el móvil y en el portátil. Pusimos la comparación cara a cara en nuestro artículo sobre alternativa a Wispr Flow por si estás decidiendo entre las dos.
Ideal para: quienes quieren una experiencia refinada y multidispositivo y no necesitan trabajar sin conexión.
Otter.ai: la mejor para reuniones, no para dictar
Otter es excelente en lo suyo, que no es esto. Es un transcriptor de reuniones que se une a Zoom, Microsoft Teams y Google Meet, con un plan gratuito Basic limitado a 300 minutos de transcripción al mes. No escribe en tus apps; graba y transcribe conversaciones y luego las resume. Una categoría completamente distinta. Si tu problema es "resumir mis reuniones", Otter es una buena respuesta; si es "escribir más rápido", es la herramienta equivocada por muy buena que sea. Además funciona como su propia app y servicio web, no como un atajo de teclado para todo el sistema, así que no es algo a lo que recurras para rellenar un campo de formulario. Profundizamos en esa idea en nuestro artículo sobre alternativa a Otter.ai.
Ideal para: capturar y resumir reuniones, no escribir por voz.
Comparativa rápida: dónde funciona cada herramienta
Dejé la precisión fuera de esta tabla a propósito. Solo Dragon y Whisper publican una cifra, y ambas son autoinformadas. Win+H, el dictado por voz de Google Docs y Otter no publican ninguna cifra verificable. Cualquier ranking del tipo "la herramienta X tiene un 96,3 % de precisión" entre las cinco es una conjetura disfrazada de hecho. Así que las columnas de abajo son las que sí puedes comprobar: dónde se ejecuta, si funciona sin conexión, si llega a cada app y para qué está hecha.
| Herramienta | Modelo de precios | Local/Nube | Funciona sin conexión | Funciona en cualquier app | Idiomas | Ideal para |
|---|---|---|---|---|---|---|
| Whisper by Remskill | Local gratis, nube de pago (ver /pricing) | Local o nube | Sí, en modo local | Sí, atajo para todo el sistema | 99 en los modelos multilingües | Escribir por voz en cualquier app |
| Dictado por voz Win+H | Gratis, integrado | Nube (Azure) | No, necesita internet | No, solo cuadro de texto | Varios, se configuran en Ajustes | Dictado rápido en línea |
| Dragon Professional | De pago, consulta la tienda de Nuance | Consultar al proveedor | Consultar al proveedor | Dentro de apps compatibles | Consultar al proveedor | Vocabulario especializado |
| Wispr Flow | De pago, ver proveedor | Sin confirmar | Sin confirmar | Para todo el sistema en Win/Mac | Más de 100 anunciados | Dictado pulido en la nube |
| Otter.ai | Plan gratuito, de pago por encima (ver proveedor) | Nube | No | No, su propia app | Consultar al proveedor | Transcripción de reuniones |
Lee la tabla de izquierda a derecha y el terreno se ordena solo. Si "funciona en cualquier app" y "sin conexión" tienen que ser ambos un sí, la lista es corta. Si te apañas en línea y dentro de una sola app, las opciones gratuitas integradas se encargan y puedes dejar de leer aquí. La decisión rara vez va de qué herramienta es "la mejor" en abstracto. Va de qué fila encaja con tu forma de trabajar.
Otras herramientas que conviene conocer
El terreno de Windows es más amplio que cinco nombres. Aquí van unas cuantas que verás en otras listas, con una línea honesta cada una para que puedas saltarte las que no encajan:
- Dictado de Microsoft Word — integrado en Word de Microsoft 365, gratis si ya pagas Office y bueno dentro de Word. Atrapado dentro de Word. Si la mayor parte de tu escritura ocurre allí de todos modos, es una opción válida sin coste adicional. Cubrimos sus peculiaridades en voz a texto en Word.
- Dictado por voz de Google Docs — gratis, pero solo dentro de Google Docs y Slides en un navegador compatible, donde el navegador controla el servicio de voz. No funciona en todo el sistema, y en cuanto sales de Docs deja de funcionar.
- API de voz a texto de OpenAI — whisper-1, gpt-4o-transcribe y gpt-4o-mini-transcribe, con un límite de subida de 25 MB por archivo. Esto es una pieza de construcción para desarrolladores, no una app que instales. Es lo que herramientas como el modo Cloud de Whisper llaman por debajo, no algo a lo que apuntes y empieces a hablar.
- Speechnotes — un bloc de dictado gratuito en el navegador. Está bien para apuntar notas, vive en una pestaña y no sale de la pestaña.
- Acceso por voz de Windows — el control del sistema operativo manos libres de Microsoft, pensado para accesibilidad y para usar todo sin teclado, no para escribir rápido. Conviene saber que existe si necesitas manejar Windows enteramente por voz.
- OpenAI Whisper — el propio modelo de código abierto, que puedes ejecutar en local sin la línea de comandos. Si lo que quieres específicamente es el modelo Whisper en un PC, mira nuestro tutorial de OpenAI Whisper para Windows para la forma de instalarlo y usarlo sin terminal.
Si quieres el repaso más largo de toda la categoría, incluidas las herramientas de reuniones y los servicios de transcripción en la nube, escribimos una guía completa de software de transcripción. La versión corta para esta página: la mayoría de estas o están atadas al navegador o no encajan de categoría para la tarea de escribir en cualquier app de Windows.
Cuándo saltarte una app de pago (y usar simplemente Win+H)
Windows · Win + H
Aquí está la parte que la mayoría de estas listas se dejan fuera, porque mandarte a un competidor gratuito no le paga el blog a nadie. Si estás en línea y solo dictas algún que otro mensaje corto en un navegador o cuadro de chat, no pagues por nada, incluidos nosotros. Pulsa Win+H y sigue. Es gratis, viene integrado en Windows 11 y maneja bien las ráfagas cortas. Si vives en Google Docs, su dictado por voz es gratuito y está ahí mismo dentro del documento. Si tu necesidad real es grabar y resumir reuniones en lugar de escribir, el plan gratuito de Otter te da 300 minutos al mes. Una app de dictado de pago empieza a ganarse su sitio en una línea concreta: cuando escribes textos más largos, trabajas en algún sitio sin cobertura o necesitas hablar en apps a las que Win+H no puede entrar. Por debajo de esa línea, la opción integrada es la respuesta correcta, y prefiero que te quedes tu dinero y vuelvas cuando se te quede pequeña.
Aquí va la única opinión fuerte que voy a plantar en este artículo: si tu herramienta de dictado necesita que la entrenes, estás en 1999. El reconocimiento de voz moderno funciona nada más sacarlo de la caja en la mayoría de acentos e idiomas. El ritual de calibración de 45 minutos que definió la vieja era de Windows era un apaño por la escasez de potencia de cálculo, no una función. A finales de los noventa, un familiar mío ejecutaba Dragon NaturallySpeaking en un sobremesa con Windows 98 y 64 MB de RAM. El proceso de entrenamiento tardaba 45 minutos. Leías una lista de palabras para calibrarlo. Luego el dictado funcionaba, a duras penas, con un 70 % de precisión quizá y un retardo de cuatro segundos por frase. Un párrafo de una carta navideña tardaba quince minutos. Los auriculares acabaron lanzados por la habitación. Los auriculares sobrevivieron; el experimento no. Veinticinco años después, una niña de siete años de la misma familia dictó un correo entero en 90 segundos, sin entrenamiento, sin calibración. Si una herramienta de 2026 todavía te pide que la entrenes antes de escucharte, eso es una idea de 1999 con un icono nuevo.
Precios sin dar vueltas
Todo el flujo local de Whisper es gratis para cualquiera con una cuenta: Whisper local, Parakeet, mejora con IA en el dispositivo, historial de dictado, atajos personalizados, todo, sin necesidad de método de pago para registrarte. Esa es la parte que merece detenerse: el dictado sin conexión y que funciona en cualquier app, sobre el que va todo este artículo, no cuesta nada, y no tienes que dar una tarjeta para conseguirlo. Whisper Pro añade la capa Cloud para transcripción con la tecnología de OpenAI, mejora con IA en la nube y búsqueda web por voz, para quienes quieren los últimos modelos y respuestas de la web en la misma herramienta. Win+H y el dictado por voz de Google Docs también son gratis. Otter tiene un plan gratuito de 300 minutos al mes y planes de pago por encima. Dragon es un producto de pago cuyo precio actual no pude confirmar directamente con Nuance, así que consulta su tienda. Las cifras exactas de Whisper Pro están en la página de precios, claras, por escrito, sin "desde", y te enviamos un correo antes de cualquier renovación para que la fecha y el importe nunca sean una sorpresa.
Abre un cuadro de texto ahora mismo y pulsa Win+H. Si esa barra rápida cubre todo lo que haces, has terminado y te has ahorrado una descarga. En el momento en que te encuentres en un tren sin cobertura, o hablándole a una app que se niega a escuchar, o escribiendo algo más largo que un mensaje, esa es la línea donde una herramienta que instalas empieza a importar. Mi hija de siete años la cruzó el día que quiso escribirle a su abuela desde el asiento trasero del coche, donde la luna no dejaba de desaparecer y el Wi-Fi no apareció en ningún momento.
¿Quieres verlo en tu PC con Windows?
Descarga Whisper, mantén pulsado Ctrl+Space y mira cómo la transcripción aterriza en cualquier app. El flujo local es gratis, sin tarjeta al registrarte.
Dictado local gratuito para todos los usuarios registrados. Pro añade las funciones en la nube en una prueba aparte.



