Dictado por voz · Guía
App de dictado por voz: qué instalar en cada dispositivo
En Android y iPhone, usa el dictado integrado en el teclado. Es gratis y funciona bien. En Windows y Mac, las herramientas integradas sirven para textos cortos, pero se quedan cortas enseguida cuando escribes en serio. Una app de dictado por voz de escritorio como Whisper añade un atajo global, modelos locales sin conexión y texto que aparece en cualquier aplicación.
Última actualización: junio de 2026

Una app de dictado por voz convierte tu voz en texto allí donde esté el cursor. En el móvil, el teclado integrado ya lo hace: Gboard en Android, la tecla del micrófono en el teclado del iPhone. En los escritorios con Windows y Mac, las herramientas integradas tienen más limitaciones, y ahí es donde una app de escritorio dedicada como Whisper by Remskill se gana su lugar.
Busca "app de dictado por voz" en cualquier tienda de aplicaciones y te saldrán páginas y páginas de teclados, cada uno un botón de micrófono con una mano de pintura nueva. Mientras tanto, las cifras de fondo no se han movido: la mayoría de la gente escribe a unas 40 palabras por minuto y habla a unas 145. Esa diferencia es la razón de ser de toda esta categoría.
Yo construí una de estas apps y aun así la semana pasada me pillé escribiendo a dos pulgares un correo de 400 palabras. Las costumbres sobreviven a sus motivos. Lo que pasa es que la respuesta correcta depende del dispositivo que tengas en la mano, y para uno de ellos esa respuesta no cuesta nada y ya venía preinstalada.
"App de dictado por voz" describe dos situaciones distintas bajo un mismo nombre, y casi ningún resumen lo dice. En el móvil, el dictado es un problema resuelto que las tiendas no dejan de revender; en el escritorio, donde se escriben los textos largos, las herramientas integradas vienen con condiciones. La forma sensata de elegir es por dispositivo.
Al terminar esta página sabrás qué dejar en tu móvil, dónde se quedan cortas las herramientas integradas del escritorio y qué instalar cuando se te quedan pequeñas. Me dedico a construir una app de dictado por voz de escritorio, y lo primero que le digo a la gente es que no instale nada en su móvil.
Los móviles ya traen una app de dictado por voz de fábrica

La verdad aburrida es que la mejor app de dictado por voz para tu móvil es el teclado con el que vino. En Android lo hace Gboard: toca un campo de texto, toca el micrófono en la parte superior del teclado y habla cuando aparezca "Habla ahora". Puedes dictar la puntuación en voz alta, como "punto", "coma" y "párrafo nuevo", aunque Google advierte de que la puntuación y el dictado por voz no están disponibles en todos los idiomas. En el iPhone, el teclado tiene una tecla de micrófono que hace exactamente lo mismo.
Eso cubre mensajes, correos, cajas de búsqueda y notas, que es la mayor parte de lo que cualquiera escribe en un móvil. Un dictado típico de móvil es una respuesta de correo de entre 50 y 150 palabras, unos 30 segundos hablando; el micrófono integrado lo gestiona sin rechistar. Los teclados de terceros que llenan los resultados de la tienda envuelven ese mismo micrófono en otra marca, a veces con una suscripción de propina. Antes de instalar uno, prueba el botón que ya tienes. Esta es una de esas raras categorías de producto donde la opción gratuita y preinstalada es además la más sensata.
Una confesión honesta, ya que este es el punto en el que un fabricante daría el salto a su app móvil: nosotros no tenemos. Whisper by Remskill es una app de escritorio para Windows y macOS, y punto. Si tu vida de dictado ocurre en el móvil, el teclado integrado es mi recomendación, y puedes cerrar esta pestaña con mi bendición.
El escritorio es donde las herramientas integradas se quedan cortas
Ambos sistemas operativos de escritorio incluyen dictado por voz, y conviene conocer los dos antes de instalar nada. En Windows 11, pulsa la tecla Windows + H y aparecerá un pequeño panel de dictado por voz. Necesita tres cosas: conexión a internet, un micrófono que funcione y el cursor colocado en un cuadro de texto. Admite más de 40 idiomas y puede insertar la puntuación por ti si activas esa opción. El requisito de internet es el detalle que hay que recordar. Win+H es estupendo hasta que el wifi del hotel deja de serlo.
Dictado por voz
Escuchando…
En un Mac, el dictado se inicia desde la tecla del micrófono en la fila de funciones, desde un atajo de teclado o desde Edición > Iniciar dictado. No tiene límite de longitud, pero se detiene solo tras 30 segundos de silencio, lo que en la práctica significa que se apaga justo mientras miras al techo buscando una palabra. Pone la puntuación en los idiomas compatibles sin que se lo pidas, y Apple aclara que el dictado no está disponible en todos los idiomas ni regiones.
Ninguna de las dos herramientas es mala, y ambas valen para una frase o tres. Los límites aparecen cuando la escritura se pone en serio. El vocabulario personalizado para los nombres de tus productos y clientes no figura en la lista de funciones de ninguna de las dos, y tampoco la limpieza con IA de esa capa de "eh, o sea" que arrastra el habla. En un Mac puedes comprobar si el dictado se ejecuta en el dispositivo; en Windows, la herramienta se apaga en el momento en que pierdes la conexión. Esos límites son la razón por la que las apps de dictado por voz de escritorio existen como categoría.
Qué debería hacer de verdad una app de dictado por voz de escritorio

El mecanismo es fácil de enunciar. Una app de dictado por voz de escritorio se queda en segundo plano, vigila un único atajo global, graba mientras lo mantienes pulsado, pasa el audio por un modelo de reconocimiento de voz y pega el resultado allí donde esté tu cursor. Cada parte de esa frase es algo que conviene comprobar antes de instalar.
El atajo importa porque convierte el dictado en un reflejo en lugar de una función que tienes que ir a visitar. La parte de "allí donde esté tu cursor" importa porque se escribe en el correo, en Slack, en un CRM, en un editor de código y en el formulario de un navegador; una herramienta que solo escribe en su propia ventana es un bloc de notas con micrófono. El modelo importa por partida doble: una por la precisión, otra por adónde va tu audio. Los modelos locales se ejecutan en tu máquina y funcionan sin conexión. Los modelos en la nube envían el audio a un servidor y a menudo transcriben mejor. Una buena app de escritorio te deja elegir según la situación en lugar de decidir por ti.
La velocidad también pertenece a la lista, en cifras concretas. En un MacBook Air con M1 ejecutando un modelo local pequeño en inglés, Whisper tarda desde que sueltas la tecla hasta que el texto aparece pegado unos 1,4 segundos; en modo nube con una conexión decente, unos 1,1 segundos. Una respuesta en ese rango mantiene el dictado en la categoría de "reflejo". Si una herramienta te hace esperar, abrir una ventana o copiar el texto de un panel, la fricción se come la ventaja de velocidad que venías a buscar.
Aquí va mi única opinión de esta página: el mejor truco de productividad son menos pasos, no pasos más rápidos. Casi todas las herramientas intentan acelerar la escritura. El dictado por voz la elimina. El flujo pasa de "parar, sentarse, escribir" a "hablar, listo", que es como el habla a 145 palabras por minuto le gana a la escritura a 40 sin que nadie tenga que aprender nada nuevo. Una app que vuelve a meter pasos ha perdido el sentido de su propia categoría.
Para un recorrido más a fondo por la categoría en sí —motores, precisión, el dilema entre local y nube— tenemos un artículo aparte sobre el software de dictado por voz. Esta página se queda en la pregunta más concreta: qué instalar, según el dispositivo.
Cómo gestiona Whisper el dictado por voz en Windows y Mac
Whisper by Remskill es nuestra respuesta para la mitad de escritorio de la pregunta. Mantienes pulsado un atajo (Ctrl+Space en Windows, Command+Option en un Mac), hablas, lo sueltas y el texto aparece allí donde esté tu cursor, en cualquier aplicación. Mientras hablas, un pequeño panel flota en la pantalla para que veas que te está escuchando.
Por dentro eliges entre tres caminos, y la app no elige por ti.
- Whisper local — Familias de modelos optimizadas para inglés y multilingües, desde un modelo Base de ~140 MB hasta el Large v3 de ~3 GB. La familia multilingüe cubre más de 90 idiomas, incluida la detección automática. Los modelos solo en inglés son justo eso, solo inglés, así que elige la familia multilingüe si cambias de idioma a lo largo del día.
- Parakeet local — Funciona entre 5 y 10 veces más rápido que Whisper en CPU y cubre el inglés más 24 idiomas europeos. El carril rápido para el dictado mayormente en inglés.
- Nube (con tu propia clave de OpenAI) — Se conecta a OpenAI con tu propia clave de API, usando gpt-4o-mini-transcribe o gpt-4o-transcribe para el habla en sí y gpt-5-mini para la limpieza opcional con IA.
Todo lo local es gratis: los modelos se ejecutan en tu dispositivo, funcionan sin conexión, no envían nada a ninguna parte y no hace falta tarjeta para registrarse.
Hay un truco más que merece la pena conocer: una palabra clave de IA. Empieza una grabación con "Hey whisper" y la app activa el procesamiento con IA del texto transcrito en lugar de pegarlo tal cual. Dictado para las frases de cada día, un asistente para los momentos en que quieres que el texto se reelabore. El mismo atajo en ambos casos.
La prueba en la que más confío no fue un benchmark. Le di Whisper a mi hija pequeña, se lo enseñé una vez (pulsar, hablar, soltar, pegar) y dictó un correo de 90 palabras a su abuela sobre un diente que se le cayó y el tipo de cambio del ratoncito Pérez, sin más preguntas. Dos días después me informó de que "el atajo no funciona en mi app de dibujo", que es como aprendí que los usuarios normales no saben lo que es un conflicto de atajos. Solo saben que no funciona. Los ajustes de atajo personalizable se publicaron esa misma noche. Si una niña de siete años puede completar el bucle, el bucle es bastante simple.
La app incrustada de arriba es la interfaz de escritorio real, no una captura; trastea por ella. Y repito la confesión, porque la intención de instalar merece una respuesta clara: Whisper funciona en Windows y en Macs con Apple Silicon, y en ningún otro sitio.
Una lista breve antes de instalar nada
Instalar software es un compromiso, aunque el software sea gratis. Cinco preguntas resuelven esto más rápido que cualquier ronda de reseñas:
- ¿En qué dispositivo escribes de verdad, con sinceridad? Sobre todo en el móvil: quédate con el dictado integrado del teclado y no gastes nada.
- ¿Escribe en todas las aplicaciones? Busca un atajo global que pegue en el cursor, no una ventana aparte de la que tengas que copiar.
- ¿Funciona sin conexión? El dictado por voz de Windows no puede. Los modelos locales sí. Si entre lo que escribes hay cosas que no deberían pasar por un servidor, esta pregunta va la primera.
- ¿Qué idiomas, contados por motor? Más de 40 en el dictado por voz de Windows, más de 90 en los modelos multilingües de Whisper, 25 en Parakeet y solo inglés en los modelos .en.
- ¿Has arreglado primero el micrófono? Un micro USB de 20 dólares hace más por la precisión que cualquier mejora de modelo. Yo construyo el software y aun así gana el micro. A nadie en este sector le hace gracia decirlo en voz alta.
Si has llegado aquí desde el ángulo de la investigación —cifras de precisión, cómo se comparan los motores—, el artículo sobre app de voz a texto cubre ese lado. Los planes y lo que incluyen están en la página de precios; la versión corta es que todo lo local no cuesta nada.
Cuándo saltarte Whisper
Si tu dictado ocurre en el móvil, sáltanos. No tenemos app móvil, y el dictado de Gboard o del teclado del iPhone es gratis y más que suficiente. Si escribes una frase o dos al día en un Mac, Apple Dictation viene integrado, se inicia desde la tecla del micrófono y pone la puntuación por ti.
Si necesitas transcripción de reuniones con varios participantes y resúmenes, eso es una categoría de producto distinta de la escritura por voz, y deberías buscar en esa categoría. Y si estás en Linux o en un Mac con Intel, Whisper no funciona ahí, así que las herramientas integradas y las del navegador son tus opciones honestas.
Fuentes
Hace veinte años, el dictado por voz consistía en leerle guiones de calibración a tu ordenador y cruzar los dedos. Hoy el resumen honesto cabe en dos líneas: tu móvil ya lo hace, y tu escritorio puede hacerlo como es debido con una sola instalación. El micrófono lleva ya un tiempo siendo el dispositivo de entrada más rápido de tu mesa. La mayoría simplemente aún no hemos pulsado la tecla.
Pon una app de dictado por voz en tu escritorio
Descarga Whisper, mantén pulsado un atajo y mira cómo el texto aparece allí donde esté tu cursor.
Funciona en Windows y en Macs con Apple Silicon. Todo lo local es gratis. Tu teclado seguirá ahí cuando lo necesites.



