Por Denys Medvediev

Guía

La app de dictado moderna

Una app de dictado convierte las palabras habladas en texto escrito. En el escritorio, las buenas lo hacen en tiempo real: pulsas una tecla, hablas y las palabras aparecen en el cursor, dentro de la app que ya tenías abierta. Sin subir archivos, sin copiar y pegar, sin ventanas extra. Hablas, el texto llega.

Última actualización: junio de 2026

Un micrófono de condensador, un portátil y unos auriculares sobre un escritorio blanco y despejado, evocando el dictado por voz en el escritorio

Una app de dictado convierte tu voz en texto directamente en el cursor. Esta guía explica cómo funciona el esquema pulsa-tecla-habla-pega, qué herramientas de dictado incluye gratis tu sistema operativo, cuándo merece la pena una app dedicada, un repaso honesto a las apps más conocidas y cuándo no necesitas una app dedicada en absoluto.

Eso es toda la categoría en una sola frase. El resto del artículo es lo que nadie te cuenta. Cómo funciona de verdad, por qué la herramienta de dictado que ya viene en tu ordenador a veces es todo lo que necesitas y cuándo una app dedicada se gana su hueco cuando la integrada ya no es suficiente.

Debo decir desde el principio que yo desarrollo una de estas apps. Se llama Whisper by Remskill y seré honesto sobre dónde encaja y dónde no, incluida la parte en la que te digo que uses la herramienta gratuita que ya viene con tu sistema operativo.

Entremos en materia.

Pulsa una tecla, habla y las palabras aparecen en el cursor

Este es el mecanismo que define una app de dictado en el escritorio. Pulsas una tecla —Ctrl+Space en Windows por defecto, un atajo push-to-talk que puedes reasignar—. Dices una frase. Sueltas la tecla. Un segundo después, el texto aparece exactamente donde parpadeaba el cursor.

Pasted
El panel de la app en el momento en que termina el dictado: la línea grabada se transcribe y aparece en el cursor, dentro de la app que tenía el foco.

La parte de «en el cursor, en cualquier app» es lo que separa una app de dictado real de una web de transcripción. Una herramienta de transcripción toma un archivo grabado y te devuelve un bloque de texto que luego tienes que copiar en algún sitio. Una app de dictado se salta el archivo por completo. El sitio donde escribes es el sitio donde aparecen las palabras. Es la diferencia entre dictar una carta y transcribir una grabación tuya leyéndola.

La velocidad importa más de lo que la gente espera. Escribir ronda las 40 palabras por minuto para la mayoría. Hablar ronda las 145. Eso es aproximadamente tres veces y media más rápido, y por eso una herramienta que pulsas un segundo puede ahorrarte una buena porción de tarde. El montón de correos pendientes, las notas de la reunión, las doce variantes del email en frío antes de comer.

Tu ordenador ya tiene una, y a veces eso es suficiente

Antes de instalar nada, sabe que casi con total seguridad ya tienes una herramienta de dictado. Los dos grandes sistemas operativos incluyen una de forma gratuita.

En Windows 11, pulsas la tecla de Windows + H y aparece una barra de escritura por voz. Funciona, con un inconveniente: usa reconocimiento de voz en línea basado en Azure, así que necesita conexión a internet para hacer algo. Sin conexión, sin dictado. Puede insertar puntuación automáticamente si lo activas.

En el Mac, Apple Dictation vive en Ajustes del Sistema, bajo Teclado, y se activa con la tecla del micrófono o un atajo que tú eliges. La versión de Apple puede funcionar completamente en el dispositivo una vez que descargas el modelo de voz, lo que significa que trabaja sin conexión y tu voz no sale del equipo. Cubre decenas de idiomas. Apple lista 54 en línea y 43 disponibles sin conexión en su página de disponibilidad de funciones. Lo que no hace es vocabulario personalizado, corrección automática de tu redacción ni elegir qué modelo de transcripción usar.

La verdad aburrida es que para el dictado corto y casual —un texto de 30 palabras, una búsqueda rápida, una respuesta de una línea— la herramienta integrada funciona perfectamente. Es gratis, ya está ahí y no necesitas un cuarto icono en la barra de menús para mandarle un mensaje a tu madre. Si solo haces eso, cierra esta pestaña y ve a pulsar Win+H o la tecla de dictado de tu Mac. Lo digo en serio.

Si también dictas en el móvil o la tableta, qué app de escritura por voz encaja en cada dispositivo explica la elección plataforma a plataforma.

Cuándo una app de dictado dedicada se gana su lugar

¿Cuándo deja de ser suficiente la herramienta integrada? Por lo general, tres razones. La primera es el modo sin conexión que de verdad es privado. El dictado por voz de Windows necesita la nube. Una app dedicada puede ejecutar todo el proceso en tu propio CPU, de modo que el correo al colegio de tu hijo o el borrador legal que estás redactando no viajan a ningún sitio. La segunda es la precisión y el control: elegir un modelo más potente, añadir palabras personalizadas que siempre confunde, que tu redacción se corrija automáticamente. La tercera es lo que las integradas obvian en silencio: funcionar igual en cada app, en cada momento, sin sorpresas.

Ese es el hueco que ocupa Whisper by Remskill. Es una app de escritorio para Windows y macOS en Apple Silicon. El pipeline local completo es gratuito para cualquier usuario registrado, sin tarjeta al registrarte. Eso incluye los motores de transcripción local, la corrección con IA, el historial, las palabras personalizadas y el registro de hasta tres dispositivos propios.

Whisper
Whisper by Remskill funcionando en local: el mismo atajo, el mismo panel y la misma configuración tanto si estás sin conexión con un modelo local gratuito como si usas la superficie de nube opcional.

Con el motor, no te dan uno por defecto y punto. Tú eliges. Local Parakeet es la opción más rápida: unos 600 MB, entre 5 y 10 veces más rápido que Whisper en una CPU, con cobertura en inglés más otros 24 idiomas europeos. Local Whisper es más lento pero admite 99 idiomas, puede traducir el habla al inglés y te da vocabulario personalizado y un control más fino; el modelo más grande pesa unos 3 GB. Y si quieres los últimos modelos en la nube de OpenAI y respuestas en tiempo real de la web, existe una superficie Pro en la nube opcional donde tú aportas tu propia clave de API y Remskill no se lleva ningún porcentaje. Tres caminos; tú eliges según lo que más te importe: velocidad, idiomas o la última calidad en la nube.

La opinión honesta: la mayoría de apps de «dictado con IA» son margen, no modelo

Esta es mi única opinión firme, y la respaldo con un número. Muchas de las apps de dictado lanzadas en los últimos dos años son lo mismo por dentro: un modelo de voz que podrías ejecutar tú mismo, una interfaz pulida encima y una factura mensual que tiene muy poco que ver con el coste del cómputo. El precio habitual de ese esquema ronda los treinta dólares al mes en las más caras.

El argumento de venta dice «impulsado por IA». Lo mismo dice mi solicitud de hipoteca. La frase ha dejado de significar algo. Lo que pagas en realidad, en una app solo en la nube, es la comodidad de que otro ejecute el modelo más el coste de privacidad de que tu audio salga de tu portátil para hacerlo. Si el trabajo es sensible, eso no es comodidad, es un riesgo.

Esa es la razón por la que soy firme en que el modo local gratuito sea el punto de partida, no el extra de pago. Tu portátil tiene micrófono y CPU. Para un párrafo de dictado, no necesita ningún servidor en el proceso.

Un repaso rápido y honesto a las otras apps de dictado

Conviene conocer el panorama antes de elegir. Aquí están las que merece la pena mencionar, una línea cada una, reconociendo el mérito donde lo hay.

superwhispermadura y multiplataforma (Mac, Windows, iOS), hace dictado en directo más transcripción de archivos y funciona sin conexión con modelos locales. Una opción genuinamente sólida; si ya la usas y estás contento, no hay razón para cambiar.

Apple Dictationgratuita, integrada en macOS, funciona en el dispositivo y sin conexión una vez descargado el modelo. Sin vocabulario personalizado ni corrección con IA, pero para fragmentos cortos es todo lo que la mayoría necesita.

Escritura por voz de Windows (Win+H)gratuita, integrada en Windows 11, se abre con Win+H, pero requiere conexión en línea a Azure. Perfecta cuando tienes internet, inútil en un avión.

Dragon (Nuance)la veterana del sector, ahora un producto profesional solo para Windows (Dragon Professional v16) con precio bajo solicitud. Sigue liderando en comandos de voz manos libres y afirma una precisión de hasta el 99 %. Si necesitas controlar todo el ordenador con la voz, está en una categoría propia.

Wispr Flowelegante, en la nube y con el precio en el nivel de los treinta dólares al mes del que me acabo de quejar. Buena web de marketing.

He dejado unas cuantas fuera. La cuestión no es memorizar una lista, sino que «app de dictado» es una etiqueta amplia que abarca integraciones gratuitas, proyectos de código abierto, suscripciones pulidas y suites empresariales de comandos de voz. Elige según lo que realmente haces, no según la página web que hayas visto primero.

Por qué «solo pulsa una tecla» es más difícil de lo que parece

Una historia corta, porque es la razón por la que me importan los detalles aburridos. Le di la app a mi hija pequeña, que tiene siete años, un sábado. Una demostración: pulsa, habla, suelta, pega. Escribió un correo de 90 palabras a su abuela sobre un diente caído, la tarifa del ratoncito Pérez y la clase de baile, sin hacer ni una sola pregunta.

Dos días después volvió: «el atajo no funciona en mi app de dibujo». La persona media no sabe qué es un conflicto de tecla de acceso rápido. Solo sabe que dejó de funcionar. Esa noche publiqué la configuración de atajo personalizable. Una app de dictado vive o muere por los pequeños detalles: el conflicto que no predijiste, la liberación fantasma de tecla en Windows que en su momento hacía que mi controlador se disparara seis veces por pulsación y que me costó varios días y un debounce de 300 ms arreglar. Tengo un máster. El debounce me puso en mi sitio.

Cuándo no necesitas una app de dictado

Esta es la parte que la mayoría de artículos omite, así que aquí va sin rodeos. No necesitas una app de dictado dedicada si alguna de estas afirmaciones es cierta en tu caso.

  • Solo dictas cosas cortas y casuales. Mensajes, búsquedas, alguna respuesta de una línea. La herramienta integrada lo cubre gratis.
  • Siempre tienes conexión y nunca tocas nada sensible. En ese caso, las integraciones en la nube o una app de pago solo en la nube son perfectamente válidas; el modo local no te aportaría mucho.
  • Solo dictas dentro de un mismo sitio, como una sola pestaña del navegador. Una extensión del navegador cubre eso sin necesidad de una app de sistema. Voice In, por ejemplo, es una extensión de Chrome que funciona únicamente dentro del navegador.
  • Quieres control manos libres de todo el ordenador, no solo introducir texto. Eso es territorio de comandos de voz, y Dragon lo hace mejor que cualquier herramienta orientada al dictado.

Una app dedicada empieza a merecer la pena en el extremo más largo, más frecuente, más privado y más multilingüe, aproximadamente a partir del punto en que dictas párrafos de verdad, cada día, y prefieres que no salgan de tu máquina. Por debajo de esa línea, ahorra el dinero. Para una comparación más completa de las opciones gratuitas, hay una guía de software de dictado gratuito, un análisis más amplio del software de escritura por voz y, si llegaste aquí desde una app concreta, el análisis comparativo de alternativas a superwhisper.

Si solo te quedas con una idea

Una app de dictado es simplemente «pulsa una tecla, habla, las palabras aparecen donde estás escribiendo». La integrada en tu ordenador ya hace la versión fácil de forma gratuita. Una app dedicada vale la pena cuando necesitas privacidad sin conexión, precisión multilingüe real o el mismo comportamiento en cada app; y no vale la pena cuando no es así.

Whisper by Remskill mantiene el pipeline local completo gratuito exactamente por eso: deberías poder descubrir dónde está tu límite sin pagar primero. Los precios del nivel Pro en la nube opcional están en la página de precios. Mi hija de siete años encontró el límite en un sábado. Tú probablemente lo harás más rápido.

Prueba a dictar tu próximo párrafo en lugar de escribirlo

Descarga Whisper by Remskill, crea una cuenta sin necesidad de tarjeta, pulsa el atajo y habla. El pipeline local completo es gratuito, así que puedes descubrir dónde está tu límite antes de pagar nada.

Dictado local gratuito, sin tarjeta al registrarte.

Foto de Denys Medvediev

Denys Medvediev

Soy quien lee nuestro correo de soporte, probablemente dictando las respuestas.

Más información