Por Denys Medvediev

Tutorial

Dictado por voz en Word: Win+H, Dictado o algo mejor

Dos formas integradas de dictar en Word y una mejora para todo el sistema. Dónde está cada una, cómo activarla y hasta dónde llega.

Última actualización: junio de 2026

Manos escribiendo un documento en un portátil rodeado de papeles, el flujo de trabajo que el dictado por voz en Word reemplaza

El dictado por voz en Word funciona de dos maneras desde el primer momento: pulsa Win+H para abrir el dictado por voz de Windows en cualquier campo de texto, o haz clic en el botón Dictado de la pestaña Inicio de Word. Ambos necesitan conexión a internet para transcribir. Una herramienta local como Whisper añade dictado sin conexión que funciona en Word y en cualquier otra aplicación.

El mes pasado tardé 19 minutos en escribir a teclado un informe de estado de 700 palabras y poco menos de 5 en dictarlo a 145 palabras por minuto. El mismo documento, la misma ventana de Word, el mismo autor. Lo único que cambió fue qué entrada estaba escuchando la aplicación más famosa de Microsoft. Word tiene oídos desde hace años; lo que pasa es que casi nadie encontró los dos botones que los activan. (Yo los encontré de la forma más vergonzosa: pulsando Win+H para silenciar una llamada.)

Este es el problema: los usuarios de Word encuentran una de las dos herramientas de dictado integradas, dan por hecho que es la única y juzgan el dictado por voz según la que toparon primero. Hoy Windows 11 incluye el dictado por voz en Win+H y Microsoft 365 incluye Dictado dentro de Word, y son herramientas distintas con requisitos distintos. Esta guía explica cómo activar ambas dentro de Word, dónde se queda cada una y cómo una herramienta para todo el sistema cubre lo que se les escapa.

Al terminar tendrás el dictado por voz funcionando en Word en menos de un minuto, además de una configuración sin conexión por si la necesitas. La mayoría de las dudas sobre dictado que llegan a nuestro buzón de soporte se reducen a "cuál de estas estoy usando". Leo esos correos, así que puedo decirlo sin pestañear.

Word tiene dos caminos de dictado por voz, no uno

Microsoft creó los dos, y por eso nadie sabe distinguirlos. El dictado por voz de Windows forma parte del sistema operativo. Se abre con Win+H, flota sobre cualquier aplicación que tenga el foco y escribe allá donde esté el cursor. Funciona en Word igual que en el Bloc de notas o en un formulario del navegador. Dictado forma parte de Microsoft 365. Vive en la pestaña Inicio de Word, solo existe dentro de las aplicaciones de Office y necesita una suscripción activa a Microsoft 365.

La verdad aburrida: para dictar párrafos normales en Word, dan resultados casi idénticos, porque ambos envían tu audio a los servicios de voz en línea de Microsoft. Las diferencias que importan son el alcance y los requisitos. Win+H viene con Windows y te acompaña en todas las aplicaciones. Dictado está atado a tu plan de Microsoft 365 y conoce trucos propios de Word, como los comandos de formato. Si tienes una suscripción a Microsoft 365 y te pasas el día dentro de Word, empieza por Dictado. Si escribes en Word, Outlook, Slack y un navegador, empieza por Win+H. Ninguno cuesta nada extra sobre lo que ya tienes.

Win+H: el dictado por voz que vive en Windows, no en Word

Escuchando…
La píldora del dictado por voz de Windows 11: una recreación simplificada de la interfaz de Microsoft, no la aplicación Whisper.

Lo que necesitas antes del paso 1: un PC con Windows 11 (Windows 10 tiene la barra de dictado más antigua con el mismo atajo), un micrófono que funcione y conexión a internet, porque el dictado por voz de Windows transcribe a través del reconocimiento de voz en línea de Microsoft. Sin conexión, no se escribe nada. La configuración total lleva menos de un minuto.

1. Abre tu documento y haz clic donde quieres que aparezca el texto

El dictado por voz necesita el cursor dentro de un cuadro de texto; si no hay nada con el foco, la píldora se abre pero no escribe nada.

Comprueba: el cursor está parpadeando dentro de tu página de Word.

2. Pulsa Win+H

La píldora del dictado por voz aparece cerca de la parte superior o inferior de la pantalla.

Comprueba: muestra "Escuchando…" antes de que empieces a hablar.

3. Habla por frases, no palabra a palabra

Las frases completas salen más limpias que el dictado palabra por palabra.

4. Activa la puntuación automática

Haz clic en el engranaje de la píldora y activa la puntuación automática, o dila en voz alta: "punto", "coma", "signo de interrogación".

Comprueba: terminar una frase y hacer una pausa produce un punto sin que tú lo digas.

5. Detente con la voz o con el mismo atajo

Di "dejar de escuchar", o pulsa Win+H otra vez.

Win+H también admite comandos de edición: "borra eso", "selecciona eso", "pulsa Enter". Funcionan, con la paciencia de quien negocia los deberes: aciertos claros en las peticiones sencillas, alguna sorpresa en las compuestas. Para correcciones más largas, el teclado y el ratón siguen invictos. Si la píldora se abre pero no pasa nada, nuestras soluciones para cuando Win+H no funciona cubren los sospechosos habituales, y la documentación del dictado por voz de Microsoft enumera todos los comandos y los más de 40 idiomas admitidos.

Un detalle más: en los PC Copilot+, una función llamada dictado fluido corrige la gramática y la ortografía mientras hablas, y se desactiva sola en los campos de contraseña.

El botón Dictado, en breve

Inicio
Dictado
El botón Dictado de Word en la pestaña Inicio: una recreación simplificada de la interfaz de Microsoft.

Dictado es el botón del micrófono en la pestaña Inicio de Word. Haz clic, espera a que indique que está escuchando y habla. Necesita una suscripción a Microsoft 365, un micrófono y una conexión a internet fiable, y funciona en Word para Windows, Mac, la web y el móvil. En un Mac, Option+F1 lo activa y desactiva. Si escribes en Word en un Mac todo el día, Dictado más ese único atajo puede ser todo el dictado por voz que necesitas.

Su ventaja sobre Win+H es que conoce Word. La puntuación automática está disponible en la mayoría de los idiomas admitidos (un interruptor en sus ajustes) y entiende comandos de formato: "pon eso en negrita", "crea una lista con viñetas", "borra la última palabra". Su punto débil es el alcance. En cuanto sales de Office, Dictado se queda atrás. Mantengo esta sección corta a propósito. Tenemos una guía completa de la función Dictado integrada en Word que cubre todos los comandos, idiomas y ajustes, y la documentación de Dictado de Microsoft es la referencia canónica. Si Dictado aparece en gris o no está, la guía de solución de problemas del dictado en Word repasa las soluciones.

Dónde chocan contra un muro ambas opciones integradas

Tres límites aparecen en la práctica, ordenados según la frecuencia con que aparecen.

Primero, ninguno funciona sin conexión. Win+H transcribe a través de los servicios en línea de Microsoft; Dictado declara una conexión a internet fiable como requisito. En un tren, en un avión, con un Wi-Fi de hotel que se cae cada 40 segundos, los dos se quedan mudos. Entre tú y yo: un dictado que no puede funcionar sin conexión es también una decisión de privacidad que tomó otra persona por ti. El correo al colegio de tu hijo, la revisión salarial, el borrador legal: todo pasa por los servidores de un proveedor porque querías escribir con la voz. La transcripción local no envía nada a ninguna parte, y para algunos documentos eso no es una preferencia, es un requisito.

Segundo, los topes de idiomas son distintos. Win+H admite más de 40 idiomas. Dictado admite unos 15 idiomas y variantes regionales por completo, y unos 25 más en versión preliminar con menor precisión. Dictar en ucraniano o mezclar idiomas a mitad de documento se vuelve irregular enseguida.

Tercero, el alcance. Dictado termina en las fronteras de Office. Win+H va a todas partes, pero sigue siendo una función de Windows; no hay un equivalente para Mac. Y nunca encontré dónde enseñarle a ninguna de las dos herramientas los nombres de proyectos, nombres de clientes o la jerga de productos que uso a diario: "Remskill" me llega como "rem skill" por muchas veces que lo corrija.

Un atajo que escribe en Word y en todo lo demás

A finales de los años noventa, un familiar mío usaba Dragon NaturallySpeaking en un PC de sobremesa con Windows 98 y 64 MB de RAM. Entrenarlo llevaba 45 minutos leyendo un texto de calibración, el dictado iba a paso de tortuga con 4 segundos de retraso por frase, y un párrafo de una carta navideña tardaba 15 minutos. Los auriculares acabaron volando por la habitación. Los auriculares sobrevivieron; el experimento, no. Archivé el dictado por voz bajo "ideas cuyo momento no ha llegado" y no toqué el archivo en veinte años. Esta sección es ese archivo reabierto.

Whisper es una aplicación de escritorio que pone un único atajo por encima de todo el sistema. Pulsa Ctrl+Space en Word (o en cualquier otro sitio donde puedas escribir), habla, suelta y el texto cae en tu cursor. La misma tecla funciona en Outlook, Slack, un navegador, un editor de código. No hay ninguna barra que encontrar ni ninguna función que activar por aplicación, y esa es la diferencia estructural con ambas opciones integradas.

Whisper
La aplicación Whisper real, renderizada en vivo: haz clic por los Ajustes; esto es lo que se instala.

La configuración lleva unos diez minutos, la mayoría es la descarga:

1. Instala la aplicación

Funciona en Windows 10 o posterior y macOS 11 o posterior, y pesa unos 25 MB.

Comprueba: la ventana de Whisper se abre en Ajustes.

2. Inicia sesión

El motor local —modelos, historial, ajustes preestablecidos, el atajo— solo necesita una cuenta.

3. Elige un modelo local y descárgalo

El predeterminado es el Small multilingüe, de unos 480 MB. Parakeet v3, de unos 600 MB, va de 5 a 10 veces más rápido en CPU y cubre el inglés más 24 idiomas europeos; sus detalles están en la ficha del modelo NVIDIA Parakeet. La familia de modelos Whisper llega hasta Large v3, de unos 3 GB, y cubre más de 90 idiomas en las variantes multilingües (las versiones solo en inglés son exactamente eso).

Comprueba: el modelo aparece como descargado en Ajustes.

4. Pon el cursor en Word, mantén Ctrl+Space, habla y suelta

La transcripción se pega donde está el cursor.

Comprueba: tus palabras están en el documento, con puntuación incluida.

Cancel
La superposición flotante mientras grabas: te sigue a cualquier aplicación.

Tras descargar el modelo, la transcripción ocurre en tu máquina con cero actividad de red; el mismo dictado funciona a 11.000 metros con el Wi-Fi apagado. La precisión en modo local suele situarse entre el 95 % y el 99 % según el tamaño del modelo, y un vocabulario personalizado le enseña los nombres que las opciones integradas siguen masacrando. También hay un modo en la nube, donde aportas tu propia clave de OpenAI para los últimos modelos de transcripción, pero para dictar en Word, local es la mitad que yo uso. Dicté esta sección al borrador mientras un hervidor negociaba con una bolsita de té; la sección necesitó dos correcciones, el té no necesitó ninguna.

Cuándo las herramientas integradas son suficiente

Oficina en casa con un micrófono de sobremesa, teclado y pantalla: una configuración sencilla donde el dictado integrado hace el trabajo

Si dictas un párrafo a la semana, en un escritorio con buena conexión, solo en Word y en uno de los ~15 idiomas que Dictado admite por completo, sáltate Whisper. Dictado ya está en tu plan de Microsoft 365 y hace bien ese trabajo. Lo mismo vale para Win+H si tu dictado nunca sale de Windows y los más de 40 idiomas admitidos cubren el tuyo: está a un atajo de distancia y no cuesta nada extra. El dictado por voz de terceros se gana su lugar cuando dictas a diario, trabajas sin conexión, necesitas vocabulario personalizado o quieres una sola herramienta para todas las aplicaciones, no antes.

Veinticinco años separan los auriculares de Dragon que volaron por la habitación de un documento de Word que se escribe solo mientras preparas un té. Las herramientas se pusieron al día. Lo que queda es elegir qué oyente encaja con tu semana. Pulsa Win+H hoy y dicta un párrafo real: una actualización de estado, una respuesta que llevas posponiendo. Si aguanta, tienes una nueva opción por defecto. Si chocas con el muro de la falta de conexión o el tope de vocabulario, ya sabes dónde está la mejora.

Prueba el mismo párrafo con un solo atajo

Descarga Whisper, mantén Ctrl+Space en Word y mira cómo la transcripción cae en tu cursor.

Funciona en Windows 10 o posterior y macOS 11 o posterior. El modo local funciona sin conexión.

Foto de Denys Medvediev

Denys Medvediev

Soy quien lee nuestro correo de soporte, lo más probable dictando las respuestas.