Solución de problemas
El micrófono funciona, el dictado no
La prueba del micro muestra los niveles moviéndose, pero el dictado por voz no produce ningún texto. Casi siempre el problema está en la capa de reconocimiento de voz, no en el micrófono: un interruptor de voz en línea apagado, un idioma incorrecto o el cursor en el campo equivocado. Las soluciones a continuación son por sistema operativo y conservadoras.
Última actualización: junio de 2026

Cuando el micrófono funciona pero el dictado no, el micrófono está bien y el problema está en la capa de reconocimiento de voz. En Windows, activa el reconocimiento de voz en línea y confirma el idioma de entrada. En Mac, comprueba el idioma del dictado y el permiso del micrófono. Una herramienta offline dedicada evita por completo el proceso de reconocimiento de voz en línea que suele causar esto.
La primera vez que me pasó esto, pasé veinte minutos culpando a un micrófono perfectamente bueno. El medidor de nivel se movía, la luz del auricular estaba encendida, la grabación de prueba sonaba bien — y el dictado seguía dándome un cursor parpadeante y nada más. El micrófono nunca fue el problema. El problema estaba en la capa que se sitúa entre el micrófono y el texto, y esa capa falla en silencio.
Esta es la confusión más habitual en el dictado: una prueba de micrófono solo demuestra que el audio llega al sistema operativo. El dictado necesita una segunda cosa — un servicio de reconocimiento de voz activado, configurado en el idioma que estás hablando y apuntando al mismo micrófono, con el cursor en un campo que acepte texto. Si cualquiera de esas condiciones no se cumple, obtienes exactamente lo que estás viendo: un micrófono funcional y ninguna palabra.
Aquí está la parte que la mayoría de páginas de "cómo solucionarlo" se saltan. Tu micrófono y tu dictado son dos sistemas separados. El micrófono capta el sonido. El reconocedor de voz convierte ese sonido en texto. Una prueba de micrófono ejercita el primero y no te dice nada sobre el segundo.
Así que la pregunta no es «¿está roto mi micrófono?» — eso ya lo has respondido. La pregunta es «¿cuál eslabón de la cadena de voz está caído?», y la respuesta suele ser uno de cinco: el servicio de voz en línea está apagado, el idioma de dictado no coincide con lo que estás hablando, el campo no tiene el foco real, el micrófono equivocado está seleccionado para el servicio de voz, o el paquete de idioma del dispositivo no se ha descargado. Te explico la solución rápida, la permanente y la reparación por sistema operativo si prefieres conservar la herramienta integrada.
Por qué el micrófono pasa la prueba pero no aparece ningún texto

Un micrófono funcional y un dictado funcional no son la misma prueba. Cuando abres los ajustes de sonido y ves moverse el nivel de entrada, has confirmado que el audio llega al sistema operativo. El dictado está una capa más arriba: toma ese audio y lo procesa mediante un servicio de reconocimiento de voz. Si ese servicio está apagado, mal configurado o escuchando un dispositivo diferente, el medidor sigue moviéndose y no aparece ningún texto. Esa brecha es el error completo.
En Windows 11, el dictado por voz — la barra con la tecla del logotipo de Windows + H — convierte el habla usando el reconocimiento de voz en línea de Microsoft, que funciona en la nube y necesita conexión a internet. La propia página de soporte de Microsoft es explícita: el dictado por voz requiere un micrófono funcional, un cuadro de texto donde esté el cursor y una conexión a internet. Si el ajuste de privacidad «reconocimiento de voz en línea» está desactivado, o estás sin conexión, la barra se abre, la luz del micrófono se enciende y nada aterriza. Esta es la versión más común de «el micrófono funciona, el dictado no» en Windows.
En macOS, los modos de fallo son diferentes pero riman. El dictado tiene que estar activado en los ajustes del Teclado, configurado en el idioma que estás hablando realmente, y con permiso de acceso al micrófono concedido. En Apple Silicon, muchos idiomas se procesan localmente tras una descarga única — y si esa descarga no ha terminado, el dictado puede quedarse ahí sin hacer nada. La guía de solución de problemas de Apple también señala los obvios-pero-comunes: fuente de entrada incorrecta seleccionada, idioma incorrecto para tu habla, micrófono obstruido. Ninguno de esos aparece en una prueba de medidor de nivel, que es exactamente por qué el medidor te engañó.
La solución rápida que funciona para la mayoría
La mayoría de los casos se reducen a dos o tres comprobaciones por sistema operativo. Hazlas en orden y detente cuando aparezca texto. Están extraídas de las propias páginas de soporte de Microsoft y Apple, no de suposiciones, porque una instrucción incorrecta aquí te hace perder una tarde que no tienes.
En Windows, haz estas tres. Primero, activa el reconocimiento de voz en línea: Configuración > Privacidad y seguridad > Voz, actívalo. Segundo, confirma que estás conectado a internet — el dictado por voz no transcribe sin conexión. Tercero, comprueba el idioma de entrada: pulsa la tecla del logotipo de Windows + Barra espaciadora y elige el idioma que estás hablando. Luego coloca el cursor en un cuadro de texto real, pulsa la tecla del logotipo de Windows + H, y habla. Si sigue sin hacer nada, confirma que el micrófono correcto está seleccionado en Configuración > Sistema > Sonido > Entrada, y que el acceso al micrófono está activado en Configuración > Privacidad y seguridad > Micrófono.
En Mac, haz estas tres. Primero, asegúrate de que el Dictado está activado: Configuración del Sistema > Teclado > Dictado, actívalo. Segundo, configura el idioma del dictado para que coincida con lo que estás hablando — en ese mismo panel de Dictado, edita la lista de idiomas. Tercero, confirma que la entrada correcta está elegida en Configuración del Sistema > Sonido > Entrada, y que la app que estás usando tiene permiso de micrófono. Haz clic en un campo de texto, activa el Dictado con su atajo de teclado y habla. El indicador que aparece a continuación es de un tipo diferente de herramienta — una app de dictado dedicada que omite por completo el servicio de voz en línea — pero la idea es la misma: un pequeño indicador que confirma que está escuchando de verdad, para que no tengas que adivinar.
La solución permanente: dictado que nunca tiene este problema
Si prefieres no volver a luchar con un interruptor de voz en línea cada pocas semanas, la solución duradera es una herramienta de dictado que no dependa del servicio de voz del sistema operativo en absoluto. Whisper ejecuta su propio motor localmente, usa el micrófono directamente y pega el texto en el cursor. No hay proceso de verificación en la nube que expire ni interruptor de privacidad contra el que pelear — así que un micrófono funcional significa realmente un dictado funcional. Necesitas un Mac con Apple Silicon o un PC con Windows 10 o superior, un micrófono funcional y un par de minutos. El modo local es gratuito para cualquier cuenta con sesión iniciada, sin método de pago en el registro.
Paso 1 — Instala Whisper e inicia sesión.
Descarga desde la página de descarga, instala y crea una cuenta gratuita. Sin tarjeta. El modo de transcripción local se abre de inmediato.
Sabrás que ha funcionado cuando aparezca el icono de la bandeja del sistema y la configuración ofrezca elegir un modelo.
Paso 2 — Elige un modo de transcripción y deja que se descargue un modelo.
La app no elige por ti. Tienes tres opciones: Cloud (OpenAI, trae tu propia clave), Local Parakeet o Local Whisper. Para una solución completamente offline, empieza con local — más información sobre cuál elegir en las dos secciones siguientes.
Sabrás que ha funcionado cuando un modelo termine de descargarse y aparezca como listo.
Paso 3 — Confirma tu atajo de teclado y micrófono.
Windows usa Ctrl+Space por defecto, Mac usa Command+Option mantenido como pulsar para hablar. Apúntalo al mismo micrófono que pasó tu prueba. En Mac, concede el permiso de Accesibilidad cuando se te pida, o el pegado en el cursor no podrá acceder a otras apps.
Sabrás que ha funcionado cuando una grabación de prueba se pegue en cualquier campo de texto.
Paso 4 — Coloca el cursor donde quieras y habla.
Haz clic en cualquier cuadro de texto, mantén el atajo pulsado, di una frase, suéltalo. La transcripción aparece donde está el cursor, sin que ningún servicio de voz en línea intervenga.
Sabrás que ha funcionado cuando tu frase hablada aparezca como texto en el campo.
La parte lenta es la descarga inicial del modelo, no la configuración. Una vez que hay un modelo local instalado, el motor de voz vive en tu máquina — no hay ningún interruptor en los ajustes de Privacidad que pueda apagarlo silenciosamente, ni ningún corte de internet que lo silencie. Esa es la razón estructural por la que este tipo de error no vuelve a ocurrir.
Si prefieres reparar el integrado
Conservar el dictado del sistema operativo es una elección perfectamente válida, y vale la pena conocer las correcciones más profundas. En Windows, el culpable habitual es que el reconocimiento de voz en línea se desactiva tras una actualización o un ajuste de privacidad: Configuración > Privacidad y seguridad > Voz, vuelve a activarlo. Si está activado y sigue fallando, el orden de Microsoft es revisar el dispositivo de entrada en Configuración > Sistema > Sonido > Entrada, confirmar el acceso al micrófono en Configuración > Privacidad y seguridad > Micrófono, y verificar el idioma con la tecla del logotipo de Windows + Barra espaciadora. Como Win+H pasa por la nube, también confirma que estás en línea — una configuración por lo demás correcta no produce ningún texto en el momento en que cae la conexión.
En Mac, empieza en Configuración del Sistema > Teclado > Dictado y confirma que está activado. Los dos fallos silenciosos son el idioma y la descarga. Si el idioma del dictado no coincide con el idioma que estás hablando, no obtendrás nada o palabras sin sentido — edita la lista de idiomas en ese mismo panel. Y en Apple Silicon, muchos idiomas se procesan localmente solo después de que el modelo de voz termina de descargarse, así que dale tiempo y conexión la primera vez. Luego comprueba la entrada en Configuración del Sistema > Sonido > Entrada y asegúrate de que la app en la que estás dictando tiene permiso de micrófono. La propia lista de Apple añade los aburridos-pero-reales: un micrófono obstruido, la fuente de entrada incorrecta, demasiado ruido de fondo.
Dos trampas multiplataforma afectan a las personas independientemente del sistema operativo. Primera, el foco: el dictado escribe en el campo que tiene el cursor, así que si una notificación te robó el foco o estás en un control que no acepta texto, las palabras no tienen adónde ir. Haz clic directamente en el cuadro de texto y vuelve a intentarlo. Segunda, el micrófono equivocado: si el servicio de voz está vinculado al micrófono integrado del portátil pero estás hablando por unos auriculares USB (o al revés), el medidor que probaste puede moverse mientras el reconocedor escucha silencio. Configura el dispositivo en el que estás hablando como la entrada seleccionada, no solo como predeterminado que casualmente pasa una prueba.
Local o nube: qué modo elegir
Si te pasas a una herramienta dedicada, la elección es qué motor gestiona tu dictado. La app te hace elegir en lugar de adivinar por ti, y la elección correcta depende del idioma y de cuánto te importa quedarte sin conexión. Para los que vienen del problema de «el micrófono funciona, el dictado no», el modo local es la respuesta satisfactoria, porque todo el fallo que acabas de experimentar proviene de un servicio de voz en línea — y el modo local elimina ese servicio por completo.
Así difieren los tres modos:
- Local Parakeet — El motor TDT de NVIDIA, unos 600 MB, y la opción local más rápida — de 5 a 10 veces más rápido que Whisper en CPU. Cubre inglés más 24 idiomas europeos, 25 en total. Sin traducción al inglés. Si dictas en inglés o en otro idioma europeo, esta es la opción rápida y completamente offline.
- Local Whisper — más lento que Parakeet en la misma máquina, pero los modelos multilingües cubren 99 idiomas y pueden traducir al inglés. Los modelos solo en inglés son solo inglés, no 99. Elige este para chino, japonés, coreano o cualquier trabajo de traducción que Parakeet no pueda hacer. El modelo en inglés por defecto ocupa unos 480 MB.
- Cloud (OpenAI, BYOK) — la mejor precisión y acceso a la web, usando tu propia clave de OpenAI facturada directamente por OpenAI. La transcripción usa gpt-4o-mini-transcribe por defecto. Necesita internet, por lo que es el único modo que sale de tu máquina — la misma dependencia que originó todo este problema. La funcionalidad Cloud forma parte de Whisper Pro.
La verdad sencilla es que para el dictado cotidiano, el modo local es más que suficiente, y es el modo que evita estructuralmente lo que acabas de depurar. Ambos motores locales se ejecutan completamente en tu máquina sin enviar nada a un servidor. La nube gana su lugar cuando quieres la máxima precisión en una grabación difícil o necesitas que el modelo consulte un dato de la web a mitad de una frase. Si lo que te trajo aquí fue «la cosa en línea dejó de funcionar», el modo local es la respuesta que no tiene ninguna cosa en línea que pueda dejar de funcionar.
Texto más limpio una vez que el dictado funciona
Una vez que las palabras aterrizan, la siguiente molestia es que el dictado en bruto sale como un texto sin puntuación. Dices «bueno responde al correo del colegio confirma el jueves y recuérdame mandar el formulario» y eso es la pared sin puntuar que te entrega cualquier motor de voz. Limpiarla es donde las herramientas difieren.
El Dictado por Voz de Windows añade puntuación mientras hablas, y el Dictado de macOS maneja puntuación básica cuando dices «coma» o «punto». Para una limpieza más profunda — eliminar los «eeh», arreglar los textos continuos, convertir un párrafo hablado en algo que realmente enviarías — Whisper puede ejecutar un pase de IA. Di la frase de activación «Hey whisper» y el texto queda mejorado antes de aterrizar. Con un modelo local que pasa por Ollama; en modo nube es gpt-5-mini por defecto.
okay so reply to the school email confirm thursday and remind me to send the form um before friday
Okay, so reply to the school email, confirm Thursday, and remind me to send the form before Friday.
El pase de limpieza es también el momento de corregir los pequeños errores que comete cualquier reconocedor — un nombre que deletreó fonéticamente, un número que interpretó como palabra. Un modelo local lo gestiona en tu máquina; la nube lo hace con más margen en audio difícil. De cualquier forma, el punto es el mismo: captura las palabras con la voz, deja que el pase las ordene y deja de reescribir lo que ya dijiste.
Ese flujo de hablar-y-limpiar resulta valioso en todas partes, no solo en una app — puedes escribir más rápido en todos los programas con tu voz una vez que el camino micrófono-a-texto es sólido, así que un mensaje largo se convierte en unas pocas frases habladas en lugar de un párrafo que tecleas letra a letra.
Cuándo el integrado es suficiente

A veces esto fue algo puntual, y pretender que necesitas una nueva app sería deshonesto. Si cambiar el interruptor de voz en línea, o ajustar el idioma del dictado a lo que estás hablando, lo solucionó — y la herramienta integrada ahora hace lo que necesitas — ya terminaste. No instales nada. El dictado gratuito que ya tienes en tu máquina está bien para usos cortos.
En Windows, si el dictado por voz vuelve a funcionar después de activar de nuevo el reconocimiento de voz en línea, y normalmente estás conectado de todas formas, la tecla del logotipo de Windows + H está ahí y es gratis. En Mac, si el Dictado volvió una vez que el idioma y el permiso estuvieron correctos, Configuración del Sistema > Teclado > Dictado es todo lo que necesitas, y en Apple Silicon puede funcionar localmente una vez que el idioma se ha descargado. Para una respuesta rápida o una nota de dos líneas, esa es la herramienta correcta, y no cuesta nada.
Recurre a una herramienta dedicada y offline cuando la integrada sigue recayendo: el interruptor que no se mantiene activado, el dictado que falla cada vez que la conexión se tambalea, el trabajo en textos largos donde el límite en línea o el viaje de ida y vuelta a la nube entorpecen, o querer un atajo de teclado que funcione igual en todas partes. Por debajo de ese umbral, usa lo que es gratuito. No voy a decirte que instales una app para arreglar un ajuste que puedes cambiar en diez segundos.
Si el fallo era específico de Windows y quieres el recorrido completo por versión, la guía más detallada sobre el dictado por voz que no funciona en Windows cubre los fallos relacionados con actualizaciones y los reemplazos modernos con más detalle.
El micrófono era inocente todo el tiempo. Casi siempre lo es. El dictado son dos sistemas con un mismo abrigo — un micrófono que capta el sonido y un reconocedor que lo convierte en texto — y el medidor de nivel solo avala el primero. Cambia el interruptor correcto, ajusta el idioma, haz clic en el campo adecuado, y las palabras aparecen. Escribí la mayor parte de esto con una herramienta que omite por completo el proceso de verificación del reconocedor, que es una forma de asegurarse de que el abrigo nunca se abre a mitad de frase.
Consigue un dictado que simplemente escucha
Apúntalo al micrófono que ya pasó tu prueba, mantén el atajo pulsado y habla. El texto aterriza en tu cursor — sin ningún servicio de voz en línea que pueda configurarse mal.
Modo local gratuito para cualquier cuenta con sesión iniciada. No se requiere tarjeta para empezar.



