Solución de problemas
«Speech recognition could not start»: 6 soluciones para Windows
El error proviene de la antigua función Windows Speech Recognition, normalmente por un micrófono que Windows no puede usar, un idioma de reconocimiento incompatible o un servicio de audio detenido. La solución depende de si aparece una sola vez o en cada arranque.
Última actualización: junio de 2026

«Speech recognition could not start» es un error de la función heredada Windows Speech Recognition, causado normalmente por un micrófono que Windows no puede acceder, un idioma de reconocimiento que no coincide con el idioma de visualización de Windows, o un servicio de audio detenido. La solución depende de si el error aparece una sola vez al abrir el programa o en cada arranque.
Aún recuerdo a un familiar peleándose con Dragon NaturallySpeaking en un escritorio con Windows 98 y 64 MB de RAM. El entrenamiento tardaba 45 minutos —había que leer una lista de palabras para «calibrar»— y después el dictado funcionaba con un 70% de precisión, cuatro segundos por detrás de cada frase. Los auriculares terminaron volando por la habitación. Los auriculares sobrevivieron. El experimento de dictado, no.
Veinticinco años después, Windows sigue incluyendo una función de voz que puede fallar desde el primer intento con un único mensaje escueto y ninguna explicación. Algo que conviene saber antes de dedicarle una hora: el diálogo viene de Windows Speech Recognition (WSR), la vieja función del Panel de control y Accesibilidad, no del dictado por voz con Win+H ni de Voice Access. En Windows 11 versión 22H2 y posteriores, Microsoft reemplazó WSR con Voice Access en septiembre de 2024; WSR sigue presente en versiones anteriores de Windows. Así que parte de la solución es decidir si realmente necesitas lo que está fallando. La mayoría de las correcciones tardan menos de cinco minutos.
Qué significa realmente el error «could not start»

Hay dos versiones de este error, con soluciones distintas. Distinguirlas es lo que más tiempo ahorra.
Versión uno: aparece una vez, cuando abres Speech Recognition. Lo abriste a propósito y el cuadro de diálogo te bloqueó en la puerta. Casi siempre es el micrófono, el idioma de reconocimiento o un servicio de audio detenido. Las soluciones están abajo, en orden.
Versión dos: te molesta en cada arranque. No lo pediste. Windows intenta iniciar WSR automáticamente al entrar, falla y muestra el diálogo antes de que hayas abierto siquiera el navegador. Esta gente no quiere que Speech Recognition funcione; quiere que deje de preguntar. La solución es diferente: desactiva «Run Speech Recognition at startup». Sáltate a esa sección.
Detrás de ese mensaje tan escueto hay una lista corta de sospechosos habituales, más o menos en el orden en que vale la pena revisarlos: un micrófono silenciado o que no es el predeterminado, un permiso de aplicación que falta, un idioma de reconocimiento incompatible, un servicio de audio detenido, archivos de sistema dañados.
Comprueba el micrófono que Windows está usando realmente

El micrófono es la causa más frecuente, así que empieza aquí. Speech Recognition no puede iniciar una sesión si no tiene nada que escuchar.
Primero, el permiso. Ve a Inicio > Configuración > Privacidad y seguridad > Micrófono y asegúrate de que tanto «Acceso al micrófono» como «Permitir que las aplicaciones accedan al micrófono» estén activados. Una actualización de Windows puede desactivarlos sin avisarte (a mí me pasó dos veces con la misma actualización acumulativa).
Luego el dispositivo. Ve a Inicio > Configuración > Sistema > Sonido > Entrada, selecciona el micrófono que usas y pulsa «Iniciar prueba»; habla y observa si la barra se mueve. Si la barra no se mueve, Windows no te está escuchando, y nada dentro de Speech Recognition va a ayudar hasta que eso cambie.
La ruta clásica también funciona: abre el panel de Sonido, pestaña Grabación, haz clic derecho en tu micrófono y selecciona «Establecer como dispositivo predeterminado». Si desconectaste unos auriculares y el micrófono integrado no es el predeterminado, esos dos clics lo resuelven. Si el micrófono no aparece en absoluto, consulta por qué Windows no detecta tu micrófono para dictar.
Haz coincidir el idioma de voz con el idioma de Windows

Esta es la causa más silenciosa y la corrección más rápida. WSR solo funciona cuando el idioma de reconocimiento coincide con el idioma de visualización de Windows. Cambia uno sin cambiar el otro y el programa se niega a arrancar.
Pasa más de lo que imaginas. Cambias el idioma de visualización para probar algo, o un cambio de región arrastra un nuevo diseño de teclado, y el motor de voz queda configurado en un idioma que el sistema ya no usa. El motor y el sistema operativo no se ponen de acuerdo sobre qué hablas, así que el motor decide no abrirse.
Abre Panel de control > Speech Recognition (en versiones antiguas, Accesibilidad > Speech Recognition) y confirma que el idioma de reconocimiento coincide con el idioma en que está configurado Windows. La guía de configuración de reconocimiento de voz de Microsoft enumera los idiomas compatibles; en pocas palabras: haz que los dos coincidan. Ya que estás, ve a Configuración > Privacidad y seguridad > Voz y activa el reconocimiento de voz en línea si lo necesitas.
Reinicia los servicios de audio y voz

WSR depende de varios servicios de audio de Windows. Si alguno se ha detenido, el motor de voz no puede obtener una ruta de audio limpia y falla al arrancar. Reiniciarlos no tiene ningún efecto negativo y tarda unos 30 segundos.
Pulsa Win+R, escribe services.msc y presiona Entrar. Reinicia estos tres: Windows Audio, Windows Audio Endpoint Builder y Human Interface Device Service; haz clic derecho en cada uno y elige Reiniciar (o Iniciar, si está detenido). Si usas un micrófono Bluetooth, reinicia también Bluetooth Support Service y Bluetooth Audio Gateway Service; el audio Bluetooth tiene su propio hábito de quedarse en silencio.
Para ser claros, este es un paso probado por la comunidad, no uno que Microsoft documenta específicamente para este error. Pero reiniciar Windows Audio no causa ningún daño y está ampliamente recomendado, y resuelve un número sorprendente de problemas de «simplemente no arranca», así que tiene su lugar antes de recurrir a herramientas más pesadas. Si la barra de prueba de sonido se movía pero Speech Recognition sigue sin abrirse, un servicio bloqueado es el principal sospechoso.
Cuando te molesta en cada arranque: desactívalo
Si el error te recibe en cada inicio de sesión, el objetivo cambia. No necesitas que Speech Recognition arranque. Necesitas que deje de intentarlo.
WSR tiene una opción llamada «Run Speech Recognition at startup». Cuando está activada, Windows intenta lanzar la función heredada en cada arranque; y si algo por debajo está roto, ese intento falla y muestra el diálogo antes de que hayas hecho nada. Desactívala y el aviso deja de aparecer. (Mi suegro convivió con ese diálogo durante un año porque daba por sentado que era imprescindible. No lo era.)
Abre Panel de control > Speech Recognition (o Accesibilidad > Speech Recognition en versiones antiguas), busca la opción de inicio automático y desmárcala. El texto varía según la versión, así que si no está en la pantalla principal, revisa las opciones de voz avanzadas. Algunos usuarios señalan que el verdadero culpable es que ctfmon.exe, el componente de servicios de texto, ya no se inicia automáticamente; restaurarlo al inicio ha resuelto el aviso para ellos. Es un remedio de la comunidad, no una solución oficial de Microsoft, así que trátalo como un «inténtalo si desactivar el inicio automático no lo solucionó».
Hay una pregunta honesta enterrada aquí: si una función heredada solo aparece para decirte que ha fallado, ¿quieres que siga ejecutándose? En 22H2 y versiones posteriores ni siquiera es la función de voz actual. Hay más sobre eso a continuación.
Repara el problema de fondo: SFC, DISM y el perfil

Si el micrófono pasa las pruebas, los idiomas coinciden y los servicios están en marcha, la causa probablemente está más abajo: archivos de sistema dañados o un perfil de voz corrupto. Aquí es donde entran las herramientas oficiales de reparación de Microsoft.
Abre un Símbolo del sistema elevado (clic derecho, «Ejecutar como administrador»). Ejecuta DISM primero y SFC después; el orden importa porque DISM suministra los archivos limpios que SFC usa para reparar. Escribe DISM.exe /Online /Cleanup-image /Restorehealth, espera a «The operation completed successfully» y luego ejecuta sfc /scannow. SFC analiza los archivos de sistema protegidos y reemplaza los dañados desde una copia en caché. Microsoft documenta la secuencia en su guía del Comprobador de archivos del sistema. Reinicia al terminar. (La primera vez ejecuté SFC solo tres veces antes de leer que DISM va primero. La documentación tenía razón. Yo, no suelo tenerla.)
¿Sigues atascado? Volver a ejecutar la configuración de Speech Recognition es un reinicio de bajo riesgo que reconstruye un perfil de reconocimiento que se haya estropeado tras una actualización. Algunos artículos sugieren crear un perfil nuevo y eliminar el antiguo; es un consejo de la comunidad sin una página oficial de Microsoft detrás, así que guárdalo como último recurso. Si el dictado está roto de forma más general que este único cuadro de diálogo —Win+H no hace nada, el texto no aparece—, la guía general de solución de problemas de Windows Speech Recognition cubre más casos.
Cuándo dejar de pelear con Windows Speech Recognition
Esto es lo que la mayoría de los artículos de solución no dicen. Puedes pasar una tarde intentando resucitar una función de la que Microsoft ya ha pasado página. En Windows 11 22H2 y versiones posteriores, Voice Access reemplazó Windows Speech Recognition en septiembre de 2024; WSR solo persiste en versiones antiguas. En un Windows 11 actual no reparas WSR en absoluto: usas Voice Access, o pulsas Win+H para dictar en cualquier campo de texto, una función diferente y compatible. La guía de dictado por voz con Win+H explica ese camino. Una advertencia antes de cambiar: Voice Access se lanzó en inglés y ha ido añadiendo idiomas desde entonces, así que primero comprueba que el tuyo esté incluido.
Y aquí va mi opinión personal: si tu herramienta de dictado necesita que la «entrenes» antes de funcionar, es 1999. Ese entrenamiento de 45 minutos de Dragon tenía sentido cuando la capacidad de cómputo era escasa. En 2026 es un fracaso de diseño. Una función de voz que lanza un críptico «could not start» en lugar de simplemente escuchar es el mismo fracaso en un diálogo más nuevo. Para mucha gente, esa es la razón definitiva para dejar de luchar con este error: la función no vale la tarde.
Si prefieres simplemente hablarle a tu ordenador, hay caminos que no pasan por el servicio WSR en absoluto. Whisper by Remskill no lo toca. Ejecuta su propio motor, sin conexión, en tu equipo, así que toda la clase de errores «could not start» no aplica. No hay ninguna sesión de WSR que arrancar ni que falle.
En Windows el atajo predeterminado es Ctrl+Space: mantenlo pulsado, habla, suéltalo y el texto aparece en el cursor, en cualquier aplicación en la que estés. Un único atajo dedicado, no una función del sistema operativo que tiene que arrancar y puede que no lo haga. Transcribe más de 90 idiomas localmente, lo que evita el bloqueo por idioma de visualización que le causa problemas a WSR. El modo local es gratuito una vez que inicias sesión, sin tarjeta requerida. Nada de eso arregla Windows Speech Recognition, pero si llegaste aquí porque Windows te dijo que no, es un camino sin línea de salida de la que tropezar.
Los auriculares de aquel familiar sobrevivieron a un vuelo por la habitación hace un cuarto de siglo, lo que ya es más de lo que duró el experimento de dictado. La buena noticia es que ya no tienes que tirar nada. Si la función heredada no arranca y Microsoft ya la ha retirado, puedes dejarla ir.
¿Prefieres simplemente hablarle a tu ordenador?
Descarga Whisper, mantén pulsado Ctrl+Space y observa cómo la transcripción aparece en tu cursor: sin sesión de WSR, sin línea de salida de la que tropezar.



