Guía
Voz a texto para estudiantes de inglés
Si el inglés no es tu idioma materno, puedes escribirlo hablando. Pulsa un atajo, habla y el texto limpio aparece donde está el cursor en cualquier aplicación. Un paso de IA corrige la gramática y las muletillas. Es una herramienta de escritura, no un profesor de pronunciación.
Última actualización: junio de 2026

Voz a texto para estudiantes de inglés permite que los hablantes no nativos escriban en inglés hablando en lugar de teclear. Una herramienta como Whisper transcribe el inglés hablado donde está el cursor en cualquier app, y un paso de IA corrige la gramática y las muletillas. El reconocimiento de acento es bueno, pero no perfecto, y es una herramienta de escritura, no un profesor de pronunciación.
El inglés es mi tercer idioma. Lo aprendí después del ucraniano y el ruso, principalmente a través de documentación e informes de errores, que es exactamente tan romántico como suena. Durante años, lo lento de escribir en inglés no era pensar. Era teclear: buscar la palabra correcta mientras mis dedos se quedaban atrás, dudar sobre una ortografía, perder la frase que tenía en mente en algún punto entre el teclado y la pantalla.
Hablar es más rápido que escribir en cualquier idioma, incluso en uno que todavía estás aprendiendo. Voz a texto cierra esa brecha: dices la frase en inglés que ya puedes pronunciar en voz alta, y la herramienta la escribe por ti. Lo que nadie menciona es que reconoce tu acento, no tu nivel académico. Ahora maneja los acentos bien, de verdad. No es un profesor, y seré honesto sobre ambas cosas.
Aquí va la versión sin rodeos. El reconocimiento de voz moderno funciona con la familia de modelos Whisper, entrenados con una enorme variedad de audio real en muchos acentos. Eso significa que un hablante no nativo de inglés puede dictar y obtener texto en inglés utilizable la mayor parte del tiempo: no perfecto, pero un primer borrador sólido que luego puedes corregir.
Así que la pregunta para quien aprende inglés no es «¿me entenderá?». Por lo general, sí. Las preguntas de verdad son qué modelo maneja mejor los acentos e idiomas, si conviene usarlo en local o en la nube, y cómo aprovechar el paso de limpieza de IA para que un borrador hablado se convierta en inglés escrito limpio. Te lo explico todo, configuro uno en dos minutos y te digo cuándo una herramienta de dictado no es lo que necesitas.
Por qué escribir en inglés con la voz ayuda cuando no es tu idioma materno

Lo difícil de escribir en un segundo idioma raramente son las ideas. Es la fricción entre la idea y la página. Sabes lo que quieres decir. Puedes decirlo en voz alta. Pero teclearlo significa lidiar con la ortografía, el orden de las palabras y el teclado mientras la frase que tenías en mente se evapora silenciosamente. Hablar te ahorra casi toda esa lucha.
El dictado ronda las 145 palabras por minuto, frente a unas 40 para escribir. Para un hablante nativo eso es una mejora agradable. Para alguien que redacta en su segundo o tercer idioma, la ganancia es mayor, porque teclear en un idioma no nativo es más lento y propenso a errores desde el principio. El esfuerzo ahorrado lo destinas a lo que importa: decirlo bien, no a la mecánica.
Y hay un beneficio más discreto. Cuando dices una frase y la ves escrita, descubres enseguida si realmente tiene sentido. Una expresión torpe se ve torpe en la pantalla de una manera que no siempre suena así en tu cabeza. Ese ciclo de retroalimentación es útil para quien aprende, igual que le sirve a un estudiante que convierte una clase en apuntes. No corregirá tu gramática por sí sola, eso lo hace el paso de IA, dos secciones más adelante, pero ver tus propias palabras en la página es su pequeña lección.
Pulsa un atajo, habla en inglés, el texto aparece donde está el cursor
El mecanismo es sencillo, y eso es todo su atractivo. Pulsas un atajo de teclado, hablas, sueltas y la transcripción aparece donde está el cursor en el campo de texto que tenga el foco. Whisper mantiene un breve margen después de que sueltes la tecla para que no se corte la última palabra, muy útil cuando todavía estás encontrando el final de una frase en inglés. Como pega en el cursor del sistema operativo, funciona igual en tu correo electrónico, un Google Doc, un chat o una tarea.
No hay nada que configurar por aplicación. Sin extensión de navegador, sin complemento, sin token que pegar. El cursor está en el campo, hablas y las palabras aparecen. Una pequeña cápsula se muestra mientras hablas para que sepas que está escuchando:
Vale la pena configurar el atajo una vez y olvidarse. En Windows es Ctrl+Space; en Mac es Command+Option, un modificador que mantienes pulsado mientras hablas. Ambos se pueden cambiar en Ajustes si coinciden con algo que ya usas. Si alguna vez has configurado escritura por voz en Google Docs, la idea es la misma, salvo que no está limitada a una sola app: la misma tecla rellena cualquier campo de texto en tu pantalla.
Configúralo en dos minutos (Windows o Mac)
Necesitas un Mac con Apple Silicon o un PC con Windows 10 o posterior, un micrófono que funcione y cualquier aplicación en la que quieras escribir. Todo el proceso local es gratuito para cualquier cuenta con sesión iniciada, sin pedir ningún método de pago al registrarse. Este es el proceso.
Paso 1 — Instala Whisper e inicia sesión.
Descarga desde la página de descarga, instala y crea una cuenta gratuita. Sin tarjeta. Todo el proceso de transcripción local queda disponible de inmediato.
Sabrás que funcionó cuando aparezca el icono en la bandeja del sistema y el asistente de configuración ofrezca elegir un modelo.
Paso 2 — Elige una ruta de transcripción.
La aplicación no elige por ti. Tienes tres opciones: Cloud (OpenAI, con tu propia clave), Local Parakeet o Local Whisper. Para tolerancia de acento y traducción, los modelos multilingües de Whisper son los más relevantes; más sobre esto a continuación.
Sabrás que funcionó cuando un modelo termine de descargarse y aparezca como listo.
Paso 3 — Confirma tu atajo.
Windows usa Ctrl+Space por defecto; Mac usa Command+Option mantenido como push-to-talk. En Mac, concede el permiso de Accesibilidad cuando se solicite; sin él, el pegado en el cursor no puede alcanzar otras aplicaciones.
Sabrás que funcionó cuando una grabación de prueba se pegue en cualquier campo de texto.
Paso 4 — Coloca el cursor en un campo de texto y habla.
Abre tu correo, un documento o un chat, haz clic en el campo, mantén el atajo, di una frase en inglés y suelta. La transcripción aparece donde está el cursor.
Sabrás que funcionó cuando tu frase en inglés aparezca en el campo como texto.
Lo lento es la descarga del modelo, no la configuración. Todo lo demás son los cuatro pasos anteriores. Una vez en marcha, escribir un correo en inglés deja de ser una tarea de tecleo y se convierte en una tarea de conversación, que es precisamente la parte que quieres practicar cuando el inglés es lo que todavía estás aprendiendo.
Qué tan bien maneja los acentos y el truco de los 99 idiomas
Déjame ser directo sobre los acentos, porque aquí es donde importa la respuesta honesta. Los modelos de Whisper se entrenaron con una amplia variedad de habla real, incluyendo mucho inglés no nativo. En la práctica, eso significa que un acento fuerte pero no nativo se transcribe con precisión la mayoría de las veces. La mayoría. Acentos más marcados, habla rápida, ruido de fondo o un nombre y un término técnico en la misma frase todavía pueden confundirlo a veces. Es bueno. No es magia, y quien te diga que capta todos los acentos a la perfección te está vendiendo una demo, no el martes a las ocho.
Dos ajustes prácticos mueven el marcador más que la elección del modelo. Primero, el micrófono: un micrófono USB de veinte dólares mejora la precisión más que cualquier actualización de modelo, punto. Hablar con claridad y un poco más despacio también ayuda, lo que no es ningún sacrificio cuando ya estás practicando inglés de todas formas. Segundo, la familia de modelos. Las versiones multilingües de Whisper cubren 99 idiomas y tienden a manejar mejor el inglés con acento que las versiones solo en inglés, porque han escuchado mucho más del mundo. Local Parakeet cubre el inglés más otros 24 idiomas europeos, 25 en total, y es la opción local más rápida, pero no puede traducir. Los modelos .en solo en inglés son exactamente eso: solo inglés, sin traducción.
Ese último punto abre un truco realmente útil para quien aprende. Los modelos multilingües de Whisper pueden traducir al inglés mientras transcriben. Así que cuando una frase en inglés no sale, la palabra está en la punta de la lengua en tu idioma materno pero se escapa en inglés, puedes decirla en tu idioma nativo y obtener un borrador en inglés. No es una traducción pulida, y yo no la enviaría sin retocarla, pero como forma de hacer el borrador en tu idioma más fuerte y luego refinarlo en inglés, elimina un obstáculo real. Dilo en el idioma en que piensas; corrígelo en el idioma que estás aprendiendo.
Local o nube: qué modo se adapta mejor a quien aprende idiomas
Para la mayor parte de la escritura en inglés como segunda lengua, correos, tareas, mensajes, un primer borrador de un ensayo, el modo local es más que suficiente, y es gratuito y sin conexión. La nube gana su lugar cuando quieres la máxima precisión en una grabación difícil o necesitas consultar algo a mitad de una frase. Así es como difieren las tres opciones, porque la aplicación te obliga a elegir y prefiero que elijas bien.
La diferencia se reduce a velocidad, cobertura de idiomas y adónde va tu voz.
- Local Parakeet — El motor TDT de NVIDIA, unos 600 MB y la opción local más rápida: entre 5 y 10 veces más rápido que Whisper en CPU. Cubre el inglés más otros 24 idiomas europeos, 25 en total. Sin traducción al inglés. Si tu idioma materno es europeo y escribes en inglés, esta es la opción rápida y completamente sin conexión.
- Local Whisper — más lento que Parakeet en la misma máquina, pero las versiones multilingües cubren 99 idiomas, manejan mejor los acentos y pueden traducir al inglés. Elígelo para chino, japonés, coreano, árabe o cualquier idioma que Parakeet no admita, y para el truco de hacer el borrador en tu idioma. El modelo de inglés por defecto pesa unos 480 MB.
- Cloud (OpenAI, BYOK) — la mejor precisión y acceso web, usando tu propia clave de OpenAI facturada directamente por OpenAI. La transcripción usa gpt-4o-mini-transcribe por defecto. Requiere internet, por lo que es la única opción que sale de tu máquina. El acceso Cloud forma parte de Whisper Pro.
La verdad sin adornos es que para escribir en inglés a diario, el modelo local multilingüe de Whisper cubre bien a la mayoría de quienes aprenden: 99 idiomas, tolerancia aceptable al acento, traducción al inglés cuando la necesitas y nada enviado a un servidor. Ambos motores locales funcionan completamente en tu máquina, lo que importa si dictas algo que prefieres mantener privado: un ensayo personal, una solicitud de empleo, un mensaje del que no estás seguro. Empieza en local. Recurre a la nube solo cuando el modo local no te dé la precisión que necesitas.
Convertir un borrador hablado en inglés escrito limpio
El dictado en bruto sale como un torrente continuo, en cualquier idioma. Dices una frase tal como la dirías en voz alta, con una muletilla, una autocorrección, una coma que no pronunciaste, y eso es el muro sin puntuación que devuelve cualquier motor de voz. Para quien aprende, aquí es donde voz a texto demuestra su valor, porque el paso de limpieza hace la parte más difícil en un segundo idioma.
Whisper puede aplicar un paso de IA sobre el texto bruto antes de que aparezca. Di la frase de activación «Hey whisper» y el borrador hablado se mejora: se eliminan las muletillas, se añade puntuación, el texto continuo se divide en frases y los deslices obvios se suavizan. En un modelo local, esto pasa a través de Ollama; en modo cloud es gpt-5-mini por defecto. Ordena la gramática y la estructura en lugar de reescribir tu significado, así que el resultado sigue sonando como tú, solo más limpio.
so um i want to ask about the the deadline for the assignment because i am not sure is it friday or next monday and also can i send it by email
I want to ask about the deadline for the assignment, because I'm not sure if it's Friday or next Monday. Also, can I send it by email?
Un límite honesto. El paso de IA corrige la gramática y la forma; no te explica por qué cambió algo. Si tu objetivo es aprender la regla, lee el antes y el después uno al lado del otro: la diferencia es la lección. Si tu objetivo es simplemente enviar un mensaje limpio antes de una fecha límite, deja que lo limpie y sigue adelante. Los dos son usos válidos; son objetivos distintos, y solo tú sabes cuál persigues hoy.
Ese mismo flujo de hablar y limpiar funciona para todo lo que escribes, no solo en una app: puedes escribir más rápido con tu voz en correos, documentos y chats, así un párrafo largo se convierte en unas pocas frases habladas en lugar de un texto que escribes palabra por palabra con cuidado.
Cuándo voz a texto es la herramienta equivocada para quien aprende inglés

Prefiero perder tu clic antes que hacerte perder el tiempo, así que aquí está cuándo una herramienta de dictado no es la respuesta. Si tu objetivo es mejorar la pronunciación, esto no es lo tuyo. Voz a texto convierte tu habla en texto; no puntúa tu acento, no corrige cómo pronuncias una palabra ni te dice que «treinta» sonó como «tienta». Para eso necesitas una aplicación de idiomas enfocada en pronunciación, un tutor o un compañero de conversación. Una herramienta de transcripción es una ayuda para escribir, no un entrenador de expresión oral, y fingir lo contrario sería deshonesto.
Algunos desvíos honestos más. Si solo necesitas dictar un mensaje corto, las herramientas gratuitas que ya tienes en tu máquina te bastan: en Windows, pulsa la tecla Windows + H para la barra de escritura por voz integrada; en Mac, activa el Dictado en Ajustes del Sistema bajo Teclado, y en Apple Silicon el texto general puede procesarse en el dispositivo. La opción de Windows necesita conexión a internet y pasa por los servidores de Microsoft, así que no funciona sin conexión. Y si quieres una herramienta que realmente te enseñe reglas gramaticales con explicaciones y ejercicios, eso es un corrector gramatical o una aplicación de aprendizaje; la limpieza de IA aquí corrige el texto, no da clases.
Recurre a una herramienta de dictado dedicada y para todo el sistema cuando escribir es el cuello de botella: correos largos, ensayos, solicitudes, cualquier cosa que puedas decir más rápido de lo que puedes escribirla en inglés, y quieres un atajo que funcione igual en todas las aplicaciones de Windows y Mac. Por debajo de esa barra, usa lo que es gratuito o la herramienta adecuada para cada tarea. La respuesta correcta a veces apunta lejos de nosotros, y siempre lo diré.
Si estás eligiendo dónde dictar, las guías de plataforma cubren la configuración en detalle: voz a texto en Windows repasa el mismo proceso paso a paso en un PC.
El inglés es mi tercer idioma, y escribí la mayor parte de esta guía hablándola en un campo de texto y dejando que el paso de limpieza arreglara las costuras que nunca detectaría de oído. Esa es la propuesta honesta: no hará tu inglés perfecto, ni te enseñará las reglas, pero sacará la frase de tu cabeza y la pondrá en la página mucho más rápido de lo que pueden tus dedos. La corrección sigue siendo tuya. La parte rápida es la ayuda.
Escribe tu próximo correo en inglés hablando
Mantén el atajo, dilo en inglés, suelta. El texto limpio aparece donde está el cursor: en tu correo, tus documentos y todas las demás aplicaciones.
Modo local gratuito para cualquier cuenta con sesión iniciada. No se requiere tarjeta para empezar.



