Por Denys Medvediev

Guía

Voz a texto para la artritis

Si escribir te resulta incómodo, la voz a texto te permite descansar las manos hablando en lugar de teclear. Pulsa una tecla rápida, habla y las palabras se pegan donde está el cursor en cualquier aplicación. No es un dispositivo médico ni un consejo médico: es una herramienta de comodidad y productividad.

Última actualización: junio de 2026

Manos descansando junto a un teclado sobre un escritorio tranquilo y ordenado, que sugieren tomarse un descanso de escribir

La voz a texto para la artritis es una forma de escribir con la voz para que tus manos puedan descansar. Una herramienta para todo el sistema como Whisper convierte el habla en texto escrito en cualquier aplicación con una sola tecla rápida, sin conexión y con un nivel local gratuito. Es una ayuda de comodidad y productividad, no un dispositivo médico ni un consejo médico.

Una línea rápida y honesta antes que nada: yo creo software de dictado, no soy médico, y nada de lo que hay aquí trata, alivia ni diagnostica la artritis. Esto no es un consejo médico y Whisper no es un dispositivo médico. Si te duelen las manos o las articulaciones, la persona con quien hablar es un profesional sanitario, no una entrada de blog.

Dicho esto, lo que el dictado realmente hace es algo concreto y útil. Te deja crear texto sin pulsar teclas. Si escribir es la parte que resulta incómoda, escribir menos es la palanca que puedes accionar hoy mismo. La gente busca "voz a texto para la artritis" con la esperanza de encontrar un interruptor que les deje descansar las manos durante un correo largo o un documento. Lo hay: solo que vive fuera de cualquier aplicación concreta y se configura en unos dos minutos.

Aquí está la parte que la mayoría de las páginas sobre esta búsqueda se saltan. Un cuadro de texto es un cuadro de texto, ya sea Gmail, un documento de Word, una ventana de chat o una barra de búsqueda. A una herramienta de dictado que pega donde está el cursor no le importa en qué aplicación esté el cursor. Así que no necesitas que cada aplicación añada un botón de micrófono. Necesitas una sola herramienta que se sitúe por encima de todas ellas.

Así que la verdadera pregunta no es "qué aplicación admite la voz para la artritis". Es "qué herramienta de dictado ejecuto por encima de todo", y la respuesta depende de si quieres algo gratuito e integrado, la pulsación de tecla con el menor esfuerzo posible o una sola tecla rápida sin conexión que se comporte igual en todos los programas. Lo recorreré todo, configuraré una y te diré con claridad cuándo conviene prescindir de una herramienta dedicada, incluido el caso en que quieras manejar todo el ordenador con la voz, no solo el texto.

Por qué la gente recurre a la voz para escribir menos

Un teclado sobre un escritorio con las manos de una persona descansando cerca, sin teclear

Voy a repetir la advertencia porque importa: esto no es un consejo médico, y el software de dictado no cura nada. Lo que hace es reducir la cantidad de teclas que pulsas al día. Tú hablas, el ordenador escribe, y las pulsaciones que habrías hecho te las ahorras. Para una bandeja de entrada que normalmente responderías con cuarenta minutos de tecleo, eso son unos cientos de pulsaciones que simplemente no haces. Ese es el beneficio entero y aburrido, y es el honesto.

El trabajo que la gente quiere resolver de verdad es más grande que el correo. Es ese documento largo que sigues posponiendo porque tus manos no están para ello. Es la respuesta de chat, el formulario, la nota que apuntarías si apuntar no costara nada. Es captar una idea antes de que se escape, a la velocidad a la que piensas, en lugar de a la velocidad a la que puedes teclear. Cuando el teclado es la parte incómoda, dejarle el texto a tu voz es una forma de seguir trabajando sin que sea una carga.

Hay un efecto secundario de velocidad que merece una frase. Hablar ronda las 145 palabras por minuto para la mayoría de la gente; escribir se acerca más a 40. Así que, además de descansar las manos, sueles avanzar unas tres veces y media más rápido, lo cual es un agradable extra cuando la opción más lenta era también la que te molestaba. Nada de esto es una afirmación sobre la salud. Es simple aritmética de pulsaciones.

Pulsa una tecla rápida, habla, y el texto aterriza en cualquier aplicación

Este es todo el mecanismo, y es deliberadamente aburrido. Pulsas una tecla rápida, hablas, sueltas, y la transcripción se pega donde está el cursor, en cualquier campo de texto que tenga el foco. Whisper mantiene una pequeña cola después de que sueltes la tecla, para que tu última palabra no se corte. Como pega donde está el cursor del sistema, cada aplicación es simplemente "cualquier cuadro de texto": tu cliente de correo, un documento de Word, Slack, un formulario del navegador, tu aplicación de notas. La misma tecla, el mismo flujo, en todas partes.

Esa es la parte que las páginas de aterrizaje complican de más. No hay ningún complemento que encajar en cada programa, ningún token de API que pegar, ninguna ventana aparte de la que pescar tus palabras. Tu cursor está en el cuadro, hablas, las palabras aparecen en el cuadro. Una pequeña cápsula aparece mientras hablas para que sepas que está escuchando:

Cancel
El indicador de grabación: una pequeña cápsula que aparece mientras hablas, para que sepas que Whisper está escuchando.

La tecla rápida es lo único que conviene acertar desde el principio, y también es donde entra la comodidad. En Windows, la predeterminada es Ctrl+Space; en Mac es Command+Option, una pulsación-para-hablar de solo modificadores que mantienes mientras hablas. Si mantener pulsada una combinación ya te resulta incómodo, no tienes por qué: cámbiala a pulsar-para-alternar en Ajustes, Grabación, de modo que un toque inicie y un toque detenga, y nunca mantengas una tecla pulsada. (Toda tecla rápida es personalizable porque al principio lancé una fija y chocó con el software de música de alguien a las dos de la madrugada. Tengo un máster.) Si ya has configurado el dictado en Windows o en Mac antes, esta es la misma memoria muscular apuntando a todas partes a la vez.

Configúralo en dos minutos (Windows o Mac)

Necesitas un Mac con Apple Silicon o un PC con Windows 10 o posterior, un micrófono que funcione y abierta en segundo plano la aplicación en la que quieras escribir. Todo el flujo local es gratuito para cualquier cuenta con sesión iniciada, sin que se pida un método de pago al registrarse. Esta es la secuencia.

Paso 1: instala Whisper e inicia sesión.

Descárgalo desde la página de descarga, instálalo y crea una cuenta gratuita. Sin tarjeta. Todo el flujo de transcripción local se abre enseguida.

Sabrás que funcionó cuando aparezca el icono de la aplicación en la bandeja del sistema y el asistente de configuración te ofrezca elegir un modelo.

Paso 2: elige una ruta de transcripción.

La aplicación no elige por ti. Tienes tres opciones: Nube (OpenAI, con tu propia clave), Parakeet local o Whisper local. Para mantener las notas en tu propio equipo, empieza por la local; más sobre esto dos secciones más abajo.

Sabrás que funcionó cuando un modelo termine de descargarse y aparezca como listo.

Paso 3: configura una tecla rápida que sea suave para tus manos.

Windows usa por defecto Ctrl+Space y Mac, Command+Option mantenido como pulsación-para-hablar. Si mantener pulsada una combinación es incómodo, cambia a pulsar-para-alternar, de modo que un toque inicie y un toque detenga. En Mac, concede el permiso de Accesibilidad cuando se te pida; sin él, el pegado donde está el cursor no puede alcanzar otras aplicaciones.

Sabrás que funcionó cuando una grabación de prueba se pegue en cualquier campo de texto.

Paso 4: pon el cursor donde sea y habla.

Haz clic en cualquier cuadro de texto, empieza a grabar, di una frase y detente. La transcripción aparece donde está el cursor, como si la hubieras tecleado.

Sabrás que funcionó cuando tu frase hablada esté en el cuadro de texto convertida en texto.

Whisper
La aplicación de escritorio real de Whisper en la pantalla de ajustes: elige un motor de transcripción y configura el comportamiento de la tecla rápida que sea más suave para tus manos.

La parte lenta es la descarga del modelo, no la configuración. Todo lo demás son los cuatro pasos de arriba. Una vez en marcha, el acto de poner una idea en la pantalla deja de ser una tarea de tecleo y se convierte en una tarea de hablar, que es justo el objetivo cuando teclear es la parte incómoda.

voz a texto en Windows · en Mac

Una sola tecla rápida en todas las aplicaciones que ya usas

La razón por la que una herramienta para todo el sistema gana a una función por aplicación es que no te obliga a reaprender nada cuando cambias de programa. La misma tecla que rellena el cuadro de redacción de tu correo rellena un documento de Word, un mensaje de Slack, un formulario del navegador, una celda de hoja de cálculo y un mensaje de commit. En lo que respecta a tu ordenador, estás escribiendo, así que funciona allá donde funciona escribir. Una herramienta, cada campo de texto, tanto en Windows como en Mac.

Eso importa más de lo que parece cuando el objetivo es descansar las manos. Si cada aplicación tuviera su propio botón de dictado, te pasarías el día buscando un control distinto, y la mitad ni existirían. Con una sola tecla rápida, la fricción de empezar baja casi a cero: tocas, hablas, listo. Cuantos menos pasos haya entre "quiero escribir esto" y "ya está escrito", menos recurrirás al teclado por costumbre cuando tus manos prefieran que no lo hagas.

El alcance honesto, para que no haya sorpresas: esto pone palabras donde está tu cursor. No mueve el cursor, no hace clic en menús ni navega por ventanas por ti. Para la mayoría de la gente, el grueso de la carga del teclado es el texto en sí —correos, documentos, mensajes, notas—, así que ceder el texto ya quita casi toda la presión. Si necesitas que el ordenador haga más que eso con la voz, hay una sección más abajo que te lleva a algo mejor.

Local o nube: qué modo elegir

Empieza con el modo local. Mucho de lo que dictarás es personal —una nota a la consulta de tu médico, un formulario del seguro, un mensaje a la familia— y no hay motivo para que eso salga de tu portátil para convertirse en texto escrito. La transcripción local se ejecuta por completo en tu equipo, sin conexión, sin enviar nada a un servidor. Si tu Mac es Apple Silicon o tu PC es de los últimos años, la local maneja el dictado diario sin quejarse, y la nube se convierte en la salida de emergencia en vez de la opción por defecto.

Así es como se diferencian las tres rutas, porque la aplicación te hace elegir y prefiero que elijas bien:

  • Parakeet localel motor TDT de NVIDIA, de unos 600 MB, y la opción local más rápida: de 5 a 10 veces más rápido que Whisper en CPU. Cubre el inglés más otros 24 idiomas europeos, 25 en total. Sin traducción al inglés. Si escribes en inglés u otro idioma europeo, esta es la opción rápida y totalmente sin conexión.
  • Whisper localmás lento que Parakeet en el mismo equipo, pero las versiones multilingües cubren 99 idiomas y pueden traducir al inglés. Las versiones solo en inglés son solo en inglés, no 99. Elige esta para chino, japonés, coreano o cualquier trabajo de traducción, que Parakeet no puede hacer. El modelo en inglés por defecto ocupa unos 480 MB.
  • Nube (OpenAI, con tu propia clave)la mejor precisión y acceso a la web, usando tu propia clave de OpenAI que OpenAI te factura directamente. La transcripción se ejecuta en gpt-4o-mini-transcribe por defecto. Necesita internet, así que es la única ruta que sale de tu equipo. La superficie de Nube forma parte de Whisper Pro.

La verdad aburrida es que, para la mayoría del texto diario, la local sobra. Ambos motores locales se ejecutan por completo en tu equipo sin enviar nada a ninguna parte, que es la opción por defecto correcta cuando dictas cosas personales con la voz. La nube se gana su lugar cuando quieres una precisión de primer nivel en una grabación difícil o necesitas que el modelo saque un dato de la web a media frase. Para un día de correo y notas, empieza por la local y recurre a la nube solo cuando la local se te quede corta.

Limpieza con IA para que no lo arregles a mano

Este paso importa para descansar las manos más de lo que parece al principio. El lenguaje hablado es desordenado. Dices "eh", reinicias frases, te quedas a medias. Si luego tienes que volver y arreglar todo eso tecleando, has vuelto a meter las pulsaciones, lo cual frustra el objetivo. Por eso Whisper tiene una pasada opcional de IA que recorta las muletillas y ordena la redacción antes de que el texto se pegue. Menos correcciones significa menos teclas.

La Escritura por voz de Windows añade puntuación básica mientras hablas, y el Dictado de macOS la gestiona cuando dices "coma" o "punto". Para una limpieza más a fondo —quitar las muletillas, arreglar las frases interminables, convertir un párrafo hablado en algo que enviarías de verdad—, Whisper ejecuta esa pasada de IA a petición. Di la frase de activación "Hey whisper" y el texto se mejora antes de aterrizar. En un modelo local eso se ejecuta a través de Ollama, gratis, en tu propio equipo; en el modo de nube es gpt-5-mini por defecto.

Thinking...
Sin procesar

eh sí pues el el informe está básicamente terminado creo que solo necesito enviárselo a maria antes del viernes

Limpio

El informe está básicamente terminado, creo. Solo necesito enviárselo a María antes del viernes.

El objetivo de la limpieza, para este uso, es que leas el resultado una vez y sigas adelante en lugar de volver al texto con el teclado. También puedes desactivarla y pegar la transcripción en bruto cuando no te importe el acabado. En cualquier caso, la edición que haces a mano baja, que es la parte que tus manos notarán.

Ese mismo flujo de hablar-y-limpiar da frutos en todo lo que escribes: también puedes escribir más rápido con la voz de modo que un mensaje largo se convierte en unas pocas frases habladas en vez de un párrafo que sacas tecla a tecla.

Cuándo prescindir de una herramienta de dictado como esta

Dos flechas dibujadas con tiza en el pavimento apuntando en direcciones distintas, que ilustran una decisión entre herramientas

A veces la herramienta adecuada no es la mía, y fingir lo contrario sería hacerte un flaco favor. Hay dos casos que surgen a menudo, y el dictado a texto es la respuesta equivocada para ambos.

Primero, si quieres controlar todo el ordenador con la voz —mover y hacer clic con el ratón, abrir aplicaciones, navegar por menús, desplazarte, no solo poner texto en un cuadro—, una herramienta de dictado no te llevará hasta ahí. Whisper se encarga del texto; no maneja la máquina. Para un uso totalmente manos libres, mira primero las herramientas de accesibilidad de tu sistema operativo: el Control por voz de macOS te deja controlar toda la interfaz con la voz, y Windows tiene Acceso por voz. Más allá de las integradas, Dragon (Windows) añade comandos de voz para el ratón y los menús, y Talon Voice (Mac, Windows, Linux) va más lejos, combinando comandos de voz con seguimiento ocular y clic mediante sonidos para un control manos libres de verdad. Si eso es lo que necesitas, empieza por ahí, no por aquí.

Segundo, si solo necesitas dictar algún que otro mensaje corto, no instales nada todavía. En Windows, pulsa la tecla del logotipo de Windows + H y se abre la barra de escritura por voz integrada allá donde esté tu cursor; puntúa por sí sola y es gratuita, aunque pasa por los servidores de Microsoft y necesita internet. En un Mac, el Dictado te deja hablar en cualquier campo de texto, se configura en Ajustes del Sistema, en Teclado, y en Apple Silicon puede ejecutarse en el dispositivo. Y para un uso rápido en el móvil, el micrófono del teclado de tu teléfono ya dicta en cualquier campo. Una herramienta dedicada se gana su lugar con el volumen: escritura larga, la tecla con menos fricción, uso sin conexión y una sola tecla rápida que se comporta igual en todas partes. Por debajo de ese listón, usa lo que es gratis.

El enfoque aquí es el mismo que uso en la guía más amplia sobre software de dictado para las lesiones por esfuerzo repetitivo: reduce las pulsaciones, manténlo honesto y recurre a una herramienta más pesada solo cuando el problema sea el teclado, no únicamente el tecleo.

Más información

Nada de esto es una solución para la artritis, y no voy a fingir que lo sea. Es una forma de crear texto sin pulsar teclas, que es algo pequeño y útil cuando pulsar teclas es la parte incómoda. El cursor es la integración: habla en cualquier cuadro, obtén texto, límpialo sin volver al teclado. Dicté la mayor parte de esta guía en un editor de texto con la misma tecla rápida, con las manos casi siempre lejos de las teclas, y luego la releí una vez. Ese es todo el truco; y si tus articulaciones necesitan más que un descanso del tecleo, a quienes hay que preguntar es a quienes tienen el título de medicina, no a mí.

Descansa las manos en tu próximo correo

Mantén o toca la tecla rápida, habla, y la transcripción aterriza donde está tu cursor, en cada aplicación, sin teclado.

Modo local gratuito para cualquier cuenta con sesión iniciada. No se necesita tarjeta para empezar.

Foto de Denys Medvediev

Denys Medvediev

Soy quien lee nuestro correo de soporte, lo más probable es que dictando las respuestas.