Guía
Software de dictado para médicos
Esto es dictado para la escritura propia del médico — correos, cartas de derivación, notas personales, trámites administrativos, borradores de investigación — por voz en cualquier aplicación de escritorio. No es una herramienta de documentación clínica, historia clínica electrónica ni transcripción médica, y no ofrece ninguna garantía de cumplimiento normativo.
Última actualización: junio de 2026

El software de dictado para médicos, en el sentido que se aborda aquí, es una herramienta de uso general que un médico utiliza para su propia escritura — correos, cartas de derivación, notas personales, trámites administrativos, borradores de investigación — por voz en cualquier aplicación de escritorio. Un atajo de teclado transcribe el habla en el cursor. Funciona sin conexión en modo local y no es una herramienta de documentación clínica ni de cumplimiento normativo.
Voy a empezar por lo que esto no es, porque el término «software de dictado para médicos» aparece en dos mundos muy distintos y confundirlos es perder tu tiempo. Un mundo es la documentación clínica — dictar notas de pacientes en una historia clínica electrónica, con toda la precisión, integración y burocracia de cumplimiento que eso exige. Esa es una categoría de producto especializada, y Whisper no forma parte de ella. Lo repetiré más adelante, y te indicaré el tipo de herramienta adecuado cuando eso sea lo que realmente necesitas.
El otro mundo es todo lo demás que un médico escribe en un día y que no tiene nada que ver con el historial de un paciente. La carta de derivación. La respuesta a un colega. El mensaje al responsable de la consulta sobre el horario. El primer borrador caótico de un artículo. El correo al organizador del congreso. Esa escritura es simplemente teclear, igual que hace cualquier persona, y es de lo que trata esta guía. Puedes dictarla en lugar de escribirla, en cualquier aplicación de tu ordenador, con un solo atajo de teclado.
Esta es la línea que quiero trazar con claridad y no difuminar en ningún momento. Whisper es una herramienta de dictado para productividad. Convierte tu voz en texto en el cursor, en cualquier aplicación que esté activa. No es una herramienta clínica ni de registros médicos, no está pensada para información sanitaria protegida, y no ofrece ninguna garantía de cumplimiento con HIPAA, historiales clínicos electrónicos ni ninguna otra normativa. No la uses para dictar notas de pacientes. Úsala para tu propia escritura no clínica.
Dentro de esos límites hay mucho margen. Dos características concretas la convierten en una opción sensata para la escritura propia de un médico en particular. El modo local se ejecuta completamente en tu equipo, de modo que el texto de un correo o un borrador no sale del portátil — una propiedad real de dónde ocurre el procesamiento, no un certificado de cumplimiento. Y el Whisper local acepta un vocabulario personalizado, así que la terminología que usas cada día deja de convertirse en texto sin sentido. Lo configuro, te muestro para qué escritura cotidiana sirve, y te digo con toda claridad cuándo conviene dejarlo y comprar un producto médico especializado.
Qué es esto, y qué no es

Lo que es: una herramienta de dictado de uso general que escribe tus palabras habladas en cualquier aplicación de escritorio, de modo que un médico puede redactar sus propios correos, cartas de derivación, notas personales, mensajes administrativos y textos de investigación hablando en lugar de tecleando. Se comporta igual en tu cliente de correo, tu procesador de textos y tu navegador, porque pega en el cursor sin importar en qué aplicación esté.
Lo que no es, dicho con claridad para que no haya ambigüedad: no es una herramienta de documentación clínica, no es un complemento para historiales clínicos electrónicos, no es transcripción médica y no sirve para registros de pacientes, diagnósticos ni tratamientos. No ofrece ninguna garantía de cumplimiento con HIPAA, GDPR ni ninguna otra normativa. Las razones honestas por las que un médico podría usarla de todas formas son mundanas y ciertas — las cartas largas y los borradores cansan al escribirlos, y dictar tu propia correspondencia es más rápido que teclearla. Eso es todo. No hay ninguna declaración de salud asociada a nada de esto.
Mantengo esos límites visibles porque los dos mundos se venden uno al lado del otro, y la diferencia importa. Un producto clínico está construido en torno al historial del paciente, con la integración y el trabajo de cumplimiento normativo que eso conlleva. Una herramienta de productividad como esta está construida en torno a tu cursor y tus propias palabras. El mismo verbo — dictar — una responsabilidad completamente diferente. Si lo que escribes es una nota de paciente destinada a una historia clínica, esta guía termina aquí y la sección «cuándo necesitas una herramienta clínica» es adonde debes ir.
Pulsa un atajo, habla, el texto aparece en el cursor
El mecanismo es sencillo. Pulsas un atajo de teclado, hablas, lo sueltas, y la transcripción se pega en tu cursor en el campo de texto que esté activo. Whisper mantiene un pequeño margen después de que sueltes la tecla, para que tu última palabra no se corte. Como pega en el cursor del sistema operativo, la aplicación que hay debajo es simplemente «cualquier cuadro de texto» — tu ventana de redacción de correo, un documento de Word, una plantilla de carta de derivación que guardas en un documento, el cuerpo de un borrador de investigación. Aparece una pequeña cápsula mientras hablas para que sepas que está escuchando.
No hay nada que conectar a un programa concreto. Sin complementos por aplicación, sin token que pegar, sin sincronización. Tu cursor está en el correo, hablas, las palabras aparecen en el correo. La misma tecla rellena la siguiente frase de un borrador de artículo, o un mensaje al responsable de la consulta, o una nota para ti mismo entre tareas. Una herramienta, en todos los campos de texto en los que escribirías de todos modos.
El atajo de teclado es lo único que debes configurar con cuidado. En Windows es Ctrl+Space; en Mac es Command+Option, un atajo de solo modificadores que mantienes pulsado mientras hablas y sueltas para detener. Ambos se pueden cambiar en Ajustes si entran en conflicto con algo que ya uses. (Un conflicto de atajo es la queja de «no funciona» más habitual que recibimos, y casi nunca es un fallo — son dos aplicaciones peleando por la misma tecla, por eso todos los atajos son personalizables.) Si ya tienes configurado voz a texto en Windows o en Mac antes, la mecánica es la misma, solo que apuntada a tu propia escritura.
Configúralo en dos minutos (Windows o Mac)
Necesitas un Mac con Apple Silicon o un PC con Windows 10 o superior, un micrófono que funcione y la aplicación en la que vas a escribir — cliente de correo, procesador de textos, navegador — abierta. Toda la cadena local es gratuita para cualquier cuenta con sesión iniciada, sin que se pida ningún método de pago al registrarse. Este es el proceso.
Paso 1 — Instala Whisper e inicia sesión.
Descarga desde la página de descarga, instala y crea una cuenta gratuita. Sin tarjeta. Toda la cadena de transcripción local queda disponible de inmediato.
Sabrás que ha funcionado cuando aparezca el icono de la bandeja del sistema y el asistente de configuración ofrezca seleccionar un modelo.
Paso 2 — Elige una modalidad de transcripción.
La aplicación no elige por ti. Tienes tres opciones: Cloud (OpenAI, con tu propia clave), Local Parakeet o Local Whisper. Para correspondencia y borradores que prefieras mantener en el equipo, empieza en local — más adelante explico cuál elegir.
Sabrás que ha funcionado cuando un modelo termine de descargarse y aparezca como listo.
Paso 3 — Confirma tu atajo de teclado.
En Windows el predeterminado es Ctrl+Space; en Mac, Command+Option mantenido como push-to-talk. En Mac, concede el permiso de Accesibilidad cuando se solicite; sin él, el pegado en el cursor no puede llegar a otras aplicaciones.
Sabrás que ha funcionado cuando una grabación de prueba se pegue en cualquier campo de texto.
Paso 4 — Coloca el cursor en un correo o documento y habla.
Abre tu cliente de correo o procesador de textos, haz clic donde escribirías, mantén el atajo pulsado, di una frase, suéltalo. La transcripción aparece donde está el cursor.
Sabrás que ha funcionado cuando tu frase hablada aparezca como texto en el correo o el documento.
La parte lenta es la descarga del modelo, no la configuración. Todo lo demás son los cuatro pasos anteriores. Una vez en marcha, redactar una carta de derivación larga o responder a ese correo que llevas días aplazando deja de ser una tarea de tecleo y se convierte en una tarea de conversación — que, al final de un día largo, cansa de otra manera.
La escritura cotidiana no clínica para la que sirve
Piensa en la escritura de tu día que no es un historial de paciente. La carta de derivación a un colega, que en su mayor parte es prosa que redactas tú de todas formas. El aluvión de correos — la respuesta al congreso, el mensaje al responsable de la consulta, la respuesta a una consulta de administración. La nota para ti mismo sobre un seguimiento o una lectura pendiente. El primer borrador en bruto de un artículo, el resumen para un póster, el texto de una diapositiva de docencia. Nada de eso es documentación clínica, y todo se produce más rápido hablado que escrito.
Una carta larga es donde el dictado demuestra su valor. La velocidad de tecleo sostenida ronda las cuarenta palabras por minuto para la mayoría de las personas; hablar se acerca a las ciento cuarenta y cinco. No vas a producir una carta terminada a velocidad de conversación — nadie lo hace — pero tendrás el cuerpo del texto en aproximadamente un tercio del tiempo, y luego lo puedes repasar. No se trata de saltarse la edición. Se trata de mover ese primer paso lento de la velocidad de tecleo a la velocidad de conversación, de modo que lo que tecleas sea corrección, no composición.
La opinión honesta que subyace en toda esta guía es que la mayoría de las herramientas de productividad son problemas de tecleo disfrazados. Un cliente de correo más rápido, una plantilla mejor, una bandeja de entrada más ordenada — todo es andamiaje alrededor del acto de teclear. La solución real a «paso las tardes contestando correos» no es una aplicación más ágil. Es no escribirlos a mano. Dicta la respuesta, corrige las dos palabras que salieron mal, envíala y vete a casa. Esa es la mejora estructural, y no tiene nada que ver con ningún paciente.
Local o nube: mantener tu propio texto en el equipo
Para la escritura propia de un médico, lo importante es entender dónde se procesa el audio. El modo local se ejecuta completamente en tu equipo — las palabras de un correo o un borrador se transcriben en el portátil y nunca se envían a ningún sitio. Eso es una afirmación sobre la arquitectura técnica, no una garantía de cumplimiento normativo, y no voy a presentarlo como tal. Pero es una propiedad real y útil cuando lo que estás dictando es tu propia correspondencia y prefieres que siga siendo tuya. El modo Cloud envía el audio a OpenAI para su transcripción, que es el intercambio opuesto. Así es como difieren las tres opciones, porque la aplicación te obliga a elegir.
La elección depende de lo que escribes y de lo que te importa:
- Local Parakeet — El motor TDT de NVIDIA, unos 600 MB, y la opción local más rápida — entre 5 y 10 veces más rápida que Whisper en CPU. Cubre inglés más otros 24 idiomas europeos, 25 en total. Sin traducción al inglés ni vocabulario personalizado. Si escribes en inglés y quieres un dictado rápido y completamente sin conexión para cartas y correos del día a día, esta es la opción sencilla.
- Local Whisper — más lento que Parakeet en el mismo equipo, pero las versiones multilingües cubren 99 idiomas y pueden traducir al inglés, y — lo más importante aquí — acepta vocabulario personalizado. Ahí es donde tu terminología deja de convertirse en texto sin sentido. Elígelo si tus borradores están llenos de términos especializados o escribes en un idioma distinto del inglés. El modelo inglés predeterminado ocupa unos 480 MB. Sigue funcionando completamente en tu equipo.
- Cloud (OpenAI, BYOK) — la mejor precisión en bruto y acceso web, usando tu propia clave de OpenAI facturada directamente por OpenAI. La transcripción se ejecuta con gpt-4o-mini-transcribe de forma predeterminada. Requiere internet y envía el audio fuera del equipo, así que es la única opción que abandona tu portátil. La función Cloud forma parte de Whisper Pro. Para correspondencia que prefieras mantener en local, esta es la opción que yo saltaría.
La verdad sencilla es que para la mayor parte de la escritura propia de un médico — cartas, correos, notas, borradores — el modo local es más que suficiente. Ambos motores locales se ejecutan completamente en tu equipo sin enviar nada a ningún servidor. El modo Cloud gana su lugar cuando quieres precisión de primer nivel en una grabación difícil o necesitas consultar un dato de internet a mitad de una frase. Si mantener tu propio texto en tu propio disco es parte del motivo por el que estás aquí, empieza en local y deja la nube como excepción. Nada de esto cambia el límite: sigue sin ser apta para historiales de pacientes, elijas la opción que elijas.
Terminología, frases seguidas y cómo limpiar un borrador dictado
El dictado en bruto sale como una frase sin pausas. Dices «gracias por la derivación he revisado las notas y sugeriría concertar un seguimiento en seis semanas y poner en copia al responsable de la consulta» y eso es la pared sin puntuación que cualquier motor de voz te entrega. Dos cosas convierten eso en una carta que enviarías: acertar con los términos y limpiar la mecánica.
La terminología es donde el dictado general suele fallar, porque un modelo de voz adivina las palabras que no espera. Local Whisper acepta un vocabulario personalizado — tu propia lista de términos especializados, nombres de fármacos, abreviaturas, nombres propios — y se inclina hacia ellos, así que las palabras que usas cada día dejan de salir mal. Parakeet y la transcripción en la nube no admiten esa lista, así que si tus borradores dependen mucho de terminología específica, local Whisper es la opción que la protege. Para la mecánica — eliminar los «eeh», corregir las frases seguidas, dividir un monólogo en oraciones — Whisper puede ejecutar un pase de limpieza con IA. Di la frase de activación «Hey whisper» y el texto se mejora antes de aparecer. En un modelo local se ejecuta a través de Ollama; en modo cloud es gpt-5-mini de forma predeterminada.
gracias por la derivación he revisado las notas y sugeriría concertar un seguimiento en seis semanas y poner en copia al responsable de la consulta
Gracias por la derivación. He revisado las notas y sugeriría concertar un seguimiento en seis semanas, y poner en copia al responsable de la consulta.
Una aclaración sobre para qué sirve el pase de limpieza y para qué no. Es un pase de mecánica — puntuación, muletillas, cortes de frase. No es un juicio sobre el contenido, y desde luego no es una revisión clínica de nada. Trátalo como un repaso de tu propia prosa y lee lo que ha producido antes de enviarlo, igual que releerías cualquier cosa que hubieras tecleado. El modelo corrige las frases seguidas; tú sigues siendo responsable de cada palabra que sale.
Ese mismo flujo de hablar-y-limpiar es útil en toda tu escritura — también puedes guardar tus propias notas rápidas por voz de la misma forma, dejando caer una línea en cualquier aplicación de notas entre tareas en lugar de teclearla.
Cuándo necesitas una herramienta clínica

Esta es la sección más importante, así que voy a ser directo. Si lo que estás dictando es documentación clínica — una nota de paciente, cualquier cosa que entre en una historia clínica electrónica, cualquier información sanitaria protegida, o cualquier transcripción médica que tenga requisitos de cumplimiento normativo — entonces Whisper es la herramienta equivocada y deberías dejar de leer y adquirir un producto de dictado médico especializado. El tipo de software Dragon Medical existe exactamente para esto: construido en torno al historial del paciente, integrado con sistemas de historia clínica electrónica y comercializado con la maquinaria de cumplimiento que exige el trabajo clínico. Whisper no tiene nada de eso ni lo pretende.
El motivo no es modestia. Es que una herramienta de dictado para productividad y un producto de documentación clínica responden a preguntas diferentes. Una lleva tus propias palabras a tu propio correo. La otra es responsable de la precisión, integración y cumplimiento normativo en un registro regulado sobre un paciente. No voy a difuminar esa línea para retenerte en esta página. Si tu tarea vive en la historia clínica, ve a un producto médico diseñado para ello — esa es la respuesta honesta, y es la que le daría a un colega que me preguntara.
Para fragmentos muy breves y no clínicos, la herramienta adecuada puede que ya sea gratuita en tu equipo. En Windows, la tecla de Windows + H abre la barra de Dictado por voz integrada donde esté el cursor; punctúa sola pero pasa por los servidores de Microsoft y necesita internet, así que no es una opción sin conexión. En Mac, Dictado te permite hablar para introducir texto en cualquier lugar donde puedas escribir, y en Apple Silicon el texto general puede procesarse en el dispositivo. Para algo «menos que una carta larga o un borrador real», usa lo que ya tienes gratis. Recurre a una herramienta dedicada cuando la escritura se alargue, la terminología se densifique o quieras un atajo que se comporte igual en todas partes — y recurre a un producto clínico en el momento en que un historial de paciente esté implicado.
Si el motivo por el que te importa el procesamiento local es mantener tu propio texto fuera de los servidores de otros, el caso más amplio a favor de voz a texto privado y en el dispositivo explica qué significa «local» en la práctica y cuáles son sus límites.
Toda la guía es un límite y mucho espacio detrás de él. El límite: esto no es una herramienta clínica, no sirve para historiales de pacientes, no ofrece garantías de cumplimiento. El espacio: cada correo, carta, nota y borrador que un médico escribe sin relación alguna con una historia clínica, dictado en lugar de tecleado, en cualquier aplicación, sin conexión si quieres. Redacté la mayor parte de esto por voz en un cuadro de texto que no era una historia clínica electrónica, con una herramienta que no sabe lo que es una historia clínica electrónica. Ese es el punto.
Pruébalo en tu próxima carta o correo
Mantén el atajo pulsado, habla, suéltalo. La transcripción aparece donde esté tu cursor — en tu correo, tu borrador o cualquier otra aplicación en la que escribas. No en un historial de paciente.
Modo local gratuito para cualquier cuenta con sesión iniciada. Sin tarjeta para empezar.



