Por Denys Medvediev

Guía

Software de transcripción legal, con honestidad

«Software de transcripción legal» suele referirse a transcripciones certificadas de juicios y deposiciones. Whisper by Remskill no es eso. Es una herramienta de dictado que abogados y paralegales usan para redactar sus propios textos — memorandos, cartas, notas de caso — por voz, en cualquier aplicación, con un modo local sin conexión.

Última actualización: junio de 2026

Libros de derecho, un bloc de notas y un portátil sobre un escritorio de madera en una oficina tranquila, evocando la redacción jurídica

El software de transcripción legal suele referirse a transcripciones certificadas de juicios, deposiciones y vistas. Whisper by Remskill no es transcripción certificada y no ofrece garantías de cumplimiento normativo ni de privilegio profesional. Es una herramienta de dictado para la redacción propia del abogado — memorandos, cartas y notas de caso por voz en cualquier aplicación — con un modo local sin conexión que mantiene el texto en la máquina.

Quiero empezar con algo que la mayoría de las páginas que venden «software de transcripción legal» pasan por alto. La frase tiene dos significados muy distintos, y confundirlos le cuesta dinero real a mucha gente. Un significado es la transcripción certificada: un taquígrafo judicial o un servicio de transcripción que convierte una deposición, vista o entrevista grabada en un registro literal que se puede archivar o citar. El otro significado es el dictado: un abogado que habla en lugar de escribir, para plasmar el primer borrador de un memorando o una carta más rápido.

Whisper es claramente lo segundo. No es un servicio de transcripción certificada, no produce transcripciones con validez para el expediente judicial y no ofrece garantías de cumplimiento, privilegio profesional ni exactitud para el registro. Si buscas lo primero, salta al último apartado, donde te señalo el tipo de servicio adecuado. Si redactas muchos borradores propios y ya te cansas de teclear, la parte central de esta guía es para ti.

Para ser claros. Una herramienta de dictado no transcribe una vista judicial. Pega tus palabras habladas en el cursor, en el campo de texto que tenga el foco — un documento de Word, un correo electrónico, una nota de gestión del caso, un descripción para facturación. No sabe que estás trabajando en algo «legal». Simplemente convierte lo que dices en texto, en la aplicación en la que ya estás.

Así que la pregunta real no es «¿es esto software de transcripción legal?». Para transcripciones certificadas, la respuesta es no, y lo digo sin rodeos. La pregunta real es «¿puedo redactar mis propios textos por voz en lugar de escribirlos?», y ahí la respuesta es sí — sin conexión si lo prefieres, con un vocabulario personalizado para los nombres y términos que usas a diario. Voy a explicar la configuración, el flujo de trabajo de redacción, cuándo elegir local frente a la nube, y exactamente cuándo dejar esta herramienta a un lado y contratar un servicio certificado.

Qué es esto y qué no es

Libros de derecho apilados junto a un portátil cerrado sobre un escritorio, con una ventana al fondo

Déjame trazar la línea con claridad, porque aquí importa más que en la mayoría de los campos. Whisper es software de dictado. Hablas y tus palabras aparecen como texto editable en el cursor. No es transcripción certificada. No produce un registro literal y certificable de una deposición, vista o entrevista grabada. No tiene validez para el expediente judicial y no ofrece garantías de cumplimiento normativo, privilegio profesional, confidencialidad ni cadena de custodia. Si un documento necesita estar certificado o archivado como registro fiel de lo que se dijo, esta no es la herramienta adecuada. Punto.

Para lo que sí sirve es para tus propios borradores. El memorando que de otro modo escribirías frase a frase con esfuerzo. La carta al cliente, el resumen de notas del caso después de una llamada, el estado interno de un asunto, el esquema inicial de un argumento antes de refinarlo. En esos casos, tú eres el autor y el único criterio que importa es «¿capturó lo que quería decir?». La voz es más rápida que el teclado para eso — en mi uso personal, unas 145 palabras por minuto habladas frente a unas 40 escritas — y el texto es tuyo para editar antes de que nadie más lo vea.

Hay un punto más que vale la pena mencionar sobre el modo local, porque en otros sitios se exagera. Los motores locales de Whisper se ejecutan completamente en tu máquina, así que el audio y el texto resultante nunca salen de tu ordenador. Para asuntos sensibles, mantener el texto en la máquina es una propiedad real y útil. No es, por sí sola, una garantía de confidencialidad ni de cumplimiento normativo — tus propios sistemas, políticas y obligaciones siguen rigiendo el archivo. Prefiero que entiendas la diferencia antes de que compres una frase que suena a promesa.

Pulsa el atajo, habla, el texto aparece en tu borrador

El mecanismo es sencillo, y eso es precisamente lo que busca. Pulsas un atajo de teclado, hablas, lo sueltas y la transcripción aparece en el cursor, en la aplicación que tenga el foco. Whisper conserva un pequeño margen al soltar la tecla para que no se corte tu última palabra. Como pega en el cursor del sistema operativo, tu nota del caso en Word es simplemente «un campo de texto», igual que tu cliente de correo o tu sistema de gestión de asuntos. No hay ningún plugin que conectar a una aplicación legal específica, ninguna integración que autorizar.

Eso es lo que las páginas de aterrizaje complican de más. El cursor está en tu borrador, hablas y las palabras aparecen en el borrador. Mientras hablas aparece una pequeña cápsula para que sepas que está escuchando:

Cancel
El indicador de grabación: una pequeña cápsula que aparece mientras hablas, para que sepas que Whisper está escuchando.

El atajo de teclado es lo único que conviene configurar bien desde el principio. En Windows es Ctrl+Space; en Mac es Command+Option, un modificador de pulsación continua que mantienes mientras hablas. Ambos se pueden cambiar en Ajustes si entran en conflicto con algo que ya uses. (Mi hija pequeña me dijo una vez que un atajo «no funcionaba» en su aplicación de dibujo. Era un conflicto, no un fallo, y así aprendí que la mayoría de la gente no tiene ni idea de qué es un conflicto de atajos. Por eso ahora todos los atajos son personalizables.) Si ya has configurado el dictado en Windows o en Mac antes, es la misma memoria muscular apuntada a tus aplicaciones de redacción.

Configúralo en dos minutos (Windows o Mac)

Necesitas un Mac con Apple Silicon o un PC con Windows 10 o posterior, un micrófono que funcione y la aplicación en la que redactas abierta y lista. Todo el flujo local es gratuito para cualquier cuenta con sesión iniciada, sin necesidad de método de pago al registrarte. Esta es la secuencia.

Paso 1 — Instala Whisper e inicia sesión.

Descarga desde la página de descarga, instala y crea una cuenta gratuita. Sin tarjeta. Todo el flujo de transcripción local se abre de inmediato.

Sabrás que funcionó cuando aparezca el icono de la bandeja del sistema y el asistente de configuración te ofrezca elegir un modelo.

Paso 2 — Elige un modo de transcripción.

La aplicación no elige por ti. Tienes tres opciones: Cloud (OpenAI, con tu propia clave), Local Parakeet o Local Whisper. Para asuntos sensibles, empieza en local — más sobre eso en las dos secciones siguientes.

Sabrás que funcionó cuando un modelo termine de descargarse y aparezca como listo.

Paso 3 — Confirma tu atajo de teclado.

Windows usa Ctrl+Space por defecto; Mac usa Command+Option en modo de pulsación continua. En Mac, concede el permiso de Accesibilidad cuando te lo pida; sin él, el pegado en el cursor no puede alcanzar otras aplicaciones.

Sabrás que funcionó cuando una grabación de prueba se pegue en cualquier campo de texto.

Paso 4 — Coloca el cursor en tu borrador y habla.

Abre el memorando, la carta o la nota del caso, haz clic donde quieras el texto, mantén el atajo pulsado, di una frase y suéltalo. La transcripción aparece donde está el cursor.

Sabrás que funcionó cuando tu frase hablada esté en el documento como texto.

Whisper
La aplicación de escritorio real de Whisper en la pantalla de ajustes, con los paneles de Transcripción e IA abiertos.

La parte lenta es la descarga del modelo, no la configuración. Todo lo demás son los cuatro pasos anteriores. Una vez en marcha, trasladar un pensamiento a la página deja de ser una tarea de mecanografía y se convierte en una tarea de conversación.

voz a texto en Windows · en Mac

Redactar memorandos, cartas y notas de caso por voz

Esto es lo que parece el día a día en la práctica, porque es más útil que una lista de funciones. Terminas una llamada con un cliente y quieres anotar lo que pasó antes de que se te olvide. Cursor en la nota del caso, atajo pulsado, narras lo que ocurrió en frases sencillas, sueltas. Dos minutos después tienes un párrafo que puedes ordenar en lugar de una página en blanco mirándote fijamente. El mismo flujo sirve para el primer borrador de un memorando, una carta de presentación, un resumen del expediente, una descripción para facturación — cualquier cosa donde tú eres el autor y las palabras empiezan siendo tuyas.

Donde el dictado se gana su lugar es en los textos largos. Un memorando de dos páginas implica mucho teclear y muy poco pensar cuando ya sabes lo que quieres decir. Hablado, sale en el orden en que lo argumentarías en voz alta, que a menudo es el orden en que debería leerse. No estás transcribiendo a nadie — estás plasmando tu propio argumento a velocidad de conversación y luego lo editas. La edición sigue siendo tu trabajo. La voz elimina el teclado, no al abogado. (El mismo flujo de redacción aparece en otras profesiones que viven entre documentos — se parece mucho a lo que describí para el software de dictado para consultores, donde el resultado es un informe en lugar de un memorando.)

La otra ventaja silenciosa son las manos. Si tus muñecas ya no aguantan más después de años redactando, dictar el primer borrador y reservar el teclado para las ediciones es un alivio real. No voy a presentar eso como una afirmación médica — no lo es. Son simplemente menos pulsaciones de tecla para el mismo resultado, algo que la mayoría de quienes redactan profesionalmente agradecen.

Local o nube: qué modo elegir para asuntos sensibles

Para la redacción jurídica, prueba primero el modo local. El motivo es sencillo: un argumento a medio formar, el nombre de un cliente, los hechos de un asunto activo — ese texto nunca necesita salir de tu máquina para convertirse en un borrador. Los motores locales de Whisper se ejecutan completamente en tu ordenador, así que el audio y el texto se quedan ahí. Es una propiedad real para el trabajo sensible, aunque, como ya dije al principio, es una propiedad de dónde ocurre el procesamiento, no un certificado de cumplimiento. Si tu Mac es Apple Silicon o tu PC es de los últimos años, el modo local gestiona el dictado cotidiano sin problemas.

Aquí tienes cómo difieren las tres opciones, porque la aplicación te obliga a elegir y prefiero que elijas bien:

  • Local ParakeetEl motor TDT de NVIDIA, unos 600 MB, y la opción local más rápida — entre 5 y 10 veces más rápido que Whisper en CPU. Cubre inglés más otros 24 idiomas europeos, 25 en total. Sin traducción al inglés y sin vocabulario personalizado. Si redactas en inglés y quieres velocidad, completamente sin conexión, esta es la elección rápida.
  • Local Whispermás lento que Parakeet en la misma máquina, pero es el motor que admite vocabulario personalizado, lo cual importa aquí — aliméntalo con nombres de partes, términos en latín y las frases que repites a diario, y el motor dejará de adivinarlas. Las versiones multilingües cubren 99 idiomas y pueden traducir al inglés; las versiones solo en inglés son exclusivamente en inglés. El modelo de inglés por defecto ocupa unos 480 MB. Es la opción local si lo que te importa es la precisión terminológica.
  • Cloud (OpenAI, BYOK)mejor precisión y acceso web, usando tu propia clave de OpenAI facturada directamente por OpenAI. La transcripción usa gpt-4o-mini-transcribe por defecto. Necesita internet, así que es la única opción donde el texto sale de tu máquina — piénsatelo bien antes de enrutar asuntos sensibles por aquí. La función Cloud es parte de Whisper Pro.

La verdad sin adornos es que para los borradores de tu propia redacción, el modo local es más que suficiente, y para asuntos sensibles es el punto de partida obvio. Ambos motores locales se ejecutan completamente en tu máquina sin enviar nada a un servidor. La nube se gana su lugar cuando quieres máxima precisión en una grabación difícil o necesitas buscar un dato en internet a mitad de una frase — y cuando el contenido no es lo suficientemente sensible como para mantenerlo en la máquina. Empieza en local; recurre a la nube solo cuando el local se quede corto.

Términos jurídicos, nombres de partes y limpieza del borrador

El dictado en bruto sale como un flujo continuo. Dices «bien nota para el expediente hablamos con el cliente sobre el litigio de servidumbre quieren llegar a un acuerdo antes de la vista recuérdame redactar la carta el jueves» y eso es el muro sin puntuación que te devuelve cualquier motor de voz. Dos cosas ayudan.

Primero, la terminología. Local Whisper admite un vocabulario personalizado — una lista de palabras hacia las que orientas el motor. Añade los nombres de las partes, las frases en latín, las abreviaturas propias del despacho que repites a diario, y el motor dejará de adivinarlas. Esa función es exclusiva de Whisper local; Parakeet y los modelos de transcripción en la nube no admiten vocabulario personalizado. Segundo, la limpieza. Para eliminar los «eeh», corregir el flujo continuo y convertir un párrafo hablado en algo que querrías conservar, Whisper puede ejecutar un pase de IA. Di la frase de activación «Hey whisper» y el texto se mejora antes de llegar. En un modelo local eso funciona a través de Ollama; en modo cloud es gpt-5-mini por defecto.

Thinking...
En bruto

bien nota para el expediente hablamos con el cliente sobre el litigio de servidumbre quieren llegar a un acuerdo antes de la vista eeh recuérdame redactar la carta el jueves

Limpio

Nota para el expediente: hablamos con el cliente sobre el litigio de servidumbre. Quieren llegar a un acuerdo antes de la vista. Recuérdame redactar la carta el jueves.

Una advertencia que encaja especialmente bien en este campo. La limpieza con IA arregla la gramática y las muletillas — no es corrección profesional ni revisión jurídica. Convertirá en una frase limpia y segura algo que dijiste mal. Lee lo que aparece antes de que llegue cerca de un cliente o de un expediente. La voz pone las palabras rápido; tu criterio hace el resto.

Ese mismo flujo de hablar y limpiar rinde mucho más allá de la redacción jurídica — también puedes dictar prosa limpia en cualquier aplicación con un solo atajo, de modo que un párrafo largo se convierte en unas pocas frases habladas en lugar de algo que tienes que teclear.

Cuándo necesitas transcripción certificada en su lugar

Columnas exteriores de un juzgado bajo un cielo despejado, evocando procedimientos judiciales formales

Este es el apartado más importante, así que voy al grano. Si lo que realmente necesitas es un registro de lo que se dijo — una deposición, una vista, una entrevista grabada, un interrogatorio — convertido en una transcripción precisa y certificable, no uses una herramienta de dictado y no uses Whisper. Necesitas un taquígrafo judicial certificado o un servicio de transcripción legal certificado. Es una categoría de trabajo diferente con estándares distintos: exactitud literal, certificación y el nivel de responsabilidad que exige un registro archivado. Whisper no ofrece ninguna de esas garantías y no voy a fingir que sí.

Lo mismo aplica a cualquier trabajo sujeto a cumplimiento normativo donde la herramienta en sí debe cumplir un estándar — una cadena de custodia documentada, un umbral de precisión contractual, un registro de auditoría de quién manejó el audio. Whisper es una herramienta de redacción personal. No tiene certificaciones, y mantener el texto en tu máquina es una propiedad del modo local, no una certificación de cumplimiento. Si una norma, un tribunal o un cliente exigen resultado certificado, la respuesta honesta es un servicio certificado. Usa la herramienta adecuada para el estándar al que estás sujeto.

Donde encaja Whisper es en la redacción que de otro modo escribirías tú mismo: el memorando, la carta, la nota del caso, el primer borrador de un argumento. Si tu necesidad es «redacto mucho y las manos me piden descanso», es una buena opción. Si tu necesidad es «tengo que producir una transcripción en la que alguien se basará como registro», no lo es — y una herramienta de dictado nunca lo será. Saber en qué lado de esa línea estás es toda la decisión.

Si tu interés es menos sobre el trabajo jurídico en concreto y más sobre conseguir borradores privados sin que intervenga un servidor, la lógica en voz a texto privado y sin conexión es la misma, porque ambos se reducen a mantener el texto en la máquina donde empieza.

En resumen: no es transcripción certificada, no es un registro judicial, no hay promesas de cumplimiento normativo. Es una herramienta de dictado para tus propios borradores, sin conexión si quieres, con un vocabulario para los términos que usas a diario. Redacté la mayor parte de esta guía hablándola y editando el resultado, que es exactamente el flujo de trabajo que describo — y no tiene nada que ver con producir una transcripción de una deposición, para lo cual contrataría a alguien cualificado. Usa la herramienta adecuada para la línea en la que te encuentras.

Redacta tu próximo memorando por voz

Mantén el atajo pulsado, habla, suéltalo. El primer borrador aparece donde está tu cursor — en tu editor, tu correo o tus notas del caso.

Modo local gratuito para cualquier cuenta con sesión iniciada. No se requiere tarjeta para empezar.

Foto de Denys Medvediev

Denys Medvediev

Soy quien lee el correo de soporte, seguramente dictando las respuestas.

Lecturas adicionales