Por Denys Medvediev

Guía

Cómo conseguir una transcripción de Zoom

La herramienta para transcribir una reunión de Zoom suele ser el propio Zoom: en un plan de pago, las grabaciones en la nube generan una transcripción de texto automáticamente, que te llega por correo cuando está lista y puedes editar en el portal web. Para llamadas en directo, un bot de reuniones puede unirse y transcribir en tiempo real.

Última actualización: junio de 2026

Escritorio despejado de una oficina en casa con un portátil, auriculares y un cuaderno, preparado para revisar la transcripción de una reunión de Zoom

La herramienta para transcribir una reunión de Zoom suele ser el propio Zoom. En un plan de pago de Zoom, las grabaciones en la nube generan una transcripción del audio automáticamente, guardada en formato VTT y editable en el portal web, en Grabaciones y transcripciones. Para llamadas en directo, un bot de reuniones como Otter o Fireflies se une y transcribe en tiempo real. Whisper es el paso siguiente: una herramienta de dictado por atajo para convertir esa transcripción en bruto en notas limpias listas para enviar.

Hace unas semanas, alguien me preguntó qué herramienta de transcripción de Zoom debería comprar. La respuesta sincera le sorprendió: probablemente ninguna, al menos no de entrada. Si tu cuenta está en un plan de pago de Zoom, Zoom ya graba y transcribe tus reuniones por ti, sin software adicional y sin una segunda suscripción.

En internet te venden esto como un problema que solo una startup puede resolver. La mayoría de las veces es una casilla que aún no has activado. Esa es la verdad aburrida, y merece un párrafo antes de que nadie saque la cartera.

Las transcripciones de reuniones llevan casi una década siendo «casi lo bastante buenas», y la gente sigue pagando por cubrir un hueco más pequeño de lo que sugiere el marketing. Ahora mismo hay tres caminos reales, y el adecuado depende de si controlas la reunión, de si puedes grabarla y de qué piensas hacer con las palabras después.

Este artículo recorre los tres (la propia transcripción de Zoom, un bot de reuniones en tiempo real y transcribir un archivo grabado que ya tienes) y dónde encaja, y dónde no, una herramienta de dictado por atajo como Whisper. La mayoría de los correos de soporte que recibo sobre este tema son de gente que compró una herramienta para hacer algo que su cuenta ya hacía. La transcripción más rápida es aquella para la que no tienes que instalar nada, así que empecemos por ahí.

La transcripción de Zoom más rápida es la que Zoom ya hace por ti

Nadie empieza por esta parte. Si grabas una reunión de Zoom en la nube con una cuenta Pro, Business, Education o Enterprise, Zoom genera una transcripción del audio automáticamente y te avisa por correo cuando está lista. La transcripción se guarda en formato VTT y vive en el portal web de Zoom, en Grabaciones y transcripciones. Sin extensión, sin bot, sin complicaciones.

El truco está en el tipo de cuenta. La transcripción de grabaciones en la nube necesita que estén activadas tanto la grabación en la nube como la transcripción del audio, y ninguna de las dos existe en el plan gratuito Basic. Así que «¿hay una IA gratuita para transcribir reuniones de Zoom?» tiene una respuesta incómoda: la transcripción del propio Zoom es gratuita en el sentido de que no cuesta nada extra una vez que ya pagas Zoom, y no es nada gratuita si estás en Basic.

La cobertura de idiomas es razonable. La documentación de soporte de Zoom enumera alrededor de 19 idiomas para las transcripciones de grabaciones en la nube, entre ellos inglés, español, francés, alemán, chino, japonés, ucraniano y rumano. Para la mayoría de las reuniones internas, es de sobra. Si necesitas coreano junto con polaco en la misma llamada, comprueba la lista actual antes de confiar en ella, ya que Zoom la va ampliando con el tiempo.

Cómo conseguir una transcripción de Zoom, paso a paso

zoom.us · Grabaciones y transcripciones
Grabaciones en la nube · 1 resultado
Sincronización semanal — 2026-06-02Transcripción lista · VTT
icono de lápiz = editar una frase marca de verificación = guardar
El propio portal web de Zoom: el panel de Grabaciones y transcripciones, donde aparece una transcripción VTT terminada y se puede editar en línea.

El flujo integrado es corto. Aquí lo tienes entero.

1

Graba la reunión en la nube. Durante la llamada, inicia una grabación en la nube, no una local. La transcripción solo se genera para las grabaciones en la nube.

La grabación aparece en el portal, no solo en tu disco duro.

2

Espera dos correos. Cuando termina la reunión, Zoom te avisa por correo de que la grabación está lista y luego un segundo correo de que la transcripción del audio está disponible.

El segundo correo llega, normalmente pocos minutos después del primero.

3

Abre el portal web de Zoom. Inicia sesión y, en el menú de navegación, haz clic en Grabaciones y transcripciones y abre la pestaña Grabaciones en la nube.

Tu reunión aparece en la lista.

4

Abre la grabación y lee la transcripción. Haz clic en la grabación para ver la transcripción junto a la reproducción.

Puedes ver las líneas con marcas de tiempo.

5

Corrige lo que esté mal. Pasa el cursor sobre una frase, haz clic en el icono de lápiz, corrígela y luego haz clic en la marca de verificación para guardar.

La línea corregida sigue corregida después de actualizar la página.

Eso es todo. Ninguna herramienta que comprar, un par de minutos en total una vez que llega el correo. Si llegaste aquí buscando una herramienta para transcribir reuniones de Zoom, puede que acabes de terminar.

Subtítulos en directo frente a transcripción de grabación en la nube: cuál quieres

Vista en picado de un portátil abierto junto a un cuaderno de espiral en blanco, contrastando los subtítulos en directo con una transcripción guardada

Son dos cosas distintas y la gente las confunde. La transcripción en directo muestra subtítulos en pantalla durante la reunión, útil para la accesibilidad o cuando el audio de alguien va regular, y desaparece en cuanto termina la llamada salvo que la guardes. La transcripción de la grabación en la nube es el documento posterior: el archivo VTT que puedes buscar, editar y leer después.

Elige según el momento en que necesitas las palabras. Si quieres seguir la conversación en directo, lo que buscas son los subtítulos. Si necesitas un registro para resumir, buscar o pegar en un correo de seguimiento, lo que buscas es la transcripción de la grabación en la nube. La mayoría de la gente que dice «transcripción» se refiere a la segunda y por accidente recurre a la primera.

Una salvedad sincera: Zoom también promociona un AI Companion que redacta resúmenes de reuniones, y los planes exactos en los que se incluye cambian con el tiempo. No voy a citar una cifra que no pueda anclar a la documentación actual de Zoom. Si lo que buscas es una función de resumen automático, comprueba qué incluye tu plan de Zoom hoy antes de dar por hecho que la tienes.

Dónde encaja Whisper: convertir la transcripción en notas limpias que puedas usar

Ahora la parte en la que tengo que ir con cuidado, porque sería fácil prometer de más. Whisper no se une a tu llamada de Zoom. No tiene ningún bot de Zoom, no se une automáticamente a las reuniones y nunca captura el audio de otros participantes. Si quieres algo que se siente en la reunión y escuche, Whisper es la herramienta equivocada, y en un momento te indico cuáles son las correctas.

Whisper
La aplicación de escritorio real de Whisper: navega por los Ajustes para ver los paneles de transcripción Local y en la nube.

Lo que hace Whisper es el paso posterior a tener una transcripción. Pulsas un atajo (Ctrl+Space en Windows, Command+Option mantenido como pulsar para hablar en macOS), hablas y tus palabras se pegan en el cursor, en la aplicación en la que estés. Así que cuando Zoom te entrega ese muro de texto VTT en bruto, abres el documento donde vive el seguimiento y dictas la versión que leerá una persona: las tres decisiones, los dos responsables, la única fecha límite.

En el modo en la nube, el asistente de IA va un paso más allá. Di «Hey whisper» y puedes pedirle que resuma un párrafo, extraiga las tareas pendientes de las notas de la reunión o redacte la respuesta, y el resultado pulido aparece en tu cursor. Las funciones en la nube forman parte de Whisper Pro; el sistema de dictado local es gratis para cualquiera con una cuenta, sin método de pago para registrarse. La transcripción es la materia prima. Whisper sirve para darle forma hasta convertirla en algo que enviarías.

Transcribe un archivo de grabación de Zoom que ya tienes

¿Y si guardaste la reunión como archivo local y nunca conseguiste una transcripción de Zoom, el problema del plan Basic? Tienes una grabación, pero no el texto.

CancelTranscribing
Whisper convirtiendo una grabación existente en texto: el estado de transcripción de la superposición.

La vía en la nube de Whisper puede transcribir un archivo de audio que sea tuyo usando tu propia clave de OpenAI, y la API de voz a texto de OpenAI admite mp3, mp4, m4a, wav y webm. La única cifra que conviene recordar: las subidas a esa API están limitadas a 25 MB. Una reunión larga las superará con creces, así que primero tendrías que dividir el audio. Los motores locales no comparten ese límite de la API, ya que se ejecutan en tu máquina: transcripción en Rust puro, sin que nada salga del portátil.

Una advertencia que te debo: no he confirmado de forma independiente la etiqueta exacta del flujo de importación de archivos de la aplicación de escritorio, así que toma «arrastra una grabación y listo» como la intención, no como un botón garantizado de un solo clic. Para un archivo limpio, grabado por ti mismo y por debajo del límite de tamaño, la vía en la nube se encarga. Para el dictado del día a día y limpiar notas, el atajo es el protagonista.

Cuándo saltarte Whisper y usar un bot de reuniones

Esta es la sección que las herramientas de IA nunca escriben, así que aquí va sin rodeos: si lo que de verdad necesitas es algo que se una a la llamada y lo apunte todo, no uses Whisper. Usa un bot de reuniones.

Otter se conecta a tu calendario de Google o Microsoft, se une automáticamente a tus reuniones de Zoom, toma notas en tiempo real, captura las diapositivas compartidas y publica un resumen del debate en el chat de Zoom. Fireflies funciona con un bot Notetaker que se une automáticamente a las reuniones del calendario para grabar, transcribir y resumir, con tareas pendientes después de cada llamada, y anuncia más de 100 idiomas. Tactiq va por el otro lado: una extensión de Chrome que transcribe Zoom en tiempo real sin que ningún bot se una, un plan gratuito con tus primeras 10 transcripciones de reuniones sin tarjeta y resúmenes con un solo clic. Tres mecanismos distintos, todos los cuales hacen la captura dentro de la reunión que Whisper deliberadamente no hace.

Esta es la opinión que voy a defender: Otter es para reuniones, Whisper es para escribir. Categorías distintas, y prefiero que uses la correcta a que pagues de más por la equivocada. Whisper hace que el acto de escribir con la voz sea rápido. No se sienta en tu reunión diaria.

Esa distinción importa más de lo que parece, y la historia de la factura en la nube es el porqué. Un equipo con el que trabajé encargó a un contratista que construyera un prototipo interno de dictado por IA que llamaba a un modelo en la nube por cada frase, en cada portátil. Al cierre del trimestre, el responsable abrió el panel de costes y se encontró una factura de cinco cifras. La mayor parte era un solo equipo transcribiendo las grabaciones de la reunión diaria cuatro veces seguidas, porque la lógica de reintentos era demasiado agresiva. La solución del contratista fue «optimizar el prompt». La del director financiero fue «o dejar de pagar por transcribir reuniones que ya tienen notas». Un bot de reuniones que necesitas merece la pena. Un bot de reuniones que compraste para hacer lo que tu cuenta de Zoom ya hace es esa factura de cinco cifras esperando a aparecer.

Cuánto cuesta una transcripción de Zoom

La transcripción de grabaciones en la nube de Zoom no cuesta nada más allá del plan de pago de Zoom que ya tienes; está reservada al nivel Pro en adelante, no al plan gratuito Basic. El sistema de dictado local de Whisper es gratis para cualquiera con una cuenta, sin necesidad de método de pago para empezar. La parte en la nube (transcripción con OpenAI, mejora con IA y búsqueda web) forma parte de Whisper Pro. Las cifras exactas están en la página de precios de Whisper para que estén siempre actualizadas. Las herramientas de bot como Otter, Fireflies y Tactiq fijan sus precios cada una a su manera; consulta sus páginas directamente, ya que los precios de los bots de reuniones cambian a menudo.

Whisper funciona en Windows y macOS con Apple Silicon, con el sistema local operando totalmente sin conexión tras una descarga única del modelo. Si primero quieres hacerte una idea del flujo de dictado, la visión general de la app de voz a texto y la comparativa de alternativas a Otter.ai cubren con más profundidad el lado de escribir con la voz.

La mayoría de las búsquedas de una herramienta de transcripción de Zoom terminan igual: alguien descubre que la transcripción ya estaba esperando en su portal de Zoom, activa la grabación en la nube y sigue con su día. La herramienta que necesitabas era una casilla. Lo que queda después de eso, convertir un muro de marcas de tiempo en las dos frases que leerá tu equipo, es la parte que merece la pena hacer con la voz. Dicté casi todo este artículo entre recoger a mi hija del colegio y un correo de soporte sobre, precisamente, dónde encontrar una transcripción de Zoom. Mi hija me preguntó qué estaba escribiendo. Le dije «cómo conseguir una transcripción de Zoom». Me preguntó si eso era un trabajo de verdad. Tiene razón.

Más lecturas

¿Listo para limpiar tus notas de reunión con la voz?

Consigue tu transcripción desde Zoom, luego descarga Whisper y dicta la versión que tu equipo va a leer de verdad.

Modo local gratis para cualquier cuenta con sesión iniciada. Sin tarjeta para empezar.

Foto de Denys Medvediev

Denys Medvediev

Soy quien lee nuestro correo de soporte, lo más probable es que dictando las respuestas.