Por Denys Medvediev

Guía

Herramientas de notas de reuniones con IA, sin rodeos

La categoría abarca dos productos distintos, y las páginas de marketing difuminan la diferencia. Una mete un bot en tu llamada. La otra nunca la toca. Aquí te explico cómo saber cuál necesitas de verdad.

Última actualización: junio de 2026

Portátil abierto y cuaderno de espiral en blanco con un bolígrafo y un café sobre un escritorio de madera durante una jornada de trabajo

Una herramienta de notas de reuniones con IA graba una conversación y la convierte en una transcripción, un resumen y una lista de tareas. La mayoría son bots de unión automática que entran en una llamada de Zoom, Teams o Meet y escriben las notas para toda la sala. Hay un segundo tipo, sin bot: dictas las notas tú mismo, y nada se une a la llamada. Elige los bots (Otter, Fireflies, Granola, Read AI, tl;dv) cuando quieras que un robot asista y haga el resumen; elige una herramienta de dictado como Whisper cuando quieras tus propias notas limpias por voz sin grabar a toda la sala.

Una reunión de una hora llega a unas 9.000 palabras habladas, como regla aproximada a ojo. Nadie las escribe a mano, y por eso toda una industria de herramientas se une ahora a tus llamadas sin invitación y escribe las notas por ti. La verdad aburrida: "herramienta de notas de reuniones con IA" abarca dos productos distintos, y las páginas de marketing hacen todo lo posible por difuminar la diferencia. Una mete un bot en la sala. La otra nunca toca la llamada. Elige la equivocada y o pagas por una función que no quieres, o envías una grabación de toda tu reunión a un sitio al que no pretendías.

Aquí tienes el veredicto de entrada, ya que esto es una comparativa. ¿Quieres que un robot asista a tu Zoom y reparta un resumen a todos después? Los bots de unión automática (Otter, Fireflies, Granola, Read AI, tl;dv) están hechos para eso, y varios tienen planes gratuitos. ¿Quieres capturar tus propias notas limpias por voz, durante la llamada o justo después, sin que un tercero grabe la sala? Esa es otra herramienta, y ahí encaja Whisper. Este artículo ordena la categoría en esos dos tipos, nombra los bots que vale la pena conocer y te dice a cuál recurriría yo en cada caso. La mayoría de los correos de soporte que leo vienen de gente que compró el tipo equivocado el primer día, así que tengo interés en explicar bien la diferencia.

Yo hago Whisper, así que déjame ser claro sobre su lugar antes de seguir. Whisper no es un bot de reuniones. No se une a tu llamada. Es una herramienta de dictado: pulsas un atajo, hablas, y el texto aparece donde esté tu cursor. Eso lo convierte en la herramienta equivocada para "transcribir una reunión de cuatro personas a la que solo asisto a medias", y en la herramienta adecuada para "escribir mis propias notas y tareas por voz sin subir toda la reunión". Ambos trabajos son reales. La mayoría de los artículos fingen que solo existe uno.

Una herramienta de notas de reuniones con IA convierte lo hablado en notas con las que actuar

Espacio de trabajo con un portátil, un cuaderno y un bolígrafo sobre un escritorio de madera con una pizarra desenfocada al fondo

Quita el marketing y toda herramienta de esta categoría hace tres cosas. Captura el audio. Transcribe ese audio a texto. Luego un modelo de lenguaje comprime el texto en un resumen, una lista de decisiones y un conjunto de tareas. La Vista General de IA que Google muestra para esta búsqueda dice lo mismo con más palabras.

Lo que distingue a las herramientas es el paso de captura, y esa es la parte que las páginas de inicio pasan por alto. Un bot de unión automática captura enviando a un participante a tu videollamada. Ya lo has visto: ese asistente de más llamado "Otter.ai" o "Fireflies Notetaker" sentado en la cuadrícula. Una herramienta de escritorio sin bot captura en cambio el audio que suena por tu ordenador, así que no aparece ningún invitado de más en la sala. Una herramienta de dictado como Whisper captura solo lo que tú dices al micrófono cuando mantienes pulsado un atajo. La misma categoría sobre el papel. Tres cosas distintas en la sala.

La razón por la que esto importa es el consentimiento y la privacidad, no las funciones. Cuando un bot se une, un tercero graba a todos los de la llamada, a menudo sin un aviso claro. Cuando dictas tus propias notas, la única voz capturada es la tuya, y en modo local nada sale de tu máquina. Volveremos a eso. Primero, cómo funcionan los bots.

Cómo funcionan los tomadores de notas de unión automática

Las herramientas de unión automática viven en tu calendario. Conectas Google Calendar u Outlook, y unos minutos antes de que empiece cada reunión, la herramienta despacha un bot que pide unirse a la llamada como participante. Fireflies, por ejemplo, puede "unirse automáticamente a las reuniones de tu calendario", o puedes invitar a su bot a una reunión en directo sobre la marcha. El argumento de Read AI es que "se une a tus reuniones, graba y entrega un resumen" en Zoom, Google Meet y Microsoft Teams.

Una vez dentro, el bot graba la llamada, transcribe a cada interlocutor y, tras la reunión, escribe un resumen con tareas que envía por correo o deja en un espacio de trabajo. Algunas de estas herramientas te permiten luego buscar en todas las reuniones pasadas y "preguntar" cosas sobre lo que se dijo.

Un segundo método más discreto ha crecido durante el último año: la captura sin bot. En lugar de un bot que se une a la llamada, una aplicación de escritorio graba el audio que sale de los propios altavoces de tu ordenador. Granola "transcribe el audio de tu ordenador directamente, sin bots de reuniones que se unan a tu llamada". Fathom ahora ofrece ambos, con bot o sin bot, para que puedas "mantenerte concentrado en la reunión" de cualquiera de las dos formas. tl;dv anuncia un flujo "SIN BOT NECESARIO" en su plan gratuito. Las notas siguen cubriendo toda la reunión; la diferencia es si aparece o no un invitado visible en la cuadrícula. La grabación sigue ocurriendo. Solo que ocurre en tu portátil en lugar de en la nube.

Los dos tipos de herramienta que nadie te ayuda a distinguir

Aquí está la distinción que las páginas de la categoría se niegan a trazar. Está la herramienta que escucha a la sala, y está la herramienta que te escucha a ti.

Las herramientas de sala, con bot o sin bot, capturan toda la conversación, a cada interlocutor, por su cuenta. Tú te recuestas y las notas aparecen. Eso se gana su sitio cuando estás en una reunión a la que no puedes asistir del todo, o cuando todo el equipo necesita un registro compartido. También es una grabación de otras personas, lo que conlleva cuestiones de consentimiento y almacenamiento que ahora son tuyas.

La herramienta "tú" captura solo lo que tú eliges decir. Mantienes pulsado un atajo, dictas las tres decisiones que importaron, y el texto pulido aparece en tu app de notas o en tu correo. Nadie más queda grabado. No existe nada de la reunión salvo el resumen que dijiste a propósito. El trabajo es más lento en el sentido de que tienes que pensar, pero pensar es justo el punto. Un resumen de 600 palabras que dictaste vale más que una transcripción de 9.000 palabras que nadie lee.

La mayoría de quienes buscan "herramienta de notas de reuniones con IA" dan por hecho que quieren la herramienta de sala. Cerca de la mitad de ellos, cuando lo piensan, quieren la herramienta "tú". Nunca supieron que era una categoría. Esa es la razón entera por la que existe este artículo.

Cómo elegí las herramientas de esta comparativa

Una nota rápida sobre el método, porque aquí importa la versión honesta. No monté un laboratorio. No he sentado siete de estos bots uno al lado del otro en la misma llamada de Zoom para cronometrarlos, y cualquier artículo que afirme haberlo hecho, sin mostrar la grabación, está adivinando. Así que no voy a inventarme porcentajes de precisión ni cifras de velocidad para herramientas que no construyo. Lo que sigue se basa en dos cosas: las capacidades documentadas de cada herramienta (las afirmaciones de sus páginas de precios y producto, citadas en el texto), más el uso de primera mano de la única app que sí construyo y uso cada día.

Las cualidades que sopesé, en el orden en que tienden a importar para esta categoría:

  • Qué captura. Toda la sala (unión automática o sin bot) frente a solo tu propia voz. Esta es la bifurcación de la que cuelga todo lo demás.
  • A quién se graba. Un bot en la llamada graba a todos los participantes; el dictado te graba solo a ti. Eso decide la historia del consentimiento y la privacidad.
  • Adónde va el audio. Servicio en la nube frente a tu propia máquina. La mayoría de los bots son solo nube; un modo local es la excepción.
  • Alcance de plataformas. A qué apps de llamadas se une (Zoom, Meet, Teams) y qué sistemas operativos la ejecutan.
  • Cobertura de idiomas. Sacada directamente de la página de cada proveedor. Cuando un proveedor no indica un número, lo digo en vez de adivinar.
  • Forma del coste. Plan gratuito, suscripción por puesto o freemium. Las cifras reales en dólares están en la página de cada herramienta y en la página de precios; aquí no las cito a mitad de frase.

Eso son criterios de selección, no un veredicto disfrazado de criterios. Una vez expuestos, aquí tienes la categoría en una sola tabla.

Las herramientas de un vistazo

Cada celda de abajo viene de las afirmaciones documentadas de cada herramienta (citadas en el texto de la siguiente sección) o, para Whisper, de cómo sale la app. No aparece ninguna cifra de precisión ni de velocidad, porque ningún proveedor aquí publica pruebas verificadas y yo no me las voy a inventar.

Las primeras seis filas son la sala. La última fila eres tú.
HerramientaPlataformas a las que se uneLocal o nubeFunciona sin conexiónForma del precioIdiomas (declarados)Ideal para
Otter.aiZoom, Teams, MeetNubeNoPlan gratuito + por puesto6Equipos muy de Zoom en uno de sus idiomas
Fireflies.aiZoom, Meet, Teams, +másNubeNoGratis para siempre + por puesto100+Un archivo de cada llamada en el que buscar
GranolaZoom, Meet, Webex, Slack, TeamsNube (captura local sin bot)NoFreemiumNo declaradoNotas de toda la reunión sin bot visible
Read AIZoom, Meet, TeamsNubeNoPlan gratuito + de pago20+Probar la idea en un plan gratis sin tarjeta
tl;dvMeet, Zoom, TeamsNube (opción sin bot)NoGratis para siempre + de pago30+El plan gratuito más generoso
Notion AI Meeting NotesNo declaradoNubeNoIncluido en los planes de pago de NotionNo declaradoEquipos que ya viven en Notion
Whisper by RemskillNo se une a nada (tú dictas)Local o nube (tú eliges)Sí (modo local)Plan local gratuito + Pro para la nube99 (multilingüe en local)Escribir tus propias notas por voz, en privado

Lee la tabla como una herramienta para ordenar, no como un marcador. Las primeras seis filas son la sala. La última fila eres tú. Elige tu fila y el resto de este artículo te dice a qué nombre de ella recurrir.

Los bots de reuniones que vale la pena conocer

Weekly sync · 4 participants
YYou
PPriya
MMarcus
recordingNotetaker
Un bot de reuniones de unión automática, recreado: el participante de más llamado "Notetaker" sentado en la cuadrícula de tu llamada, grabando. No es Whisper; este es el tipo de interfaz que Whisper evita deliberadamente.

Si la herramienta de sala es lo que necesitas, aquí están los cinco que merecen tu tiempo. Todas las afirmaciones de abajo vienen de las propias páginas de cada herramienta.

Otter.ai es el nombre por defecto en este espacio. Se une a Zoom, Microsoft Teams y Google Meet para escribir y compartir notas, con transcripción y subtítulos en directo. Su plan gratuito Basic te da 300 minutos de transcripción al mes. El detalle que conviene saber: su página de precios lista seis idiomas, a saber, inglés, español, francés, alemán, japonés y chino. Fuera de esos, busca en otro sitio. Si estás comparando Otter con el dictado, el artículo de la alternativa a Otter.ai profundiza más en la división reunión-frente-a-escritura.

Fireflies.ai se une automáticamente a las reuniones del calendario en Zoom, Meet, Teams y más, y anuncia transcripción en más de 100 idiomas. Tiene un nivel gratis para siempre con 800 minutos de almacenamiento por puesto. Se inclina hacia equipos que quieren un archivo de cada llamada en el que buscar.

Granola es el que no usa bot. Graba el audio de tu ordenador, sin bot en la cuadrícula, y funciona junto a Zoom, Meet, Webex, Slack y Teams con una app para iPhone. Si la incomodidad del bot visible es tu objeción, Granola la elimina sin dejar de capturar toda la reunión.

Read AI quedó primero en los resultados de búsqueda que miré. Se une, graba y entrega un resumen en Zoom, Meet y Teams, con apps en Windows, macOS, Android, iPhone y Chrome, más de 20 idiomas. Su nivel gratuito ofrece 5 reuniones al mes sin tarjeta de crédito.

tl;dv es la opción gratuita agresiva. Su plan Free Forever anuncia grabaciones y transcripciones ilimitadas en más de 30 idiomas con resúmenes de IA, y se integra con Meet, Zoom y Teams. Si "gratis" es tu único requisito firme, empieza aquí.

Uno más que merece una mención: Notion AI Meeting Notes transcribe y resume dentro de Notion sin un bot aparte, incluido en los planes Business y Enterprise de Notion. Vale la pena conocerlo si ya vives en Notion, aunque su página no indica a qué plataformas de llamadas se une ni cuántos idiomas cubre.

Dónde encaja Whisper: tú dictas, él escribe, nada se une a la llamada

Pasted
El overlay de Whisper terminando una nota dictada: su estado completo. Ningún bot se unió a la llamada; la única voz capturada es la tuya.

Whisper es la herramienta "tú". Pulsas un atajo (Ctrl+Space en Windows, o mantienes Command+Option en macOS como combinación de pulsar para hablar), luego hablas, y tus palabras se pegan como texto donde esté el cursor, en cualquier app. Ningún bot se une a tu llamada. Ningún invitado de más aparece en la cuadrícula de Zoom. El único audio capturado es lo que tú dices a tu propio micrófono, a propósito.

Eso cambia el flujo de trabajo. En lugar de una transcripción de 9.000 palabras de toda la reunión, dictas la parte que importa (las tres decisiones, los dos responsables, la fecha límite) directamente en tu documento de notas mientras la llamada aún está fresca. En modo nube, el asistente de IA puede pulirlo, resumir un párrafo, extraer tareas de lo que dictaste o redactar el correo de seguimiento, pegado en el cursor. Di "Hey whisper" antes de tu instrucción para activar el paso de IA.

Tú eliges el motor. Whisper local ejecuta ocho modelos en tu máquina y cubre 99 idiomas en sus variantes multilingües; las versiones .en solo en inglés manejan únicamente el inglés. NVIDIA Parakeet es la opción local más rápida, de 5 a 10 veces más rápida que Whisper en CPU, cubre 25 idiomas (inglés más 24 europeos), todo en el dispositivo. O el modo nube usa tu propia clave de OpenAI: gpt-4o-mini-transcribe o gpt-4o-transcribe para la transcripción, gpt-5-mini para la mejora. En modo local, todo funciona sin conexión tras una descarga de modelo única; nada se envía a ningún sitio durante la transcripción. Si ejecutar todo en tu propia máquina es la parte que te importa, la guía de voz a texto sin conexión repasa los motores locales con más profundidad. Whisper sale en Windows y macOS (Apple Silicon); Linux no está soportado.

El compromiso honesto: las herramientas de sala te ahorran atención, y Whisper te ahorra una grabación que no necesitabas. Si la mayor parte de lo que haces es escribir cosas (correos, documentos, notas tras una llamada), el flujo de dictado se gana su sitio en tu día mucho más allá de las reuniones. Ese es el mismo argumento que defiendo en el artículo más amplio de la app de voz a texto, y es por lo que Whisper está construido en torno al dictado primero y a las reuniones después.

Ahora la única opinión que mantengo con fuerza aquí, dicha sin rodeos: el dictado solo en la nube es un desastre de privacidad esperando a ser transcrito. Un equipo con el que trabajé una vez dejó que un contratista construyera un prototipo interno de "dictado con IA" que llamaba a un modelo en la nube en cada frase y corría en cada portátil. El responsable abrió el panel de costes a fin de trimestre y se encontró una factura de cinco cifras, la mayoría de un solo equipo transcribiendo grabaciones de reuniones diarias cuatro veces porque la lógica de "reintento inteligente" era demasiado agresiva. El contratista dijo "deberíamos optimizar el prompt". El director financiero dijo "o deberíamos dejar de pagar por subir reuniones que ya tienen notas". La sala se quedó muy en silencio. Las cifras del sueldo de tu jefe, el correo al colegio de tu hijo, el borrador legal que estás dictando: nada de eso necesita vivir en los registros de un proveedor solo porque quisiste escribir con la voz. En el modo local de Whisper, tu audio se procesa en tu ordenador y nada se envía a ningún servidor, nunca.

Cuándo un bot de reuniones le gana a Whisper

Ahora la parte honesta. Si tu trabajo real es "capturar una llamada de cuatro personas a la que apenas puedo asistir, y enviar a todos el resumen por correo", Whisper es la herramienta equivocada y no te la vendería. Quieres una herramienta de sala. Recurre a Otter si vives en Zoom y hablas uno de sus seis idiomas, o a tl;dv si quieres grabaciones ilimitadas en un plan gratuito en más de 30 idiomas, o a Granola si quieres capturar toda la reunión sin un bot visible en la cuadrícula. El nivel gratuito de Read AI de 5 reuniones al mes es una buena forma de probar la idea sin tarjeta.

Hay un caso más que vale la pena nombrar: si el valor que quieres es que el bot se una y resuma por su cuenta mientras tú te centras en otra cosa, un bot dedicado a notas de reuniones le gana al dictado de plano, porque unión automática más resumen automático es exactamente lo que hace y lo que Whisper deliberadamente no hace. Whisper no se une a las llamadas, no transcribe a otros interlocutores y no produce un resumen de varios interlocutores. Captura lo que tú dices. Si necesitas la sala, usa la herramienta de sala. Prefiero perder la venta a leer el correo del reembolso.

Precios

Whisper es gratis para todos en toda la cadena local: transcripción local, mejora con IA mediante Ollama, historial, ajustes preconfigurados, atajo personalizado, sin método de pago al registrarte. Whisper Pro añade la capa de nube: transcripción en la nube de OpenAI, mejora con IA en la nube y búsqueda web por voz. Las cifras completas están en la página de precios. Los bots cobran por puesto: el Basic gratuito de Otter da 300 minutos al mes, Fireflies es gratis para siempre con 800 minutos de almacenamiento por puesto, el plan Free Forever de tl;dv es ilimitado, y el nivel gratuito de Read AI es de 5 reuniones al mes. Si el listón es "gratis para uso personal", casi todo lo de aquí lo supera.

Si te quedas con una sola cosa de todo esto: decide si necesitas la sala o solo tu propia voz antes de registrarte en nada. Los bots son buenos siendo la sala, así que déjalos. Pero la próxima vez que termines una llamada y vayas al teclado a escribir las tres cosas que importaron, prueba a mantener pulsado un atajo y a decirlas. Las notas quedan escritas en el tiempo que tarda el bot en enviar su resumen por correo, y la única persona en la grabación eres tú. Mi hija pequeña lo descubrió más rápido que yo. Todavía no tiene ninguna reunión.

¿Necesitas la sala o solo tu propia voz?

Si lo que buscas son tus propias notas, descarga Whisper, mantén pulsado el atajo y dicta las tres cosas que importaron. La cadena local es gratis, sin tarjeta al registrarte.

Dictado local gratuito para todo usuario con sesión iniciada. Pro añade las funciones de nube en una prueba aparte.

Foto de Denys Medvediev

Denys Medvediev

Soy el que lee nuestros correos de soporte, lo más probable dictando las respuestas.

Lecturas adicionales