Guia
Ferramentas de notas de reunião com IA, com sinceridade
A categoria reúne dois produtos diferentes, e as páginas de marketing embaralham essa fronteira. Uma envia um robô para a sua chamada. A outra nunca toca nela. Veja como saber de qual você realmente precisa.
Última atualização: junho de 2026

Uma ferramenta de notas de reunião com IA grava uma conversa e a transforma em transcrição, resumo e itens de ação. A maioria são robôs que entram sozinhos numa chamada do Zoom, Teams ou Meet e escrevem as notas para a sala inteira. Há um segundo tipo, sem robô: você mesmo dita as notas, e nada entra na chamada. Escolha os robôs (Otter, Fireflies, Granola, Read AI, tl;dv) quando quiser que uma máquina participe e faça o resumo; escolha uma ferramenta de ditado como o Whisper quando quiser suas próprias notas limpas por voz, sem gravar a sala.
Uma reunião de uma hora chega a cerca de 9.000 palavras faladas, como regra de bolso. Ninguém digita isso na mão, e é por isso que toda uma indústria de ferramentas agora entra nas suas chamadas sem ser convidada e escreve as notas por você. A verdade sem graça: "ferramenta de notas de reunião com IA" cobre dois produtos diferentes, e as páginas de marketing fazem de tudo para embaralhar a fronteira. Uma envia um robô para a sala. A outra nunca toca na chamada. Escolha a errada e você ou paga por um recurso que não quer, ou envia uma gravação da reunião inteira para um lugar onde não pretendia mandar.
Já que isto é uma comparação, aqui vai o veredito logo de cara. Quer um robô que participe do seu Zoom e entregue um resumo a todos depois? Os robôs de entrada automática (Otter, Fireflies, Granola, Read AI, tl;dv) foram feitos para isso, e vários têm planos gratuitos. Quer capturar suas próprias notas limpas por voz, durante ou logo após a chamada, sem um terceiro gravando a sala? Essa é outra ferramenta, e é aí que o Whisper se encaixa. Este artigo separa a categoria nesses dois tipos, nomeia os robôs que vale a pena conhecer e diz qual eu escolheria em cada caso. A maior parte dos e-mails de suporte que leio vem de pessoas que compraram o tipo errado logo no primeiro dia, então tenho todo o interesse em acertar essa distinção.
Eu faço o Whisper, então deixe-me ser franco sobre o lugar dele antes de seguirmos. O Whisper não é um robô de reunião. Ele não entra na sua chamada. É uma ferramenta de ditado: você aperta uma tecla de atalho, fala, e o texto aparece onde estiver o cursor. Isso o torna a ferramenta errada para "transcrever uma reunião de quatro pessoas em que estou só pela metade", e a ferramenta certa para "escrever minhas próprias notas e itens de ação por voz sem subir a reunião inteira". Os dois trabalhos são reais. A maioria dos artigos finge que só existe um.
Uma ferramenta de notas de reunião com IA transforma fala em notas práticas

Tire o marketing do caminho e toda ferramenta dessa categoria faz três coisas. Captura o áudio. Transcreve esse áudio em texto. Depois um modelo de linguagem comprime o texto num resumo, numa lista de decisões e num conjunto de itens de ação. A Visão Geral da IA que o Google mostra para essa busca diz a mesma ideia com mais palavras.
O que diferencia as ferramentas é a etapa de captura, e é justamente a parte que as páginas iniciais passam por cima. Um robô de entrada automática captura enviando um participante para a sua videochamada. Você já viu: aquele participante extra chamado "Otter.ai" ou "Fireflies Notetaker" sentado na grade. Uma ferramenta de desktop sem robô captura, em vez disso, o áudio que toca no seu computador, então nenhum convidado extra aparece na sala. Uma ferramenta de ditado como o Whisper captura apenas o que você diz ao microfone enquanto segura uma tecla de atalho. No papel, a mesma categoria. Na sala, três coisas diferentes.
Isso importa por causa de consentimento e privacidade, não de recursos. Quando um robô entra, um terceiro grava todo mundo na chamada, muitas vezes sem um aviso claro. Quando você dita suas próprias notas, a única voz capturada é a sua, e no modo local nada sai da sua máquina. Voltaremos a isso. Primeiro, como os robôs funcionam.
Como funcionam os anotadores de entrada automática
As ferramentas de entrada automática vivem na sua agenda. Você conecta o Google Calendar ou o Outlook e, alguns minutos antes de cada reunião começar, a ferramenta dispara um robô que pede para entrar na chamada como participante. O Fireflies, por exemplo, pode "entrar automaticamente nas reuniões da sua agenda", ou você pode convidar o robô dele para uma reunião ao vivo na hora. A proposta do Read AI é que ele "entra nas suas reuniões, grava e entrega um resumo" no Zoom, no Google Meet e no Microsoft Teams.
Uma vez dentro, o robô grava a chamada, transcreve cada participante e, depois da reunião, escreve um resumo com itens de ação que ele envia por e-mail ou deposita num espaço de trabalho. Algumas dessas ferramentas então deixam você buscar em todas as reuniões passadas e "perguntar" sobre o que foi dito.
Um segundo método mais discreto cresceu no último ano: a captura sem robô. Em vez de um robô entrar na chamada, um aplicativo de desktop grava o áudio que sai das próprias caixas de som do seu computador. O Granola "transcreve o áudio do seu computador diretamente, sem robôs de reunião entrando na sua chamada". O Fathom agora oferece os dois, com ou sem robô, para que você possa "manter o foco na reunião" de qualquer jeito. O tl;dv divulga um fluxo "SEM ROBÔ NECESSÁRIO" no plano gratuito. As notas ainda cobrem a reunião inteira; a diferença é se um convidado visível aparece ou não na grade. A gravação ainda acontece. Só acontece no seu notebook em vez de na nuvem.
Os dois tipos de ferramenta que ninguém te ajuda a distinguir
Aqui está a distinção que as páginas da categoria se recusam a traçar. Existe a ferramenta que escuta a sala, e existe a ferramenta que escuta você.
As ferramentas de sala, com ou sem robô, capturam a conversa inteira, cada participante, por conta própria. Você relaxa e as notas aparecem. Isso vale o seu dinheiro quando você está numa reunião à qual não consegue dar atenção total, ou quando o time inteiro precisa de um registro compartilhado. Também é uma gravação de outras pessoas, o que traz questões de consentimento e armazenamento que agora passam a ser suas.
A ferramenta "você" captura apenas o que você escolhe dizer. Você segura uma tecla de atalho, dita as três decisões que importaram, e o texto já ajustado aparece no seu app de notas ou no seu e-mail. Ninguém mais é gravado. Nada da reunião existe além do resumo que você falou de propósito. O trabalho é mais lento no sentido de que você tem de fazer o pensamento, mas o pensamento é justamente o ponto. Um resumo de 600 palavras que você ditou vale mais do que uma transcrição de 9.000 palavras que ninguém lê.
A maioria das pessoas que busca "ferramenta de notas de reunião com IA" presume que quer a ferramenta de sala. Cerca de metade delas, depois de pensar um pouco, quer a ferramenta "você". Elas nunca souberam que isso era uma categoria. É exatamente por isso que este artigo existe.
Como escolhi as ferramentas desta comparação
Uma nota rápida sobre o método, porque a versão honesta importa aqui. Eu não montei um laboratório. Não coloquei sete desses robôs lado a lado na mesma chamada do Zoom para cronometrá-los, e qualquer artigo que afirme ter feito isso, sem mostrar a gravação, está chutando. Então não vou inventar porcentagens de precisão nem números de velocidade para ferramentas que eu não construo. O que vem a seguir é montado a partir de duas coisas: as capacidades documentadas de cada ferramenta (as afirmações nas páginas de preço e produto delas, citadas no texto), mais o uso prático do único app que eu construo e rodo todo dia.
As qualidades que pesei, na ordem em que costumam importar para esta categoria:
- O que ela captura. A sala inteira (entrada automática ou sem robô) versus apenas a sua própria voz. Esse é o ponto de divisão do qual tudo o mais depende.
- Quem é gravado. Um robô na chamada grava cada participante; o ditado grava só você. Isso decide a história de consentimento e privacidade.
- Para onde vai o áudio. Serviço na nuvem versus na sua própria máquina. A maioria dos robôs é só na nuvem; um modo local é a exceção.
- Alcance de plataformas. Em quais apps de chamada ela entra (Zoom, Meet, Teams) e quais sistemas operacionais a executam.
- Cobertura de idiomas. Tirada da fonte primária, a página de cada fornecedor. Onde o fornecedor não informa um número, eu digo isso em vez de chutar.
- Formato de custo. Plano gratuito, assinatura por usuário ou freemium. Os valores reais em dólares ficam na página de cada ferramenta e na página de preços; não vou citá-los no meio da frase aqui.
Esses são critérios de seleção, não um veredito disfarçado de critério. Com eles enunciados, aqui está a categoria numa tabela.
As ferramentas num relance
Cada célula abaixo vem das afirmações documentadas de cada ferramenta (citadas no texto da próxima seção) ou, no caso do Whisper, de como o app é distribuído. Nenhum número de precisão ou velocidade aparece, porque nenhum fornecedor aqui publica benchmarks verificados e eu não vou inventá-los.
| Ferramenta | Plataformas em que entra | Local ou nuvem | Funciona offline | Formato de preço | Idiomas (informados) | Melhor para |
|---|---|---|---|---|---|---|
| Otter.ai | Zoom, Teams, Meet | Nuvem | Não | Plano gratuito + por usuário | 6 | Times intensivos em Zoom num de seus idiomas |
| Fireflies.ai | Zoom, Meet, Teams, +outras | Nuvem | Não | Gratuito para sempre + por usuário | 100+ | Um arquivo pesquisável de cada chamada |
| Granola | Zoom, Meet, Webex, Slack, Teams | Nuvem (captura local sem robô) | Não | Freemium | Não informado | Notas da reunião inteira sem robô visível |
| Read AI | Zoom, Meet, Teams | Nuvem | Não | Plano gratuito + pago | 20+ | Experimentar a ideia num plano gratuito sem cartão |
| tl;dv | Meet, Zoom, Teams | Nuvem (opção sem robô) | Não | Gratuito para sempre + pago | 30+ | O plano gratuito mais generoso |
| Notion AI Meeting Notes | Não informado | Nuvem | Não | Incluído nos planos pagos do Notion | Não informado | Times que já vivem no Notion |
| Whisper by Remskill | Não entra em nada (você dita) | Local ou nuvem (você escolhe) | Sim (modo local) | Plano local gratuito + Pro para nuvem | 99 (local multilíngue) | Escrever suas próprias notas por voz, com privacidade |
Leia a tabela como uma ferramenta de triagem, não como um placar. As primeiras seis linhas são a sala. A última linha é você. Escolha sua linha e o resto deste artigo diz qual nome dela buscar.
Os robôs de reunião que vale a pena conhecer
Se a ferramenta de sala é do que você precisa, aqui estão os cinco que valem o seu tempo. Todas as afirmações abaixo vêm das próprias páginas de cada ferramenta.
Otter.ai é o nome padrão neste espaço. Ele entra no Zoom, no Microsoft Teams e no Google Meet para escrever e compartilhar notas, com transcrição e legendas ao vivo. Seu plano Basic gratuito dá 300 minutos de transcrição por mês. A ressalva que vale conhecer: sua página de preços lista seis idiomas, a saber, inglês, espanhol, francês, alemão, japonês e chinês. Fora desses, procure em outro lugar. Se você está pesando o Otter contra o ditado, o artigo sobre alternativa ao Otter.ai aprofunda a divisão entre reunião e escrita.
Fireflies.ai entra automaticamente nas reuniões da agenda no Zoom, Meet, Teams e mais, e anuncia transcrição em mais de 100 idiomas. Tem um plano gratuito para sempre com 800 minutos de armazenamento por usuário. Ele pende para times que querem um arquivo pesquisável de cada chamada.
Granola é o sem robô. Ele grava o áudio do seu computador, sem robô na grade, e funciona junto com Zoom, Meet, Webex, Slack e Teams, com um app para iPhone. Se a sua objeção é o constrangimento do robô visível, o Granola elimina isso enquanto ainda captura a reunião inteira.
Read AI ficou em primeiro nos resultados de busca que olhei. Ele entra, grava e entrega um resumo no Zoom, Meet e Teams, com apps para Windows, macOS, Android, iPhone e Chrome, além de mais de 20 idiomas. Seu plano gratuito oferece 5 reuniões por mês sem cartão de crédito.
tl;dv é a opção gratuita mais agressiva. Seu plano Free Forever anuncia gravações e transcrições ilimitadas em mais de 30 idiomas com resumos de IA, e integra com Meet, Zoom e Teams. Se "gratuito" é o seu único requisito inegociável, comece por aqui.
Mais um que merece menção: o Notion AI Meeting Notes transcreve e resume dentro do Notion sem um robô separado, incluído nos planos Business e Enterprise do Notion. Vale conhecer se você já vive no Notion, embora a página dele não informe em quais plataformas de chamada ele entra nem quantos idiomas cobre.
Onde o Whisper se encaixa: você dita, ele digita, nada entra na chamada
O Whisper é a ferramenta "você". Você aperta uma tecla de atalho (Ctrl+Space no Windows, ou segura Command+Option no macOS como atalho "aperte para falar"), depois fala, e suas palavras são coladas como texto onde estiver o cursor, em qualquer app. Nenhum robô entra na sua chamada. Nenhum convidado extra aparece na grade do Zoom. O único áudio capturado é o que você diz ao seu próprio microfone, de propósito.
Isso muda o fluxo de trabalho. Em vez de uma transcrição de 9.000 palavras da reunião inteira, você dita a parte que importa (as três decisões, os dois responsáveis, o único prazo) direto no seu documento de notas enquanto a chamada ainda está fresca. No modo nuvem, o assistente de IA pode ajustar o texto, resumir um parágrafo, extrair itens de ação do que você ditou ou redigir o e-mail de acompanhamento, colado no cursor. Diga "Hey whisper" antes da sua instrução para acionar a etapa de IA.
Você escolhe o motor. O Whisper local roda oito modelos na sua máquina e cobre 99 idiomas nas suas variantes multilíngues; as versões .en só em inglês lidam apenas com o inglês. O NVIDIA Parakeet é a opção local mais rápida, de 5 a 10× mais veloz que o Whisper na CPU, cobrindo 25 idiomas (inglês mais 24 europeus), tudo no dispositivo. Ou o modo nuvem usa a sua própria chave da OpenAI: gpt-4o-mini-transcribe ou gpt-4o-transcribe para transcrição, gpt-5-mini para o aprimoramento. No modo local, tudo roda offline depois de um download único do modelo; nada é enviado a lugar nenhum durante a transcrição. Se rodar tudo na sua própria máquina é a parte que importa para você, o guia de voz para texto offline detalha os motores locais com mais profundidade. O Whisper é distribuído para Windows e macOS (Apple Silicon); Linux não é suportado.
A troca honesta: as ferramentas de sala economizam sua atenção, e o Whisper economiza uma gravação de que você não precisava. Se você escreve coisas a maior parte do tempo (e-mails, documentos, notas depois de uma chamada), o fluxo de ditado conquista seu lugar no seu dia muito além das reuniões. É o mesmo argumento que faço no artigo mais amplo sobre app de voz para texto, e é por isso que o Whisper é construído em torno do ditado primeiro e das reuniões depois.
Agora a única opinião que defendo com firmeza aqui, dita sem rodeios: ditado só na nuvem é um desastre de privacidade esperando para ser transcrito. Um time com quem trabalhei certa vez deixou um terceirizado construir um protótipo interno de "ditado com IA" que chamava um modelo na nuvem a cada frase e rodava em todos os notebooks. O gerente abriu o painel de custos no fim do trimestre e encontrou uma conta de cinco dígitos, a maior parte vinda de um time que transcrevia gravações de daily quatro vezes seguidas porque a lógica de "nova tentativa inteligente" era agressiva demais. O terceirizado disse "a gente deveria otimizar o prompt". O CFO disse "ou a gente não deveria pagar para subir reuniões que já têm notas". A sala ficou bem quieta. Os números de salário do seu chefe, o e-mail para a escola do seu filho, a minuta jurídica que você está ditando: nada disso precisa viver nos logs de um fornecedor só porque você quis digitar com a voz. No modo local do Whisper, seu áudio é processado no seu computador e nada é enviado a servidor nenhum, nunca.
Quando um robô de reunião ganha do Whisper
Agora a parte honesta. Se o seu trabalho de verdade é "capturar uma chamada de quatro pessoas à qual mal consigo dar atenção e mandar o resumo por e-mail a todos", o Whisper é a ferramenta errada e eu não tentaria vendê-lo a você. Você quer uma ferramenta de sala. Recorra ao Otter se você vive no Zoom e fala um dos seis idiomas dele, ou ao tl;dv se quiser gravações ilimitadas num plano gratuito em mais de 30 idiomas, ou ao Granola se quiser a reunião inteira capturada sem um robô visível na grade. O plano gratuito de 5 reuniões por mês do Read AI é um jeito ótimo de testar a ideia sem cartão.
Há mais um caso que vale nomear: se o valor que você quer é o robô entrar e resumir por conta própria enquanto você foca em outra coisa, um robô dedicado a notas de reunião ganha do ditado de lavada, porque entrar automaticamente mais resumir automaticamente é exatamente o que ele faz e o que o Whisper deliberadamente não faz. O Whisper não entra em chamadas, não transcreve outros participantes e não produz um resumo com múltiplos falantes. Ele captura o que você diz. Se você precisa da sala, use a ferramenta de sala. Prefiro perder a venda a ler o e-mail de reembolso.
Preços
O Whisper é gratuito para todos em toda a pipeline local: transcrição local, aprimoramento de IA via Ollama, histórico, presets, tecla de atalho personalizada, sem método de pagamento no cadastro. O Whisper Pro acrescenta a parte da nuvem: transcrição na nuvem da OpenAI, aprimoramento de IA na nuvem e busca na web por voz. Os números completos ficam na página de preços. Os robôs cobram por usuário: o Basic gratuito do Otter dá 300 minutos por mês, o Fireflies é gratuito para sempre com 800 minutos de armazenamento por usuário, o plano Free Forever do tl;dv é ilimitado, e o plano gratuito do Read AI é 5 reuniões por mês. Se "gratuito para uso pessoal" é a régua, quase tudo aqui passa.
Se você levar uma só coisa de tudo isso: decida se precisa da sala ou só da sua própria voz antes de se cadastrar em qualquer coisa. Os robôs são bons em ser a sala, então deixe que sejam. Mas, da próxima vez que você terminar uma chamada e for para o teclado escrever as três coisas que importaram, experimente segurar uma tecla de atalho e dizê-las em vez disso. As notas ficam prontas no tempo que o robô leva para mandar o resumo por e-mail, e a única pessoa na gravação é você. Minha filha mais nova entendeu isso mais rápido do que eu. Ela ainda não tem nenhuma reunião.
Precisa da sala, ou só da sua própria voz?
Se são as suas próprias notas que você busca, baixe o Whisper, segure a tecla de atalho e dite as três coisas que importaram. A pipeline local é gratuita, sem cartão no cadastro.
Ditado local gratuito para todo usuário cadastrado. O Pro acrescenta os recursos de nuvem num teste separado.



