Guia
Voz para texto para fazer anotações
Capture anotações falando em vez de digitar. Um atalho de teclado que funciona em todo o sistema cola suas palavras no cursor de qualquer app de anotações — Notion, Obsidian, Apple Notes, OneNote, texto puro. Sem trocar de app, sem plugin específico de cada app. Depois, um passe de IA dá uma arrumada no despejo de ideias.
Última atualização: junho de 2026

Voz para texto para fazer anotações funciona por meio de uma ferramenta que atua em todo o sistema, não pelo app de anotações em si. Pressione um atalho, fale, e a transcrição cola no cursor de qualquer app que estiver em foco — Notion, Obsidian, Apple Notes, OneNote ou um arquivo de texto puro. Funciona offline e de graça nos modelos locais, e um passe de IA limpa o rascunho falado.
A maior parte das anotações é só digitar com etapas a mais. Você tem uma ideia, abre o app, procura a página certa, digita a ideia, e a ideia já meio que evaporou quando seus dedos finalmente alcançam. A forma mais rápida que encontrei de guardar uma ideia é dizê-la em voz alta no segundo em que ela aparece, para qualquer janela que esteja aberta, e deixar as palavras caírem como texto.
As pessoas pesquisam "voz para texto para fazer anotações" esperando escolher o único app com o melhor ditado. Essa é a pergunta errada. Quase nenhum app de anotações tem um bom ditado nativo no desktop, e os que têm só funcionam dentro de si mesmos. O que realmente funciona igual em todo lugar não é um recurso de app. É um atalho que cola no seu cursor, e o cursor não se importa em qual app de anotações ele está.
Aqui está a parte que a maioria das páginas que rodeiam essa palavra-chave não diz com clareza. Uma anotação, em qualquer app, é uma caixa de texto. O editor do Notion é uma caixa de texto. Uma nota do Obsidian é uma caixa de texto. Apple Notes, OneNote, uma janela de notas adesivas, um arquivo .txt aberto em qualquer editor — todas caixas de texto. O ditado que cola no seu cursor não se importa com qual delas é.
Então a pergunta de verdade não é "qual app de anotações tem a melhor digitação por voz". É "qual ferramenta de ditado eu rodo por cima de todos eles". A resposta é a que funciona em todo o sistema, roda offline se você quiser, e limpa a bagunça falada depois. Vou mostrar o porquê, o como, a configuração em dois minutos, como ela entra em cada app de anotações e — a parte que ninguém mais escreve — quando dispensar de vez a ferramenta dedicada.
Por que falar suas anotações em vez de digitá-las

O que um app de anotações realmente faz é capturar ideias antes que elas escapem. O gargalo não é o app. É a distância entre ter a ideia e colocá-la no papel. Digitar gira em torno de 40 palavras por minuto para a maioria das pessoas. Falar gira em torno de 145. Isso não é uma pequena vantagem; é a diferença entre capturar a ideia inteira e capturar a metade dela que sobreviveu até o teclado.
O ditado fecha essa lacuna de duas formas. A primeira é a velocidade pura — um parágrafo de anotações são quinze segundos de fala em vez de um minuto de digitação. A segunda é mais silenciosa e importa mais: ela permite capturar enquanto suas mãos estão ocupadas. Em pé na lousa, passeando com o cachorro, lavando a louça depois que as crianças vão dormir e as únicas boas ideias do dia finalmente chegam. Você não senta para fazer a anotação. Você só fala.
Tem também as mãos em si. Se seus pulsos já estão cansados às 15h, ditar suas anotações é um jeito de continuar trabalhando sem somar à pilha de toques no teclado. Não vou enfeitar isso como algo médico — é uma questão de produtividade. Menos toques, mesmas anotações. Numa longa sessão de captura, suas mãos se sentirem bem no fim já é motivo suficiente.
Aperte um atalho, fale, e o texto aparece na nota
Esse é o mecanismo inteiro, e ele é entediante no melhor sentido. Você aperta um atalho, fala, solta, e a transcrição cola no seu cursor, em qualquer campo de texto que estiver em foco. O Whisper segura um pequeno trecho final depois que você solta a tecla, para que sua última palavra não seja cortada. Como ele cola no cursor do sistema, um bloco do Notion, uma nota do Obsidian e um cartão do Apple Notes são todos apenas "qualquer caixa de texto". Mesma tecla, mesmo comportamento, em todo app.
Essa é a parte que as páginas de venda complicam demais. Não há plugin para instalar no seu app de anotações, nenhum token de API para colar, nenhum job de sincronização para ficar de babá. Seu cursor está na nota, você fala, as palavras aparecem na nota. Uma pequena cápsula surge enquanto você fala, para que você saiba que está ouvindo:
O atalho é a única coisa que vale a pena acertar logo de cara. No Windows é Ctrl+Space; no Mac é Command+Option, um push-to-talk só com modificadores que você segura enquanto fala. Ambos são alteráveis nas Configurações se entrarem em conflito com algo que você já usa. (Minha filha mais nova uma vez me disse que um atalho "não funcionava" no app de desenho dela. Era um conflito, não um bug, e foi assim que aprendi que a pessoa comum não faz ideia do que é um conflito de atalho. Então agora todo atalho é personalizável.) Se você já configurou ditado no Windows ou no Mac, essa é a mesma memória muscular apontada para todos os apps ao mesmo tempo.
Configure em dois minutos (Windows ou Mac)
Você precisa de um Mac com Apple Silicon ou um PC com Windows 10 ou mais recente, um microfone funcionando e seu app de anotações aberto — qualquer um deles. Todo o pipeline local é grátis para qualquer conta logada, sem pedir forma de pagamento no cadastro. Aqui está a sequência.
Passo 1 — Instale o Whisper e faça login.
Baixe pela página de download, instale e crie uma conta gratuita. Sem cartão. Todo o pipeline de transcrição local abre na hora.
Você vai saber que deu certo quando o ícone do app aparecer na bandeja e o assistente de configuração oferecer a escolha de um modelo.
Passo 2 — Escolha um caminho de transcrição.
O app não escolhe por você. Você tem três: Nuvem (OpenAI, use sua própria chave), Parakeet local ou Whisper local. Para anotações privadas, comece local — mais sobre isso duas seções abaixo.
Você vai saber que deu certo quando um modelo terminar de baixar e aparecer como pronto.
Passo 3 — Confirme seu atalho.
O Windows usa Ctrl+Space por padrão, o Mac usa Command+Option segurado como push-to-talk. No Mac, conceda a permissão de Acessibilidade quando for solicitado; sem ela, a colagem no cursor não consegue alcançar outros apps.
Você vai saber que deu certo quando uma gravação de teste colar em qualquer campo de texto.
Passo 4 — Coloque o cursor numa nota e fale.
Abra o app de anotações que você usar, clique dentro de uma nota, segure o atalho, diga uma frase, solte. A transcrição aparece onde o cursor está.
Você vai saber que deu certo quando sua frase falada estiver ali na nota como texto.
A parte lenta é o download do modelo, não a configuração. Todo o resto são os quatro passos acima. Quando estiver rodando, capturar uma ideia em qualquer um dos seus apps de anotações deixa de ser uma tarefa de digitar e passa a ser uma tarefa de falar.
Notion, Obsidian, Apple Notes, OneNote — mesmo atalho
A razão pela qual um atalho que atua em todo o sistema vence um recurso específico de cada app é que você para de reaprender. Os poucos apps de anotações com ditado próprio só funcionam dentro de si mesmos, e a maioria nem tem isso no desktop. Com um atalho que cola no cursor, o fluxo é idêntico não importa qual app você abriu hoje de manhã.
No Notion, clique em qualquer bloco ou campo de banco de dados, segure a tecla, fale — o texto cai no bloco. No Obsidian, coloque o cursor numa nota e as palavras aparecem no markdown, igual a digitá-las. Apple Notes e OneNote têm áreas de texto comuns, então o cursor também captura a transcrição ali. Até um arquivo .txt puro em qualquer editor funciona, porque para uma ferramenta que cola no cursor um arquivo de texto não é diferente de um editor sofisticado. Para passo a passos específicos de cada app, o mesmo fluxo é abordado para ditar no Notion e no Obsidian.
Tem uma jogada gratuita de produtividade escondida nisso. As anotações da maioria das pessoas vivem em dois ou três apps — anotações de trabalho em um, pessoais em outro, capturas rápidas em um terceiro. Com uma ferramenta específica de cada app, você precisaria que cada app suportasse voz, e trocaria de botão toda vez. Com o atalho, o mesmo gesto preenche todos eles, e preenche também seu e-mail e seu app de chat, porque digitação por voz não é realmente sobre apps de anotações — é sobre o cursor. Eu troco de app umas quarenta vezes por hora e não quero ter quarenta botões de ditado diferentes para lembrar.
Local ou nuvem: qual modo para anotações privadas
Para anotações, experimente o modo local primeiro. Boa parte do que vai para um app de anotações é exatamente o tipo de coisa que você nunca ia querer no servidor de outra pessoa — uma ideia meio formada, um valor de salário, um rascunho de um e-mail difícil, um pensamento sobre alguém. Seria uma escolha estranha guardar tudo isso num arquivo de anotações local e então rotear sua voz por uma nuvem para chegar lá. Se o seu Mac tem Apple Silicon ou o seu PC é dos últimos anos, o local dá conta da captura de anotações do dia a dia sem reclamar, e a nuvem vira a saída de emergência em vez do padrão.
Aqui está como os três caminhos diferem, porque o app faz você escolher e eu prefiro que você escolha bem:
- Parakeet local — O motor TDT da NVIDIA, cerca de 600 MB, e a opção local mais rápida — de 5 a 10 vezes mais rápido que o Whisper na CPU. Cobre inglês mais 24 outros idiomas europeus, 25 no total. Sem tradução para o inglês. Se você faz anotações em inglês ou em outro idioma europeu, essa é a escolha rápida e totalmente offline.
- Whisper local — mais lento que o Parakeet na mesma máquina, mas as versões multilíngues cobrem 99 idiomas e conseguem traduzir para o inglês. As versões só em inglês são só em inglês, não 99. Escolha esta para chinês, japonês, coreano ou qualquer trabalho de tradução, que o Parakeet não faz. O modelo padrão em inglês tem cerca de 480 MB.
- Nuvem (OpenAI, BYOK) — melhor precisão e acesso à web, usando sua própria chave da OpenAI cobrada direto pela OpenAI. A transcrição roda no gpt-4o-mini-transcribe por padrão. Precisa de internet, então é o único caminho que sai da sua máquina. A superfície de Nuvem faz parte do Whisper Pro.
A verdade entediante é que, para o tipo de texto que a maioria das pessoas coloca nas anotações, o local é mais que suficiente. Os dois motores locais rodam inteiramente na sua máquina, sem nada enviado a um servidor, que é todo o sentido se suas anotações são privadas. A nuvem ganha seu lugar quando você quer precisão de primeira numa gravação difícil ou precisa que o modelo busque um fato na web no meio da frase. Para o hábito diário de anotar, comece local e só recorra à nuvem quando o local deixar você na mão.
Transformando um despejo de ideias falado em anotações organizadas
O ditado bruto sai como um amontoado sem pontuação. Você diz "ok então três coisas para o lançamento primeiro a página de preços segundo mandar e-mail para a lista do beta terceiro me lembrar de ligar para a gráfica", e essa é a parede sem pontuação que qualquer motor de fala te entrega. Um despejo de ideias falado é rápido de produzir e feio de ler. Limpar isso é onde os caminhos se separam.
A Digitação por Voz do Windows adiciona pontuação enquanto você fala, e o Ditado do macOS lida com pontuação básica quando você diz "vírgula" ou "ponto". Para uma limpeza mais pesada — tirar os "hum", consertar os amontoados, transformar um parágrafo falado em algo que você de fato guardaria — o Whisper pode rodar um passe de IA. Diga a frase de ativação "Hey whisper" e o texto é aprimorado antes de cair. Num modelo local isso roda através do Ollama; no modo nuvem é o gpt-5-mini por padrão.
ok então três coisas para o lançamento primeiro a página de preços segundo mandar e-mail para a lista do beta terceiro me lembrar de ligar para a gráfica hum antes de sexta
Três coisas para o lançamento: primeiro, a página de preços; segundo, mandar e-mail para a lista do beta; terceiro, me lembrar de ligar para a gráfica antes de sexta.
Agora o limite honesto. O ditado te dá palavras — palavras limpas e pontuadas. Ele não te dá a estrutura do seu app de anotações. O passe de limpeza pode transformar um amontoado numa frase organizada, mas não vai criar um toggle no Notion, indentar um marcador no Obsidian, marcar uma caixa no OneNote ou aplicar um título. Os atalhos de cada app fazem isso. Dite a frase, depois aperte Tab para aninhar, digite # ou - para a estrutura que você quiser, do jeito que você sempre faz. Quem promete "diga faça uma checklist e veja ela se formatar" está te vendendo uma demonstração, não uma terça-feira. Coloque as palavras no papel rápido por voz, dê forma à nota com as teclas que você já conhece.
Esse mesmo fluxo de falar e depois limpar compensa muito além das anotações — você pode ditar texto limpo em qualquer app com o único atalho, então uma nota longa vira algumas frases faladas em vez de um parágrafo que você digita por inteiro.
Quando dispensar uma ferramenta de ditado para anotações

Às vezes uma ferramenta de ditado dedicada é a resposta errada, e fingir o contrário seria desonesto. Dois casos aparecem bastante, e em ambos eu te apontaria para outro lugar.
O primeiro é gravar uma reunião ou uma palestra para transcrever depois. Esse é um trabalho diferente. O ditado digita o que você fala em tempo real no seu cursor; ele não fica num canto capturando uma conversa de 90 minutos entre várias pessoas e te entregando uma transcrição com os falantes identificados depois. Para isso você quer uma ferramenta de transcrição feita para isso — múltiplos falantes, resumos pós-reunião, tudo. Não recorra a um atalho de ditado para gravar uma sala; é a ferramenta errada. O segundo é a captura rápida no celular. O Whisper é só para desktop, Windows e macOS, então quando você está numa fila com uma ideia, o microfone embutido no teclado do seu celular já dita em qualquer app de anotações, de graça. Use. Eu não vou te dizer para instalar uma ferramenta de desktop por causa de uma captura de uma linha que você fez no celular.
E para anotações curtas no próprio desktop, os recursos nativos servem. No Windows, tecla Windows + H abre a Digitação por Voz onde quer que seu cursor esteja e pontua sozinho — o detalhe é que ela passa pelos servidores da Microsoft e precisa de internet, então não é offline. No Mac, o Ditado funciona em qualquer campo de texto, configurado nos Ajustes do Sistema em Teclado, e no Apple Silicon textos gerais podem ser processados no próprio dispositivo. Recorra a uma ferramenta que atua em todo o sistema quando os recursos nativos começarem a doer: anotações longas, captura multilíngue, privacidade offline no Windows, ou querer um único atalho que se comporte igual em todo app de anotações que você usa. Abaixo dessa linha, use o que é grátis.
Se a maior parte do seu ditado acaba em um app específico, o passo a passo focado em ditar no Obsidian cobre a mesma lógica de que o cursor é a integração para um único app de markdown local-first.
Leitura complementar
Nenhum app de anotações precisa criar um ótimo botão de microfone, porque o cursor é a integração. Fale na nota, ganhe texto, dê forma com os atalhos que você já conhece. Eu ditei a maior parte deste guia numa caixa de texto, com uma ferramenta que não se importa com qual caixa é, e depois colei tudo nas minhas próprias anotações. A única coisa que ela não fez foi fazer as anotações por mim, o que provavelmente é melhor assim.
Faça sua próxima anotação falando
Segure o atalho, fale, solte. A transcrição cai em qualquer nota onde seu cursor estiver — Notion, Obsidian, Apple Notes, OneNote, texto puro e todos os outros apps também.
Modo local grátis para qualquer conta logada. Sem cartão para começar.



