Guia
Voz para texto no Joplin
O aplicativo de desktop do Joplin não tem ditado embutido — a digitação por voz dele é um recurso exclusivo do Android. A solução é uma ferramenta que funciona em todo o sistema: aperte um atalho, fale, e a transcrição é colada na posição do cursor em qualquer nota do Joplin. O ditado do seu próprio sistema operacional também funciona, para capturas curtas.
Última atualização: junho de 2026

Voz para texto no Joplin no desktop funciona por meio de uma ferramenta que abrange todo o sistema, não pelo próprio Joplin. A digitação por voz embutida do Joplin é um recurso exclusivo do Android; o aplicativo de desktop não tem nenhuma. A solução é uma ferramenta como o Whisper: aperte um atalho, fale, e a transcrição é colada na posição do cursor em qualquer nota do Joplin. O ditado do sistema operacional também funciona, para notas curtas.
Eu guardo minhas notas no Joplin porque confio mais em uma pasta de markdown puro que sincroniza com um armazenamento que eu controlo do que na nuvem de outra pessoa. A única coisa que eu vivia procurando era um jeito de falar com uma nota em vez de digitá-la. Então fui caçar a opção no meu notebook. Não existe opção nenhuma. O aplicativo de desktop do Joplin não tem botão de microfone, e depois de fuçar bastante tenho certeza de que ele não está escondendo nenhum.
Aqui está a parte que confunde as pessoas. O Joplin tem, sim, digitação por voz embutida — só que no Android. A própria documentação dos desenvolvedores diz isso com todas as letras. As pessoas ouvem "o Joplin tem digitação por voz", vão procurar no desktop, não acham nada e concluem que deixaram passar algum botão. Não deixaram. O botão está no celular. A boa notícia: a solução no desktop leva cerca de dois minutos, roda totalmente offline se você quiser e, de quebra, funciona em todos os outros aplicativos que você abrir.
Aqui está o que a maioria das páginas que ficam rodeando essa palavra-chave não diz com clareza. Uma nota do Joplin é só uma caixa de texto markdown, igual ao Gmail ou a uma barra de busca. O ditado que cola na posição do cursor não se importa em qual aplicativo o cursor está.
Então a pergunta de verdade não é "como ativo a digitação por voz no Joplin no meu notebook". Não há nenhum botão no desktop. A pergunta é "qual ferramenta de ditado eu rodo por cima do Joplin", e a resposta depende de você querer algo gratuito e embutido, no nível do sistema operacional, ou um único atalho offline que se comporta igual em todo lugar. Vou percorrer tudo isso, configurar um em dois minutos e dizer quando pular o caminho da ferramenta dedicada.
O Joplin tem ditado embutido?

No desktop, não. O aplicativo de desktop do Joplin para Windows, Mac e Linux não tem nenhum recurso embutido de fala para texto, ditado ou digitação por voz para escrever em uma nota falando. Não há botão de microfone, comando de voz nem preferência escondida. Se você andou vasculhando as Configurações atrás disso, pode parar. Não está lá.
O que existe — e é aqui que todo mundo se perde — é a digitação por voz no aplicativo Android do Joplin. A própria documentação dos desenvolvedores do Joplin afirma isso diretamente: o aplicativo móvel para Android suporta digitação por voz embutida e offline, por padrão através do Whisper. A equipe colocou trabalho de verdade nisso, adicionando pontuação automática e um glossário personalizado. É um recurso genuinamente bom. Só que ele vive no celular. Confundir "o Joplin tem digitação por voz" com "o Joplin tem digitação por voz no meu notebook" custa uma tarde, e eu prefiro que você pule essa tarde.
Então o cenário no celular está resolvido: no Android você tem isso embutido, no iPhone você se apoiaria no microfone do teclado e, de qualquer forma, é um recurso de celular. Na nota no desktop, onde a maioria das pessoas de fato vive, você precisa de uma ferramenta que fique por cima do Joplin. Há alguns caminhos honestos, e o resto deste guia os cobre.
Aperte um atalho, fale, o texto cai na nota
É essa toda a mecânica, e ela é entediante no melhor sentido. Você aperta um atalho, fala, solta, e a transcrição é colada na posição do cursor, em qualquer campo de texto que esteja em foco. O Whisper segura um pequeno trecho depois que você solta a tecla, para que sua última palavra não fique cortada. Como ele cola na posição do cursor do sistema operacional, uma nota do Joplin é só "qualquer caixa de texto". Editor markdown, editor de texto formatado, a barra de busca — mesmo comportamento.
Essa é a parte que as páginas de captação complicam demais. Não há plugin para instalar no Joplin, nenhum token de API para colar, nenhuma rotina de sincronização para ficar vigiando. Seu cursor está em uma nota, você fala, as palavras aparecem na nota. Uma pequena cápsula surge enquanto você fala, para você saber que ele está ouvindo:
O atalho é a única coisa que vale a pena acertar logo de cara. No Windows é Ctrl+Space; no Mac é Command+Option, um apertar-para-falar só com modificador que você segura enquanto fala. Os dois podem ser mudados nas Configurações se entrarem em conflito com algo que você já usa. (Minha filha mais nova uma vez me disse que um atalho "não funcionava" no aplicativo de desenho dela. Era um conflito, não um bug, e foi assim que aprendi que a pessoa comum não faz a menor ideia do que é um conflito de atalho. Por isso agora todo atalho é personalizável.) Se você já configurou ditado no Mac, essa é a mesma memória muscular apontada para outro aplicativo.
Configure em dois minutos (Windows ou Mac)
Você precisa de um Mac com Apple Silicon ou de um PC com Windows 10 ou mais recente, um microfone funcionando e o Joplin aberto no seu desktop. Todo o pipeline local é gratuito para qualquer conta logada, sem pedir nenhuma forma de pagamento no cadastro. Aqui está a sequência.
Passo 1 — Instale o Whisper e faça login.
Baixe pela página de download, instale e crie uma conta gratuita. Sem cartão. Todo o pipeline de transcrição local abre na hora.
Você saberá que deu certo quando o ícone do aplicativo aparecer na bandeja e o assistente de configuração oferecer a escolha de um modelo.
Passo 2 — Escolha um caminho de transcrição.
O aplicativo não escolhe por você. Você tem três: Nuvem (OpenAI, com sua própria chave), Parakeet Local ou Whisper Local. Para notas privadas que você guarda em markdown puro, comece pelo local — falo mais sobre isso duas seções abaixo.
Você saberá que deu certo quando um modelo terminar de baixar e aparecer como pronto.
Passo 3 — Confirme seu atalho.
O padrão no Windows é Ctrl+Space, e no Mac é Command+Option segurado como apertar-para-falar. No Mac, conceda a permissão de Acessibilidade quando solicitado; sem ela, a colagem na posição do cursor não consegue alcançar outros aplicativos.
Você saberá que deu certo quando uma gravação de teste for colada em qualquer campo de texto.
Passo 4 — Coloque o cursor em uma nota do Joplin e fale.
Abra o Joplin, clique no corpo de uma nota, segure o atalho, diga uma frase e solte. A transcrição aparece onde o cursor está, na nota.
Você saberá que deu certo quando sua frase falada estiver na nota do Joplin como texto.
A parte demorada é o download do modelo, não a configuração. Todo o resto são os quatro passos acima. Quando ele está rodando, o ato de capturar uma ideia em uma nota deixa de ser uma tarefa de digitação e passa a ser uma tarefa de fala.
Desktop x celular: onde a digitação por voz do Joplin realmente vive
Vale a pena fixar isso, porque é a origem de quase toda pergunta do tipo "por que não consigo achar". A digitação por voz embutida do Joplin é um recurso do Android. A documentação é explícita: o aplicativo Android faz digitação por voz offline através do Whisper, com pontuação e glossário. No aplicativo de desktop, esse recurso não existe. Mesmo produto, mesmas notas, duas capacidades muito diferentes dependendo do dispositivo que você abriu.
Então, se você captura a maior parte no celular, talvez não precise de nada a mais — a digitação por voz do Android está bem ali no editor de notas. A lacuna é o notebook, onde acontece a maior parte da escrita mais longa e onde o Joplin não te dá nada. Um atalho que abrange todo o sistema fecha essa lacuna. Ele cola na posição do cursor do sistema operacional, independentemente de qual janela seja a dona dele, então a mesma tecla que preenche uma nota do Joplin também preenche sua caixa de redação do Gmail, uma mensagem do Slack e uma mensagem de commit. Uma ferramenta, todos os campos de texto, no Windows e no Mac.
Há também uma arrumação em manter o mesmo fluxo entre dispositivos. No celular você usa a digitação por voz do próprio Joplin; no desktop você usa o atalho. Os dois colocam palavras na mesma nota markdown. Você não reaprende nada quando troca de máquina, e a ferramenta de desktop não se importa que seja o Joplin especificamente — o que significa que ela também cobre todos os outros programas em que você escreve. Eu pegaria o atalho único porque troco de aplicativo umas quarenta vezes por hora e não quero ter quarenta botões de ditado diferentes para lembrar.
Local ou nuvem: qual modo para um cofre privado
Para o Joplin, experimente primeiro o modo local. A razão pela qual muitos de nós escolhemos o Joplin é que ele é markdown puro local-first que você sincroniza com um armazenamento que você controla — um resumo de reunião, uma ideia mal formada, uma entrada de diário que você jamais quereria no servidor de outra pessoa. Seria uma escolha estranha guardar suas notas em uma pasta que é sua e depois rotear sua voz por uma nuvem para chegar lá. Se o seu Mac for Apple Silicon ou o seu PC for dos últimos anos, o local dá conta do ditado do dia a dia sem reclamar, e a nuvem vira a saída de emergência em vez do padrão.
Veja como os três caminhos diferem, porque o aplicativo faz você escolher e eu prefiro que você escolha bem:
- Parakeet Local — O motor TDT da NVIDIA, em torno de 600 MB, e a opção local mais rápida — de 5 a 10 vezes mais rápido que o Whisper na CPU. Cobre o inglês mais outros 24 idiomas europeus, 25 no total. Sem tradução para o inglês. Se você escreve notas em inglês ou em outro idioma europeu, essa é a escolha rápida e totalmente offline.
- Whisper Local — mais lento que o Parakeet na mesma máquina, mas as versões multilíngues cobrem 99 idiomas e podem traduzir para o inglês. As versões só de inglês são só de inglês, não 99. Escolha esta para chinês, japonês, coreano ou qualquer trabalho de tradução, que o Parakeet não faz. O modelo padrão em inglês tem cerca de 480 MB.
- Nuvem (OpenAI, BYOK) — melhor precisão e acesso à web, usando sua própria chave da OpenAI cobrada diretamente pela OpenAI. A transcrição roda no gpt-4o-mini-transcribe por padrão. Precisa de internet, então é o único caminho que sai da sua máquina. A superfície da Nuvem faz parte do Whisper Pro.
A verdade entediante é que, para o tipo de texto que a maioria das pessoas coloca no Joplin, o local já basta. Os dois motores locais rodam inteiramente na sua máquina, sem nada enviado a um servidor, o que combina com o espírito de um aplicativo de notas que você escolheu justamente porque os dados continuam sendo seus. Também se alinha com a própria digitação por voz do Joplin no Android, que a equipe manteve totalmente offline pelo mesmo motivo. A nuvem conquista seu lugar quando você quer precisão de primeira linha em uma gravação difícil ou precisa que o modelo busque um fato na web no meio de uma frase. Para o hábito de notas diárias, comece pelo local e só recorra à nuvem quando o local deixar você na mão.
Pontuação, markdown e limpeza por voz
O ditado bruto sai como um texto emendado. Você fala "ok então escreve a nota da revisão de arquitetura marca como projeto alfa e me lembra na quinta", e essa é a parede sem pontuação que qualquer motor de fala te entrega. Limpar isso é onde os caminhos divergem.
A Digitação por Voz do Windows adiciona pontuação enquanto você fala, e o Ditado do macOS lida com a pontuação básica quando você diz "vírgula" ou "ponto". Para uma limpeza mais pesada — tirar os "ééés", consertar as frases emendadas, transformar um parágrafo falado em algo que você de fato guardaria em uma nota — o Whisper pode fazer uma passagem de IA. Diga a frase de ativação "Hey whisper" e o texto é aprimorado antes de cair. Em um modelo local isso roda através do Ollama; no modo nuvem é o gpt-5-mini por padrão.
ok então escreve a nota da revisão de arquitetura marca como projeto alfa e me lembra na quinta é antes do standup
Ok, então escreve a nota da revisão de arquitetura, marca como Projeto Alfa e me lembra na quinta, antes do standup.
Para o markdown do próprio Joplin — títulos, listas com marcadores, caixas de seleção, os links internos [[nota]] — a resposta honesta é que a voz te dá o texto e os atalhos de markdown do Joplin te dão a estrutura. Dite a frase e depois digite o # para um título, o - para um marcador ou - [ ] para uma caixa de seleção, do jeito que você sempre faz. Nenhuma ferramenta de ditado conjura a sintaxe markdown do nada sob comando; quem promete "diga título projeto alfa e veja formatar" está te vendendo uma demonstração, não um dia comum. Ponha as palavras no papel rápido pela voz e modele o markdown com as teclas que você já conhece.
Esse mesmo fluxo de falar-e-depois-limpar compensa muito além das suas notas — você também pode ditar uma prosa limpa em qualquer aplicativo com o atalho único, então uma nota longa vira algumas frases faladas em vez de um parágrafo que você digita.
Quando pular uma ferramenta de ditado para o Joplin

Às vezes a ferramenta certa é a gratuita que já está na sua máquina, e fingir o contrário seria desonesto. Se você só joga capturas curtas no Joplin — uma linha rápida, um lembrete de duas palavras — e está no celular, a própria digitação por voz do Android do Joplin já cobre isso de graça. No desktop, seu sistema operacional faz o mesmo.
No Windows, aperte tecla Windows + H e a barra de Digitação por Voz embutida abre onde quer que seu cursor esteja, incluindo uma nota do Joplin. Ela pontua sozinha e dá conta de rajadas curtas. O porém: ela passa pelos servidores da Microsoft e precisa de conexão com a internet, então não é uma opção offline, o que importa mais que o normal quando todo o sentido das suas notas é continuarem locais. No Mac, o Ditado permite que você fale para inserir texto em qualquer lugar onde você possa digitar, configurado em Ajustes do Sistema, em Teclado, e no Apple Silicon o texto geral pode ser processado no dispositivo.
Recorra a uma ferramenta dedicada que abrange todo o sistema quando os recursos embutidos começarem a doer: notas longas, trabalho multilíngue, privacidade offline no Windows ou a vontade de ter um único atalho que se comporta igual no Joplin, no seu e-mail e no seu editor. Abaixo dessa linha, use o que é gratuito — o sistema operacional no desktop, a própria digitação por voz do Joplin no Android. Eu não vou te dizer para instalar um aplicativo por causa de um lembrete de uma linha.
O mesmo trade-off aparece se você também mantém notas em outro lugar — a lógica em ditar no Obsidian é idêntica, porque ambos são aplicativos de markdown local-first onde o cursor, não um plugin, é a integração de verdade.
Leitura complementar
O Joplin lançou um botão de microfone — no Android, não no meu notebook, e depois de escrever isto duvido que o do desktop chegue tão cedo. Nem precisa, porque no desktop o cursor é a integração. Fale com a nota, receba o texto, modele com os atalhos de markdown que você já conhece. Eu ditei a maior parte deste guia em uma caixa de texto que não era o Joplin, com uma ferramenta que não se importa com qual caixa é, e depois colei tudo na minha própria nota. É esse o truque inteiro.
Experimente na sua próxima nota do Joplin
Segure o atalho, fale, solte. A transcrição cai em qualquer nota onde estiver o seu cursor — e em todos os outros aplicativos também.
Modo local gratuito para qualquer conta logada. Não é preciso cartão para começar.



