Guia
Software de ditado para estudantes
O melhor software de ditado para estudantes é aquele que roda de graça no seu próprio notebook e digita em qualquer aplicativo. Aperte um atalho, fale, e as palavras aparecem no Google Docs, no Word ou nas suas anotações. Sem assinatura para começar, funciona offline, no Windows e no Mac.
Última atualização: junho de 2026

O melhor software de ditado para estudantes funciona em todo o sistema: você aperta um atalho, fala, e a transcrição é colada onde está o cursor, seja no Google Docs, no Word, no Notion ou em qualquer aplicativo. Uma ferramenta local como o Whisper roda de graça no próprio notebook do estudante, sem cartão no cadastro, funciona offline e dá conta de redações, anotações de aula e cartões de estudo por voz.
Os estudantes pesquisam por software de ditado e caem num paredão de aplicativos de US$30 por mês, testes grátis que pedem cartão antes de você digitar uma palavra e uma ferramenta que só roda no celular. O que a maioria dessas páginas não diz com todas as letras é que o cursor é a integração. Um documento do Google Docs é uma caixa de texto. Um arquivo do Word também é, assim como uma página do Notion e o aplicativo de flashcards que você usa pra estudar. O ditado que cola onde está o cursor não liga pra qual deles você está usando.
Eu criei o Whisper porque digitar estava devorando noites que eu não tinha. A parte que acabou importando para os estudantes não é uma IA inteligente — é que a versão local é gratuita para qualquer conta logada, sem pedir forma de pagamento no cadastro, e roda totalmente offline. Para quem está com o orçamento apertado de estudante e escreve redações na zona morta do Wi-Fi da biblioteca, essa combinação é a proposta inteira. A configuração leva uns dois minutos e funciona em todo aplicativo que você abrir.
Aqui vai a verdade sem firula sobre ditado para trabalhos da faculdade. Você não precisa de um aplicativo especial para "estudante", e não precisa entregar um cartão para um teste grátis. Você precisa de uma ferramenta que cole onde está o cursor e que não custe nada para começar, porque o cursor já está dentro do que você está escrevendo — um rascunho de redação, um documento de anotações de aula, uma resposta no fórum às 23h.
Então a pergunta de verdade não é "qual aplicativo de ditado para estudantes eu compro". É "qual ferramenta roda por cima dos aplicativos que eu já uso, de graça, sem internet". Vou explicar por que os estudantes recorrem à voz logo de cara, como funciona o atalho, uma configuração de dois minutos, como ela lida com redações versus anotações rápidas, qual modo escolher, o passo de limpeza que conserta as frases emendadas e — a parte honesta — quando outra ferramenta é a escolha certa.
Por que os estudantes recorrem ao ditado logo de cara

O trabalho de verdade a ser feito raramente é "tenho preguiça de digitar". É que falar é mais rápido do que digitar quando você já sabe o que quer dizer. A pessoa média digita cerca de 40 palavras por minuto e fala perto de 145. Para um rascunho de redação de 1.500 palavras, essa é a diferença entre uma tarde inteira e uma pausa para o café. Você ainda edita depois — o ditado coloca a massa bruta na página, ele não esculpe ela pra você. Mas superar a página em branco é a parte em que a maioria dos estudantes trava, e a voz é muito boa em matar a página em branco.
Tem um segundo motivo que não tem nada a ver com velocidade. Alguns estudantes ditam porque digitar por horas literalmente dói — a dor no punho depois de um semestre de redações e relatórios de laboratório é real, e descansar as mãos enquanto continua trabalhando é um ganho de produtividade, não uma questão médica. Outros leem e escrevem com mais conforto por voz do que pelo teclado; se esse é o seu caso, a entrada por voz é um apoio assistivo de verdade, e eu escrevi mais sobre isso em conversão de fala em texto para dislexia — apresentada como uma ferramenta que tira o teclado do caminho, não como algo médico. De qualquer forma, o ganho é o mesmo: continuar trabalhando sem que o teclado seja o gargalo.
E aí tem o motivo do contexto bagunçado, que é o mais subestimado. Você pensa na frase de tópico perfeita enquanto volta de uma aula, está segurando um café, a mochila está pendurada no outro ombro. Você não vai digitar aquilo. Segure um atalho, fale, e está no seu rascunho antes de você esquecer. É esse o cenário de uso que me fez passar de "que demonstração bacana" para "eu uso isso todo dia".
Aperte um atalho, fale, e as palavras caem na sua redação
O funcionamento é entediante no melhor dos sentidos. Você aperta um atalho, fala, solta, e a transcrição é colada onde está o cursor, em qualquer campo de texto que estiver em foco. O Whisper mantém um pequeno respiro depois que você solta a tecla, para que sua última palavra não seja cortada. Como ele cola onde está o cursor do sistema, um parágrafo do Google Docs é só "qualquer caixa de texto" — igual a um documento do Word, uma página do Notion, um cartão do Quizlet ou aquele e-mail para o seu professor que você está empurrando com a barriga.
Essa é a parte que as páginas de US$30 por mês complicam à toa. Não tem extensão de navegador para conectar ao Google Docs, nem complemento para instalar no Word, nem token de API para colar. Seu cursor está na redação, você fala, as palavras aparecem na redação. Uma cápsula pequena aparece enquanto você fala, para você saber que está ouvindo:
O atalho é a única coisa que vale a pena acertar logo no começo. No Windows é Ctrl+Space; no Mac é Command+Option, um modo "aperte e fale" só de modificadores que você segura enquanto fala. Os dois podem ser trocados nas Configurações se conflitarem com algo que você já usa — e num notebook de estudante cheio de um gravador de tela, um aplicativo de música e três extensões de navegador, algo costuma conflitar. (Um usuário inicial me mandou e-mail às 2 da manhã porque o atalho padrão estava travando o software de música dele. Eu lancei um atalho personalizável e voltei pra cama. Agora todo atalho é seu pra mudar.) Se você já configurou ditado no Windows ou no Mac antes, essa é a mesma memória muscular apontada para os seus trabalhos da faculdade.
Configure em dois minutos (Windows ou Mac)
Você precisa de um Mac com Apple Silicon ou um PC com Windows 10 ou mais novo, um microfone funcionando e o que quer que você escreva aberto — Google Docs no navegador, Word, Notion, qualquer coisa. Todo o fluxo local é gratuito para qualquer conta logada, sem pedir forma de pagamento no cadastro, o que pesa mais no orçamento de estudante do que qualquer recurso. Aqui vai a sequência.
Passo 1 — Instale o Whisper e faça login.
Baixe na página de download, instale e crie uma conta gratuita. Sem cartão. Todo o fluxo de transcrição local abre na hora.
Você vai saber que deu certo quando o ícone do aplicativo aparecer na bandeja e o assistente de configuração oferecer escolher um modelo.
Passo 2 — Escolha um caminho de transcrição.
O aplicativo não escolhe por você. Você tem três: Nuvem (OpenAI, use sua própria chave), Parakeet local ou Whisper local. Para trabalhos da faculdade com orçamento apertado, comece pelo local — mais sobre qual escolher duas seções abaixo.
Você vai saber que deu certo quando um modelo terminar de baixar e aparecer como pronto.
Passo 3 — Confirme seu atalho.
O Windows usa Ctrl+Space por padrão, o Mac usa Command+Option segurado como "aperte e fale". No Mac, conceda a permissão de Acessibilidade quando for solicitado; sem ela, a colagem onde está o cursor não consegue alcançar outros aplicativos.
Você vai saber que deu certo quando uma gravação de teste for colada em qualquer campo de texto.
Passo 4 — Coloque o cursor na sua redação e fale.
Abra seu documento do Google Docs ou arquivo do Word, clique onde quer escrever, segure o atalho, diga uma frase, solte. A transcrição aparece onde está o cursor.
Você vai saber que deu certo quando sua frase falada estiver no documento, em forma de texto.
A parte lenta é o download do modelo, não a configuração. Todo o resto são os quatro passos acima. Num MacBook Air M1 com o modelo pequeno de inglês rodando localmente, o intervalo entre soltar a tecla e o texto aparecer no seu documento é de cerca de 1,4 segundo. Depois que está rodando, escrever um parágrafo deixa de ser uma tarefa de digitação e vira uma tarefa de fala.
Redações, anotações de aula e cartões de estudo por voz
As três coisas que os estudantes realmente escrevem se dividem com clareza pela forma como você deve usar a voz em cada uma. As redações são o ganho óbvio. Dite um primeiro rascunho bagunçado rápido — diga o argumento em voz alta do jeito que você explicaria para um colega, coloque todas as 1.500 palavras no papel e depois volte e edite com o teclado. A voz é para o rascunho, o teclado é para o acabamento. Tentar ditar um parágrafo final perfeitamente formatado de primeira é como você acaba frustrado; ninguém fala em prosa impecável, e tudo bem.
Anotações de aula são diferentes. A versão honesta: ditar suas próprias anotações de memória logo depois de uma aula funciona lindamente — você resume enquanto está fresco, com as mãos livres, andando até o próximo prédio. Mas gravar a aula em si para transcrever depois é um trabalho totalmente diferente, e uma ferramenta de ditado é a ferramenta errada para isso. Eu falo sobre isso na seção "quando pular", porque fingir o contrário desperdiçaria a sua tarde. Para as anotações que você mesmo escreve, a voz é mais rápida do que rabiscar e o texto fica pesquisável no instante em que aparece.
O material de estudo — flashcards, folhas-resumo, esquemas de preparação para prova — é onde o truque de colar onde está o cursor brilha sem alarde. Seu cursor vai na caixa de resposta do aplicativo de flashcards, você diz a definição, ela aparece, você passa para o próximo cartão. Se você estuda matérias técnicas com termos que um modelo de fala talvez não conheça, o caminho do Whisper local oferece vocabulário personalizado e priorização de palavras-chave, para que "mitocôndria" ou "Heisenberg" saiam escritos certo em vez de foneticamente. Dite o conteúdo, formate os cartões com as teclas que você já usa — a voz pega as palavras, seu teclado pega a estrutura.
Local ou nuvem: qual modo para o orçamento de estudante
Para trabalhos da faculdade, comece pelo modo local, e não só pela privacidade. O local é gratuito para qualquer conta logada, roda totalmente offline e não pede cartão — que é exatamente o formato que o orçamento de estudante quer. O Wi-Fi da biblioteca cair não te impede de rascunhar uma redação. Veja como os três caminhos se diferenciam, porque o aplicativo faz você escolher e eu prefiro que você escolha bem.
O aplicativo não escolhe por você. Três opções honestas:
- Parakeet local — o motor TDT da NVIDIA, cerca de 600 MB, e a opção local mais rápida — de 5 a 10 vezes mais rápida que o Whisper na CPU. Cobre inglês mais 24 outros idiomas europeus, 25 no total. Sem tradução para o inglês. Se você escreve suas redações em inglês ou em outro idioma europeu, essa é a escolha rápida, totalmente offline e gratuita — e a que eu indicaria para começar um estudante.
- Whisper local — mais lento que o Parakeet no mesmo notebook, mas as versões multilíngues cobrem 99 idiomas e podem traduzir para o inglês. As versões só de inglês são só de inglês, não 99. Escolha este para chinês, japonês, coreano, qualquer trabalho de tradução, ou quando você precisa de vocabulário personalizado para o jargão da matéria. O modelo padrão de inglês tem cerca de 480 MB.
- Nuvem (OpenAI, BYOK) — melhor precisão e acesso à web ao vivo, usando sua própria chave da OpenAI cobrada diretamente pela OpenAI em frações de centavo por minuto. Precisa de internet, então é o único caminho que sai da sua máquina. A superfície de Nuvem faz parte do Whisper Pro — o nível local acima continua gratuito.
A verdade sem firula é que, para redações e anotações, o local já dá conta de sobra. Os dois motores locais rodam totalmente na sua máquina, sem nada enviado para um servidor, o que numa rede compartilhada de alojamento é um recurso, não uma nota de rodapé. A nuvem ganha o seu lugar quando você quer precisão de primeira linha numa gravação difícil ou precisa que o modelo puxe um dado da web no meio da frase. Para o dia a dia dos trabalhos da faculdade, comece pelo local e só recorra à nuvem quando o local te deixar querendo mais.
Transformando um rascunho falado em texto limpo
O ditado bruto sai como uma frase emendada, e isso pega os usuários de primeira viagem de surpresa. Você diz "ok então o argumento principal é que a política falhou porque ãã ignorou o contexto local e aí o segundo ponto é financiamento", e esse é o paredão sem pontuação que qualquer motor de fala te entrega. Limpar isso é onde os modos divergem.
A Digitação por Voz do Windows adiciona pontuação enquanto você fala, e o Ditado do macOS dá conta do básico quando você diz "vírgula" ou "ponto". Para uma limpeza mais pesada — tirar os "ãã", consertar as frases emendadas, transformar um parágrafo falado em algo que você realmente entregaria — o Whisper pode rodar um passo de IA. Diga a frase de ativação "Hey whisper" e o texto é aprimorado antes de aparecer. Num modelo local, ele roda pelo Ollama, gratuito e offline; no modo nuvem, é o gpt-5-mini por padrão.
ok então o argumento principal é que a política falhou porque ãã ignorou o contexto local e aí o segundo ponto é sobre o financiamento ter sido cortado
O argumento principal é que a política falhou porque ignorou o contexto local. O segundo ponto é sobre o financiamento ter sido cortado.
Uma ressalva honesta, porque é um contexto acadêmico: a limpeza com IA arruma a pontuação e os vícios de linguagem — ela não escreve a sua redação nem inventa citações. É a diferença entre um corretor ortográfico e um ghostwriter, e ela fica firme do lado do corretor ortográfico nessa linha. O argumento, as evidências, o raciocínio — esses são seus. A ferramenta só te impede de entregar uma frase de 200 palavras sem nenhuma vírgula. Use-a para colocar suas próprias palavras no papel de forma limpa e rápida.
Esse mesmo fluxo de falar-e-depois-limpar compensa muito além das suas redações — você também pode digitar mais rápido com a voz em todos os aplicativos para que um post longo de fórum ou um documento de trabalho em grupo vire algumas frases faladas em vez de um parágrafo que você digita inteiro.
Quando pular uma ferramenta de ditado

Às vezes uma ferramenta de ditado é a resposta errada, e fingir o contrário seria desonesto. A maior delas para estudantes: gravar uma aula inteira de 90 minutos para transcrever depois é um trabalho diferente. Uma ferramenta de ditado ao vivo digita o que você diz na hora em que diz — ela não foi feita para engolir um arquivo de áudio de uma hora e cuspir uma transcrição depois. Para isso, você quer um serviço de gravação e transcrição feito para a tarefa. Não tente fazer uma ferramenta de colar onde está o cursor fazer isso; você vai brigar com ela o tempo todo.
A outra situação para pular é a captura rápida no celular. O Whisper roda só no Windows e no macOS — não tem aplicativo de celular, de propósito. Se você está no ponto de ônibus e quer jogar uma ideia de uma linha nas suas anotações, o teclado do seu celular já tem um botão de microfone que dita em qualquer campo. Use-o. É grátis, já está ali, e instalar um aplicativo de desktop para um lembrete de uma linha que você vai digitar no celular é bobagem. Para rajadas bem curtas no seu notebook, os recursos nativos também te cobrem: a tecla Windows + H abre a Digitação por Voz onde quer que esteja seu cursor (ela precisa de internet, então não é offline), e o Ditado do macOS deixa você falar texto em qualquer lugar onde dá pra digitar, processado no próprio dispositivo no Apple Silicon.
Recorra a uma ferramenta dedicada, gratuita e offline quando os recursos nativos começarem a doer: rascunhos longos de redação, trabalhos da faculdade em vários idiomas, ditar no trem sem sinal, ou querer um atalho só que se comporte igual no Google Docs, no Word e no seu e-mail. Abaixo dessa régua, use o que é grátis e já está na sua máquina. Eu não vou te dizer para instalar um aplicativo por um lembrete de uma linha que você digitaria no celular.
Se a maior parte da sua escrita acontece no editor do Google, o funcionamento é o mesmo, mas merece o próprio passo a passo — ditar no Google Docs cobre o truque do cursor-é-a-integração no único aplicativo em que a maioria dos estudantes vive.
Não existe um aplicativo de ditado especial para estudantes, e tenho quase certeza de que nunca vai precisar existir. O cursor é a integração. Fale dentro da redação, ganhe texto, edite com as teclas que você já conhece — e não pague uma mensalidade para começar. Minha filha mais nova ditou um e-mail de 90 palavras para a avó dela na primeira vez que experimentou, sem perguntas depois da demonstração. Se uma criança de sete anos consegue rascunhar por voz entre uma queda de dente e outra, um estudante mal-dormido à 1 da manhã consegue rascunhar uma redação. Eu ditei a maior parte deste guia numa caixa de texto que não era um processador de texto e depois colei tudo onde precisava ir. É esse o truque inteiro.
Experimente no seu próximo rascunho de redação
Segure o atalho, fale, solte. A transcrição cai no documento em que está o seu cursor — Google Docs, Word ou suas anotações — e em todos os outros aplicativos também.
Modo local gratuito para qualquer conta logada. Sem cartão para começar.



