Por Denys Medvediev

Guia

O moderno app de ditado

Um app de ditado transforma palavras faladas em texto digitado. No desktop, os bons fazem isso em tempo real: você pressiona um atalho, fala, e as palavras aparecem onde o cursor está piscando, no app que já estiver aberto. Sem upload, sem copiar e colar, sem janela separada. Você fala, o texto aparece.

Última atualização: junho de 2026

Um microfone condensador, laptop e fone de ouvido sobre uma mesa branca limpa, evocando ditado de voz no desktop

Um app de ditado converte fala em texto no cursor. Este guia explica como funciona o mecanismo de pressionar o atalho, falar e colar, as ferramentas de ditado gratuitas que já vêm com seu sistema operacional, quando um app dedicado justifica seu espaço, um tour honesto dos principais apps e quando você não precisa de um app dedicado.

É isso: toda a categoria em uma frase. O restante deste artigo é a parte que ninguém conta. Como funciona de verdade, por que a ferramenta de ditado já embutida no seu computador às vezes é tudo que você precisa e como um app dedicado ganha seu espaço quando o nativo deixa de ser suficiente.

Preciso ser transparente: eu desenvolvo um desses apps. Chama-se Whisper by Remskill, e vou ser honesto sobre onde ele se encaixa e onde não se encaixa — incluindo a parte em que digo para você usar a opção gratuita que já vem com seu sistema operacional.

Vamos ao que interessa.

Pressione um atalho, fale, e as palavras aparecem no cursor

Esse é o mecanismo que define um app de ditado para desktop. Você pressiona uma tecla — Ctrl+Space no Windows por padrão, um atalho push-to-talk personalizável. Fala uma frase. Solta a tecla. Um segundo depois, o texto aparece exatamente onde o cursor estava piscando.

Pasted
O overlay exibido assim que o ditado termina: a fala é transcrita e inserida no cursor do app que estava em foco.

A parte "no cursor, em qualquer app" é o que separa um verdadeiro app de ditado de um site de transcrição. Uma ferramenta de transcrição recebe um arquivo gravado e devolve um bloco de texto que você precisa copiar para outro lugar. Um app de ditado elimina o arquivo por completo. Você digita direto no app que já estava usando. É a diferença entre ditar uma carta e transcrever uma gravação de si mesmo lendo uma.

A velocidade importa mais do que as pessoas esperam. Digitar rende cerca de 40 palavras por minuto para a maioria das pessoas. Falar rende cerca de 145. Isso é aproximadamente três vezes e meia mais rápido — e é por isso que uma ferramenta que você aciona por um segundo pode economizar um bom pedaço da sua tarde. A caixa de e-mails acumulada, as anotações de reunião, as doze variações de cold email antes do almoço.

Seu computador já tem um, e às vezes isso basta

Antes de instalar qualquer coisa, saiba que você quase certamente já tem uma ferramenta de ditado. Os dois principais sistemas operacionais incluem uma gratuitamente.

No Windows 11, você pressiona a tecla Windows + H e aparece uma barra de digitação por voz. Funciona, mas com um porém: usa reconhecimento de fala online via Azure, então precisa de conexão com a internet para funcionar. Sem conexão, sem ditado. Ela pode inserir pontuação automaticamente se você ativar essa opção.

No Mac, o Apple Dictation fica nas Configurações do Sistema, em Teclado, e é ativado com a tecla do microfone ou um atalho de sua escolha. A versão da Apple pode rodar inteiramente no dispositivo depois que você baixa o modelo de fala, ou seja, funciona offline e sua voz não sai da máquina. Suporta dezenas de idiomas — a Apple lista 54 online e 43 disponíveis offline na página de disponibilidade de recursos. O que ela não oferece é vocabulário personalizado, ajuste de texto por IA ou a possibilidade de escolher qual modelo de transcrição usar.

A verdade simples é que, para ditados curtos e casuais — uma mensagem de 30 palavras, uma busca rápida, uma resposta de uma linha —, a ferramenta nativa funciona muito bem. É gratuita, já está lá, e você não precisa de um quarto ícone na barra de menus para mandar mensagem pra sua mãe. Se é só isso que você faz, feche esta aba e vá pressionar Win+H ou a tecla de ditado do seu Mac. Falo sério.

Se você também dita em celular ou tablet, qual app de digitação por voz se encaixa em cada dispositivo percorre a escolha plataforma por plataforma.

Quando um app de ditado dedicado justifica seu lugar

Então quando o nativo deixa de ser suficiente? Em geral, três situações. A primeira é privacidade offline de verdade. A digitação por voz do Windows precisa da nuvem. Um app dedicado pode rodar tudo no seu próprio CPU, então o e-mail para a escola do seu filho ou o contrato que você está redigindo nunca viaja por servidor algum. A segunda é precisão e controle: escolher um modelo maior, adicionar palavras que o sistema insiste em errar, ter o texto ajustado automaticamente. A terceira é algo que os nativos ignoram silenciosamente: funcionar da mesma forma em todo app, sempre, sem surpresas.

É exatamente aí que o Whisper by Remskill se encaixa. É um app de desktop para Windows e macOS em Apple Silicon. Todo o pipeline local é gratuito para qualquer pessoa que faz login — sem cartão no cadastro. Isso inclui os motores de transcrição local, ajuste por IA, histórico, palavras personalizadas e o registro de até três dispositivos.

Whisper
Whisper by Remskill rodando localmente — o mesmo atalho, overlay e configurações, seja você offline num modelo local gratuito ou usando a superfície opcional de nuvem.

Quanto ao motor, você não recebe um padrão e fica com ele. Você escolhe. O Parakeet local é a opção mais rápida: cerca de 600 MB, de 5 a 10 vezes mais rápido que o Whisper num CPU, com suporte a inglês mais 24 outros idiomas europeus. O Whisper local é mais lento, mas suporta 99 idiomas, pode traduzir fala para o inglês e oferece vocabulário personalizado e controle mais refinado; o maior modelo tem cerca de 3 GB. E se você quiser os últimos modelos de nuvem da OpenAI com respostas da web em tempo real, existe uma superfície Pro de nuvem opcional em que você usa sua própria chave de API e a Remskill não fica com nada. Três caminhos — você escolhe com base no que importa mais para você: velocidade, idiomas ou qualidade de ponta na nuvem.

A opinião honesta: a maioria dos apps de "ditado com IA" cobra mais pelo serviço do que pelo modelo

Aqui está minha opinião mais firme, e vou sustentá-la com um número. Muitos dos apps de ditado lançados nos últimos dois anos são a mesma coisa por baixo: um modelo de fala que você poderia rodar sozinho, uma interface bonita por cima e uma fatura mensal que tem muito pouco a ver com o custo de processamento. A tarifa que a maioria cobra chega a trinta dólares por mês nos mais caros.

O discurso de venda diz "movido por IA." O meu pedido de financiamento imobiliário também. A frase perdeu qualquer significado. O que você está pagando de verdade, num app só de nuvem, é pela conveniência de outra empresa rodar um modelo por você — mais o custo de privacidade do seu áudio sair do seu laptop para isso acontecer. Se o trabalho é sensível, isso não é conveniência, é um risco.

Esse é o motivo pelo qual insisto que o local gratuito deve ser o piso, não o upgrade. Seu laptop tem microfone e CPU. Para um parágrafo de ditado, ele não precisa de servidor algum no caminho.

Um tour rápido e honesto pelos outros apps de ditado

Você deve conhecer o cenário antes de escolher. Aqui estão os que merecem ser mencionados, uma linha cada, mérito onde ele existe.

superwhispermaduro e multiplataforma (Mac, Windows, iOS), faz ditado ao vivo e transcrição de arquivos, funciona offline com modelos locais. Uma opção genuinamente sólida; se você já é um usuário pagante satisfeito, não há motivo para trocar.

Apple Dictationgratuito, integrado ao macOS, roda no dispositivo e offline depois que o modelo é baixado. Sem vocabulário personalizado e sem ajuste por IA, mas para trechos curtos é tudo que a maioria das pessoas precisa.

Windows Voice Typing (Win+H)gratuito, integrado ao Windows 11, abre com Win+H, mas exige conexão com o Azure. Funciona bem quando você está online; inútil num avião.

Dragon (Nuance)o veterano da categoria, hoje um produto profissional exclusivo para Windows (Dragon Professional v16) vendido mediante consulta de preço. Ainda lidera em comandos de voz mãos-livres e afirma até 99% de precisão. Se você precisa controlar o computador inteiro por voz, ele está numa categoria à parte.

Wispr Flowelegante, na nuvem e cobrado na faixa de uns trinta dólares por mês da qual acabei de reclamar. Boa página de marketing.

Deixei alguns de fora. O objetivo não é memorizar uma lista. É entender que "app de ditado" é um termo amplo que cobre ferramentas nativas gratuitas, projetos de código aberto, assinaturas bem acabadas e suítes corporativas de comando por voz. Escolha pelo que você realmente faz, não pela home de quem você viu primeiro.

Por que "pressione uma tecla" é mais difícil do que parece

Uma história curta, porque ela explica por que me importo com os detalhes chatos. Num sábado, instalei o app para a minha filha caçula, que tem sete anos. Uma demonstração: pressiona, fala, solta, cola. Ela escreveu um e-mail de 90 palavras para a avó sobre um dente que caiu, a taxa de câmbio da fada dos dentes e a aula de dança — sem fazer uma única pergunta.

Dois dias depois ela voltou: "o atalho não funciona no meu app de desenho." A pessoa média não sabe o que é um conflito de atalho. Ela só sabe que parou de funcionar. Naquela noite eu lancei as configurações de atalho personalizável. Um app de ditado vive ou morre nos pequenos detalhes: o conflito que você não previu, o fantasma de soltura de tecla no Windows que certa vez fez meu handler disparar seis vezes por toque e me custou vários dias e um debounce de 300ms para resolver. Tenho mestrado. O debounce ainda me deu uma lição de humildade.

Quando você não precisa de um app de ditado

Essa é a parte que a maioria dos artigos pula — então aqui vai, sem rodeios. Você não precisa de um app de ditado dedicado se algum destes for verdade.

  • Você só dita coisas curtas e casuais. Mensagens, buscas, uma resposta de uma linha aqui e ali. A ferramenta nativa resolve de graça.
  • Você está sempre online e nunca lida com nada sensível. Nesse caso, as ferramentas nativas de nuvem ou um app pago só de nuvem são suficientes; você não ganha muita coisa com o local.
  • Você só dita dentro de um único lugar, como uma aba do navegador. Uma extensão de navegador resolve sem precisar de um app em todo o sistema. O Voice In, por exemplo, é uma extensão do Chrome que funciona apenas dentro do navegador.
  • Você quer controlar o computador inteiro com a voz, não apenas digitar texto. Isso é território de comandos de voz, e o Dragon faz isso melhor do que qualquer ferramenta focada em ditado.

Um app dedicado começa a valer a pena para ditados mais longos, mais frequentes, mais privados e mais multilíngues — grosso modo, quando você está ditando parágrafos de verdade todo dia e prefere que eles não saiam da sua máquina. Abaixo dessa linha, poupe seu dinheiro. Para uma comparação mais completa das opções gratuitas, há um guia de softwares de ditado gratuitos, um olhar mais amplo sobre software de digitação por voz, e se você chegou aqui a partir de um app específico, o comparativo de alternativas ao superwhisper vale a leitura.

Se você só vai lembrar de uma coisa

Um app de ditado é simplesmente "pressione uma tecla, fale, as palavras aparecem onde você está digitando". O nativo do seu computador já faz a versão básica de graça. Um app dedicado vale a pena quando você precisa de privacidade offline, precisão multilíngue real ou o mesmo comportamento em todos os apps — e não vale a pena quando você não precisa disso.

Whisper by Remskill mantém todo o pipeline local gratuito exatamente por esse motivo: você deve conseguir descobrir onde está o seu limite sem precisar pagar primeiro. Os preços do tier Pro de nuvem opcional ficam na página de preços. Minha filha de sete anos descobriu o limite dela num sábado. Você provavelmente vai ser mais rápido.

Experimente ditar seu próximo parágrafo em vez de digitá-lo

Baixe o Whisper by Remskill, crie uma conta sem precisar de cartão, pressione o atalho e fale. Todo o pipeline local é gratuito, então você descobre onde está o seu limite antes de pagar qualquer coisa.

Ditado local gratuito, sem cartão no cadastro.

Foto de Denys Medvediev

Denys Medvediev

Sou eu quem lê os e-mails de suporte — provavelmente ditando as respostas.

Leitura adicional