Por Denys Medvediev

Comparativo

superwhisper no Windows

O superwhisper agora tem uma versão para Windows, então a velha resposta ("Só para Mac, desculpe") está desatualizada. A questão de verdade é qual ferramenta de ditado se encaixa melhor no seu Windows. Aqui vai uma análise honesta do superwhisper no Windows e da alternativa local mais próxima.

Última atualização: junho de 2026

Notebook com Windows sobre uma mesa escura com um microfone ao lado, remetendo a ditado no desktop

O superwhisper para Windows agora é real. Em 2026, o superwhisper.com oferece um aplicativo para Windows 10 e 11 com transcrição por IA no dispositivo, offline, em qualquer campo de texto. A alternativa local mais próxima é o Whisper by Remskill, que também é nativo no Windows, gratuito para o pipeline local, com atalho push-to-talk em todo o sistema e uma etapa de limpeza por IA.

Por muito tempo, "superwhisper para Windows" era uma busca com uma resposta decepcionante. O superwhisper nasceu como app para Mac, ganhou versão iOS, e os usuários de Windows ficavam perguntando no fórum de feedback quando seria a vez deles. Se você pesquisou isso no ano passado, todas as páginas diziam a mesma coisa: só para Mac, aqui vai uma alternativa, desculpe.

Essa resposta está desatualizada. O superwhisper.com tem uma página para Windows e um download para Windows — Windows 10 e 11, x64 e ARM64, transcrição offline no dispositivo. A pergunta não é mais "consigo instalar?" É "é a escolha certa para o meu Windows, ou existe algo mais adequado?" Uso ditado no Windows todo dia, vou ser justo sobre os pontos fortes reais do superwhisper, e vou te mostrar onde o Whisper by Remskill se encaixa melhor.

Existe algo que os artigos mais antigos erraram, e vale dizer de forma clara para você não perder tempo atrás de um workaround que não precisa mais. O superwhisper não é mais exclusivo do Mac. A versão para Windows é um aplicativo real, lançado no site oficial deles, não um cadastro para beta. Se era o superwhisper que você queria, pode instalar agora mesmo.

Então isso deixou de ser um problema de "como uso o app do Mac no Windows" e virou uma escolha normal entre ferramentas. Dois bons apps de ditado local rodam no Windows agora. O resto deste guia é o comparativo honesto: o que é o superwhisper, por que as pessoas ainda procuram alternativas, como os dois se comparam, e os casos em que o superwhisper — ou a opção nativa do Windows — é a escolha mais inteligente.

O que é o superwhisper e para quem ele é

Microfone de mesa ao lado de um teclado, ilustrando ditado por voz em um computador

O superwhisper é um app de ditado com IA. Você fala, ele transcreve e cola o texto formatado no app em que você está — e-mail, chat, editor de código. Por descrição própria, funciona em todo o sistema, em qualquer aplicativo, cuida da pontuação e formatação sozinho, e suporta mais de 100 idiomas com detecção automática de língua. Ele também transcreve arquivos de áudio e vídeo, não só a fala ao vivo. É um conjunto de recursos genuinamente bom, e não vou fingir o contrário.

O ponto que o superwhisper mais enfatiza é a privacidade. A página para Windows diz claramente: "Modelos de IA no dispositivo. Seu áudio nunca sai da sua máquina e você não precisa de internet." Esse é o instinto certo para uma ferramenta de ditado, e é o mesmo que está por trás do Whisper by Remskill. Quem já viu uma conta de nuvem crescer sem parar sabe por que o processamento local importa. (Certa vez acompanhei uma equipe acumular uma conta de IA em nuvem de cinco dígitos em um trimestre, principalmente por re-transcrever gravações de standup quatro vezes porque um "smart retry" era agressivo demais. O CFO abriu o painel no meio da reunião e o silêncio tomou conta da sala.) O ditado no dispositivo contorna toda essa categoria de problema.

Então para quem é. Para quem quer um app de ditado moderno e polido, gosta da ideia de escolher entre vários modelos de IA para limpeza de texto, e usa Mac ou acabou de migrar para a nova versão Windows. O superwhisper cresceu no macOS, onde é uma escolha sólida e bem-conceituada. A versão Windows é o membro mais novo da família. Isso não é crítica — é só onde ela está na vida, e importa para o comparativo abaixo.

"Por que não tem no Windows" — e por que isso finalmente mudou

Por anos, a resposta honesta para "superwhisper para Windows" era "não tem, é um app para Mac e iPhone." Começar pelo Mac é um caminho comum para ferramentas de desenvolvedores independentes — uma plataforma para suportar, integração estreita com o sistema, menos coisas para quebrar. O Windows é mais difícil. Só a parte de integração de input já é mais trabalhosa; aprendi mais sobre o framework de métodos de entrada do Windows do que jamais quis saber, quando nosso próprio atalho disparava o callback de parar gravação seis vezes por tecla pressionada em máquinas com um método de entrada de idioma ativado. Levou um debounce de 300ms para corrigir. O Mac nunca teve esse bug.

Essa lacuna foi o que levou as pessoas a procurar alternativas, e é por isso que esse termo ainda é buscado. Hábitos antigos, artigos antigos, e o fato de que a versão Windows é recente o suficiente para que muita gente ainda não tenha sabido. O mecanismo que as duas ferramentas compartilham é a parte simples: pressione um atalho, fale, solte, e as palavras aparecem no cursor. Uma pequena cápsula surge enquanto você fala, para você saber que está ouvindo.

Cancel
O overlay de gravação: uma pequena cápsula que aparece enquanto você fala, para você saber que a ferramenta está ouvindo.

No Whisper by Remskill, o atalho push-to-talk é Ctrl+Space no Windows, mantido pressionado enquanto você fala, e pode ser alterado nas Configurações se entrar em conflito com algo. (Minha filha mais nova me disse certa vez que um atalho "não funcionava" no app de desenho dela. Era um conflito, não um bug — foi assim que aprendi que a maioria das pessoas não faz ideia do que é um conflito de atalho. Por isso, agora todos os atalhos são personalizáveis.) Se você já configurou ditado no Windows antes, é a mesma memória muscular.

Configurando o Whisper no Windows em dois minutos

Se você quiser testar a alternativa junto com o superwhisper, aqui está toda a configuração. Você precisa de um PC com Windows 10 ou superior, um microfone funcionando e alguns minutos. O pipeline local inteiro é gratuito para qualquer conta logada, sem pedir forma de pagamento no cadastro.

Passo 1 — Instale o Whisper e faça login.

Baixe na página de download, instale e crie uma conta gratuita. Sem cartão. O pipeline de transcrição local inteiro abre na hora.

Você saberá que funcionou quando o ícone na bandeja aparecer e o assistente de configuração oferecer a escolha de um modelo.

Passo 2 — Escolha o caminho de transcrição.

O app não escolhe por você. Você tem três opções: Cloud (OpenAI, use sua própria chave), Local Parakeet ou Local Whisper. Para trabalho privado, comece pelo local — mais sobre isso dois tópicos abaixo.

Você saberá que funcionou quando um modelo terminar o download e aparecer como pronto.

Passo 3 — Confirme seu atalho.

O padrão no Windows é Ctrl+Space, mantido pressionado como push-to-talk. Mude nas Configurações se entrar em conflito com algo que você já usa.

Você saberá que funcionou quando uma gravação de teste aparecer em qualquer campo de texto.

Passo 4 — Coloque o cursor em qualquer lugar e fale.

Clique em qualquer campo de texto — e-mail, um documento, um chat — segure o atalho, diga uma frase, solte. A transcrição aparece onde o cursor está.

Você saberá que funcionou quando a frase que você disse aparecer no campo como texto.

Whisper
O app Whisper desktop real na tela de configurações, com os painéis de Transcrição e IA abertos.

A parte demorada é o download do modelo, não a configuração em si. Todo o resto são os quatro passos acima. Assim que estiver rodando, ditar em um campo deixa de ser uma tarefa de digitação e vira uma tarefa de conversa. O mesmo vale depois de instalar o superwhisper — as duas ferramentas precisam de um atalho e um microfone para funcionar em qualquer lugar.

Como superwhisper e Whisper se comparam, de verdade

Os dois rodam no Windows agora, os dois transcrevem no dispositivo, os dois funcionam em qualquer app, os dois cobrem uma longa lista de idiomas. Há muita sobreposição, e prefiro admitir isso a fingir que existe um abismo entre eles. Onde diferem é nos detalhes. O superwhisper oferece uma lista de modelos de limpeza — o site lista opções como GPT, Claude, Llama, Grok, Gemini e Mistral — e um sistema de "modos" personalizados para moldar o tom. Se você gosta de ter muitas opções para configurar, isso é uma vantagem real, e o superwhisper faz isso genuinamente bem.

O Whisper by Remskill é construído de forma um pouco diferente. Ele não escolhe o motor de transcrição por você — coloca três caminhos na sua frente e deixa você decidir: um motor local rápido, um motor local multilíngue que também pode traduzir para o inglês, ou uma opção em nuvem usando sua própria chave OpenAI. No Windows, o atalho push-to-talk é Ctrl+Space, personalizável. O pipeline local — todos os modelos locais, limpeza por IA com modelo local, histórico, predefinições, atalho personalizado, três dispositivos — é gratuito para qualquer conta logada, sem cartão no cadastro. O plano pago só adiciona o recurso em nuvem. Isso é um formato diferente de um plano gratuito mais Pro simples.

A única ressalva honesta sobre o superwhisper no Windows é maturidade, não capacidade. A versão Windows é mais nova que a irmã no macOS, e softwares desktop mais novos no Windows tendem a ter arestas mais ásperas por um tempo — é só o custo dos problemas de integração de input que mencionei antes. Se você quer a versão com mais estrada rodada, é o macOS para o superwhisper e Windows-e-Mac-desde-o-início para o Whisper. Se você é um usuário feliz do Mac com superwhisper e está curioso sobre o Windows, experimente; só não espere paridade desde o primeiro dia com a plataforma em que ele cresceu.

Local ou nuvem: qual modo do Whisper no Windows

Se você for pelo caminho do Whisper, experimente o modo local primeiro. A maior parte do que as pessoas ditam — um e-mail, uma nota pela metade, uma mensagem que você nunca quer ver nos logs de algum fornecedor — não precisa sair do seu notebook por um parágrafo de texto. Se o seu PC é dos últimos anos, o modo local dá conta do ditado do dia a dia sem reclamar, e a nuvem vira o plano B em vez do padrão. Veja como os três caminhos diferem, porque o app te obriga a escolher e prefiro que você escolha bem.

A escolha se resume a velocidade, cobertura de idiomas ou precisão máxima.

  • Parakeet LocalO motor TDT da NVIDIA, em torno de 600 MB, e a opção local mais rápida — de 5 a 10 vezes mais rápido que o Whisper na CPU. Cobre inglês e outros 24 idiomas europeus, 25 no total. Sem tradução para o inglês. Se você fala principalmente inglês ou outro idioma europeu, esta é a escolha rápida e totalmente offline.
  • Whisper Localmais lento que o Parakeet na mesma máquina, mas os modelos multilíngues cobrem 99 idiomas e podem traduzir para o inglês. Os modelos somente em inglês são somente em inglês, não 99. Escolha este para chinês, japonês, coreano ou qualquer trabalho de tradução, o que o Parakeet não faz. O modelo padrão em inglês tem em torno de 480 MB.
  • Nuvem (OpenAI, BYOK)melhor precisão e acesso à web, usando sua própria chave OpenAI cobrada diretamente pela OpenAI. A transcrição roda no gpt-4o-mini-transcribe por padrão. Precisa de internet, então é o único caminho que sai da sua máquina. O recurso em nuvem faz parte do Whisper Pro.

A verdade sem drama é que, para a maioria do que as pessoas ditam em um Windows, o modo local é suficiente. Os dois motores locais rodam completamente no seu próprio hardware sem enviar nada a um servidor — a mesma promessa de processamento no dispositivo que o superwhisper faz. A nuvem ganha seu lugar quando você quer precisão máxima em uma gravação difícil ou precisa que o modelo busque uma informação na web no meio de uma frase. Comece pelo local, recorra à nuvem só quando o local não for suficiente.

A etapa de limpeza por IA que transforma falas em texto limpo

O ditado bruto sai como uma sequência corrida. Você fala "tá então revisa o doc de arquitetura marca como projeto alpha e me lembra quinta" e isso é a parede sem pontuação que qualquer motor de fala entrega primeiro. O que você faz com essa parede é onde as ferramentas provam seu valor.

O superwhisper faz a limpeza pelo seletor de modelos e modos personalizados. O Whisper by Remskill também tem uma etapa de IA: diga a frase de ativação "Hey whisper" e o texto é melhorado antes de aparecer — palavras de preenchimento removidas, frases corridas corrigidas, o parágrafo falado transformado em algo que você enviaria de verdade. Com um modelo local, essa etapa roda pelo Ollama, totalmente offline; no modo nuvem é o gpt-5-mini por padrão. De qualquer forma, o objetivo é o mesmo — você fala de forma casual, o texto chega organizado.

Thinking...
Bruto

okay so review the architecture doc tag it project alpha and remind me thursday um before the standup

Limpo

Okay, so review the architecture doc, tag it Project Alpha, and remind me Thursday before the standup.

A etapa de limpeza é a diferença entre um ditado que você precisa corrigir e um ditado que você pode enviar direto. É também onde a linha entre processamento no dispositivo e na nuvem importa mais: um modelo de limpeza que roda na sua máquina nunca vê um servidor, que é o motivo principal para ditar localmente. Se você só precisa de transcrições brutas, não vai sentir falta. No momento em que você começa a mandar e-mails reais por voz, é o recurso que você para de notar porque simplesmente funciona.

Esse mesmo fluxo de falar e limpar é o que torna a voz mais rápida do que o teclado — você pode digitar mais rápido com a voz em qualquer app, então um parágrafo longo vira algumas frases faladas em vez de cinco minutos de digitação.

Se você está no Mac

MacBook aberto sobre uma mesa de madeira com luz suave, representando ditado no macOS

Seja honesto sobre o seu hardware, porque a resposta certa muda. Se você está lendo isso em um Mac, o superwhisper é uma boa escolha e eu diria isso na sua cara. Ele começou no macOS, foi polido lá por anos, e no Apple Silicon seus modelos no dispositivo rodam bem. Para um usuário de Mac que quer um app de ditado maduro e nativo com um seletor de modelos completo, o superwhisper merece genuinamente a recomendação. Não vou te afastar de uma boa ferramenta só para marcar um ponto.

Vale saber: o Whisper by Remskill também roda no Mac, no Apple Silicon, com o mesmo pipeline local primeiro e um atalho push-to-talk de command+option mantido enquanto você fala. Então a escolha no Mac não é superwhisper-ou-nada — são duas boas opções locais, e qual se encaixa melhor depende de se você prefere a abordagem de modelos-e-modos do superwhisper ou a abordagem de três-caminhos-você-escolhe do Whisper. Os dois mantêm seu áudio na sua máquina. Experimente aquele cuja forma você mais gosta; nenhum dos dois é um erro.

E se você vai mandar um texto de 30 palavras, não instale nada. O Ditado do macOS vem embutido, configurado em Ajustes do Sistema, em Teclado, e no Apple Silicon pode processar texto geral no dispositivo. No Windows, a barra de Digitação por Voz nativa abre com Windows + H onde quer que seu cursor esteja — ela pontua sozinha e funciona bem para textos curtos, mas passa pelos servidores da Microsoft e precisa de internet, então não é uma opção offline. (Se o Win+H parar de funcionar, as causas mais comuns estão em esta correção para Win+H não funcionando.) Recorra a uma ferramenta dedicada quando as opções nativas começarem a limitar — notas longas, privacidade offline ou querer o mesmo atalho em todos os lugares.

Se você chegou aqui vindo da geração anterior de ditado, a mesma lógica de comparação vale para a alternativa moderna ao Dragon — local, sem etapa de treinamento, e construída para a forma como as pessoas realmente ditam hoje.

"superwhisper para Windows" costumava ser um beco sem saída. Não é mais — o app está no Windows, faz bem o que promete, e se era isso que você queria, pode ir instalar. O único motivo para ler além do botão de instalação é ter certeza de que você escolheu a ferramenta que se encaixa na sua máquina e no seu nível de privacidade, não a que apareceu primeiro nos resultados. Ditei a maior parte deste comparativo em um notebook com Windows, com uma ferramenta que cola onde quer que meu cursor esteja, e enviei. O teclado ficou parado ali sem uso, que é exatamente o ponto.

Experimente o ditado local no seu Windows

Segure o atalho, fale, solte. A transcrição aparece onde seu cursor estiver — em qualquer app, totalmente na sua máquina.

Modo local gratuito para qualquer conta logada. Sem cartão para começar.

Foto de Denys Medvediev

Denys Medvediev

Sou eu quem lê nosso e-mail de suporte, provavelmente ditando as respostas.

Leitura adicional