Por Denys Medvediev

Comparativo

A alternativa honesta ao MacWhisper alternativa

O MacWhisper converte arquivos de áudio e vídeo em transcrições no seu Mac, totalmente local. O Whisper by Remskill faz um trabalho diferente: ele digita a sua fala ao vivo diretamente no aplicativo que você já está usando, com um atalho de teclado, e todo o pipeline local é gratuito. A escolha certa se resume a uma única pergunta: você começa por um arquivo ou pela sua voz?

Última atualização: junho de 2026

Monitores de estúdio e um microfone sobre uma mesa de madeira, evocando ferramentas de voz e áudio

Sou Denys. Desenvolvo o Whisper by Remskill nas horas vagas, e já passei noites suficientes testando tanto ferramentas de transcrição de arquivos quanto ferramentas de ditado para saber que não são a mesma coisa com nomes diferentes. Elas resolvem dois problemas distintos que, por acaso, envolvem um microfone e a palavra "Whisper".

Se o seu trabalho é transformar gravações em transcrições — podcasts, entrevistas, reuniões, uma pasta de recados de voz —, o MacWhisper é a ferramenta certa para você e não há motivo para mudar. Se o seu trabalho é escrever por voz em qualquer aplicativo, sem nenhum arquivo envolvido, isso é ditado — e é o que fazemos. Rodamos no Windows e no macOS, todo o pipeline local é gratuito sem cartão de crédito, e a nuvem é opcional com a sua própria chave OpenAI.

O que é este comparativo e quem o criou

Então este não é um ataque. O MacWhisper é um aplicativo genuinamente bom para Mac, e para o trabalho que foi criado eu não te aconselharia a trocá-lo. O que quero fazer é traçar uma linha clara, para que você pare de tentar fazer uma ferramenta fazer o trabalho da outra. É o que vejo as pessoas enfrentando em silêncio.

A verdade sem rodeios é que a maioria das decisões de "qual app de transcrição usar" são, na verdade, decisões disfarçadas de "qual trabalho estou fazendo".

Sem contagens de avaliações falsas, sem números de usuários inventados, sem logotipos de equipes que supostamente nos adoram. Apenas duas listas honestas de recursos e uma tabela que você pode comparar com as duas páginas iniciais.

O MacWhisper transcreve arquivos — o trabalho para o qual foi criado

O MacWhisper é um aplicativo para Mac que transcreve arquivos de áudio e vídeo em texto usando o Whisper da OpenAI e o NVIDIA Parakeet, tudo no dispositivo, sem que nenhum dado saia da sua máquina. Você arrasta uma gravação e recebe de volta uma transcrição limpa. Esse design centrado em arquivos é o ponto central, e há uma lista real de tarefas que ele executa muito bem.

Um podcaster joga dentro um episódio de 50 minutos e recebe o texto completo para transformar em notas do programa, um post no blog ou marcadores de capítulo. Um jornalista passa uma entrevista gravada por ele e lê a transcrição em vez de ficar repassando o áudio atrás da única citação que precisa. Um estudante transforma uma aula gravada de 90 minutos em anotações que pode pesquisar de verdade. Uma equipe grava uma chamada no Zoom, Teams ou Webex e sai com um registro escrito, porque o MacWhisper captura a reunião e a transcreve em uma única etapa. E quando o resultado precisa ser legendas, ele exporta para SRT e outros formatos de documento, então um vídeo ganha legendas sem precisar de um segundo aplicativo.

Cada um desses casos começa com um arquivo entrando e termina com texto saindo. É um trabalho real, recorrente e valioso, e o MacWhisper foi feito exatamente para ele. Dê todo o crédito: local, privado, sem upload, sem cobrança por minuto na nuvem. Ele até inclui um recurso de ditado em todo o sistema com a intenção de substituir o próprio Apple, então não ignora a digitação ao vivo. Só que o foco é nos arquivos.

Funciona no Mac, com suporte limitado ao iOS. Uma nota honesta antes de você continuar lendo: não vou citar um preço para ele. A página de preços do MacWhisper fica em uma página de checkout que nossa pesquisa não conseguiu ler com confiança, então em vez de imprimir um número do qual não tenho certeza, vou apontar para a página deles. Citar um preço errado seria pior do que não citar nenhum.

O Whisper by Remskill digita a sua fala ao vivo — sem arquivo necessário

Eis a diferença de forma em uma linha: o MacWhisper começa com um arquivo; nós começamos com a sua voz. Você pressiona um atalho push-to-talk (Ctrl+Space no Windows por padrão, remapeável), fala, solta, e o texto aparece no campo em que o cursor estiver — Gmail, Slack, um comentário de código, um Google Doc, seu CRM. Não há gravação para importar nem transcrição para copiar de volta. O ato de escrever simplesmente vira o ato de falar.

Isso é ditado, e é uma vantagem estrutural, não incremental. Esta é a única opinião que vou defender neste artigo: o melhor hack de produtividade é ter menos etapas, não etapas mais rápidas. Um fluxo com arquivo é: gravar, salvar, importar, transcrever, copiar, colar. O ditado elimina a maioria dessas etapas. Você passa de "parar, trocar de app, digitar" para "falar, pronto". A voz chega a cerca de 145 palavras por minuto contra aproximadamente 40 na digitação, então também é mais rápido — mas a velocidade é quase secundária. O ganho real são as etapas que você nunca vai precisar executar.

Whisper
O aplicativo Whisper by Remskill ao vivo — barra lateral, painel de transcrição e cartões de instrução de IA. Esta é a interface real, não um mockup.

Por dentro, utilizamos as mesmas famílias de motores que o MacWhisper usa, então você não está trocando qualidade por formato. A transcrição local é em Rust puro, sem sidecar Python: 8 modelos Whisper do Base (~140 MB) ao Large v3 (~3 GB), mais o NVIDIA Parakeet (~600 MB), que é de 5 a 10 vezes mais rápido que o Whisper em CPU. Os modelos multilíngues do Whisper cobrem 99 idiomas e podem traduzir para o inglês; o Parakeet cobre o inglês mais 24 outros idiomas europeus. Você escolhe o caminho; nós não escolhemos por você.

E funciona no Windows além do macOS — o que, se você não usa Mac, encerra a conversa por si só.

Se você já dita no Gmail e no Docs o dia todo, o guia de voz para texto no Windows explica todo o processo de configuração.

MacWhisper vs Whisper by Remskill, lado a lado

Esta tabela é sobre o tipo de trabalho, não sobre quem ganha. Leia a primeira linha primeiro. Todo o resto decorre dela.

Comparação de recursos entre MacWhisper e Whisper by Remskill
O que você está comparandoMacWhisperWhisper by Remskill
Função principalTranscrever arquivos de áudio/vídeo existentesDitar fala ao vivo no aplicativo em foco
Ditado ao vivo no cursorSim (ditado em todo o sistema)Sim, é o recurso principal
Transcrição de arquivos/gravaçõesSim, é o recurso principalNão, por design
Gravação de reuniões (Zoom, Teams, etc.)SimNão
Exportação de legendas / SRTSimNão
PlataformasMac, iOS limitadoWindows + macOS (Apple Silicon)
Local / no dispositivoSim (Whisper + Parakeet)Sim (8 modelos Whisper + Parakeet, Rust puro)
Motores disponíveis para escolhaWhisper, Parakeet8 modelos Whisper, Parakeet, mais nuvem BYOK
IdiomasBaseado em Whisper, múltiplos99 (Whisper multilíngue) / 25 (Parakeet)
Opção de nuvemFocado no dispositivo localOpenAI na nuvem opcional com sua própria chave
Custo do pipeline localConsulte a página delesGratuito para todos os usuários autenticados, sem cartão

Repare que não há linha de preço tentando eleger um vencedor. Também não citamos nossos próprios preços no corpo do texto. Eles estão na página de preços, com valores diretos, sem "a partir de". A única célula de comparação honesta é "pipeline local gratuito, sem cartão", o que é verdade independentemente do que cada plano pago custa.

O que "gratuito" significa do nosso lado

Todo o pipeline local é gratuito para qualquer usuário autenticado, sem método de pagamento no cadastro. Isso inclui todos os modelos Whisper, o Parakeet, limpeza de IA local via Ollama, histórico, predefinições, palavras-chave personalizadas, aceleração de hardware, downloads de modelos e seu próprio atalho de teclado. Não é um período de teste que fica te incomodando no oitavo dia. Não é um plano gratuito que limita você silenciosamente a dez ditados por semana. É gratuito, e gratuito para a parte que a maioria das pessoas vai usar.

Pasted
O overlay pós-ditado — como é um ditado gratuito e totalmente local no momento em que termina.

Quero ser preciso sobre onde fica o limite, porque afirmações vagas de "gratuito" são o motivo pelo qual ninguém acredita nelas. Os modelos locais rodam na sua própria máquina, então não há medidor por minuto e nada a enviar. Seu CPU faz o trabalho quer você dite dez palavras ou dez mil. O que custa dinheiro é a superfície Cloud opcional (transcrição em nuvem via OpenAI, aprimoramento de IA na nuvem e pesquisa na web), e mesmo isso é traga-sua-própria-chave, então o custo por minuto da OpenAI vai para a sua conta, não como margem nossa. Você pode usar por anos e nunca precisar tocar nisso. Os valores diretos, incluindo a opção vitalícia, estão na página de preços onde devem estar.

Criei o plano gratuito desta forma por uma razão pessoal. Sou o tipo de arquiteto que diagrama o sistema inteiro antes de instalar o runtime, e o diagrama sempre está errado a partir do segundo commit. Local gratuito significava que eu podia errar barato — e você também pode.

Quando ficar com o MacWhisper

Esta é a seção que comparativos gerados por IA nunca incluem, então aqui está em termos claros. Se estas situações descrevem você, não mude. O MacWhisper é a ferramenta mais adequada, e nós somos a escolha errada.

Seu trabalho é transcrever gravações

Se você regularmente transforma podcasts, entrevistas, aulas gravadas ou uma fila de recados de voz em texto, isso é transcrição de arquivos — e é exatamente para o que o MacWhisper foi criado. Nós não transcrevemos uma pasta de arquivos, e adicionar isso a uma ferramenta de ditado pioraria os dois trabalhos. Fique onde você está.

Você precisa gravar e transcrever reuniões

O MacWhisper grava reuniões do Zoom, Teams, Webex e outros e entrega a transcrição. Nós não fazemos captura de reuniões. É uma categoria diferente, uma ferramenta diferente. Se a sua semana é "gravar a chamada, receber a transcrição", essa é a função do MacWhisper, não a nossa.

Você precisa de legendas ou exportações de documentos

Se o seu resultado final é um arquivo SRT para um vídeo ou um documento formatado, o MacWhisper exporta diretamente para esses formatos. Nós digitamos texto no aplicativo em que você está; não geramos arquivos de legenda. Quando o produto final é um vídeo legendado, esse é o trabalho do MacWhisper, sem dúvida.

Você é exclusivamente usuário de Mac e está feliz com isso

Se você vive inteiramente no Mac, gosta do aplicativo e o fluxo de arquivos no dispositivo se encaixa no seu dia, não há motivo para mudar. Nossa maior vantagem estrutural sobre o MacWhisper é rodar no Windows também, e se você nunca vai tocar no Windows, essa vantagem não vale nada para você. Trocar de ferramenta deve resolver um problema real, não perseguir um recurso que você jamais vai abrir.

Há três tipos de pessoas que chegam a este artigo: os curiosos, os que transcrevem arquivos e os que realmente querem escrever por voz. Somente o terceiro grupo deve trocar.

Se você só vai lembrar de uma coisa

O MacWhisper transforma arquivos em transcrições. Nós transformamos a sua voz em texto no aplicativo que você já está usando. Escolha pela tarefa: uma pasta de gravações ou um campo em branco esperando por palavras. Se forem as gravações, fique — e digo isso com sinceridade. Se for a escrita, o pipeline local é gratuito, roda no Windows e no Mac, e você pode estar transcrevendo sua próxima frase em cerca de um minuto.

Para um comparativo igualmente honesto de outra ferramenta, veja o comparativo com a alternativa ao superwhisper.

Comece a ditar em qualquer aplicativo

Baixe o Whisper by Remskill, escolha um modelo local, configure seu atalho e escreva seu próximo e-mail falando. Sem cartão, sem arquivo para importar, sem margem.

Transcrição local gratuita para sempre. Sem método de pagamento no cadastro. O período de teste Cloud opcional solicita cartão somente no upgrade.

Foto de Denys Medvediev

Denys Medvediev

Sou o cara que lê nosso e-mail de suporte — provavelmente ditando as respostas.

Leitura adicional