Guia
Whisper para Mac
"Whisper para Mac" pode significar duas coisas. Ou é o modelo open source Whisper da OpenAI rodando no Mac via Python e linha de comando, ou é um app de Mac que usa o Whisper por baixo dos panos. A maioria das pessoas quer o segundo. Só ainda não sabe disso.
Última atualização: junho de 2026

Whisper para Mac são duas coisas diferentes usando o mesmo nome. O modelo é open source e gratuito, mas a forma oficial de rodá-lo exige Python e linha de comando, e ele transcreve arquivos em vez da sua fala ao vivo. Se você quer apertar um atalho e ver suas palavras aparecerem em qualquer app do Mac, o que você quer é um app de ditado como o Whisper by Remskill, cujo pipeline local inteiro é gratuito para qualquer usuário logado.
Whisper é um modelo, não um app de Mac
Deixa eu esclarecer o nome, porque os resultados de busca embolam tudo.
Whisper é um modelo de reconhecimento de fala open source da OpenAI, lançado sob a Licença MIT. O modelo é gratuito. O código é gratuito. Você pode baixar os pesos e rodá-los na sua própria máquina, sem precisar de conta. Essa parte é genuinamente "Whisper para Mac" no sentido literal.
O detalhe é como você o roda. O Whisper oficial da OpenAI é uma ferramenta de Python e linha de comando. Você instala com o pip, também precisa da ferramenta de linha de comando ffmpeg, e aí aponta para um arquivo de áudio. Ele transcreve gravações: audio.mp3, audio.wav, esse tipo de coisa. Ele não digita sua fala ao vivo no Mail ou no Slack. Ele transforma em texto um arquivo que você já tem.
Existem seis tamanhos de modelo (tiny, base, small, medium, large e turbo), quatro deles com variantes só em inglês que trocam velocidade por precisão. O Whisper é multilíngue e consegue traduzir fala para o inglês com uma única flag. Bom modelo. A verdade sem graça é que o modelo nunca foi a parte difícil. Encaixá-lo no jeito que você realmente trabalha no Mac é que é.
As ferramentas de Mac que encapsulam o Whisper, e para que serve cada uma
A maioria das pessoas que pesquisa "Whisper para Mac" não quer encostar no pip. Elas querem um app. Existem várias boas opções, e elas não são intercambiáveis. Dividem-se em dois grupos.
Grupo um: transcrever arquivos
O whisper.cpp é uma port pura em C/C++ do Whisper, com licença MIT, e é cidadão de primeira classe no Apple Silicon, otimizado com ARM NEON, o framework Accelerate, Metal e Core ML. Roda só em CPU, você o compila a partir do código-fonte e o controla pela linha de comando. Se você se sente à vontade no terminal e quer transcrição local de arquivos, crua e rápida, ele é excelente. O MacWhisper te dá uma versão gráfica dessa ideia. Ele transcreve arquivos de áudio e vídeo no próprio dispositivo usando OpenAI Whisper e NVIDIA Parakeet, sem que nenhum dado saia da sua máquina, além de um recurso de ditado para todo o sistema. Se o seu trabalho é transformar gravações em transcrições, esse é o grupo certo.
Grupo dois: digitar sua fala ao vivo
Isso é ditado. Você aperta um atalho, fala, e o texto aparece no cursor, em qualquer app que estiver em foco. O VoiceInk vive aqui. É open source sob a GPL-3.0, roda modelos locais no Apple Neural Engine, incluindo o Parakeet v3, e cola no cursor com um atalho de pressionar para falar. Exige Apple Silicon e macOS 14.4 ou mais recente. O superwhisper também está aqui, com ditado ao vivo mais transcrição de arquivos, local ou na nuvem, em Mac, Windows e iOS.
O Whisper by Remskill, o app que eu construo, está no grupo dois. Ditado em primeiro lugar. Vale saber em qual grupo você está antes de baixar qualquer coisa.
O que o Whisper by Remskill faz em um Mac
Vou descrever a coisa que eu construí, e aí você pode julgá-la em comparação com o resto.
É um app de ditado. Você aperta um atalho, fala, e o texto cai no cursor em qualquer app: Mail, Notes, Slack, seu editor de código, a caixa onde você está digitando a autorização da escola das crianças deste ano. O atalho padrão no Mac é Command e Option pressionados juntos, e ele é totalmente remapeável. Toda a transcrição acontece no seu Mac. Nenhum arquivo para enviar, nenhuma gravação para gerenciar.
Você também não roda Python. Não tem pip, não tem ffmpeg, não tem terminal, não tem GPU. A coisa toda é Rust puro. Os motores Whisper e Parakeet rodam através de uma biblioteca chamada transcribe-rs, sem nenhum sidecar de Python embutido. A transcrição local roda na sua CPU, sem GPU dedicada, e o app ocupa cerca de 25 MB em disco.
Quanto ao modelo em si, você escolhe. O Whisper local te dá 8 modelos, 99 idiomas, tradução para o inglês, vocabulário personalizado, controle de beam-size e priorização de palavras-chave. Mais lento, mas com o máximo de controle. O Parakeet é o motor NVIDIA TDT, com cerca de 600 MB, e roda de 5 a 10 vezes mais rápido que o Whisper em uma CPU, cobrindo o inglês mais 24 outros idiomas europeus, sem tradução para o inglês. O modo nuvem é o terceiro caminho: você usa sua própria chave da OpenAI, e não ficamos com nenhuma parte. Eu deliberadamente não escolho um por você. Detalhamos as diferenças em Whisper vs Parakeet se você quiser a versão longa.
A precisão local costuma ficar entre 95% e 99%. O pipeline local inteiro é gratuito para qualquer usuário logado: Whisper, Parakeet, limpeza por IA offline através do Ollama, histórico de transcrições, presets, palavras-chave, aceleração por hardware, downloads de modelos e o atalho personalizado. Sem método de pagamento no cadastro. Você pode usar em até 3 dispositivos. O plano pago, o Whisper Pro, só adiciona a camada de nuvem: transcrição em nuvem da OpenAI, limpeza por IA na nuvem e busca na web. Os preços ficam na página de preços. Não vou citar valores aqui, porque páginas de preços mudam e você deve lê-los direto da fonte.
Uma limitação honesta: nossa build para Mac é só para Apple Silicon, do M1 ao M4. Se você está em um Mac com Intel, este app não é para você, e já já vou te dizer qual é.
É assim que o seu primeiro ditado realmente fica. Aperte o atalho, um pequeno indicador de gravação aparece, você fala, solta, e o texto já organizado cai exatamente onde o seu cursor estava. A sobreposição abaixo é a coisa real que o app mostra, não uma maquete.
A configuração é rápida. Baixe o app, faça login e deixe ele puxar um modelo. O Parakeet é o menor, com cerca de 600 MB, ou um modelo Whisper se você quiser idiomas ou tradução. Escolha seu atalho ou mantenha Command e Option. Depois abra o Mail, segure o atalho e diga uma frase. Esse é todo o onboarding. Minha filha mais nova fez isso sem me fazer uma única pergunta de acompanhamento, que é o único teste de usabilidade em que eu confio plenamente. Se você quer o passo a passo mais longo, captura por captura, com os três caminhos de modelo, eu escrevi um guia dedicado: voz para texto no Mac.
Por que eu mantenho tudo local no Mac
Aqui vai minha única opinião forte neste artigo: ditado só na nuvem é um desastre de privacidade.
A planilha de salários do seu chefe, o e-mail para a escola do seu filho, a peça jurídica que você está redigindo no trem. Nada disso deveria passar pelos servidores de um fornecedor só porque você quis digitar com a voz. Seu Mac já tem um microfone e uma CPU. Para um parágrafo de ditado, ele não precisa de um servidor no meio do caminho. Com os motores locais, o áudio nunca sai da sua máquina. É o padrão que eu escolheria, e é gratuito.
O modo nuvem existe para quando você realmente quer os modelos mais recentes da OpenAI ou respostas da web, na sua própria chave. É a saída de emergência, não a porta da frente.
Quando MacWhisper, VoiceInk ou o CLI são a melhor escolha
Eu seria um péssimo guia se fingisse que um app vence em todos os casos. Não vence. Aqui vão as situações em que eu te mandaria para outro lugar.
Você transcreve gravações na maior parte do tempo
Se o seu dia é jogar episódios de podcast, gravações de entrevistas ou capturas de reuniões dentro de uma transcrição, você quer uma ferramenta de transcrição de arquivos, não um app de ditado. O MacWhisper foi feito exatamente para isso: arraste um arquivo, receba o texto, no próprio dispositivo. Use-o. Nós não fazemos upload de arquivos. Nós digitamos sua fala ao vivo.
Você quer algo cru, scriptável, gratuito e vive no terminal
Então o whisper.cpp é a resposta. Ele tem licença MIT, é otimizado para Apple Silicon, roda só em CPU e você pode encaixá-lo em qualquer pipeline. Se você é o tipo de pessoa que curte compilar a partir do código-fonte, vai ficar mais feliz ali do que em qualquer interface gráfica.
Você quer ditado totalmente open source e está no Apple Silicon
O VoiceInk é GPL-3.0, você pode ler ou auditar cada linha, e ele cola no cursor como nós. É uma opção gratuita sólida. Nós somos um app gerenciado, com contas, histórico, BYOK na nuvem e suporte a Windows, e não somos open source. Então, se open source é um requisito inegociável, a decisão é sua, e o VoiceInk é uma boa escolha.
Você está em um Mac com Intel
Nosso app não vai rodar. O whisper.cpp open source compila e roda em Intel, e o próprio Ditado integrado da Apple é gratuito para notas curtas. Qualquer um dos dois é melhor do que esperar por uma máquina com Apple Silicon que você ainda nem comprou.
Se você só lembrar de uma coisa
O modelo é gratuito e aberto. A decisão que importa é o que você coloca ao redor dele: um terminal, uma interface gráfica de transcrição de arquivos, ou um atalho que digita sua fala ao vivo em qualquer coisa que você esteja olhando. Combine o invólucro com a tarefa, e, no Mac, ignore o Python a menos que você genuinamente curta. Existem três tipos de pessoas que vão procurar o Whisper no Mac: as que têm uma pasta de gravações, as que nunca mais querem digitar, e as que só gostaram do nome. Duas delas estão no grupo errado até chegarem até aqui na leitura.
Eu ditei a maior parte deste artigo em vez de digitar, o que pareceu apropriado. O único parágrafo que digitei à mão teve mais erros de digitação.
Leitura adicional
Experimente no seu Mac
Baixe o Whisper by Remskill, faça login e dite sua primeira frase no seu Mac. A camada local é gratuita, e você pode decidir depois se algum dia vai precisar da nuvem.
Transcrição local gratuita para sempre. Sem método de pagamento no cadastro. Só para Apple Silicon.



