Tudo, totalmente offline.
Transcrição local, IA local, zero nuvem. As mesmas funcionalidades — nenhum dado sai da sua máquina.
Licença vitalícia · pagamento único · atualizações gratuitas
Porque é que o offline importa.
Notas médicas, rascunhos legais, NDAs, código interno — há categorias de trabalho onde 'enviar para a nuvem' não é opção.
O modo offline mantém cada byte na sua máquina. Sem upload de áudio, sem upload de texto, sem telemetria sobre o conteúdo da transcrição. Redes air-gapped, indústrias reguladas e fundadores paranoicos são todos bem-vindos.
Dois motores, uma tecla de atalho.
Escolha por sessão em Definições → Modelos. Whisper para precisão, línguas e funcionalidades de IA. Parakeet para velocidade bruta em CPU.
A mesma tecla de atalho, o mesmo overlay, o mesmo dicionário. Muda apenas o modelo que transcreve.
Comparação de motores
Escolha por sessão. A mesma tecla de atalho, backend diferente.
| Whisper (OpenAI, local) | Parakeet TDT 0.6B v3 (NVIDIA, local) | |
|---|---|---|
| Velocidade | Rápido em GPU, moderado em CPU | Até ~10× mais rápido em CPU — tempo real num portátil |
| Precisão | Padrão de excelência — ajustável via tamanho do modelo (Base → Large v3) | Paridade com o Whisper em línguas europeias segundo benchmarks NVIDIA |
| Línguas | Mais de 90 | 24 línguas europeias |
| Tradução | Fale qualquer língua → cole em inglês | Apenas transcrição |
| Perfis de desempenho | Rápido / Equilibrado / Preciso | Fixo |
| Presets de IA + trigger word | (via Ollama) | Apenas transcrição |
| Remoção de enchimento + dicionário | ||
| Tempo de execução | whisper.cpp com aceleração CUDA / Vulkan / Metal | ONNX Runtime |
| Melhor para | Precisão, tradução, conjunto completo de funcionalidades de IA | Velocidade bruta, ditado puro, máquinas apenas com CPU |
Rápido, Equilibrado, Preciso.
O modo Whisper expõe três perfis de desempenho. Cada um ajusta o tamanho do modelo, chunking e definições de GPU — para trocar velocidade por precisão de forma explícita.
Portátil antigo a bateria? Escolha Rápido. Estação de trabalho com GPU? Preciso dá resultados mais afiados. O Whisper deteta automaticamente CUDA, Vulkan e Metal.
Ollama para reescritas de IA locais.
Aponte o Whisper para uma instância de Ollama em localhost e obtém a mesma trigger word, as mesmas presets, o mesmo modo Sempre Ativo — mas o LLM corre na sua máquina.
Escolha qualquer modelo que tenha descarregado: Llama 3.1, Mistral, Qwen, o que convém ao seu hardware. Configure-o uma vez, use-o em qualquer sítio onde a tecla de atalho funcione.
Traduza qualquer língua para inglês — nativamente.
Os modelos multilingues do Whisper têm uma tarefa de tradução integrada. Fale japonês, ucraniano, polaco, ou qualquer uma de mais de 90 línguas — cole em inglês. Uma passagem, sem modelo extra, sem chamada de API.
Mais ninguém nesta categoria oferece um tradutor offline integrado. Ative 'Traduzir para inglês' nas Definições e cada ditado muda de modo.
Presets, localmente.
Cada preset do modo nuvem funciona offline. Guarde instruções, combine-as, mude-as a partir do overlay.
Correm via Ollama em vez de OpenAI — mesma forma, mesma sintaxe, mesmos resultados.
Palavras personalizadas — determinístico, universal.
O dicionário funciona da mesma forma offline como online. Adicione uma vez, aplicado a cada transcrição, sem tokens gastos.
Agnóstico à língua e ao modelo. Nomes, siglas, termos de produto — todos respeitados.
Remoção de enchimento, pós-processamento.
O mesmo limpador determinístico de palavras de enchimento corre em modo offline. Funciona com qualquer motor. Funciona com qualquer língua.
Sem IA necessária — apenas correspondência de padrões rápida depois de a transcrição estar feita.
Reescreva qualquer seleção por voz.
Selecione um texto em qualquer aplicativo — Slack, Gmail, Notion, seu editor. Aperte a tecla de atalho de ditado, diga o que você quer — "deixe formal", "corte o blá-blá corporativo", "traduza para o espanhol" — e a seleção é substituída no lugar pela versão reescrita.
É o mesmo truque do polimento, mas partindo de um texto que você já escreveu. No modo local, a reescrita roda no modelo Ollama que você configurou, sem nunca sair da sua máquina. Sem segunda tecla de atalho, sem menu, sem copia-e-cola.
Postura de privacidade, numa linha.
Sem upload de áudio. Sem upload de texto. Sem telemetria sobre o conteúdo da transcrição.
O único tráfego de rede em modo offline é a verificação de licença e as verificações de atualizações — e ambas podem ser auditadas com qualquer monitor de rede.
Gratuito, uma vez que seja seu.
Mensal é $9. Vitalício é um pagamento único — compre uma vez, é seu para sempre, sem fatura recorrente.
Os modelos são gratuitos. A inferência é gratuita. Sem custo por minuto, sem custo por token. Só a aplicação é paga.
Perguntas comuns
Preciso de uma GPU NVIDIA para o modo offline?
Qual o tamanho dos modelos?
O modo offline não tem mesmo nenhum tráfego de internet?
Privado por padrão. Potente por escolha.
Licença vitalícia significa que paga uma vez e é seu. O modo offline significa que o áudio nunca sai da sua máquina.