Modo offline

Tudo, totalmente offline.

Transcrição local, IA local, zero nuvem. As mesmas funcionalidades — nenhum dado sai da sua máquina.

Licença vitalícia · pagamento único · atualizações gratuitas

Porque é que o offline importa.

Notas médicas, rascunhos legais, NDAs, código interno — há categorias de trabalho onde 'enviar para a nuvem' não é opção.

O modo offline mantém cada byte na sua máquina. Sem upload de áudio, sem upload de texto, sem telemetria sobre o conteúdo da transcrição. Redes air-gapped, indústrias reguladas e fundadores paranoicos são todos bem-vindos.

Um documento regulado redigido de ponta a ponta sem atividade de rede.

Dois motores, uma tecla de atalho.

Escolha por sessão em Definições → Modelos. Whisper para precisão, línguas e funcionalidades de IA. Parakeet para velocidade bruta em CPU.

A mesma tecla de atalho, o mesmo overlay, o mesmo dicionário. Muda apenas o modelo que transcreve.

Alternar entre Whisper e Parakeet leva dois cliques.

Comparação de motores

Escolha por sessão. A mesma tecla de atalho, backend diferente.

	Whisper (OpenAI, local)	Parakeet TDT 0.6B v3 (NVIDIA, local)
Velocidade	Rápido em GPU, moderado em CPU	Até ~10× mais rápido em CPU — tempo real num portátil
Precisão	Padrão de excelência — ajustável via tamanho do modelo (Base → Large v3)	Paridade com o Whisper em línguas europeias segundo benchmarks NVIDIA
Línguas	Mais de 90	24 línguas europeias
Tradução	Fale qualquer língua → cole em inglês	Apenas transcrição
Perfis de desempenho	Rápido / Equilibrado / Preciso	Fixo
Presets de IA + trigger word	(via Ollama)	Apenas transcrição
Remoção de enchimento + dicionário
Tempo de execução	whisper.cpp com aceleração CUDA / Vulkan / Metal	ONNX Runtime
Melhor para	Precisão, tradução, conjunto completo de funcionalidades de IA	Velocidade bruta, ditado puro, máquinas apenas com CPU

Mude de motores a qualquer momento em Definições → Modelos. O seu dicionário e teclas de atalho mantêm-se iguais.

Rápido, Equilibrado, Preciso.

O modo Whisper expõe três perfis de desempenho. Cada um ajusta o tamanho do modelo, chunking e definições de GPU — para trocar velocidade por precisão de forma explícita.

Portátil antigo a bateria? Escolha Rápido. Estação de trabalho com GPU? Preciso dá resultados mais afiados. O Whisper deteta automaticamente CUDA, Vulkan e Metal.

O cursor de desempenho ajusta novamente o motor em tempo real.

Ollama para reescritas de IA locais.

Aponte o Whisper para uma instância de Ollama em localhost e obtém a mesma trigger word, as mesmas presets, o mesmo modo Sempre Ativo — mas o LLM corre na sua máquina.

Escolha qualquer modelo que tenha descarregado: Llama 3.1, Mistral, Qwen, o que convém ao seu hardware. Configure-o uma vez, use-o em qualquer sítio onde a tecla de atalho funcione.

Hey Whisper → reescrita local de Llama → texto colado. Sem internet.

Traduza qualquer língua para inglês — nativamente.

Os modelos multilingues do Whisper têm uma tarefa de tradução integrada. Fale japonês, ucraniano, polaco, ou qualquer uma de mais de 90 línguas — cole em inglês. Uma passagem, sem modelo extra, sem chamada de API.

Mais ninguém nesta categoria oferece um tradutor offline integrado. Ative 'Traduzir para inglês' nas Definições e cada ditado muda de modo.

Falar ucraniano com 'Traduzir para inglês' ativado cola texto em inglês.

Presets, localmente.

Cada preset do modo nuvem funciona offline. Guarde instruções, combine-as, mude-as a partir do overlay.

Correm via Ollama em vez de OpenAI — mesma forma, mesma sintaxe, mesmos resultados.

Aplicar uma preset encaminha o texto pelo seu modelo Ollama local.

Palavras personalizadas — determinístico, universal.

O dicionário funciona da mesma forma offline como online. Adicione uma vez, aplicado a cada transcrição, sem tokens gastos.

Agnóstico à língua e ao modelo. Nomes, siglas, termos de produto — todos respeitados.

A mesma entrada do dicionário corrige a transcrição sob Whisper e Parakeet.

Remoção de enchimento, pós-processamento.

O mesmo limpador determinístico de palavras de enchimento corre em modo offline. Funciona com qualquer motor. Funciona com qualquer língua.

Sem IA necessária — apenas correspondência de padrões rápida depois de a transcrição estar feita.

Hum, ah, tipo — removidos na saída.

Reescreva qualquer seleção por voz.

Selecione um texto em qualquer aplicativo — Slack, Gmail, Notion, seu editor. Aperte a tecla de atalho de ditado, diga o que você quer — "deixe formal", "corte o blá-blá corporativo", "traduza para o espanhol" — e a seleção é substituída no lugar pela versão reescrita.

É o mesmo truque do polimento, mas partindo de um texto que você já escreveu. No modo local, a reescrita roda no modelo Ollama que você configurou, sem nunca sair da sua máquina. Sem segunda tecla de atalho, sem menu, sem copia-e-cola.

Selecione o texto, aperte a tecla de atalho, fale a reescrita — o mesmo fluxo, totalmente local.

Postura de privacidade, numa linha.

Sem upload de áudio. Sem upload de texto. Sem telemetria sobre o conteúdo da transcrição.

O único tráfego de rede em modo offline é a verificação de licença e as verificações de atualizações — e ambas podem ser auditadas com qualquer monitor de rede.

O Wireshark confirma: zero tráfego de rede durante a transcrição.

Gratuito, uma vez que seja seu.

Mensal é $9. Vitalício é um pagamento único — compre uma vez, é seu para sempre, sem fatura recorrente.

Os modelos são gratuitos. A inferência é gratuita. Sem custo por minuto, sem custo por token. Só a aplicação é paga.

Detalhe do plano vitalício — comparado com subscrições que cobram por minuto.

Perguntas comuns

Preciso de uma GPU NVIDIA para o modo offline?

Não. O Whisper corre em CPU e em todas as GPUs comuns (CUDA, Vulkan no Windows, Metal no macOS). O Parakeet corre rápido só em CPU — apesar do nome, não é necessário hardware NVIDIA para o usar.

Qual o tamanho dos modelos?

Os modelos Whisper variam de ~75 MB (Tiny, apenas inglês) a ~3 GB (Large v3). O Parakeet TDT 0.6B tem cerca de 1,2 GB. A aplicação descarrega apenas o modelo que escolher; pode apagar ou trocar a qualquer momento.

O modo offline não tem mesmo nenhum tráfego de internet?

Durante a transcrição: sim, zero tráfego de saída. A aplicação ainda acede à internet para verificação de licença e verificações de atualizações, que acontecem ao iniciar a aplicação, não durante o ditado. Pode verificar com qualquer monitor de rede.

Privado por padrão. Potente por escolha.

Licença vitalícia significa que paga uma vez e é seu. O modo offline significa que o áudio nunca sai da sua máquina.

Descarregar agora Saber mais sobre o modo nuvem

Whisper (OpenAI, local)

Parakeet TDT 0.6B v3 (NVIDIA, local)

Velocidade

Rápido em GPU, moderado em CPU

Até ~10× mais rápido em CPU — tempo real num portátil

Precisão

Padrão de excelência — ajustável via tamanho do modelo (Base → Large v3)

Paridade com o Whisper em línguas europeias segundo benchmarks NVIDIA

Línguas

Mais de 90

24 línguas europeias

Tradução

Fale qualquer língua → cole em inglês

Apenas transcrição

Perfis de desempenho

Rápido / Equilibrado / Preciso

Fixo

Presets de IA + trigger word

(via Ollama)

Apenas transcrição

Remoção de enchimento + dicionário

Tempo de execução

whisper.cpp com aceleração CUDA / Vulkan / Metal

ONNX Runtime

Melhor para

Precisão, tradução, conjunto completo de funcionalidades de IA

Velocidade bruta, ditado puro, máquinas apenas com CPU

Perguntas comuns

Preciso de uma GPU NVIDIA para o modo offline?

Qual o tamanho dos modelos?

O modo offline não tem mesmo nenhum tráfego de internet?