Por Denys Medvediev

Guia

Software de transcrição jurídica, com honestidade

"Software de transcrição jurídica" geralmente se refere a transcrições certificadas de audiências e depoimentos. Whisper by Remskill não é isso. É uma ferramenta de ditado que advogados e paralegais usam na própria escrita — memorandos, cartas, anotações de processo — por voz, em qualquer aplicativo, com um modo local offline.

Última atualização: junho de 2026

Livros jurídicos, um bloco de notas e um laptop sobre uma mesa de madeira em um escritório tranquilo, evocando a redação de documentos legais

Software de transcrição jurídica geralmente significa transcrições certificadas de audiências, depoimentos e sessões. Whisper by Remskill não é um serviço de transcrição certificada e não oferece garantias de conformidade ou sigilo profissional. É uma ferramenta de ditado para a própria escrita do advogado — redigir memorandos, cartas e anotações de processo por voz em qualquer aplicativo — com um modo local offline que mantém o texto na máquina.

Quero começar com algo que a maioria das páginas que vendem "software de transcrição jurídica" omite. A expressão carrega dois significados bem distintos, e confundi-los custa dinheiro de verdade. Um significado é transcrição certificada — um taquígrafo ou um serviço de transcrição convertendo um depoimento, audiência ou entrevista gravada em um registro literal que pode ser protocolado ou citado. O outro significado é ditado — um advogado falando em vez de digitar, para redigir o rascunho de um memorando ou de uma carta com mais agilidade.

Whisper é definitivamente a segunda opção. Não é um serviço de transcrição certificada, não produz transcrições com qualidade de registro judicial, e não oferece garantias de conformidade, sigilo profissional ou exatidão para fins de registro oficial. Se você veio atrás do primeiro significado, pule para a última seção, onde indico o tipo certo de serviço. Se você redige muitos rascunhos próprios e suas mãos já estão cansadas disso, a parte central deste guia é para você.

Veja o enquadramento honesto. Uma ferramenta de ditado não transcreve uma audiência. Ela cola suas palavras faladas no cursor em qualquer campo de texto em foco — um documento Word, um e-mail, uma nota de processo ou uma narrativa de faturamento. Ela não sabe que é "jurídica". Ela simplesmente converte fala em texto no aplicativo que você já está usando.

Então a pergunta real não é "isso é software de transcrição jurídica?". Para transcrições certificadas, a resposta é não, e direi isso sem rodeios. A pergunta real é "posso redigir minha própria escrita por voz em vez de digitar?", e aí a resposta é sim — offline, se quiser, com uma lista de palavras personalizadas para os nomes e termos que você usa o dia todo. Vou mostrar a configuração, o fluxo de redação, a escolha entre local e nuvem, e exatamente quando largar tudo isso e contratar um serviço certificado.

O que é isso, e o que não é

Livros jurídicos empilhados ao lado de um laptop fechado sobre uma mesa, com uma janela ao fundo

Deixa eu traçar a linha com clareza, porque aqui isso importa mais do que na maioria das áreas. Whisper é um software de ditado. Você fala, e suas palavras aparecem como texto editável no cursor. Não é transcrição certificada. Não produz um registro literal e atestável de um depoimento, audiência ou entrevista gravada. Não tem qualidade de registro judicial, e não oferece garantias de conformidade, sigilo profissional, confidencialidade ou cadeia de custódia. Se um documento precisa ser certificado ou protocolado como registro exato do que foi dito, esta é a ferramenta errada, ponto final.

Para o que ele serve bem é para os seus próprios rascunhos. O memorando que você digitaria laboriosamente, uma frase dolorosa de cada vez. A carta ao cliente, o resumo de anotações pós-ligação, o recapitulativo interno sobre onde um processo está, o esboço inicial de um argumento antes de lapidá-lo. Nessas situações, você é o autor, e o único padrão que importa é "capturou o que eu quis dizer?". Falar é mais rápido do que digitar — cerca de 145 palavras por minuto faladas contra aproximadamente 40 digitadas, no meu próprio uso — e o texto é seu para editar antes que qualquer outro o veja.

Há mais um ponto honesto que vale mencionar sobre o modo local, porque é algo que outras ferramentas exageram. Os mecanismos locais do Whisper rodam completamente na sua máquina, então o áudio e o texto resultante nunca saem do seu computador. Para assuntos sensíveis, manter o texto na máquina é uma propriedade real e útil. Isso, por si só, não é uma garantia de confidencialidade ou conformidade — seus próprios sistemas, políticas e obrigações continuam regendo o arquivo. Prefiro que você entenda a diferença a comprar uma frase que soa como uma promessa.

Pressione um atalho, fale, o texto cai no rascunho

A mecânica é simples, e simples é o ponto. Você pressiona um atalho, fala, solta, e a transcrição é colada no cursor, onde quer que esteja o foco. O Whisper mantém um pequeno buffer depois que você solta a tecla para que sua última palavra não seja cortada. Como ele cola no cursor do sistema operacional, sua nota de processo no Word é apenas "uma caixa de texto", igual ao seu cliente de e-mail ou ao seu sistema de gestão de processos. Não há plugin para integrar com um aplicativo jurídico específico, nem integração a ser autorizada.

É aí que as páginas de produto complicam demais. O cursor está no seu rascunho, você fala, as palavras aparecem no rascunho. Uma pequena cápsula surge enquanto você fala para que você saiba que está ouvindo:

Cancel
O indicador de gravação: uma pequena cápsula que aparece enquanto você fala, para que você saiba que o Whisper está ouvindo.

O atalho é a única coisa que vale configurar direito desde o início. No Windows é Ctrl+Space; no Mac é Command+Option, um modificador mantido pressionado como push-to-talk enquanto você fala. Ambos são alteráveis em Configurações, caso conflitem com algo que você já usa. (Minha filha mais nova certa vez me disse que um atalho "não funcionava" no aplicativo de desenho dela. Era um conflito, não um bug — foi assim que aprendi que a pessoa média não faz ideia do que é um conflito de atalho. Por isso todo atalho é personalizável.) Se você já configurou ditado no Windows ou no Mac antes, é o mesmo músculo apontado para seus aplicativos de redação.

Configure em dois minutos (Windows ou Mac)

Você precisa de um Mac com Apple Silicon ou um PC com Windows 10 ou mais recente, um microfone funcionando, e o aplicativo em que você redige aberto e pronto. O pipeline local completo é gratuito para qualquer conta conectada, sem pedido de forma de pagamento no cadastro. Veja a sequência.

Passo 1 — Instale o Whisper e faça login.

Baixe na página de download, instale e crie uma conta gratuita. Sem cartão. O pipeline de transcrição local completo abre imediatamente.

Você saberá que funcionou quando o ícone da bandeja do aplicativo aparecer e o assistente de configuração oferecer a escolha de um modelo.

Passo 2 — Escolha o caminho de transcrição.

O aplicativo não escolhe por você. Você tem três opções: Nuvem (OpenAI, traga sua própria chave), Parakeet Local ou Whisper Local. Para assuntos sensíveis, comece com o local — mais sobre isso duas seções adiante.

Você saberá que funcionou quando um modelo terminar de baixar e aparecer como pronto.

Passo 3 — Confirme seu atalho.

O padrão no Windows é Ctrl+Space; no Mac é Command+Option mantido como push-to-talk. No Mac, conceda a permissão de Acessibilidade quando solicitado; sem ela, a colagem no cursor não consegue alcançar outros aplicativos.

Você saberá que funcionou quando uma gravação de teste for colada em qualquer campo de texto.

Passo 4 — Posicione o cursor no rascunho e fale.

Abra o memorando, a carta ou a nota de processo, clique onde quer o texto, mantenha o atalho pressionado, diga uma frase, solte. A transcrição aparece onde o cursor está.

Você saberá que funcionou quando a frase que você disse estiver no documento como texto.

Whisper
O aplicativo desktop real do Whisper na tela de configurações, com os painéis de Transcrição e IA abertos.

A parte lenta é o download do modelo, não a configuração. Todo o resto são os quatro passos acima. Uma vez em execução, colocar um pensamento no papel deixa de ser uma tarefa de digitação e passa a ser uma tarefa de fala.

voz para texto no Windows · no Mac

Redigindo memorandos, cartas e anotações de processo por voz

Veja como é o dia a dia na prática, porque isso é mais útil do que uma lista de funcionalidades. Você termina uma ligação com o cliente e quer anotar tudo antes de esquecer. Cursor na nota do processo, atalho mantido, você fala o que aconteceu em frases simples, solta. Dois minutos depois você tem um parágrafo para aparar, em vez de uma página em branco encarada sem saída. O mesmo fluxo funciona para o primeiro rascunho de um memorando, uma carta de encaminhamento, um resumo do processo, uma narrativa de faturamento — qualquer coisa em que você seja o autor e as palavras comecem como suas.

Onde o ditado faz jus ao seu lugar é nos textos longos. Um memorando de duas páginas dá muito trabalho de digitação e pouco pensamento quando você já sabe o que quer dizer. Falado, sai na ordem em que você argumentaria em voz alta, que muitas vezes é a ordem em que deveria ser lido. Você não está transcrevendo ninguém — está colocando seu próprio argumento no papel na velocidade da fala, e depois editando. A edição ainda é o seu trabalho. A voz remove o teclado, não o advogado. (O mesmo fluxo de redação aparece em outras profissões que vivem em documentos — é parecido com o que descrevi para software de ditado para consultores, onde o produto final é um relatório, não um memorando.)

A outra vantagem silenciosa são as mãos. Se seus pulsos estão exaustos depois de uma década de redação, ditar o primeiro rascunho e reservar o teclado para as edições é um alívio genuíno. Não vou embrulhar isso como uma afirmação médica — não é. São simplesmente menos teclas pressionadas para o mesmo resultado, o que a maioria das pessoas que redige para viver vai aceitar.

Local ou nuvem: qual modo para assuntos sensíveis

Para redação jurídica, experimente o modo local primeiro. O motivo é simples: um argumento ainda em formação, o nome de um cliente, os fatos de um processo ativo — esse texto nunca precisa sair da sua máquina para virar um rascunho. Os mecanismos locais do Whisper rodam completamente no seu computador, então o áudio e o texto ficam lá. Essa é uma propriedade real para trabalho sensível, embora, como disse antes, seja uma propriedade de onde o processamento acontece, não um certificado de conformidade. Se seu Mac é Apple Silicon ou seu PC é dos últimos anos, o modo local lida com o ditado do dia a dia sem reclamações.

Veja como os três caminhos diferem, porque o aplicativo faz você escolher e prefiro que você escolha bem:

  • Parakeet LocalO mecanismo TDT da NVIDIA, cerca de 600 MB, e a opção local mais rápida — de 5 a 10 vezes mais rápida que o Whisper na CPU. Cobre inglês e outros 24 idiomas europeus, 25 no total. Sem tradução para o inglês e sem vocabulário personalizado. Se você redige em inglês e quer velocidade, completamente offline, esta é a escolha rápida.
  • Whisper Localmais lento que o Parakeet na mesma máquina, mas é o mecanismo que aceita vocabulário personalizado, o que importa aqui — adicione nomes das partes, termos em latim e as expressões que você usa o dia todo. Os modelos multilíngues cobrem 99 idiomas e podem traduzir para o inglês; os modelos exclusivos para inglês são apenas em inglês. O modelo padrão em inglês tem cerca de 480 MB. Esta é a escolha local se a precisão terminológica é o que você busca.
  • Nuvem (OpenAI, BYOK)melhor precisão e acesso à web, usando sua própria chave OpenAI cobrada diretamente pela OpenAI. A transcrição usa gpt-4o-mini-transcribe por padrão. Precisa de internet, então é o único caminho em que o texto sai da sua máquina — pense bem antes de rotear assuntos sensíveis por ele. O modo Nuvem faz parte do Whisper Pro.

A verdade sem romantismo é que, para primeiros rascunhos da sua própria escrita, o local é mais do que suficiente, e para assuntos sensíveis é o ponto de partida óbvio. Ambos os mecanismos locais rodam completamente na sua máquina sem nada enviado a um servidor. A nuvem ganha espaço quando você quer precisão máxima em uma gravação difícil ou precisa de um dado da web no meio de uma frase — e quando o conteúdo não é sensível o bastante para manter na máquina. Comece local; recorra à nuvem apenas quando o local deixar a desejar.

Termos jurídicos, nomes das partes e limpeza do rascunho

O ditado bruto sai como um bloco de texto corrido. Você diz "ok anotação para o processo conversamos com o cliente sobre a disputa de servidão querem resolver antes da audiência me lembre de redigir a carta quinta-feira", e isso é a parede sem pontuação que qualquer mecanismo de fala entrega. Duas coisas ajudam.

Primeiro, terminologia. O Whisper Local aceita um vocabulário personalizado — uma lista de palavras para as quais você o direciona. Adicione os nomes das partes, as expressões em latim, as abreviações específicas do escritório que você repete diariamente, e o mecanismo para de adivinhar. Essa funcionalidade é exclusiva do Whisper local; o Parakeet e os modelos de transcrição em nuvem não aceitam lista de palavras personalizada. Segundo, limpeza. Para remover os "éhs", corrigir os textos corridos e transformar um parágrafo falado em algo que você manteria, o Whisper pode fazer uma passagem com IA. Diga a frase de ativação "Hey whisper" e o texto é aprimorado antes de aparecer. Em um modelo local, isso passa pelo Ollama; no modo nuvem, é gpt-5-mini por padrão.

Thinking...
Bruto

ok anotação para o processo conversamos com o cliente sobre a disputa de servidão querem resolver antes da audiência éh me lembre de redigir a carta quinta-feira

Limpo

Anotação para o processo: conversamos com o cliente sobre a disputa de servidão. Querem resolver antes da audiência. Me lembre de redigir a carta quinta-feira.

Uma palavra de cautela que cabe aqui mais do que na maioria das áreas. A limpeza com IA arruma gramática e vícios de linguagem — não é revisão de texto, e certamente não é análise jurídica. Ela fará com satisfação uma frase limpa e confiante a partir de algo que você disse errado. Leia o que aparecer antes de enviar para um cliente ou juntar ao processo. A voz coloca as palavras; o seu julgamento faz o resto.

Esse mesmo fluxo de falar e depois limpar rende bem além da redação jurídica — você também pode ditar um texto limpo em qualquer aplicativo com o mesmo atalho, então um parágrafo longo vira algumas frases faladas em vez de algo que você digitaria.

Quando você precisa de um serviço de transcrição certificado

Colunas externas de um tribunal contra um céu limpo, sugerindo processos jurídicos formais

Esta é a seção mais importante, por isso vou ser direto. Se o que você realmente precisa é de um registro do que foi dito — um depoimento, uma audiência, uma entrevista gravada, um interrogatório — transformado em uma transcrição exata e atestável, não use uma ferramenta de ditado, e não use o Whisper. Você precisa de um taquígrafo certificado ou de um serviço de transcrição jurídica certificado. Essa é uma categoria diferente de trabalho, com padrões diferentes: precisão literal, certificação e o tipo de responsabilidade que um registro protocolado exige. O Whisper não oferece nenhuma dessas garantias, e não vou fingir o contrário.

O mesmo vale para qualquer trabalho sujeito a conformidade regulatória em que a ferramenta em si precisa atender a um padrão — uma cadeia de custódia documentada, um limiar contratual de exatidão, uma trilha de auditoria de quem manuseou o áudio. O Whisper é uma ferramenta de redação pessoal. Não possui certificações, e manter o texto na máquina é uma propriedade do modo local, não uma atestação de conformidade. Se uma norma, um tribunal ou um cliente exige resultado certificado, a resposta honesta é um serviço certificado. Use a ferramenta certa para o padrão ao qual você está sujeito.

Onde o Whisper se encaixa é na escrita que você de outra forma digitaria sozinho: o memorando, a carta, a anotação de processo, o primeiro rascunho de um argumento. Se sua necessidade é "redijo muito e minhas mãos estão cansadas", ele é uma boa escolha. Se sua necessidade é "preciso produzir uma transcrição na qual alguém vai se basear como registro", não é — e uma ferramenta de ditado nunca será. Saber de que lado dessa linha você está é a decisão toda.

Se seu interesse é menos sobre trabalho jurídico especificamente e mais sobre criar primeiros rascunhos privados sem um servidor no meio do caminho, a lógica em transcrição de fala para texto privada e offline é a mesma, porque ambas se resumem a manter o texto na máquina onde ele começa.

Resumindo: não é transcrição certificada, não é um registro judicial, sem promessas de conformidade. Uma ferramenta de ditado para seus próprios rascunhos, offline se quiser, com uma lista de palavras para os termos que você usa o dia todo. Ditei a maior parte deste guia falando e editando o resultado, que é exatamente o fluxo de trabalho que estou descrevendo — e não tem nada a ver com produzir uma transcrição de depoimento, que eu contrataria alguém qualificado para fazer. Use a ferramenta certa para a linha em que você está.

Redija seu próximo memorando por voz

Mantenha o atalho, fale, solte. O primeiro rascunho cai onde o seu cursor está — no editor, no e-mail ou nas notas de processo.

Modo local gratuito para qualquer conta conectada. Sem cartão para começar.

Foto de Denys Medvediev

Denys Medvediev

Sou o responsável por ler nosso e-mail de suporte, provavelmente ditando as respostas.

Leituras complementares