Por Denys Medvediev

Guia

Como ditar pontuação

Você pode falar a pontuação em voz alta — "vírgula", "ponto", "novo parágrafo" — e o símbolo aparece no lugar da palavra. Ou você ignora tudo isso, fala naturalmente e deixa uma passagem de IA adicionar as vírgulas e os pontos por você. As duas abordagens funcionam. Este guia explica quando usar cada uma.

Última atualização: junho de 2026

Detalhe de sinais de pontuação em um teclado mecânico, evocando a ideia de ditar vírgulas e pontos por voz

Para ditar pontuação, fale o nome do sinal enquanto dita: "vírgula" insere uma vírgula, "ponto" insere um ponto, "ponto de interrogação" insere um ponto de interrogação, "nova linha" quebra a linha e "novo parágrafo" inicia um novo parágrafo. Tanto o Windows Voice Typing quanto o macOS Dictation reconhecem esses comandos de voz.

Na primeira vez que ditei um e-mail, ele saiu como uma frase longa sem nenhuma pausa. Eu sabia que dava para falar "vírgula" para inserir uma vírgula — a maioria das pessoas descobre isso em menos de um minuto. O que ninguém conta é como é estranho falar "ponto" em voz alta quarenta vezes seguidas, como se você estivesse lendo um telegrama de 1910.

Este guia faz duas coisas. Primeiro, ensina os comandos de pontuação por voz de forma honesta — os que realmente funcionam no Windows Voice Typing e no macOS Dictation, sem palavras mágicas inventadas. Depois, mostra o outro caminho: uma passagem de IA que lê o seu texto corrido e adiciona a pontuação por você, para que você pare de narrar vírgulas e simplesmente fale.

Aqui está a divisão que a maioria dos artigos não expõe claramente. Existem duas formas de inserir pontuação em um texto ditado. Você a fala manualmente — "vírgula", "ponto", "novo parágrafo" — e o motor de ditado coloca o símbolo onde você disse. Ou você não fala nada disso, e algo limpa o texto depois.

A forma manual dá controle exato: você decide onde cada vírgula vai. A forma automática dá fluidez: você fala como um ser humano e deixa o software adivinhar a pontuação. Nenhuma é "melhor" em abstrato — depende se você precisa de uma vírgula em um lugar específico ou se quer apenas que o parágrafo soe natural. Vou ensinar os comandos, mostrar a alternativa com IA e dizer qual escolho na hora.

Por que o texto ditado sai como um bloco sem pausas

Marcas de revisão em vermelho e correções de pontuação em uma página impressa, ilustrando a correção de um texto corrido

Um motor de fala ouve sons e escreve palavras. Ele não ouve o silêncio onde você colocaria uma vírgula, e não consegue ver o ponto no final do seu pensamento. Então, a menos que você diga o contrário, ele entrega exatamente o que ouviu: um bloco de palavras sem nenhum sinal. "tudo bem então revisa o doc manda para a maria e me lembra quinta-feira" — esse é o formato bruto de um ditado, e é o mesmo em qualquer ferramenta.

Existem duas soluções honestas, e o restante deste guia trata apenas dessas duas. Você pode falar a pontuação, nomeando cada sinal conforme avança — o que tanto Windows quanto macOS suportam sem configuração adicional. Ou pode deixar o software adicionar os sinais depois — os sistemas operacionais fazem uma versão básica disso, e uma ferramenta dedicada pode fazer uma passagem completa de limpeza que corrige a pontuação junto com os vícios de linguagem.

A maioria das pessoas começa pelos comandos de voz porque já vêm instalados e funcionam assim que você ativa o ditado. Então é por aí que vamos começar também. Depois, vou mostrar o que me fez parar de falar "ponto" em voz alta — algo que eu vinha fazendo por quase um ano inteiro, como um estenógrafo de tribunal.

Fale o sinal e ele aparece como símbolo

A forma por comandos de voz é simples depois da primeira vez. Enquanto dita, você fala o nome do sinal de pontuação, e o motor escreve o símbolo em vez da palavra. Fale "Olá vírgula como vai você ponto de interrogação" e você obtém "Olá, como vai você?" O truque é que o sinal cai exatamente onde você o disse, então você posiciona a pontuação em tempo real enquanto fala.

Isso funciona da mesma forma seja com uma ferramenta de ditado integrada ou com um atalho de teclado que cola no cursor. Pressione uma tecla, fale, nomeie os sinais, solte. Uma pequena cápsula aparece enquanto você fala para que você saiba que está sendo ouvido, e o texto cai onde quer que o cursor esteja — um e-mail, um documento, uma caixa de chat, tanto faz:

Cancel
O overlay de gravação: uma pequena cápsula que aparece enquanto você fala, para que você saiba que está sendo ouvido à medida que nomeia os sinais de pontuação.

O hábito a cultivar é falar o sinal sem fazer uma pausa antes. Fale "a reunião é quinta-feira ponto" como uma única frase, não "a reunião é quinta-feira… ponto", porque alguns motores escrevem a palavra "ponto" em vez do símbolo. A sensação é estranha por mais ou menos um dia, depois o seu cérebro assimila — da mesma forma que eventualmente parou de lutar contra o atalho de teclado para ditado no Windows. Depois disso, você para de pensar nisso. A lista completa de quais palavras correspondem a quais sinais está duas seções abaixo.

Deixe uma passagem de IA adicionar a pontuação

O outro caminho ignora completamente os comandos de voz. Você fala em frases normais, e uma passagem de limpeza por IA lê a transcrição e adiciona as vírgulas, os pontos e as quebras de parágrafo por você. No Whisper, isso é uma etapa integrada que você aciona por voz. Você precisa de um Mac com Apple Silicon ou de um PC com Windows 10 ou mais recente, um microfone funcionando e alguns minutos. O pipeline local completo é gratuito para qualquer conta com login, sem pedir cartão no cadastro. Veja a sequência.

Passo 1 — Instale o Whisper e faça login.

Baixe pela página de download, instale e crie uma conta gratuita. Sem cartão. O pipeline de transcrição local abre na hora.

Você saberá que funcionou quando o ícone do app aparecer na bandeja do sistema e o assistente de configuração oferecer a escolha de um modelo.

Passo 2 — Escolha um caminho de transcrição.

O app não escolhe por você. Você tem três opções: Cloud (OpenAI, com sua própria chave), Parakeet local ou Whisper local. Para textos privados, comece local — mais sobre isso duas seções abaixo.

Você saberá que funcionou quando um modelo terminar de baixar e aparecer como pronto.

Passo 3 — Confirme o seu atalho.

Windows usa Ctrl+Space por padrão; Mac usa Command+Option mantido pressionado como push-to-talk. No Mac, conceda a permissão de Acessibilidade quando solicitado; sem ela, a função de colar no cursor não consegue alcançar outros apps.

Você saberá que funcionou quando uma gravação de teste colar em qualquer campo de texto.

Passo 4 — Diga "Hey whisper" e fale normalmente.

Mantenha o atalho pressionado, inicie com a frase de ativação "Hey whisper" e fale em frases normais sem nenhum sinal de pontuação. A passagem de IA pontua o texto antes de ele chegar ao seu cursor.

Você saberá que funcionou quando uma frase corrida que você falou chegar com vírgulas e pontos já inseridos.

Whisper
O aplicativo desktop real do Whisper na tela de configurações, com os painéis de Transcrição e IA abertos.

Essa é a proposta completa do caminho automático: você para de ser um estenógrafo e volta a ser uma pessoa que simplesmente está falando. A ressalva — e sempre há uma — é que a IA decide onde os sinais vão, não você. Para a maioria dos textos, tudo bem. Para os casos em que não é, os comandos manuais estão logo ali, e a última seção cobre exatamente quando usá-los.

Os comandos de pontuação por voz que realmente funcionam

Aqui estão os comandos em que confio, porque estão documentados pela Microsoft e pela Apple e funcionam da mesma forma nos dois sistemas. Fale "vírgula" para uma vírgula, "ponto" para um ponto final, e "ponto de interrogação" para um ponto de interrogação. Para quebras de linha, "nova linha" move o cursor uma linha abaixo — como pressionar Enter uma vez — e "novo parágrafo" inicia um parágrafo novo, como pressionar Enter duas vezes. Esses cinco cobrem a grande maioria da escrita cotidiana.

Alguns pontos honestos, porque é aqui que os artigos de lista exageram. Os dois sistemas operacionais suportam uma lista muito maior de sinais — ponto de exclamação, dois-pontos, aspas, travessões — mas prefiro indicar as páginas de comandos da própria Microsoft e da Apple para a lista completa, em vez de recitar uma lista de memória que pode mudar entre versões do sistema. As palavras de comando também podem variar levemente por idioma e região. Se você dita em outro idioma que não seja o inglês americano, verifique a ajuda de ditado do seu sistema para os comandos localizados.

Outra coisa que vale saber: tanto o Windows Voice Typing quanto o macOS Dictation agora têm uma opção de pontuação automática que adiciona vírgulas e pontos básicos enquanto você fala, sem precisar de comandos. No Mac, fica em Configurações do Sistema, depois Teclado, depois Ditado, onde você pode ativar a pontuação automática. No Windows, o ditado por voz também tem essa opção nas configurações. Então até as ferramentas integradas dão uma amostra da abordagem sem intervenção. A passagem de IA dedicada vai além — ela também corrige vícios de linguagem e frases corridas — mas para uma nota rápida, ativar a pontuação automática do sistema operacional pode ser tudo de que você precisa.

Local ou nuvem: qual modo faz a limpeza

Se você optar pelo caminho de pontuação por IA, a próxima pergunta é onde o processamento acontece. A transcrição e a passagem de limpeza podem rodar completamente na sua própria máquina ou na nuvem pela sua chave do OpenAI. Para a maioria dos textos — e-mails, anotações, rascunhos — eu tentaria local primeiro. Funciona offline, nada sai do seu computador, e uma mensagem particular sobre a escola do seu filho ou o orçamento do seu chefe não tem por que ficar nos logs de um fornecedor só porque você queria pontuação. Veja como os três caminhos diferem, porque o app pede que você escolha e prefiro que você escolha bem:

As três opções, sem rodeios:

  • Parakeet localMotor TDT da NVIDIA, cerca de 600 MB, e a opção local mais rápida — de 5 a 10 vezes mais rápido que o Whisper na CPU. Cobre inglês e outras 24 línguas europeias, 25 no total. Sem tradução para o inglês. Se você escreve em inglês ou em outra língua europeia, esta é a escolha rápida e totalmente offline.
  • Whisper localmais lento que o Parakeet na mesma máquina, mas os modelos multilíngues cobrem 99 idiomas e podem traduzir para o inglês. Os modelos só em inglês são apenas para inglês, não 99. Escolha este para chinês, japonês, coreano ou qualquer trabalho de tradução, algo que o Parakeet não faz. O modelo padrão em inglês tem cerca de 480 MB.
  • Nuvem (OpenAI, BYOK)melhor precisão e acesso à web, usando sua própria chave do OpenAI cobrada diretamente pelo OpenAI. A transcrição roda em gpt-4o-mini-transcribe por padrão. Precisa de internet, então é o único caminho que sai da sua máquina. O recurso de nuvem faz parte do Whisper Pro.

Para a limpeza por IA especificamente, a passagem local roda pelo Ollama na sua própria máquina, e a passagem em nuvem usa gpt-5-mini por padrão. A verdade simples é que, para adicionar vírgulas e pontos a um texto comum, o local resolve sem reclamar. A nuvem ganha espaço quando você quer precisão máxima em uma gravação difícil ou precisa que o modelo busque uma informação na web no meio da frase. Para pontuação apenas, comece local.

O que a passagem de limpeza por IA realmente faz ao seu texto

Esta é a parte que me fez parar de falar "vírgula" em voz alta. O ditado bruto sai como um texto corrido — você fala "tudo bem então revisa o doc de arquitetura marca como projeto alpha e me lembra quinta-feira hum antes do standup", e esse é o bloco sem pontuação que qualquer motor de fala entrega. A passagem de limpeza lê isso e reconstrói como algo que você enviaria de verdade.

No Whisper você aciona isso iniciando com a frase de ativação "Hey whisper", e o texto é aprimorado antes de chegar ao seu cursor. A passagem adiciona as vírgulas e os pontos, divide o texto corrido em frases e remove os "ãns" e os falsos começos que você não quis manter. Em um modelo local, roda pelo Ollama; no modo nuvem, é gpt-5-mini por padrão. Você não falou nenhum comando de pontuação — apenas conversou.

Thinking...
Bruto

okay so review the architecture doc tag it project alpha and remind me thursday um before the standup

Limpo

Okay, so review the architecture doc, tag it Project Alpha, and remind me Thursday before the standup.

O limite honesto é que a IA está chutando a sua intenção. Ela chuta bem — para textos comuns, eu confiaria nela nove vezes em dez — mas está fazendo um julgamento sobre onde sua frase termina e onde a vírgula pertence. Essa é a troca certa para um e-mail ou rascunho, onde o significado sobrevive a uma vírgula em um lugar ligeiramente diferente. É a troca errada quando a posição da vírgula muda o sentido — que é exatamente o assunto da próxima seção.

O mesmo fluxo de falar e limpar rende muito além da pontuação — você também pode digitar mais rápido com voz em qualquer app para que um parágrafo que você teria digitado vire algumas frases faladas que chegam já limpas.

Quando falar a pontuação você mesmo

Duas setas apontando em direções opostas, ilustrando a escolha entre dizer a pontuação e deixar a IA adicioná-la

Às vezes o movimento certo é o comando manual, e fingir que a IA resolve tudo seria desonesto. A regra de ouro: quando a posição exata de um sinal carrega significado, fale você mesmo. A IA chuta bem, mas chuta — e há situações em que você não quer um chute.

Três casos em que eu nomeio os sinais em voz alta. Primeiro, qualquer texto onde a pontuação muda o sentido — uma cláusula de contrato, uma instrução médica, a diferença entre "vamos comer, vovó" e a versão em que a vovó é o jantar. Segundo, código e texto estruturado, onde uma vírgula ou dois-pontos são sintaxe, não estilo, e a IA não tem como saber que você está escrevendo um arquivo de configuração. Terceiro, símbolos específicos que a pontuação automática não vai usar por conta própria — dois-pontos antes de uma lista, um ponto de exclamação que você realmente quer, um ponto de interrogação em uma frase que é gramaticalmente uma afirmação. Nessas situações, o comando de voz é mais rápido e mais seguro do que ditar, ler o resultado e corrigir.

Para textos curtos, as ferramentas integradas são suficientes. Se você está escrevendo uma mensagem de duas linhas, o Windows Voice Typing (tecla Windows + H) e o macOS Dictation adicionam pontuação básica por conta própria, sem precisar instalar nada. A limitação do Windows Voice Typing é que ele passa pelos servidores da Microsoft e precisa de conexão com a internet, então não é uma opção offline. Recorra a uma ferramenta dedicada quando o texto for longo, multilíngue ou privado — ou quando você simplesmente não quiser mais falar a palavra "ponto" em voz alta nunca mais.

A mesma escolha aparece no Mac, onde a pontuação integrada do Dictation cobre anotações curtas — a lógica em voz para texto no Mac é a mesma: nomeie os sinais quando o posicionamento importa, deixe a ferramenta cuidar quando não importa.

É isso. Fale "vírgula", "ponto", "ponto de interrogação", "nova linha", "novo parágrafo" quando quiser o sinal em um lugar exato — e deixe uma passagem de IA fazer isso por você quando quiser apenas falar e ter o texto lendo como deve. Ditei a maior parte deste guia do segundo jeito, disse "Hey whisper" em vez de narrar quatrocentas vírgulas, e só recorri aos comandos manuais quando estava escrevendo as frases de exemplo — o único lugar neste guia onde falar "ponto" em voz alta era, finalmente, o ponto.

Pare de falar "ponto" em voz alta

Fale em frases normais, diga "Hey whisper" e deixe a passagem de IA adicionar as vírgulas e os pontos antes de o texto chegar ao seu cursor.

Modo local gratuito para qualquer conta com login. Não é necessário cartão para começar.

Foto de Denys Medvediev

Denys Medvediev

Sou quem lê o nosso e-mail de suporte — provavelmente ditando as respostas.

Leitura complementar