Por Denys Medvediev

Tutorial

Voz para texto no VS Code, a versão honesta

O VS Code Speech dita dentro do editor, no próprio dispositivo e de graça. A parte honesta: para a mensagem de commit, o terminal e o navegador, um atalho global alcança onde uma extensão de editor não chega.

Última atualização: junho de 2026

Código de programação vibrante exibido em uma tela de computador dentro de um editor de código, o ambiente de trabalho do desenvolvedor no dia a dia

Voz para texto no VS Code funciona por meio do VS Code Speech, a extensão oficial e gratuita da Microsoft, que dita dentro do editor no próprio dispositivo e dá vida ao chat por voz com o Copilot. Para ditar fora do editor — o terminal, o navegador, uma mensagem de commit em outro lugar — uma ferramenta de sistema como o Whisper cola o texto no cursor em qualquer app. Os dois rodam offline.

Então a resposta curta é sim, e é boa. Se você presumiu que o VS Code não fazia voz, pode parar de pesquisar. A Microsoft lançou o VS Code Speech com a versão 1.87 em fevereiro de 2024, ele roda localmente e é de graça. A maioria dos desenvolvedores que quer ditar dentro do editor já está pronta depois de dois parágrafos. Tudo bem por mim. A parte interessante é o que acontece quando aquilo que você quer ditar não está no editor.

Aqui vai a parte que ninguém te conta logo de cara. Voz para código é uma má ideia — diga "abre parênteses, camel case, user ID, fecha parênteses" em voz alta e você desiste antes do almoço. Mas voz para a prosa em volta do código — mensagens de commit, comentários, READMEs, aquela descrição de PR que você vem evitando — supera a digitação. O ditado roda em torno de 145 palavras por minuto contra cerca de 40 da digitação. Essa diferença é todo o motivo pelo qual vale dez minutos de configuração.

A situação de voz no VS Code: a extensão VS Code Speech

Close de um notebook rodando um software de programação ao lado de uma caneca de café, um setup típico de editor antes de adicionar entrada por voz

O VS Code não vem com voz para texto ligada por padrão. Você adiciona com uma extensão oficial. Abra a aba de Extensões, busque por VS Code Speech, confirme que o publicador é Microsoft (a página do ms-vscode.vscode-speech no Marketplace), e instale. Não tem chave de API, nem cadastro, nem plano pago. Ele baixa um modelo de fala pequeno que roda no dispositivo e pronto.

Para ditar dentro do editor, execute o comando Voice: Start Dictation in EditorCtrl+Alt+V no Windows e Linux, Opt+Cmd+V no Mac. Pare com Voice: Stop Dictation in Editor, atribuído a Escape. Pressione e segure o mesmo atalho para o que a Microsoft chama de "modo walkie-talkie": o reconhecimento fica ligado enquanto você segura as teclas e envia no instante em que você solta. É o mais próximo de um botão de apertar para falar que o editor tem.

A mesma extensão faz uma segunda coisa, separada: chat por voz com o GitHub Copilot. Execute Chat: Start Voice Chat (Ctrl+I / Cmd+I), ou ative a palavra de ativação "Hey Code" e fale com o Copilot Chat sem usar as mãos. Nenhuma ferramenta de ditado genérica reproduz isso. Se falar com o Copilot é o que você veio buscar, o VS Code Speech é a resposta, e não existe uma segunda.

Uma observação de praxe: a documentação oficial do VS Code lista 26 idiomas suportados, definidos pela configuração accessibility.voice.speechLanguage. Você pode topar com uma página antiga do wiki microsoft/vscode que diz "somente inglês" — está desatualizada. A documentação atual prevalece.

Ele roda na sua máquina, offline — e isso importa menos do que você imagina

Cadeado trancando uma porta listrada de azul e branco, simbolizando o ditado privado mantido na sua própria máquina

O VS Code Speech roda no dispositivo. Segundo a documentação oficial de suporte a voz do VS Code, "As gravações nunca são enviadas a nenhum serviço online, mas processadas localmente na sua máquina." Não precisa de internet depois que o modelo é baixado; seus comentários falados ficam no notebook.

Quero ser direto sobre isso, porque é aqui que muitos artigos "alternativos" ficam espertinhos. O modo local do Whisper também é totalmente offline, com o áudio nunca saindo da máquina. Então offline não é uma vantagem exclusiva do Whisper. É empate. O mesmo vale para o preço — o VS Code Speech é gratuito, e o pipeline local do Whisper é gratuito sem cartão no cadastro. Se alguém te disser para trocar de ferramenta "porque é offline e de graça", está te vendendo algo que você já tem.

A diferença honesta é alcance. O VS Code Speech roda no dispositivo e é gratuito dentro do VS Code. A questão é o que você faz quando o texto mora em outro lugar.

O que o VS Code Speech não alcança: tudo o que está fora do VS Code

O VS Code Speech dita dentro do editor e dentro do chat. Esse é o escopo, por design — ele não digita no terminal integrado como entrada genérica, não alcança o navegador e não toca no Slack, no Jira ou na sua interface gráfica de git. Nada disso é defeito. Uma extensão de editor que sequestrasse silenciosamente o seu teclado inteiro seria uma extensão pior.

Mas pense em onde a prosa do desenvolvedor de fato mora. A mensagem de commit num terminal ou num cliente git separado. A descrição do PR no GitHub, no navegador. A reprodução do bug que você cola num ticket do Jira ou numa issue do GitHub. A mensagem no Slack explicando por que o build está vermelho. Quase nada disso acontece no painel do editor. Acontece em cinco outras janelas, e a extensão do editor não consegue te seguir até lá.

Essa é a lacuna — o editor é uma janela entre oito.

Whisper para a prosa em volta do seu código, em qualquer app

O Whisper é um app de desktop para Windows e macOS, não uma extensão do VS Code. Como ele fica no nível do sistema operacional, cola a transcrição no cursor em qualquer app onde você possa digitar — o editor do VS Code e o terminal integrado, sim, mas também o navegador, o Slack, o Teams, o Gmail, sua IDE JetBrains, o Notion. Um atalho, todas as janelas.

Cancel
O overlay de gravação: uma pequena cápsula que aparece enquanto você fala, para você saber que o Whisper está ouvindo.

O atalho é Ctrl+Space no Windows e Command+Option (apertar para falar) no macOS. Segure, fale, solte, e o texto cai onde o seu cursor já estava. Se Command+Option parece muito com o Opt+Cmd+V do VS Code Speech — bom olho. As mesmas teclas modificadoras, mecanismos diferentes: um é um comando interno do VS Code, o outro um atalho global que você pode reatribuir nas Configurações. Eles não brigam; vivem em camadas diferentes.

Esta é a única opinião que vou gastar aqui: o melhor truque de produtividade é menos passos, não passos mais rápidos. Trocar de janela, achar o comando de voz certo para aquele app, lembrar qual ferramenta dita onde — tudo isso são passos. Um único atalho global que funciona igual no terminal e no navegador apaga o passo. A velocidade é boa, mas a vitória de verdade é não precisar pensar em qual janela você está.

O app inteiro, ao vivo

Whisper
O app de desktop real do Whisper — escolha um caminho de transcrição, depois segure o atalho em qualquer lugar e o texto aparece no seu cursor.

Esse é o app de desktop de verdade acima — configurações, modos, tudo. O Whisper suporta mais de 90 idiomas tanto no modo local quanto no modo nuvem (a linha de modelos multilíngues chega a 99+; as builds .en são somente inglês). O VS Code Speech cobre 26. Mas eu nunca te diria para trocar pela contagem. Você trocaria pelo alcance.

Limpe o ditado automaticamente

Thinking...

Aqui vai a única coisa que o ditado cru não consegue fazer por você. O Whisper tem uma passagem opcional de limpeza por IA que transforma uma mensagem de commit dita de qualquer jeito em prosa limpa — local via Ollama no modo gratuito, ou OpenAI no Pro. Você fala "ah, conserta aquilo do botão de login que, sabe, não funciona no Safari" e sai como uma frase que você de fato colocaria num commit. Uma vez eu enviei um commit que dizia só "conserta a coisa". O eu do futuro não agradeceu ao eu do passado. O VS Code Speech faz ditado direto; a passagem de limpeza é coisa do Whisper. Para mensagens de commit e descrições de PR, essa é a diferença entre um ditado que economiza tempo e um ditado que você refaz na mão.

Não dite o código em si

Esta é a fronteira, e um público de desenvolvedores fareja na hora se eu for vago, então vou ser direto: não escreva código-fonte por voz, e não confie em nenhuma ferramenta que diga que dá. Os dezessete símbolos numa linha de TypeScript tornam voz-para-código mais lento que o trackpad que você estava evitando. O Whisper é para a prosa em volta do código, não o código. Comentários, mensagens de commit, docs em markdown, READMEs, texto de PR, a thread do Slack. Onde você escreve português, a voz ganha. Onde você escreve sintaxe, o teclado já ganhou.

E para ser igualmente claro no outro sentido: o Whisper não faz chat por voz com o Copilot. Ele não é um substituto do VS Code Speech — é a ferramenta para as oito outras janelas.

Quando o VS Code Speech é a melhor escolha

Close detalhado das teclas de seta de um teclado preto, evocando comandos do editor e atalhos dentro da ferramenta

Prefiro te perder para a ferramenta certa a te manter na errada. Então, sem rodeios: se tudo o que você precisa é ditar dentro do editor do VS Code, ou falar com o Copilot Chat por voz, instale o VS Code Speech e pule o Whisper de vez. Ele é gratuito, oficial, roda no dispositivo, suporta 26 idiomas e faz a palavra de ativação "Hey Code" que nenhuma ferramenta de ditado genérica reproduz. Não adicione um segundo app para um trabalho que o nativo já faz.

Mais dois casos. Primeiro, Linux — o VS Code Speech roda no Linux; o Whisper desktop é só Windows e macOS. Se você está no Linux, a pergunta já está respondida. Segundo, fluxos estritamente dentro do editor — se o seu ditado realmente acontece só no painel do editor, um atalho global resolve um problema que você não tem. Recorra ao Whisper quando a prosa morar fora do VS Code. Caso contrário, o nativo basta, e "basta" é um bom lugar para parar.

Se o editor é o único lugar onde você dita, você terminou este artigo três seções atrás, e esse é um bom resultado. O VS Code Speech é o padrão certo, é gratuito e fala com o Copilot. No dia em que sua voz precisar chegar ao terminal, ao navegador e a uma mensagem de commit sem você ficar rastreando em qual janela está — é aí que um atalho global mostra o seu valor. Ditei boa parte deste artigo sem encostar no editor. O código, claro, eu digitei.

Dite a sua próxima mensagem de commit

Baixe o Whisper, segure o atalho e veja a transcrição cair no terminal, no navegador ou no editor — onde quer que o seu cursor já esteja.

Se você está num Mac, aqui está a configuração para macOS.

Modo local gratuito para qualquer conta logada. Sem cartão para começar.

Foto de Denys Medvediev

Denys Medvediev

Sou eu quem lê o nosso e-mail de suporte, provavelmente ditando as respostas.