Tutorial
Voz para texto no Airtable
O Airtable não tem ditado nativo no aplicativo de desktop, no navegador nem no aplicativo de celular. A solução é uma ferramenta que funciona em todo o sistema: aperte um atalho, fale e a transcrição é colada no ponto do cursor em qualquer célula, campo de texto longo ou comentário do Airtable. O ditado do seu sistema operacional também funciona, para capturas curtas.
Última atualização: junho de 2026

Voz para texto no Airtable funciona por meio de uma ferramenta que abrange todo o sistema, não pelo próprio Airtable. O Airtable não tem ditado nativo no navegador, no aplicativo de desktop nem no celular. A solução é uma ferramenta como o Whisper: aperte um atalho, fale e a transcrição é colada no ponto do cursor em qualquer célula, campo de texto longo ou comentário. O ditado do sistema operacional também funciona, para entradas curtas.
Eu mantenho uma base que acompanha cada versão do aplicativo — uma linha por versão, um campo de texto longo para o changelog, uma sequência de comentários onde eu discuto comigo mesmo sobre o escopo. Por muito tempo eu digitei cada palavra disso. Então fui procurar um botão de microfone no campo de texto longo, porque com certeza uma ferramenta tão boa em estruturar dados deixa você falar com ela. Não existe botão de microfone. Depois de fuçar bastante, tenho certeza de que o Airtable não está escondendo nenhum.
As pessoas pesquisam por "voz para texto no Airtable", não acham nada no aplicativo e supõem que perderam alguma chave. Não perderam. A chave nunca foi criada. A boa notícia é que a solução leva cerca de dois minutos, roda totalmente offline se você quiser, e funciona em todos os outros aplicativos que você abrir, como bônus.
Aqui está o que a maioria das páginas que rodeiam essa palavra-chave não diz com todas as letras. Uma célula do Airtable é só uma caixa de texto, igual ao Gmail ou a uma barra de busca. Um campo de texto longo e um comentário de registro são caixas de texto maiores. O ditado que cola no ponto do cursor não se importa em qual caixa o cursor está.
Então a pergunta de verdade não é "como ligo a digitação por voz no Airtable". Não existe interruptor. A pergunta é "qual ferramenta de ditado eu rodo por cima do Airtable", e a resposta depende de você querer algo grátis e embutido, só no navegador, ou um único atalho offline que se comporta igual em todo lugar. Vou passar por tudo, configurar um em dois minutos e dizer quando vale a pena pular a rota da ferramenta dedicada.
O Airtable tem ditado nativo?

Não. O Airtable não tem nenhum recurso nativo de fala para texto, ditado ou digitação por voz para inserir texto em uma célula, em um campo de texto longo ou em um comentário usando a voz. Nem no navegador, nem no aplicativo de desktop, nem no celular. Não há botão de microfone em um campo, nem comando de voz, nem preferência escondida. Se você andou vasculhando as Configurações atrás disso, pode parar. Não está lá.
O que existe é transcrição de áudio, e é aqui que as pessoas se confundem. Você pode enviar um arquivo de áudio para um campo de anexo e processá-lo com o Airtable AI ou com uma automação para receber uma transcrição de volta. Isso é útil, mas não é ditado ao vivo. Você não consegue colocar o cursor em uma célula, falar e ver as palavras aparecerem. Esses fluxos processam um arquivo gravado depois do fato; eles não digitam para você enquanto você pensa. Misturar os dois custa uma tarde inteira montando uma automação que resolve um problema diferente, e prefiro que você pule essa tarde.
Até as ferramentas de terceiros construídas em torno disso admitem com franqueza. As extensões de navegador e os aplicativos de ditado que aparecem nas buscas por "digitação por voz no Airtable" começam dizendo que o Airtable não tem entrada de voz nativa, e então se oferecem para acoplar uma de fora. Eles estão certos no diagnóstico. No aplicativo de desktop e na grade do navegador, onde a maioria das pessoas realmente vive, você precisa de uma ferramenta que fique por cima do Airtable. Existem três categorias honestas, e o resto deste guia cobre todas elas.
Aperte um atalho, fale, o texto cai na célula
Essa é toda a mecânica, e ela é maravilhosamente sem graça. Você aperta um atalho, fala, solta, e a transcrição é colada no ponto do cursor, em qualquer campo de texto que esteja em foco. O Whisper segura um pequeno rabicho de tempo depois que você solta a tecla, então sua última palavra não é cortada. Como ele cola no cursor do sistema operacional, uma célula do Airtable é só "mais uma caixa de texto". Aplicativo de desktop ou versão de navegador, o mesmo comportamento.
Essa é a parte que as landing pages complicam demais. Não há integração do Airtable para autorizar, nem chave de API para colar, nem automação para vigiar. Seu cursor está em uma célula, você fala, as palavras aparecem na célula. Uma pequena cápsula surge enquanto você fala, para você saber que ele está ouvindo:
O atalho é a única coisa que vale a pena acertar de cara. No Windows é Ctrl+Space; no Mac é Command+Option, um push-to-talk só com modificadores que você segura enquanto fala. Os dois podem ser alterados nas Configurações se conflitarem com algo que você já usa. (Minha filha mais nova uma vez me disse que um atalho "não funcionava" no aplicativo de desenho dela. Era um conflito, não um bug, e foi assim que aprendi que a pessoa comum não faz ideia do que é um conflito de atalho. Por isso agora todo atalho é personalizável.) Se você já configurou ditado no Windows ou no Mac, é a mesma memória muscular apontada para um aplicativo diferente.
Configure em dois minutos (Windows ou Mac)
Você precisa de um Mac com Apple Silicon ou de um PC com Windows 10 ou mais recente, um microfone funcionando e o Airtable aberto no aplicativo de desktop ou no navegador. Todo o fluxo local é gratuito para qualquer conta logada, sem pedir forma de pagamento no cadastro. Aqui está a sequência.
Passo 1 — Instale o Whisper e faça login.
Baixe na página de download, instale e crie uma conta gratuita. Sem cartão. Todo o fluxo de transcrição local fica disponível na hora.
Você vai saber que deu certo quando o ícone do aplicativo aparecer na bandeja e o assistente de configuração se oferecer para escolher um modelo.
Passo 2 — Escolha um caminho de transcrição.
O aplicativo não escolhe por você. Você tem três: Nuvem (OpenAI, traga sua própria chave), Parakeet Local ou Whisper Local. Para entradas do dia a dia na base, comece pelo local — falo mais sobre isso duas seções adiante.
Você vai saber que deu certo quando um modelo terminar de baixar e aparecer como pronto.
Passo 3 — Confirme seu atalho.
O Windows usa Ctrl+Space por padrão, e o Mac usa Command+Option segurado como push-to-talk. No Mac, conceda a permissão de Acessibilidade quando solicitado; sem ela, a colagem no cursor não consegue alcançar outros aplicativos.
Você vai saber que deu certo quando uma gravação de teste for colada em qualquer campo de texto.
Passo 4 — Ponha o cursor em um campo do Airtable e fale.
Abra sua base, clique em uma célula, campo de texto longo ou caixa de comentário, segure o atalho, diga uma frase e solte. A transcrição aparece onde está o cursor.
Você vai saber que deu certo quando sua frase falada estiver no campo do Airtable em forma de texto.
A parte lenta é o download do modelo, não a configuração. Todo o resto são os quatro passos acima. Uma vez rodando, preencher um campo de texto longo deixa de ser uma tarefa de digitar e passa a ser uma tarefa de falar.
Células curtas, campos de texto longo e comentários
O Airtable não é um único tipo de caixa de texto, são três, e o ditado lida com todas elas do mesmo jeito porque o cursor é o cursor. Uma célula de linha única recebe um valor falado rápido — um nome, um status, um título. Um campo de texto longo recebe um parágrafo, que é exatamente onde a voz faz a diferença, porque o parágrafo é onde a digitação te desacelera. Um comentário de registro recebe uma frase que, de outra forma, você digitaria com uma mão só enquanto lê a linha. Mesmo atalho, três caixas diferentes.
A maioria das páginas que ranqueiam para essa palavra-chave te aponta para uma extensão de navegador — Voice In, Voicy e afins — que adiciona ditado a qualquer campo de texto de uma página web, incluindo o Airtable. Extensões são uma boa resposta se você vive dentro de uma aba do navegador. Elas têm um limite estrutural: só funcionam onde o navegador alcança. O aplicativo de desktop do Airtable não é uma aba de navegador, então uma extensão do Chrome não consegue enxergá-lo. Um atalho que abrange todo o sistema consegue, porque cola no cursor do sistema operacional, não importa qual janela seja a dona dele.
Essa é a divisão de verdade. Uma extensão tem o escopo do navegador; um atalho tem o escopo de tudo. A mesma tecla que preenche um campo de texto longo do Airtable também preenche sua caixa de redação do Gmail, uma mensagem do Slack e uma mensagem de commit. Uma ferramenta, todos os campos de texto, tanto no Windows quanto no Mac. Se você só mexe no Airtable em uma aba do Chrome, uma extensão basta, e várias são gratuitas. No momento em que você abre o aplicativo de desktop, ou quer o mesmo fluxo em todos os programas, a rota que abrange o sistema vence. Eu pegaria o atalho único porque troco de aplicativo umas quarenta vezes por hora e não quero quarenta botões de ditado diferentes para lembrar.
Local ou nuvem: qual modo para sua base
Para o Airtable, experimente primeiro o modo local. Boa parte do que vai para uma base é o tipo de coisa que você prefere não passar pelos logs de um fornecedor — anotações de clientes, uma coluna de preços, um roadmap interno, um comentário sobre a ideia de um colega. Se o seu Mac for Apple Silicon ou o seu PC for dos últimos anos, o local dá conta do ditado do dia a dia sem reclamar, e a nuvem vira a saída de emergência em vez do padrão.
Veja como os três caminhos diferem, porque o aplicativo faz você escolher e prefiro que você escolha bem:
- Parakeet Local — O motor TDT da NVIDIA, com cerca de 600 MB, e a opção local mais rápida — de 5 a 10 vezes mais rápido que o Whisper em CPU. Cobre o inglês mais 24 outros idiomas europeus, 25 no total. Não traduz para o inglês. Se você preenche sua base em inglês ou em outro idioma europeu, esta é a escolha rápida e totalmente offline.
- Whisper Local — mais lento que o Parakeet na mesma máquina, mas as versões multilíngues cobrem 99 idiomas e podem traduzir para o inglês. As versões só de inglês são só de inglês, não 99. Escolha esta para chinês, japonês, coreano ou qualquer trabalho de tradução, que o Parakeet não faz. O modelo padrão de inglês tem cerca de 480 MB.
- Nuvem (OpenAI, BYOK) — melhor precisão e acesso à web, usando sua própria chave OpenAI cobrada diretamente pela OpenAI. A transcrição roda no gpt-4o-mini-transcribe por padrão. Precisa de internet, então é o único caminho que sai da sua máquina. A superfície de Nuvem faz parte do Whisper Pro.
A verdade sem graça é que, para o tipo de texto que a maioria das pessoas coloca em uma base, o local basta e sobra. Os dois motores locais rodam totalmente na sua máquina, sem nada enviado a um servidor. A nuvem ganha seu lugar quando você quer precisão de primeira linha em uma gravação difícil ou precisa que o modelo puxe um fato da web no meio da frase. Para entrada de dados diária, comece pelo local e só recorra à nuvem quando o local te deixar querendo mais.
Pontuação, limpeza e a estrutura do Airtable por voz
O ditado bruto sai como um amontoado sem pausas. Você diz "ok então coloca o status como em revisão atribui pra maria e anota que o orçamento estourou em uns doze por cento", e essa é a parede sem pontuação que qualquer motor de fala te entrega. Limpar isso é onde os caminhos se separam.
A Digitação por Voz do Windows adiciona pontuação enquanto você fala, e o Ditado do macOS lida com pontuação básica quando você diz "vírgula" ou "ponto". Para uma limpeza mais pesada — tirar os "éhs", consertar o amontoado, transformar um parágrafo falado em algo que você de fato manteria em um campo de texto longo — o Whisper pode rodar uma passagem de IA. Diga a frase de ativação "Hey whisper" e o texto é aprimorado antes de chegar. Em um modelo local isso roda pelo Ollama; no modo de nuvem é o gpt-5-mini por padrão.
ok então coloca o status como em revisão atribui pra maria e anota que o orçamento estourou em uns doze por cento éh antes do sprint terminar
Ok, então coloca o status como Em Revisão, atribui para a Maria e anota que o orçamento estourou em uns doze por cento antes do sprint terminar.
Para a estrutura do próprio Airtable — escolher um valor de uma seleção única, vincular um registro, definir um campo de data — a resposta honesta é que a voz te dá o texto e a própria interface do Airtable te dá a estrutura. Dite o campo de texto longo, depois clique no menu suspenso da seleção única ou digite o nome do registro vinculado do jeito que você sempre faz. Nenhuma ferramenta de ditado faz aparecer os tipos de campo do Airtable sob comando; quem promete "diga status em revisão e veja a opção ser escolhida" está te vendendo uma demonstração, não uma terça-feira. Coloque as palavras rapidamente por voz, dê forma ao registro com os controles que você já conhece.
Esse mesmo fluxo de falar-e-limpar compensa muito além da sua base — você também pode ditar texto limpo em qualquer aplicativo com o atalho único, então um comentário longo vira algumas frases faladas em vez de um parágrafo que você digita.
Quando pular uma ferramenta de ditado para o Airtable

Às vezes a ferramenta certa é a gratuita que já está na sua máquina, e fingir o contrário seria desonesto. Se você só joga valores curtos em uma base — um status, um nome, uma etiqueta de duas palavras — o seu sistema operacional cobre isso de graça.
No Windows, aperte a tecla Windows + H e a barra de Digitação por Voz embutida abre onde quer que esteja o seu cursor, incluindo uma célula do Airtable. Ela pontua sozinha e dá conta de rajadas curtas. O porém: ela passa pelos servidores da Microsoft e precisa de conexão com a internet, então não é uma opção offline, o que importa quando uma coluna guarda algo que você prefere manter privado. No Mac, o Ditado deixa você falar para inserir texto em qualquer lugar onde possa digitar, configurado em Ajustes do Sistema em Teclado, e no Apple Silicon o texto geral pode ser processado no próprio dispositivo. Para uma célula de linha única rápida, qualquer um dos embutidos é a escolha sensata.
Recorra a uma ferramenta dedicada que abrange todo o sistema quando os embutidos começarem a doer: campos de texto longo, entradas multilíngues, privacidade offline no Windows, ou querer um único atalho que se comporta igual no Airtable, no seu e-mail e no seu editor. Abaixo dessa régua, use o que é grátis. Não vou te dizer para instalar um aplicativo só para ditar um campo de status.
O mesmo trade-off aparece se o seu trabalho também vive em um rastreador — a lógica de ditar no Jira é idêntica, porque ambos são ferramentas de campo-e-comentário em que o cursor, não uma integração, é a conexão de verdade.
O Airtable nunca lançou um botão de microfone, e depois de escrever isto tenho quase certeza de que nunca vai lançar. Não precisa, porque o cursor é a integração. Fale na célula, receba texto, dê forma ao registro com os controles que você já conhece. Ditei a maior parte deste guia em uma caixa de texto que não era o Airtable, com uma ferramenta que não se importa com qual caixa é, e depois colei tudo no campo de texto longo onde guardo meus rascunhos. É esse o truque todo.
Experimente no seu próximo campo do Airtable
Segure o atalho, fale, solte. A transcrição cai em qualquer célula, campo de texto longo ou comentário em que esteja o seu cursor — e em todos os outros aplicativos também.
Modo local gratuito para qualquer conta logada. Sem cartão para começar.



