Por Denys Medvediev

Tutorial

Voz a texto en Airtable

Airtable no tiene dictado integrado ni en la app de escritorio, ni en el navegador, ni en la app móvil. La solución es una herramienta para todo el sistema: pulsas un atajo, hablas y la transcripción se pega donde tengas el cursor en cualquier celda, campo de texto largo o comentario de Airtable. El dictado de tu sistema operativo también sirve, para capturas cortas.

Última actualización: junio de 2026

Portátil sobre un escritorio oscuro junto a una taza de café y una libreta, que evoca entrada de datos ordenada y dictado

La voz a texto en Airtable funciona mediante una herramienta para todo el sistema, no con Airtable en sí. Airtable no tiene dictado integrado ni en el navegador, ni en la app de escritorio, ni en el móvil. La solución es una herramienta como Whisper: pulsas un atajo, hablas y la transcripción se pega donde está el cursor en cualquier celda, campo de texto largo o comentario. El dictado del sistema operativo también sirve, para entradas cortas.

Mantengo una base que registra cada versión de la app: una fila por versión, un campo de texto largo para el registro de cambios y un hilo de comentarios donde discuto conmigo mismo sobre el alcance. Durante muchísimo tiempo lo escribí todo a mano. Luego me puse a buscar un botón de micrófono en el campo de texto largo, porque seguro que una herramienta tan buena estructurando datos te deja hablarle. No hay ningún botón de micrófono. Tras buscar bastante, estoy seguro de que Airtable no esconde ninguno.

La gente busca «voz a texto en Airtable», no encuentra nada en la app y supone que se le pasó algún interruptor. No se le pasó. Ese interruptor nunca se construyó. La buena noticia es que la solución tarda unos dos minutos, funciona totalmente sin conexión si quieres, y de regalo funciona en todas las demás apps que abres.

Aquí va lo que la mayoría de las páginas que rodean esta búsqueda no dicen claramente. Una celda de Airtable no es más que un cuadro de texto, igual que Gmail o una barra de búsqueda. Un campo de texto largo y un comentario de registro son cuadros de texto más grandes. Al dictado que pega donde tienes el cursor le da igual en qué cuadro esté el cursor.

Así que la verdadera pregunta no es «cómo activo el dictado por voz en Airtable». No hay ningún interruptor. La pregunta es «qué herramienta de dictado ejecuto encima de Airtable», y la respuesta depende de si quieres algo gratis e integrado, solo para el navegador, o un único atajo sin conexión que se comporte igual en todas partes. Lo veo todo, configuro uno en dos minutos y te digo cuándo saltarte la opción dedicada.

¿Airtable tiene dictado integrado?

Manos escribiendo en el teclado de un portátil junto a una hoja de cálculo en pantalla, que contrasta la entrada manual de datos con el dictado

No. Airtable no tiene ninguna función integrada de voz a texto, dictado o escritura por voz para introducir texto en una celda, un campo de texto largo o un comentario hablando. Ni en el navegador, ni en la app de escritorio, ni en el móvil. No hay botón de micrófono en un campo, ni comando de voz, ni preferencia oculta. Si llevas tiempo peinando los Ajustes en su busca, puedes parar. No está ahí.

Lo que sí existe es la transcripción de audio, y aquí es donde la gente se lía. Puedes subir un archivo de audio a un campo de adjunto y pasarlo por Airtable AI o por una automatización para obtener una transcripción. Eso es útil, pero no es dictado en vivo. No puedes poner el cursor en una celda, hablar y ver aparecer las palabras. Esos flujos procesan un archivo grabado a posteriori; no escriben por ti mientras piensas. Confundir ambas cosas te cuesta una tarde montando una automatización que resuelve un problema distinto, y prefiero que te ahorres esa tarde.

Hasta las herramientas de terceros creadas en torno a esto lo admiten sin rodeos. Las extensiones de navegador y las apps de dictado que aparecen en «escritura por voz en Airtable» empiezan diciendo que Airtable no tiene entrada de voz nativa, y luego se ofrecen a añadirla desde fuera. Aciertan en el diagnóstico. En la app de escritorio y en la cuadrícula del navegador donde la mayoría vive de verdad, necesitas una herramienta que se sitúe encima de Airtable. Hay tres categorías honestas, y el resto de esta guía las cubre.

Pulsa un atajo, habla y el texto cae en la celda

Este es todo el mecanismo, y es aburrido en el mejor sentido. Pulsas un atajo, hablas, sueltas y la transcripción se pega donde tengas el cursor, en el campo de texto que tenga el foco. Whisper mantiene una cola corta después de que sueltes la tecla, para que tu última palabra no se corte. Como pega en el cursor del sistema operativo, una celda de Airtable no es más que «un cuadro de texto cualquiera». App de escritorio o versión del navegador, el mismo comportamiento.

Esa es la parte que las páginas de aterrizaje complican de más. No hay ninguna integración de Airtable que autorizar, ni clave de API que pegar, ni automatización que vigilar. El cursor está en una celda, hablas y las palabras aparecen en la celda. Mientras hablas aparece una pequeña cápsula para que sepas que está escuchando:

Cancel
El indicador de grabación: una pequeña cápsula que aparece mientras hablas, para que sepas que Whisper está escuchando.

El atajo es lo único que conviene dejar bien desde el principio. En Windows es Ctrl+Space; en Mac es Command+Option, un pulsar-para-hablar de solo modificadores que mantienes mientras hablas. Ambos se pueden cambiar en los Ajustes si chocan con algo que ya uses. (Mi hija pequeña me dijo una vez que un atajo «no funcionaba» en su app de dibujo. Era un conflicto, no un fallo, y así aprendí que la persona media no tiene ni idea de qué es un conflicto de atajos. Por eso ahora todos los atajos son personalizables.) Si alguna vez has configurado el dictado en Windows o en Mac, esto es la misma memoria muscular apuntada a otra app.

Configúralo en dos minutos (Windows o Mac)

Necesitas un Mac con Apple Silicon o un PC con Windows 10 o posterior, un micrófono que funcione y Airtable abierto en la app de escritorio o en el navegador. Todo el flujo local es gratis para cualquier cuenta con sesión iniciada, sin pedir ningún método de pago al registrarte. Aquí va la secuencia.

Paso 1 — Instala Whisper e inicia sesión.

Descárgalo desde la página de descargas, instálalo y crea una cuenta gratis. Sin tarjeta. Todo el flujo de transcripción local se abre de inmediato.

Sabrás que funcionó cuando aparezca el icono de la app en la bandeja y el asistente de configuración te ofrezca elegir un modelo.

Paso 2 — Elige una vía de transcripción.

La app no elige por ti. Tienes tres: Nube (OpenAI, con tu propia clave), Parakeet local o Whisper local. Para las entradas cotidianas de tu base, empieza en local; más sobre esto un par de secciones más abajo.

Sabrás que funcionó cuando un modelo termine de descargarse y aparezca como listo.

Paso 3 — Confirma tu atajo.

Windows usa Ctrl+Space por defecto, y Mac usa Command+Option mantenido como pulsar-para-hablar. En Mac, concede el permiso de Accesibilidad cuando te lo pida; sin él, el pegado en el cursor no puede llegar a otras apps.

Sabrás que funcionó cuando una grabación de prueba se pegue en cualquier campo de texto.

Paso 4 — Pon el cursor en un campo de Airtable y habla.

Abre tu base, haz clic en una celda, campo de texto largo o cuadro de comentario, mantén el atajo, di una frase y suelta. La transcripción aparece donde está el cursor.

Sabrás que funcionó cuando tu frase hablada esté en el campo de Airtable como texto.

Whisper
La app de escritorio real de Whisper en la pantalla de ajustes, con los paneles de Transcripción e IA abiertos.

La parte lenta es la descarga del modelo, no la configuración. Todo lo demás son los cuatro pasos de arriba. Una vez en marcha, rellenar un campo de texto largo deja de ser una tarea de escribir y pasa a ser una tarea de hablar.

voz a texto en Windows · en Mac

Celdas cortas, campos de texto largo y comentarios

Airtable no es un solo tipo de cuadro de texto, son tres, y el dictado los maneja todos igual porque el cursor es el cursor. Una celda de una sola línea admite un valor hablado rápido: un nombre, un estado, un título. Un campo de texto largo admite un párrafo, que es justo donde la voz se gana su lugar, porque un párrafo es donde escribir te frena. Un comentario de registro admite una frase que de otro modo teclearías con una mano mientras lees la fila. El mismo atajo, tres cuadros distintos.

La mayoría de las páginas que aparecen para esta búsqueda te apuntan a una extensión del navegador —Voice In, Voicy y similares— que añade dictado a cualquier campo de texto de una página web, Airtable incluido. Las extensiones son una buena respuesta si vives dentro de una pestaña del navegador. Tienen un límite estructural: solo funcionan donde llega el navegador. La app de escritorio de Airtable no es una pestaña del navegador, así que una extensión de Chrome no puede verla. Un atajo para todo el sistema sí, porque pega en el cursor del sistema operativo sin importar qué ventana lo posea.

Esa es la verdadera diferencia. Una extensión está limitada al navegador; un atajo abarca todo. La misma tecla que rellena un campo de texto largo de Airtable rellena también tu cuadro de redacción de Gmail, un mensaje de Slack y un mensaje de commit. Una herramienta, todos los campos de texto, tanto en Windows como en Mac. Si solo tocas Airtable en una pestaña de Chrome, una extensión basta, y varias son gratis. En el momento en que abres la app de escritorio, o quieres el mismo flujo en todos los programas, gana la opción para todo el sistema. Yo tiraría del único atajo porque cambio de app unas cuarenta veces por hora y no quiero recordar cuarenta botones de dictado distintos.

Local o nube: qué modo para tu base

Para Airtable, prueba primero el modo local. Buena parte de lo que entra en una base es del tipo de cosa que preferirías no enrutar por los registros de un proveedor: notas de clientes, una columna de precios, una hoja de ruta interna, un comentario sobre la idea de un compañero. Si tu Mac es Apple Silicon o tu PC es de los últimos años, el local maneja el dictado cotidiano sin quejarse, y la nube pasa a ser la salida de emergencia en lugar de la opción por defecto.

Así difieren las tres vías, porque la app te hace elegir y prefiero que elijas bien:

  • Parakeet localEl motor TDT de NVIDIA, unos 600 MB, y la opción local más rápida: de 5 a 10 veces más rápida que Whisper en CPU. Cubre inglés más otros 24 idiomas europeos, 25 en total. No traduce al inglés. Si rellenas tu base en inglés u otro idioma europeo, esta es la opción rápida y totalmente sin conexión.
  • Whisper localmás lento que Parakeet en la misma máquina, pero las versiones multilingües cubren 99 idiomas y pueden traducir al inglés. Las versiones solo en inglés son solo inglés, no 99. Elige esta para chino, japonés, coreano o cualquier trabajo de traducción, que Parakeet no puede hacer. El modelo en inglés por defecto ocupa unos 480 MB.
  • Nube (OpenAI, tu propia clave)la mejor precisión y acceso a la web, usando tu propia clave de OpenAI facturada directamente por OpenAI. La transcripción se ejecuta en gpt-4o-mini-transcribe por defecto. Necesita internet, así que es la única vía que sale de tu máquina. La capa de Nube forma parte de Whisper Pro.

La verdad aburrida es que, para el tipo de texto que la mayoría pone en una base, el local sobra. Ambos motores locales funcionan por completo en tu máquina sin enviar nada a un servidor. La nube se gana su lugar cuando quieres la máxima precisión en una grabación difícil o necesitas que el modelo saque un dato de la web a mitad de frase. Para la entrada de datos diaria, empieza en local y solo recurre a la nube cuando el local te deje con ganas de más.

Puntuación, limpieza y estructura de Airtable por voz

El dictado en bruto sale como una frase de carrerilla. Dices «vale pues pon el estado en revisión asígnalo a maría y anota que el presupuesto está pasado en torno a un doce por ciento», y eso es el muro sin puntuar que cualquier motor de voz te entrega. Limpiarlo es donde las vías se separan.

La Escritura por voz de Windows añade puntuación mientras hablas, y el Dictado de macOS maneja la puntuación básica cuando dices «coma» o «punto». Para una limpieza más a fondo —quitar los «ehs», arreglar las frases de carrerilla, convertir un párrafo hablado en algo que de verdad guardarías en un campo de texto largo— Whisper puede hacer una pasada de IA. Di la frase de activación «Hey whisper» y el texto se mejora antes de caer. En un modelo local eso pasa por Ollama; en modo nube es gpt-5-mini por defecto.

Thinking...
En bruto

vale pues pon el estado en revisión asígnalo a maría y anota que el presupuesto está pasado en torno a un doce por ciento eh antes de que acabe el sprint

Limpio

Vale, pues pon el estado en En revisión, asígnalo a Maria, y anota que el presupuesto está pasado en torno a un doce por ciento antes de que acabe el sprint.

En cuanto a la estructura propia de Airtable —elegir un valor de un desplegable de selección única, vincular un registro, fijar un campo de fecha—, la respuesta honesta es que la voz te da el texto y la propia interfaz de Airtable te da la estructura. Dicta el campo de texto largo y luego haz clic en el desplegable de la selección única o escribe el nombre del registro vinculado como siempre. Ninguna herramienta de dictado conjura los tipos de campo de Airtable a la orden; quien te prometa «di estado en revisión y mira cómo elige la opción» te está vendiendo una demo, no un martes cualquiera. Pon las palabras rápido por voz y dale forma al registro con los controles que ya conoces.

Ese mismo flujo de hablar y luego limpiar rinde mucho más allá de tu base: también puedes dictar prosa limpia en cualquier app con el único atajo, de modo que un comentario largo se vuelve unas cuantas frases habladas en vez de un párrafo que escribes a mano.

Cuándo saltarse una herramienta de dictado para Airtable

Dos flechas dibujadas con tiza en el pavimento apuntando en direcciones distintas, que ilustran una elección de herramienta

A veces la herramienta adecuada es la gratuita que ya tienes en tu máquina, y fingir lo contrario sería deshonesto. Si solo metes valores cortos en una base —un estado, un nombre, una etiqueta de dos palabras—, tu sistema operativo lo cubre sin coste.

En Windows, pulsa la tecla Windows + H y se abre la barra de Escritura por voz integrada justo donde tengas el cursor, una celda de Airtable incluida. Puntúa sola y va bien para ráfagas cortas. El truco: pasa por los servidores de Microsoft y necesita conexión a internet, así que no es una opción sin conexión, lo que importa cuando una columna guarda algo que preferirías mantener en privado. En Mac, el Dictado te deja hablar para introducir texto en cualquier sitio donde puedas escribir, se configura en Ajustes del sistema en Teclado, y en Apple Silicon el texto general se puede procesar en el dispositivo. Para una celda rápida de una sola línea, cualquiera de los dos integrados es la opción sensata.

Recurre a una herramienta dedicada para todo el sistema cuando los integrados empiecen a doler: campos de texto largo, entradas multilingües, privacidad sin conexión en Windows, o querer un único atajo que se comporte igual en Airtable, tu correo y tu editor. Por debajo de ese listón, usa lo que es gratis. No voy a decirte que instales una app para dictar un solo campo de estado.

El mismo equilibrio aparece si tu trabajo también vive en un gestor de seguimiento: la lógica de dictar en Jira es idéntica, porque ambas son herramientas de campos y comentarios donde el cursor, no una integración, es la verdadera conexión.

Airtable nunca lanzó un botón de micrófono y, después de escribir esto, estoy bastante seguro de que nunca lo hará. No le hace falta, porque el cursor es la integración. Habla en la celda, obtén texto y dale forma al registro con los controles que ya conoces. Dicté la mayor parte de esta guía en un cuadro de texto que no era Airtable, con una herramienta a la que le da igual qué cuadro sea, y luego pegué todo en el campo de texto largo donde guardo mis borradores. Ese es todo el truco.

Pruébalo en tu próximo campo de Airtable

Mantén el atajo, habla, suelta. La transcripción cae en la celda, campo de texto largo o comentario donde tengas el cursor, y en todas las demás apps también.

Modo local gratis para cualquier cuenta con sesión iniciada. No hace falta tarjeta para empezar.

Foto de Denys Medvediev

Denys Medvediev

Soy quien lee nuestro correo de soporte, lo más probable es que dictando las respuestas.

Para seguir leyendo