Guía
Voz a texto en Coda
Coda no tiene dictado integrado. La solución es una herramienta para todo el sistema: pulsas un atajo, hablas y la transcripción se pega justo donde tienes el cursor, en cualquier documento, celda de tabla o lienzo de Coda. El dictado de tu sistema operativo también sirve, para capturas cortas.
Última actualización: junio de 2026

La voz a texto en Coda funciona a través de una herramienta para todo el sistema, no desde Coda en sí. Coda no tiene dictado integrado. La solución es una herramienta como Whisper: pulsas un atajo, hablas y la transcripción se pega donde tienes el cursor, en cualquier documento, celda de tabla o lienzo. El dictado de tu sistema operativo también sirve, para capturas cortas.
Llevo un par de tableros de seguimiento en Coda: un registro de lecturas y un panel de un proyecto paralelo con esas tablas anidadas en las que Coda es genuinamente bueno. Lo único que no dejaba de echar de menos era poder dictar una fila en una tabla en lugar de teclearla. Así que me puse a buscar el ajuste de dictado. No hay ajuste de dictado. Coda no tiene un botón de micrófono y, después de bucear bastante por la documentación y la comunidad de creadores, estoy convencido de que no lo esconde en ningún rincón.
La gente busca «voz a texto en Coda», no encuentra nada dentro de la app y supone que se le ha pasado algún interruptor. No se les pasó. El interruptor nunca se construyó. La buena noticia es que la solución lleva unos dos minutos, funciona totalmente sin conexión si tú quieres, y de propina sirve en todas las demás apps que abras.
Esto es lo que la mayoría de las páginas que rondan esta palabra clave no dirá con claridad. Un documento de Coda, una celda de tabla, el texto del lienzo: todos son simplemente cuadros de texto, igual que Gmail o una barra de búsqueda. Al dictado que pega donde tienes el cursor le da igual en qué app esté el cursor.
Así que la verdadera pregunta no es «cómo activo el dictado por voz en Coda». No hay tal interruptor. La pregunta es «qué herramienta de dictado ejecuto por encima de Coda», y la respuesta depende de si quieres una extensión de navegador gratuita, el dictado de tu sistema operativo o un único atajo sin conexión que se comporta igual en el navegador y en la app de escritorio. Lo repasaré todo, configuraré uno en dos minutos y te diré cuándo conviene saltarse la opción dedicada.
¿Tiene Coda dictado integrado?

No. Coda no tiene ninguna función integrada de voz a texto, dictado o escritura por voz para redactar en un documento hablando. No hay botón de micrófono en una fila, ni comando de voz, ni preferencia oculta. Si has estado peinando los ajustes en su busca, puedes parar. No está ahí, y la comunidad de creadores lleva pidiéndolo desde 2021 sin que llegue.
Lo que sí existe es un Pack de Coda llamado ElevenLabs Voice AI, y aquí es donde la gente se lía. Ese Pack va en la dirección contraria: convierte el texto de tu documento en audio hablado. Es texto a voz, no voz a texto. Útil si quieres que te lean el documento en voz alta; inútil si quieres dictar una fila en una tabla. Suenan a la misma función y son justo lo contrario, una de esas colisiones de nombres que te cuesta una tarde. Prefiero ahorrarte esa tarde.
El panorama de las extensiones de navegador merece un párrafo para que no te lleve a la configuración equivocada. Existe una extensión popular de Chrome y Edge, Voice In, que dicta en páginas web, incluida la versión de Coda en navegador. Funciona, con un pero estructural: es una extensión de navegador, así que solo llega a Coda cuando Coda es una pestaña. Abre la app de escritorio de Coda y la extensión no puede verla. Más sobre esto dos secciones más abajo. Por ahora, lo importante: nada dentro de Coda hace esto. Necesitas una herramienta que se sitúe por encima.
Pulsa un atajo, habla, y el texto aterriza en la celda
Este es todo el mecanismo, y es aburrido en el mejor sentido. Pulsas un atajo, hablas, sueltas, y la transcripción se pega donde tienes el cursor, en cualquier campo de texto que tenga el foco. Whisper mantiene una pequeña cola después de que sueltes la tecla, para que tu última palabra no quede cortada. Como pega en el cursor del sistema, una celda de tabla de Coda es simplemente «cualquier cuadro de texto». Pestaña del navegador o app de escritorio: el mismo comportamiento.
Esa es la parte que las páginas de aterrizaje complican de más. No hay ningún Pack que instalar en Coda, ningún token de API que pegar, ninguna automatización que vigilar. Tu cursor está en una celda, hablas y las palabras aparecen en la celda. Mientras hablas se muestra una pequeña cápsula para que sepas que está escuchando:
El atajo es lo único que vale la pena dejar bien atado de entrada. En Windows es Ctrl+Space; en Mac es Command+Option, un pulsar para hablar solo con modificadores que mantienes mientras hablas. Ambos se pueden cambiar en Ajustes si chocan con algo que ya usas. (Mi hija pequeña me dijo una vez que un atajo «no funcionaba» en su app de dibujo. Era un conflicto, no un fallo, y así aprendí que la persona media no tiene ni idea de qué es un conflicto de atajos. Por eso ahora todos los atajos son personalizables). Si alguna vez has configurado el dictado en Windows o en Mac, esto es la misma memoria muscular apuntando a otra app.
Configúralo en dos minutos (Windows o Mac)
Necesitas un Mac con Apple Silicon o un PC con Windows 10 o más reciente, un micrófono que funcione y Coda abierto, ya sea en la app de escritorio o en una pestaña del navegador. Todo el flujo local es gratis para cualquier cuenta con sesión iniciada, sin pedir ningún método de pago al registrarte. Esta es la secuencia.
Paso 1: Instala Whisper e inicia sesión.
Descárgalo desde la página de descargas, instálalo y crea una cuenta gratuita. Sin tarjeta. Todo el flujo de transcripción local se abre de inmediato.
Sabrás que ha funcionado cuando aparezca el icono de la app en la bandeja del sistema y el asistente de configuración te ofrezca elegir un modelo.
Paso 2: Elige una vía de transcripción.
La app no elige por ti. Tienes tres: Nube (OpenAI, con tu propia clave), Parakeet local o Whisper local. Para las notas del día a día en Coda, empieza en local; más sobre esto dos secciones más abajo.
Sabrás que ha funcionado cuando un modelo termine de descargarse y aparezca como listo.
Paso 3: Confirma tu atajo.
Windows usa por defecto Ctrl+Space; Mac, Command+Option mantenido como pulsar para hablar. En Mac, concede el permiso de Accesibilidad cuando te lo pida; sin él, el pegado en el cursor no puede llegar a otras apps.
Sabrás que ha funcionado cuando una grabación de prueba se pegue en cualquier campo de texto.
Paso 4: Pon el cursor en una celda de Coda y habla.
Abre tu documento, haz clic en una celda o en una línea de texto del lienzo, mantén pulsado el atajo, di una frase y suelta. La transcripción aparece donde está el cursor.
Sabrás que ha funcionado cuando tu frase hablada esté escrita en la celda de Coda como texto.
La parte lenta es la descarga del modelo, no la configuración. Todo lo demás son los cuatro pasos de arriba. Una vez en marcha, rellenar una fila en una tabla de Coda deja de ser una tarea de teclear y pasa a ser una tarea de hablar.
Coda en el navegador frente a la app de escritorio
Coda viene de dos maneras —una versión de navegador y una app de escritorio para Mac y Windows— y qué vía de dictado funciona depende de cuál uses. La mayoría de las páginas que posicionan para esta palabra clave te apuntan directamente a Voice In, la extensión de Chrome y Edge. Es una buena opción con un límite estructural: es una extensión de navegador, así que solo llega a Coda cuando Coda es una pestaña en ese navegador. Ejecuta la app de escritorio de Coda y la extensión simplemente no puede ver la ventana.
Un atajo para todo el sistema evita ese problema. Pega en el cursor del sistema sin importar qué ventana lo tenga, de modo que la misma tecla que rellena una celda de Coda en el navegador también rellena una celda en la app de escritorio de Coda, tu cuadro de redacción de Gmail, un mensaje de Slack y un mensaje de commit. Una herramienta, todos los campos de texto, tanto el navegador como la app nativa. No tienes que reaprender nada al cambiar, ni necesitas una solución distinta según cómo tengas Coda abierto hoy.
Si solo tocas Coda en una pestaña del navegador y nunca la app de escritorio, la extensión es una opción ordenada y enfocada que merece un vistazo. En el momento en que uses la app de escritorio de Coda, o quieras el mismo flujo en todos los programas que abres, gana la vía para todo el sistema. Yo tiraría del único atajo porque cambio de app unas cuarenta veces por hora y no quiero recordar cuarenta botones de dictado distintos.
Local o nube: qué modo para tus documentos
Para la mayor parte del trabajo en Coda, prueba primero el modo local. Buena parte de lo que acaba en un documento de Coda es justo el tipo de cosa que preferirías no hacer pasar por los registros de un proveedor: un plan de proyecto, una nota de cliente, una idea a medio formar en una tabla. Si tu Mac es Apple Silicon o tu PC es de los últimos años, lo local maneja el dictado del día a día sin queja, y la nube se convierte en la salida de emergencia en lugar de la opción por defecto.
Así se diferencian las tres vías, porque la app te hace elegir y prefiero que elijas bien:
- Parakeet local — El motor TDT de NVIDIA, unos 600 MB, y la opción local más rápida: de 5 a 10 veces más rápido que Whisper en CPU. Cubre el inglés más otras 24 lenguas europeas, 25 en total. Sin traducción al inglés. Si trabajas en inglés o en otra lengua europea, esta es la opción rápida y totalmente sin conexión.
- Whisper local — más lento que Parakeet en la misma máquina, pero las versiones multilingües cubren 99 idiomas y pueden traducir al inglés. Las versiones solo en inglés son solo en inglés, no 99. Elige esta para chino, japonés, coreano o cualquier trabajo de traducción, que Parakeet no puede hacer. El modelo en inglés por defecto ronda los 480 MB.
- Nube (OpenAI, BYOK) — la mejor precisión y acceso a la web, usando tu propia clave de OpenAI facturada directamente por OpenAI. La transcripción se ejecuta en gpt-4o-mini-transcribe por defecto. Necesita internet, así que es la única vía que sale de tu máquina. La superficie de Nube forma parte de Whisper Pro.
La verdad aburrida es que, para el tipo de texto que la mayoría pone en Coda, lo local sobra. Ambos motores locales se ejecutan por completo en tu máquina sin que nada salga a un servidor. La nube se gana su sitio cuando quieres precisión de primer nivel en una grabación difícil o necesitas que el modelo saque un dato de la web a media frase. Para un hábito diario de documentos, empieza en local y solo tira de la nube cuando lo local te deje con ganas de más.
Puntuación, limpieza y formato de Coda por voz
El dictado en bruto sale como una parrafada de corrido. Dices «vale añade una fila revisar el documento de lanzamiento responsable soy yo entrega jueves estado bloqueado», y eso es el muro sin puntuación que te entrega cualquier motor de voz. Limpiarlo es donde las vías se separan.
La Escritura por voz de Windows añade puntuación mientras hablas, y el Dictado de macOS maneja la puntuación básica cuando dices «coma» o «punto». Para una limpieza más a fondo —quitar las muletillas, arreglar las parrafadas, convertir una frase hablada en algo que de verdad guardarías en un documento— Whisper puede ejecutar una pasada de IA. Di la frase de activación «Hey whisper» y el texto se mejora antes de aterrizar. En un modelo local eso pasa por Ollama; en modo nube es gpt-5-mini por defecto.
vale añade una fila revisar el documento de lanzamiento responsable soy yo entrega jueves eh antes de la reunión
Vale, añade una fila: revisar el documento de lanzamiento, responsable soy yo, entrega el jueves antes de la reunión.
Para la propia estructura de Coda —construir una tabla, fijar un tipo de columna, añadir una opción de selección, escribir una fórmula— la respuesta honesta es que la voz te da el texto y la propia interfaz de Coda te da la estructura. Dicta el contenido de la celda, y luego construye la tabla y fija los tipos de columna como siempre lo haces. Ninguna herramienta de dictado materializa un esquema de tabla de Coda por arte de magia a la orden; quien te promete «di nueva tabla con tres columnas y mira cómo se construye» te está vendiendo una demo, no un martes cualquiera. Pon las palabras rápido por voz y dale forma al documento con los controles que ya conoces.
Ese mismo flujo de hablar y luego limpiar rinde mucho más allá de tus documentos: también puedes dictar prosa limpia en cualquier app con el único atajo, de modo que un párrafo largo se convierte en unas pocas frases habladas en lugar de algo que tecleas de cabo a rabo.
Cuándo prescindir de una herramienta de dictado para Coda

A veces la herramienta adecuada es la gratuita que ya tienes en tu máquina, y fingir lo contrario sería deshonesto. Si solo metes capturas cortas en Coda —una fila rápida, un estado de dos palabras—, tu sistema operativo lo cubre gratis.
En Windows, pulsa la tecla Windows + H y se abre la barra de Escritura por voz integrada justo donde tengas el cursor, incluida una celda de Coda. Puntúa por sí sola y va bien para ráfagas cortas. El pero: pasa por los servidores de Microsoft y necesita conexión a internet, así que no es una opción sin conexión. En Mac, el Dictado te deja hablar para introducir texto en cualquier sitio donde puedas escribir, se configura en Ajustes del sistema, en Teclado, y en Apple Silicon el texto general se puede procesar en el dispositivo. Y si solo usas Coda en una pestaña del navegador, la extensión Voice In es una opción enfocada y gratuita hecha justo para eso.
Tira de una herramienta dedicada para todo el sistema cuando las integradas empiecen a doler: notas largas, trabajo multilingüe, privacidad sin conexión en Windows, la app de escritorio de Coda en vez de una pestaña, o querer un único atajo que se comporte igual en Coda, tu correo y tu editor. Por debajo de ese listón, usa lo que es gratis. No voy a decirte que instales una app para una actualización de estado de una línea.
El mismo dilema aparece si además guardas trabajo en otras herramientas: la lógica de dictar en Google Docs es idéntica, porque también ahí el cursor, no un complemento, es la verdadera integración.
Para seguir leyendo
Coda nunca lanzó un botón de micrófono y, después de escribir esto, estoy bastante seguro de que nunca lo hará. No le hace falta, porque el cursor es la integración. Habla en la celda, obtén texto, y dale forma al documento con los controles que ya conoces. La mayor parte de esta guía la dicté en un cuadro de texto que no era Coda, con una herramienta a la que le da igual qué cuadro sea, y luego pegué todo en un documento. Ese es todo el truco.
Pruébalo en tu próximo documento de Coda
Mantén el atajo, habla, suelta. La transcripción aterriza en la celda donde tengas el cursor, y en cualquier otra app también.
Modo local gratuito para cualquier cuenta con sesión iniciada. No hace falta tarjeta para empezar.



