Por Denys Medvediev

Tutorial

Voz a texto en ClickUp: dicta tareas, documentos y comentarios

ClickUp puede escucharte de dos formas. Su propio Talk to Text funciona a través de la app Brain MAX, en la nube. La alternativa gratuita y sin conexión es un atajo de teclado global como Whisper, que dicta en cualquier campo de ClickUp, y también en cualquier otra app.

Última actualización: junio de 2026

Escritorio con un portátil, cuadernos y listas de tareas codificadas por colores, que evoca el trabajo de gestión de tareas y proyectos

La voz a texto en ClickUp funciona de dos maneras. ClickUp tiene su propio dictado, Talk to Text, que funciona a través de su app Brain MAX: mantienes una tecla pulsada, hablas, y el texto pulido por IA aparece donde está el cursor. La alternativa gratuita y sin conexión es un atajo de teclado global como Whisper, que dicta en cualquier campo de ClickUp, y también en cualquier otra app.

Así que la pregunta no es si ClickUp puede escucharte. Puede. La pregunta es qué método de voz encaja mejor con cada tarea, y si quieres que tu audio viaje a la nube para conseguirlo. El martes pasado dicté un comentario en una tarea mientras cortaba pepino para dos fiambreras. El comentario quedó escrito. El pepino, no tan ordenado.

Esto es una guía práctica. Te enseñaré a dictar en el nombre de una tarea real de ClickUp, en su descripción, en un Doc y en un comentario con un solo atajo de teclado; dónde encaja el propio Talk to Text de ClickUp, dónde no, y una sección honesta que te dice cuándo conviene saltarse mi herramienta por completo.

¿ClickUp tiene voz a texto integrada? Sí, pero con matices

Manos escribiendo en un teclado sobre un escritorio de madera con papeles y un ratón, la forma habitual de introducir texto en una herramienta de tareas

Déjame acabar primero con el mito. ClickUp sí tiene dictado. Se llama Talk to Text, y es bueno: mantienes una tecla pulsada, hablas, y la IA de ClickUp limpia el resultado y lo pega allí donde tengas el cursor. La propia página de producto de ClickUp lo promociona como "habla una vez para escribir en todas partes" y dice que funciona en cualquier app, no solo en ClickUp. Funciona en una app de escritorio para Mac y Windows, además de una extensión de Chrome de Brain MAX. Habla más de 50 idiomas, aprende un diccionario personal con tu jerga y es lo bastante consciente del contexto como para @mencionar a la persona, la tarea o el Doc correctos, con el enlace adecuado.

Aquí está el matiz. Talk to Text funciona a través de la app Brain MAX de ClickUp, su producto de IA, no el plan base. ClickUp lo promociona como "gratis para probar, sin tarjeta de crédito", que es una prueba de su complemento de IA de pago más que una función base gratuita para siempre. Y es IA en la nube, sin ningún modo sin conexión mencionado en toda la página de producto.

Tampoco confundas Talk to Text con los Voice Clips de ClickUp. Un Voice Clip es una grabación de audio que adjuntas a un comentario y que se transcribe después si tu Workspace tiene ClickUp Brain. Eso es grabar primero y transcribir después. Talk to Text es dictado en vivo dentro del campo. Y el método que viene a continuación, también.

Dicta en cualquier campo de ClickUp con un atajo de teclado

La vía a nivel del sistema operativo no necesita ninguna superficie de ClickUp. Instalas una herramienta de dictado de escritorio, se queda con un atajo de teclado global, y ese atajo pega el texto transcrito en cualquier campo que tenga el cursor: el nombre de una tarea de ClickUp, una descripción, un ClickUp Doc, un comentario. El mismo atajo funciona en Slack, en tu cliente de correo y en tu editor de código, porque la herramienta vive a nivel del sistema operativo, no dentro de una pestaña del navegador.

Con Whisper el atajo por defecto es Ctrl+Space en Windows y Command+Option en macOS. El flujo es el mismo en cualquier campo de ClickUp:

Cancel
La ventana flotante de grabación: una pequeña cápsula que aparece mientras hablas, para que sepas que Whisper te está escuchando.
  1. Haz clic en el campo que quieras: el nombre de la tarea, el cuadro de descripción, un Doc o la línea de comentario.
  2. Mantén pulsado el atajo y habla. Di la frase tal como la dirías en voz alta.
  3. Suelta. Uno o dos segundos después, el texto aparece en el cursor.
  4. Échale un vistazo, corrige una palabra si hace falta y sigue.

Eso es todo. Sin diálogo de "iniciar dictado", sin ventana aparte, sin copiar y pegar desde otra app. Te quedas en el mismo campo de ClickUp en el que ya estabas.

Una nota honesta sobre el alcance, porque importa y nadie más lo dice: Whisper pega en el único campo que tiene el foco, de uno en uno. Rellena el nombre de la tarea, o la descripción, o un comentario, allí donde esté el cursor. No rellena de una sola vez un formulario de tarea con varios campos. Ese es exactamente el mismo alcance que el propio Talk to Text de ClickUp. Cualquiera que te prometa "dicta una tarea entera de golpe" te está vendiendo una demo, no un flujo de trabajo.

Whisper
La app de escritorio real de Whisper: elige una ruta de transcripción, pulsa el atajo y mira cómo el texto aterriza en el campo.

Ese embed es la app real, no una captura de pantalla. Elige una ruta de transcripción, pulsa el atajo, mira cómo aterriza el texto. ClickUp no tiene por qué saber que la herramienta existe: para ClickUp parece exactamente que escribiste rápido.

Hay tres rutas, y la app no elige por ti. El modo nube usa tu propia clave de OpenAI para máxima precisión y respuestas de la web. Parakeet es la opción local más rápida para inglés y 24 idiomas europeos. Los modelos multilingües de Whisper cubren más de 99 idiomas, incluida la detección automática, además de traducir al inglés. La mayoría del trabajo en ClickUp son ráfagas cortas (un título de tarea, un comentario de dos líneas), así que incluso los modelos locales más pequeños van sobrados.

Limpia el dictado automáticamente

Thinking...

El dictado en bruto incluye el "eh", el falso comienzo, el momento en que dijiste "no, olvida eso". El Talk to Text de ClickUp edita la transcripción automáticamente antes de pegarla. Whisper ofrece la misma limpieza como capa opcional: una pasada de IA local que se ejecuta en tu propia máquina en el modo gratuito, o una pasada en la nube en Pro si traes tu propia clave. Actívala y "eh manda la presentación a María para el jueves eh y de paso avisa a finanzas" se convierte en una descripción de tarea limpia. Desactívala y obtienes la transcripción literal. Tú decides, en cada grabación.

El comentario de la fiambrera que mencioné arriba ("pide a diseño que rehaga el hero para el viernes, avísame si hay bloqueo") entró limpio a la primera mientras alcanzaba el segundo yogur que la pequeña nunca se iba a comer. El comentario salió. El yogur volvió a casa intacto, tal como estaba previsto.

Local vs nube: por qué dicto en ClickUp sin conexión

Primer plano de un candado de latón, símbolo del dictado privado en el dispositivo que nunca sale de tu máquina

Aquí va mi única opinión firme, y la asumo: el dictado sin opción de trabajar sin conexión es un desastre de privacidad esperando a ser transcrito. La nube está bien cuando la eliges tú; Whisper también tiene una ruta en la nube, con tu propia clave. El problema es cuando la nube es la única ruta. La tarea que estás dictando podría ser una revisión salarial, una nota legal, el nombre y el teléfono de un cliente. Con ClickUp Talk to Text y con la extensión de navegador Voice In, ese audio va a un servidor para volver convertido en texto: ambas son solo nube, sin alternativa local.

El modo local de Whisper se ejecuta enteramente en tu máquina. Sin internet durante la transcripción, y el audio nunca sale del portátil. La única conexión que necesitas es la descarga única del modelo, de algún punto entre unos 140 MB y 3 GB según el modelo. Después, puedes dictar los comentarios de ClickUp de todo un sprint en un avión con el wifi apagado.

Cuánto importa eso depende de lo que haya en tus tareas. "Comprar leche", díctalo donde sea. Cualquier cosa que dudarías en leer en voz alta en una oficina abierta: en el dispositivo es la opción por defecto aburrida y correcta. El mismo razonamiento recorre nuestras guías sobre dictar en Notion y añadir voz a texto en Jira: cambia la herramienta de proyectos, pero las cuentas de la privacidad no.

ClickUp Talk to Text vs Voice In vs Whisper vs el truco de ChatGPT

Hay cuatro formas reales de llevar tu voz a ClickUp. No son intercambiables.

MétodoDónde funcionaEn línea o sin conexiónQué te cuesta
ClickUp Talk to TextCualquier app, vía la app de escritorio Brain MAX o la extensión de ChromeSolo nubeFunciona a través de la IA Brain MAX de ClickUp; prueba "gratis, sin tarjeta" de un complemento de pago
Whisper (atajo a nivel del sistema operativo)La app de escritorio de ClickUp y cualquier otra app nativaLocal/sin conexión o nube, tú eligesNivel local gratuito al registrarte, sin tarjeta; Pro añade la nube
Voice In (extensión de navegador)Solo la app web de ClickUp, dentro de la pestaña del navegadorSolo nubeNivel gratuito con mejoras de pago
El truco de ChatGPTEn cualquier sitio, pero es copiar y pegar, no dentro del campoSolo nubeLo que pagues por ChatGPT

La ruta de ChatGPT (dictar en la app de ChatGPT, dejar que lo pula, copiar, pegar en ClickUp) es por la que se conforman la mayoría de las guías de "voz a texto en ClickUp". Funciona, pero son tres apps y un portapapeles para un solo comentario. Voice In es más limpia, salvo que solo vive en la pestaña del navegador, así que es inútil en la app de escritorio de ClickUp o en cualquier sitio fuera de Chrome. El número de idiomas no es el factor decisivo: ClickUp dice más de 50 idiomas, Whisper cubre más de 90, ambos son de sobra. Los ejes de verdad son dónde se ejecuta, qué cuesta y si tu audio sale del edificio.

Cuándo usar mejor el propio Talk to Text de ClickUp

Equipo haciendo lluvia de ideas frente a una pizarra en una oficina, el trabajo colaborativo donde mejor encajan las funciones propias de una herramienta de proyectos

No voy a fingir que Whisper gana siempre. Si básicamente vives dentro de ClickUp, quieres un dictado que @mencione automáticamente al compañero, la tarea y el Doc correctos con los enlaces adecuados, y ya usas o pagas ClickUp Brain MAX, entonces el propio Talk to Text de ClickUp encaja mejor. Esa conciencia de las @menciones es una ventaja genuina de "yo vivo aquí" que ninguna herramienta de dictado general puede igualar, porque lee tu Workspace. Tira de Whisper cuando quieras que el audio se quede en tu dispositivo, una herramienta gratuita sin complemento de IA ni tarjeta, o un único atajo que funcione igual en ClickUp, Slack, Gmail y tu editor, no una superficie con forma de ClickUp.

Cuánto cuesta

ClickUp Talk to Text se promociona como "gratis para probar, sin tarjeta de crédito", que es una prueba de la IA Brain MAX de ClickUp: un complemento de pago, no el plan base permanente. Toda la canalización local de Whisper es gratuita al registrarte, sin tarjeta y sin complemento de IA. Whisper Pro añade la superficie en la nube y viene con una prueba de nube de 7 días, donde solo hace falta una tarjeta para ese flujo de mejora, nunca al registrarte por primera vez. No mezcles las dos cosas: el dictado local que gestiona tus tareas de ClickUp es la parte gratuita. Los números están en nuestra página de precios por si los quieres.

Más lecturas

La mayoría de las guías de "voz a texto en ClickUp" se quedan en la parte incómoda: abre otra app, dicta ahí, copia, pega. No hace falta. Haz clic en el campo, mantén la tecla, habla, y las palabras aparecen justo donde ya estás trabajando. Mi hija pequeña aprendió el truco en una sola demostración; tiene siete años, y su lista de la compra nunca ha sido más legible que la mía. Si quieres la versión completa sin teclado, aquí tienes cómo escribir más rápido con la voz en Windows y Mac.

Dicta tu próximo comentario de ClickUp

Haz clic en el campo, mantén la tecla, habla, suelta. La transcripción aterriza donde está el cursor, en ClickUp y también en cualquier otra app.

Modo local gratuito para cualquier cuenta con sesión iniciada. Sin tarjeta para empezar.

Foto de Denys Medvediev

Denys Medvediev

Soy quien lee nuestro correo de soporte, lo más probable es que dictando las respuestas.