Por Denys Medvediev

Guía

Voz a texto en HubSpot

HubSpot no tiene dictado por voz integrado para notas, correos o tareas. La solución es una herramienta para todo el sistema: pulsa un atajo, habla y la transcripción se pega en el cursor de cualquier campo de HubSpot. El dictado de tu sistema operativo también sirve, para capturas cortas.

Última actualización: junio de 2026

Comercial en su escritorio hablando mientras un panel de CRM brilla en la pantalla del portátil, evocando el dictado dentro de un registro

La voz a texto en HubSpot funciona a través de una herramienta de dictado para todo el sistema, no de HubSpot en sí. El CRM de HubSpot no tiene dictado por voz integrado para notas, correos o tareas. Una herramienta como Whisper lo soluciona: pulsa un atajo, habla y la transcripción se pega en el cursor de cualquier campo de HubSpot, en el navegador. El dictado del sistema operativo también sirve, para capturas cortas.

Llevo quince años viendo a los comerciales registrar llamadas, y el patrón nunca cambia. Termina la llamada, el comercial tiene la cabeza llena de contexto y entonces se queda mirando el registro del contacto y escribe quizá un tercio antes de que empiece la siguiente llamada. El buen detalle se evapora. Así que la gente se pone a buscar un botón de micrófono en HubSpot. No lo hay. Lo comprobé, luego revisé los foros de la comunidad, y el vacío es real.

La gente busca "voz a texto en HubSpot", no encuentra nada en el CRM y supone que se le pasó algún ajuste en la barra de herramientas del editor. No se les pasó nada. HubSpot nunca incorporó el dictado al campo de notas, al redactor de correos ni a la descripción de las tareas. La buena noticia es que la solución tarda unos dos minutos, funciona sin conexión si lo prefieres y, de propina, funciona en cualquier otra aplicación de tu pantalla.

Aquí está la parte que se saltan casi todas las páginas que persiguen esta palabra clave. Una nota de HubSpot no es más que una caja de texto en tu navegador, igual que Gmail o una barra de búsqueda. Al dictado que se pega en el cursor le da igual que la caja resulte estar dentro de un CRM.

Así que la verdadera pregunta no es "cómo activo el dictado por voz en HubSpot". No hay un interruptor. La pregunta es "qué herramienta de dictado ejecuto encima de HubSpot", y la respuesta depende de si quieres algo gratis e integrado, o un único atajo sin conexión que se comporta igual en una nota de negocio, en el redactor de correos y en una tarea. Te contaré lo que hace y lo que no hace HubSpot, configuraré una herramienta en dos minutos y te diré cuándo saltarte por completo la opción dedicada.

¿HubSpot tiene voz a texto?

Persona en una llamada con auriculares junto a un portátil que muestra un registro de contacto, contrastando hablar con escribir

No para escribir. El CRM de HubSpot no tiene ninguna función de dictado o voz a texto integrada para redactar una nota, un correo o una tarea por voz. No hay botón de micrófono en el editor de notas ni comando de voz para el redactor. Hay una idea abierta en el propio foro de la comunidad de HubSpot pidiendo exactamente esto, y existen al menos tres herramientas distintas que acoplan el dictado a HubSpot desde fuera, lo cual es la señal más clara posible de que el CRM no lo hace de forma nativa. Si has estado rastreando la barra de herramientas del editor en busca de un icono de micrófono, puedes parar.

Ahora, la salvedad honesta, porque es aquí donde la gente se hace un lío. HubSpot sí tiene funciones de voz; simplemente son de otra categoría. HubSpot puede grabar y transcribir llamadas de ventas mediante sus herramientas de grabación de llamadas e inteligencia conversacional. Eso es una función tipo reunión: captura una llamada que ya ocurrió y produce una transcripción después. No es dictado en directo. No puedes poner el cursor en una nota de negocio, hablar y ver tus palabras aparecer en el campo. Una graba llamadas; la otra escribe por ti mientras piensas. Resuelven problemas distintos, y confundirlas cuesta una tarde entera.

Whisper se sitúa firmemente del lado del dictado de esa línea, y quiero dejarlo claro: Whisper no se une a llamadas, no graba reuniones ni transcribe un Zoom. No es un bot de reuniones. Dicta en tu cursor. Tú hablas, las palabras caen en el campo que tenga el foco. Si quieres la transcripción de una llamada de ventas de una hora, la propia inteligencia conversacional de HubSpot es la herramienta adecuada y te la recomendaría directamente. Si quieres registrar el resumen de esa llamada como una nota limpia en treinta segundos de habla, ese es el vacío que cubre esta guía.

Pulsa un atajo, habla y el texto cae en el campo

Este es todo el mecanismo, y es aburrido en el mejor sentido. Pulsas un atajo, hablas, sueltas y la transcripción se pega en tu cursor, en cualquier campo de texto que tenga el foco. Whisper mantiene una pequeña cola después de que sueltes la tecla, para que tu última palabra no se corte. Como se pega en el cursor del sistema operativo, una nota de HubSpot no es más que "cualquier caja de texto". Nota de contacto, nota de negocio, el redactor de correos, una descripción de tarea: el mismo comportamiento en todas.

Esa es la parte que el mercado de extensiones complica de más. No hay una app de HubSpot que autorizar, ni un permiso OAuth que aprobar, ni una integración que mantener cuando HubSpot lanza una actualización de la interfaz. Tu cursor está en el campo, hablas y las palabras aparecen en el campo. Mientras hablas se muestra una pequeña cápsula para que sepas que está escuchando:

Cancel
La superposición de grabación: una pequeña cápsula que aparece mientras hablas, para que sepas que Whisper está escuchando.

El atajo es lo único que merece la pena dejar bien afinado desde el principio. En Windows es Ctrl+Space; en Mac es Command+Option, un pulsar-para-hablar de solo modificadores que mantienes mientras hablas. Ambos se pueden cambiar en Ajustes si chocan con algo que ya usas. (Un comercial de HubSpot me dijo una vez que un atajo "no funcionaba": chocaba con una app de grabación de pantalla que ejecutaba en cada llamada. Era un conflicto, no un fallo, y así aprendí que la persona media no tiene ni idea de qué es un conflicto de atajos. Por eso ahora todos los atajos son personalizables.) Si ya tienes configurado el dictado en Windows o en Mac, esto es la misma memoria muscular apuntando a otra pestaña.

Configúralo en dos minutos (Windows o Mac)

Necesitas un Mac con Apple Silicon o un PC con Windows 10 o más reciente, un micrófono que funcione y HubSpot abierto en tu navegador. Todo el flujo local es gratis para cualquier cuenta con sesión iniciada, sin que se pida método de pago al registrarse. Esta es la secuencia.

Paso 1 — Instala Whisper e inicia sesión.

Descárgalo desde la página de descarga, instálalo y crea una cuenta gratuita. Sin tarjeta. Todo el flujo de transcripción local se abre de inmediato.

Sabrás que funcionó cuando aparezca el icono de la app en la bandeja del sistema y el asistente de configuración te proponga elegir un modelo.

Paso 2 — Elige una vía de transcripción.

La app no elige por ti. Tienes tres: Nube (OpenAI, con tu propia clave), Parakeet local o Whisper local. Para los datos de clientes en un CRM, empieza en local; más sobre esto un par de secciones más abajo.

Sabrás que funcionó cuando un modelo termine de descargarse y aparezca como listo.

Paso 3 — Confirma tu atajo.

Windows usa Ctrl+Space por defecto, y Mac usa Command+Option mantenido como pulsar-para-hablar. En Mac, concede el permiso de Accesibilidad cuando se te pida; sin él, el pegado en el cursor no puede llegar a tu navegador.

Sabrás que funcionó cuando una grabación de prueba se pegue en cualquier campo de texto.

Paso 4 — Pon el cursor en un campo de HubSpot y habla.

Abre un contacto o negocio, haz clic en la caja de notas, mantén el atajo, di una frase y suelta. La transcripción aparece donde está el cursor, en el campo.

Sabrás que funcionó cuando tu frase hablada esté ahí, como texto, en la nota de HubSpot.

Whisper
La app de escritorio real de Whisper en la pantalla de ajustes, con los paneles de Transcripción y de IA abiertos.

La parte lenta es la descarga del modelo, no la configuración. Todo lo demás son los cuatro pasos de arriba. Una vez en marcha, registrar una llamada deja de ser una tarea de escribir y pasa a ser una tarea de hablar, lo cual, para un comercial, es la diferencia entre una nota que se escribe y otra que no.

Notas, el redactor de correos y descripciones de tareas

Como el dictado se pega en el cursor, cualquier campo de texto de HubSpot es terreno de juego, y vale la pena detallarlo para un flujo de ventas. Las cajas de notas de contacto y de empresa, obviamente. La nota de negocio donde registras dónde está realmente el trato. El redactor de correos: dicta el cuerpo de un seguimiento en lugar de escribirlo entre llamadas. Las descripciones de tareas, para que "llamar de vuelta el jueves por la objeción de precio" quede capturado mientras está fresco, en vez de recordarse mal el miércoles.

La que más rinde es el resumen de después de la llamada. Cuelgas, pones el cursor en la nota de negocio, mantienes el atajo y dices sin más lo que pasó: con quién hablaste, en qué pusieron pegas, a qué te comprometiste y cuándo vas a hacer el seguimiento. Treinta segundos de habla frente a tres minutos escribiendo un tercio. El detalle que normalmente se evapora entre la llamada y el teclado de verdad acaba en el registro. Esa es toda la propuesta: no escribir más rápido, sino que las notas lleguen a existir.

Nada de esto necesita que HubSpot sepa que Whisper existe. No es una integración, así que no se rompe cuando HubSpot cambia el editor, y funciona igual en tu redactor de Gmail cuando le escribes a un cliente potencial fuera del CRM. Un atajo, todos los campos, esté el campo en HubSpot o no. Para un comercial que vive entre una docena de pestañas, esa propiedad de "igual en todas partes" es la verdadera función.

Local o nube: qué modo para los datos de clientes

Para un CRM, piénsate bien primero el modo local. Las notas que dictas en HubSpot son datos de clientes: nombres, tamaños de negocio, lo que un cliente potencial dijo de un competidor, el motivo por el que alguien duda. Parte de eso es justo el tipo de cosa sobre la que tu empresa tiene normas. Sería una elección rara enrutar cada resumen de llamada hablado a través de una nube de terceros para meterlo en un registro que mantienes precisamente porque es sensible. Si tu Mac es Apple Silicon o tu PC es de los últimos años, el local maneja el dictado de cada día sin quejarse, y la nube pasa a ser la salida de emergencia en lugar de la opción por defecto.

Así es como difieren las tres vías, porque la app te hace elegir y prefiero que elijas bien:

  • Parakeet localel motor TDT de NVIDIA, unos 600 MB, y la opción local más rápida: de 5 a 10 veces más rápido que Whisper en CPU. Cubre inglés más otros 24 idiomas europeos, 25 en total. Sin traducción al inglés. Si tu flujo va en inglés o en otro idioma europeo, esta es la elección rápida y totalmente sin conexión.
  • Whisper localmás lento que Parakeet en la misma máquina, pero las versiones multilingües cubren 99 idiomas y pueden traducir al inglés. Las versiones solo en inglés son solo inglés, no 99. Elige esta si vendes a cuentas en China, Japón o Corea, o si necesitas traducción, que Parakeet no hace. El modelo de inglés por defecto ronda los 480 MB.
  • Nube (OpenAI, con tu propia clave)la mejor precisión y acceso a la web, usando tu propia clave de OpenAI facturada directamente por OpenAI. La transcripción se ejecuta en gpt-4o-mini-transcribe por defecto. Necesita internet, así que es la única vía que sale de tu máquina. La superficie de Nube forma parte de Whisper Pro.

La verdad aburrida es que para el tipo de notas que la mayoría de comerciales mete en HubSpot, el local sobra. Ambos motores locales se ejecutan por completo en tu máquina sin enviar nada a un servidor, que es exactamente lo que quieres para los datos de clientes. La nube se gana su sitio cuando necesitas precisión de primer nivel con un acento cerrado o quieres que el modelo saque un dato de la web a mitad de la nota. Para el registro de llamadas del día a día, empieza en local y recurre a la nube solo cuando el local se quede corto.

Convertir un resumen de llamada hablado en una nota limpia

El dictado en bruto sale como una parrafada. Cuelgas y dices "vale o sea hablé con maría le preocupa el plazo de migración quiere una llamada con nuestro equipo de soluciones antes de firmar seguimiento el viernes", y eso es el muro sin puntuar que te entrega cualquier motor de voz. Limpiarlo es donde las vías se separan.

El dictado por voz de Windows añade puntuación mientras hablas, y el dictado de macOS gestiona la puntuación básica cuando dices "coma" o "punto". Para una limpieza más a fondo (quitar los "eh", arreglar las parrafadas, convertir un volcado apresurado de después de la llamada en algo que el siguiente comercial pueda leer de verdad), Whisper puede hacer una pasada de IA. Di la frase de activación "Hey whisper" y el texto se mejora antes de caer en la nota. En un modelo local eso pasa por Ollama; en modo nube es gpt-5-mini por defecto.

Thinking...
En bruto

vale o sea hablé con maría le preocupa el plazo de migración quiere una llamada con nuestro equipo de soluciones antes de firmar eh seguimiento el viernes

Limpio

Hablé con María. Le preocupa el plazo de migración y quiere una llamada con nuestro equipo de soluciones antes de firmar. Seguimiento el viernes.

Un límite honesto, porque alguien lo va a preguntar. El dictado te deja texto limpio en el campo de la nota. No rellena por ti la estructura propia de HubSpot: no fijará la etapa del negocio, no asociará la nota al contacto correcto ni creará la tarea de seguimiento como una tarea de verdad. Tú dictas las palabras; tú haces clic en los controles de HubSpot como siempre. Cualquiera que prometa "di cambia la etapa del negocio a ganado y míralo suceder" te está vendiendo una demo, no un martes cualquiera. Deja el resumen rápido por voz y luego usa los propios botones del CRM para los propios campos del CRM.

Ese mismo flujo de hablar-y-limpiar rinde mucho más allá del CRM: también puedes dictar prosa limpia en cualquier app con el único atajo, así que un correo de seguimiento largo se convierte en unas pocas frases habladas en lugar de un párrafo que escribes entre llamadas.

Cuándo saltarse una herramienta de dictado para HubSpot

Dos flechas dibujadas con tiza en el pavimento apuntando en direcciones distintas, ilustrando una elección de herramienta

A veces la herramienta adecuada es la gratuita que ya tienes en tu máquina, y fingir lo contrario sería deshonesto. Si solo dejas capturas cortas en HubSpot (una nota de una línea, una tarea de dos palabras), tu sistema operativo lo cubre por nada.

En Windows, pulsa la tecla Windows + H y se abre la barra de dictado por voz integrada allá donde esté tu cursor, incluida una nota de HubSpot. Puntúa sola y va bien para ráfagas cortas. La pega: pasa por los servidores de Microsoft y necesita conexión a internet, así que no es una opción sin conexión, lo cual importa más de lo habitual cuando el texto son datos de clientes. En Mac, el dictado te deja hablar para introducir texto en cualquier sitio donde puedas escribir, se configura en Ajustes del Sistema, en Teclado, y en Apple Silicon el texto general se puede procesar en el dispositivo. Y si lo que de verdad quieres es la transcripción de la propia llamada de ventas, sáltate el dictado del todo: para eso están la grabación de llamadas y la inteligencia conversacional de HubSpot, hechas exactamente para ese trabajo.

Recurre a una herramienta dedicada y para todo el sistema cuando los recursos integrados empiecen a doler: resúmenes de llamada largos, cuentas multilingües, privacidad sin conexión para los datos de clientes en Windows, o querer un único atajo que se comporte igual en una nota de HubSpot, en tu correo y en tu lista de tareas. Por debajo de ese listón, usa lo que es gratis. No te voy a decir que instales una app para registrar un recordatorio de una línea.

El mismo equilibrio aparece si tu equipo también guarda notas de cuentas en otra herramienta aparte: la lógica de dictar en Notion es idéntica, porque allí también el cursor, y no una integración, es la verdadera conexión entre tu voz y el campo.

Para seguir leyendo

HubSpot nunca lanzó un botón de micrófono para su campo de notas y, dado lo mucho que ha invertido en cambio en la grabación de llamadas, dudo que tenga prisa por hacerlo. No le hace falta, porque el cursor es la integración. Habla en el campo, obtén texto limpio y haz clic en los propios botones del CRM para el resto. Dicté la mitad de esta guía en una caja de texto que no era HubSpot, con una herramienta a la que le da igual qué caja sea, y luego pegué todo donde tenía que ir. Ese es todo el truco.

Registra tu próxima llamada hablando

Mantén el atajo, di lo que pasó y suelta. El resumen cae en el campo de HubSpot donde esté tu cursor, y en todas las demás apps también.

Modo local gratis para cualquier cuenta con sesión iniciada. No hace falta tarjeta para empezar.

Foto de Denys Medvediev

Denys Medvediev

Soy el que lee nuestro correo de soporte, probablemente dictando las respuestas.