Guía
Software de dictado para consultores
El día de un consultor termina con una pila de memorandos sin escribir. El software de dictado convierte el vaciado mental tras la reunión en texto por voz: pulsa un atajo, habla mientras repasas lo ocurrido, y el texto aparece en el cursor — en Word, en tu propuesta o en el CRM — en cualquier aplicación.
Última actualización: junio de 2026

El software de dictado para consultores convierte los repasos hablados en memorandos escritos, propuestas y notas de reunión con solo pulsar un atajo de teclado. Una herramienta de sistema como Whisper pega la transcripción en el cursor dentro de cualquier aplicación, funciona completamente sin conexión en modo local para que el material del cliente no salga del equipo, y puede depurar el borrador con un pase de IA.
Todos los consultores que he visto trabajar tienen el mismo cuello de botella, y no es la reunión en sí. La reunión está bien. El problema son los cuarenta minutos posteriores, cuando todo está fresco en tu cabeza y tienes que convertirlo en un memo que alguien vaya a leer de verdad. Para cuando has abierto el documento, formateado el encabezado y retomado el hilo, la mitad de lo que querías decir ya se ha esfumado.
El dictado cierra esa brecha. Sales de la sala, repasas lo ocurrido en voz alta mientras todavía está vivo en tu memoria, y las palabras están en la página antes de que se desvanezcan. La gente busca "software de dictado para consultores" esperando un producto de nicho pensado para la profesión. No existe, y no lo necesitas. Lo que necesitas es una herramienta de sistema que escriba donde esté tu cursor — y, si manejas información sensible, una que lo haga sin enviar una sola palabra fuera de tu portátil.
Esto es lo que la mayoría de las páginas no dicen con claridad. No existe una "edición para consultoría" del dictado, porque un memo no es más que un campo de texto, igual que un correo o una diapositiva de propuesta. Un dictado que pega en tu cursor no distingue si ese campo está en Word, Google Docs, Salesforce o un mensaje directo en Slack para tu responsable de cuenta.
Así que la pregunta real no es "qué app de dictado está pensada para consultores". Es "qué herramienta redacta rápido, limpia bien y mantiene el material del cliente en mi máquina cuando es necesario". Este último punto importa más en esta profesión que en casi cualquier otra. Cubriré el flujo de trabajo, lo configuraré en unos dos minutos, analizaré la decisión entre local y nube, y te diré el único caso en que el dictado no es la herramienta adecuada y deberías recurrir a otra cosa.
Por qué los consultores recurren al dictado

La razón real y honesta es la velocidad contra una memoria que se desvanece. Un consultor produce mucho texto con presión de tiempo: el memo al cliente tras un taller, el correo de resumen antes de que los detalles se difuminen, el primer borrador de una sección de propuesta, las notas de alcance que prometiste para el final del día. Teclear todo eso es la parte lenta, y es más lenta precisamente cuando más cansado estás — al final de un día repleto de reuniones.
Hablar es más rápido que escribir, y no hay comparación. Al dictar de manera constante se producen unas 145 palabras por minuto frente a unas 40 al teclear. Para un resumen de 400 palabras, eso es la diferencia entre tres minutos y doce. Pero la mayor ventaja es mental. Cuando hablas de un problema que acabas de analizar con un cliente, piensas en frases completas. Cuando estás encorvado sobre el teclado, piensas en fragmentos a medias. El dictado te permite redactar del mismo modo en que le explicarías algo a un compañero en la máquina de café — que suele ser cuando el memo tiene más claridad.
También hay una razón más silenciosa. Un memo largo son muchas pulsaciones de tecla, y un día de redacción continua es duro para las manos. El dictado las descansa. No voy a presentar eso como un argumento de salud — es una herramienta de productividad que saca el teclado de la ecuación, nada más — pero cualquiera que haya tecleado tres propuestas antes de comer sabe de qué hablo. Dictar el primer borrador y editarlo a mano es menos agresivo que escribir todo el texto dos veces.
Pulsa un atajo, habla, el memo se escribe solo
El funcionamiento es sencillo, y eso es precisamente el punto. Pulsas un atajo de teclado, hablas, lo sueltas, y la transcripción aparece en tu cursor dentro de lo que tengas en foco. Whisper mantiene un pequeño margen tras soltar la tecla para que tu última palabra no se corte. Como pega en el cursor del sistema operativo, tus herramientas son simples "campos de texto" para él — Word, Google Docs, una propuesta en PowerPoint, el campo de notas en Salesforce o HubSpot, un correo al socio, un mensaje en Slack al equipo de trabajo. Mismo atajo, mismo comportamiento, en todo.
Esa es la parte que las páginas de producto complican sin necesidad. No hay ningún complemento que conectar a cada aplicación, ni integración que mantener, ni el ir y venir entre una ventana de transcripción separada. Tu cursor está en el memo, hablas, las palabras aparecen en el memo. Mientras hablas, aparece una pequeña cápsula para que sepas que está escuchando:
El atajo de teclado es lo único que vale la pena configurar bien desde el principio. En Windows es Ctrl+Space; en Mac es Command+Option, un push-to-talk de modificadores que mantienes pulsado mientras hablas y sueltas para detener. Ambos se pueden cambiar en Ajustes si entran en conflicto con algo que ya usas — y el equipo de un consultor suele tener muchos conflictos potenciales. Si ya has configurado el dictado en Windows o en Mac antes, es la misma memoria muscular apuntada a tu trabajo con clientes.
Configúralo en dos minutos (Windows o Mac)
Necesitas un Mac con Apple Silicon o un PC con Windows 10 o superior, un micrófono que funcione, y lo que uses para redactar — Word, Docs, tu CRM — abierto delante de ti. Todo el proceso local es gratuito para cualquier cuenta con sesión iniciada, sin que te pidan método de pago al registrarte. Aquí va la secuencia.
Paso 1 — Instala Whisper e inicia sesión.
Descarga desde la página de descarga, instala y crea una cuenta gratuita. Sin tarjeta. Todo el proceso de transcripción local se abre de inmediato.
Sabrás que ha funcionado cuando aparezca el icono de la app en la bandeja del sistema y el asistente de configuración ofrezca elegir un modelo.
Paso 2 — Elige una ruta de transcripción.
La app no decide por ti. Tienes tres opciones: Cloud (OpenAI, con tu propia clave), Local Parakeet o Local Whisper. Para material de clientes, empieza en local — más sobre esto dos secciones más adelante.
Sabrás que ha funcionado cuando un modelo termine de descargarse y aparezca como listo.
Paso 3 — Confirma tu atajo de teclado.
Windows usa Ctrl+Space por defecto, Mac usa Command+Option mantenido como push-to-talk. En Mac, concede el permiso de Accesibilidad cuando se solicite; sin él, el pegado en el cursor no puede alcanzar otras aplicaciones.
Sabrás que ha funcionado cuando una grabación de prueba se pegue en cualquier campo de texto.
Paso 4 — Coloca el cursor en el memo y habla.
Abre el documento, haz clic donde deba ir el texto, mantén pulsado el atajo, repasa el contenido hablando, suéltalo. La transcripción aparece en el cursor.
Sabrás que ha funcionado cuando tu resumen hablado esté en el documento como texto.
La parte lenta es la descarga del modelo, no la configuración. Todo lo demás son los cuatro pasos anteriores. Una vez en marcha, sacar un memo de tu cabeza y plasmarlo en la página deja de ser una tarea de mecanografía y se convierte en una conversación de dos minutos.
Redactar memos, propuestas y resúmenes por voz
El flujo de trabajo más rentable es el vaciado mental después de la reunión. Terminas la sesión con el cliente, buscas un rincón tranquilo y hablas el resumen completo antes de que se enfríe — las decisiones, las preguntas abiertas, quién es responsable de qué, lo que el cliente dijo de pasada y no quieres perder. No busques estructura mientras hablas. Vuelca el contenido primero como una corriente honesta, luego dale forma. Un borrador hablado y desordenado que puedes editar supera a un memo impecable que nunca empezaste porque se te acabó la tarde.
Las propuestas funcionan igual, por partes. Dicta la sección de enfoque como si se la estuvieras explicando al cliente al otro lado de la mesa, luego los supuestos, luego el alcance aproximado. Escribirás de forma más natural y humana que tecleando, que es justamente lo que necesita una propuesta — la mayoría suena a comité porque fue escrita por uno. Los encabezados, el formato de viñetas, la tabla de entregables: eso hazlo con el teclado después. El dictado te da las palabras rápido; el formato del documento te da la estructura. Ninguna herramienta genera un diseño de propuesta limpio a partir de una frase hablada, y quien te demuestre eso te está vendiendo una demo, no un martes de trabajo real.
Una nota práctica para esta profesión: cada proyecto tiene su propio argot — los nombres de productos del cliente, los acrónimos internos, la metodología que estás vendiendo. Local Whisper permite añadir vocabulario personalizado y palabras clave para que deje de deformar «EBITDA» o de convertir el producto del cliente en una aproximación fonética. Parakeet y la ruta cloud no admiten listas de vocabulario personalizado, así que si tus memos están llenos de nombres propios, eso juega a favor de Whisper. En cualquier caso, una lectura rápida siempre detecta los nombres — la voz te lleva al 95% del camino, los ojos hacen el último 5%.
Local o nube: qué modo usar con material de clientes
Para trabajo de consultoría, prueba primero el modo local, y no como mero trámite. Gran parte de lo que dictas es confidencial por defecto — los números de un cliente, una reestructuración interna, un acuerdo que aún no es público. El modo local ejecuta toda la transcripción en tu propio equipo, de modo que el audio y el texto nunca salen del portátil. Es una propiedad real y verificable: nada se envía a un servidor porque no hay ningún servidor en la cadena. No te estoy prometiendo un certificado de cumplimiento ni una garantía legal — eso es entre tú, tu empresa y el contrato del cliente — pero «el audio se queda en este dispositivo» es un hecho que puedes defender, y para material sensible es el valor predeterminado correcto. El razonamiento es el mismo que desarrollo en reconocimiento de voz privado y en el dispositivo.
Así se diferencian las tres rutas, porque la app te obliga a elegir y prefiero que elijas bien:
- Local Parakeet — El motor TDT de NVIDIA, unos 600 MB y la opción local más rápida — entre 5 y 10 veces más veloz que Whisper en CPU. Cubre inglés más otros 24 idiomas europeos, 25 en total. Sin traducción al inglés ni vocabulario personalizado. Si la mayoría de tus memos están en inglés y quieres velocidad, esta es la elección rápida y completamente sin conexión.
- Local Whisper — más lento que Parakeet en el mismo equipo, pero las versiones multilingües cubren 99 idiomas y pueden traducir al inglés, y es el único motor local que admite vocabulario personalizado y palabras clave. Elige esta opción para memos con mucho argot, clientes multilingües o cualquier trabajo de traducción. El modelo de inglés predeterminado ocupa unos 480 MB; las versiones solo en inglés son solo en inglés, no 99.
- Cloud (OpenAI, BYOK) — la mayor precisión y acceso web, usando tu propia clave de OpenAI facturada directamente por OpenAI. La transcripción usa gpt-4o-mini-transcribe por defecto. Necesita internet, así que es la única ruta que sale de tu equipo — adecuada para trabajo no sensible, la opción incorrecta para audio confidencial de clientes. La función Cloud forma parte de Whisper Pro.
El dictado exclusivo en la nube es un desastre de privacidad esperando a ser transcrito, y los consultores son exactamente quienes deberían preocuparse por eso. Una vez vi a un equipo interno acumular una factura de cinco cifras en la nube en un trimestre enrutando cada grabación de sus reuniones diarias a través de una API — y eso era solo el coste que aparecía en el panel. Lo que nadie cuantificó fue que un trimestre de reuniones confidenciales de alguien había estado almacenado en los registros de un tercero todo ese tiempo. El plan de reestructuración de tu cliente no pertenece a los registros de un proveedor porque tú querías escribir con la voz. Empieza en local; deja la nube como válvula de escape para el contenido público y no sensible donde quieras la máxima precisión o un dato extraído de la web a mitad de una frase.
Convertir un vaciado mental hablado en un memo limpio
El dictado en bruto sale como un torrente sin pausas. Dices «bueno el cliente quiere el piloto acotado al Q3 el presupuesto está ajustado les preocupa el riesgo de migración así que mencionarlo en el resumen» y eso es el muro sin puntuación que cualquier motor de voz te devuelve. Limpiarlo es donde un memo demuestra su valor.
El Dictado por voz de Windows añade puntuación mientras hablas, y macOS Dictation gestiona la puntuación básica cuando dices «coma» o «punto». Para el trabajo más pesado — eliminar rellenos, corregir frases encadenadas, convertir un discurso hablado en algo que realmente enviarías a un cliente — Whisper puede ejecutar un pase de IA. Di la frase de activación «Hey whisper» y el texto se mejora antes de que aparezca. En un modelo local funciona a través de Ollama en tu propio equipo; en modo cloud usa gpt-5-mini por defecto. El antes y el después es todo el argumento:
bueno el cliente quiere el piloto acotado al q3 el presupuesto está ajustado les preocupa el riesgo de migración así que mencionarlo en el resumen y recuérdame enviar la presentación el jueves
El cliente quiere el piloto acotado al Q3. El presupuesto está ajustado y les preocupa el riesgo de migración, así que menciónalo en el resumen. Recordatorio: enviar la presentación el jueves.
Una advertencia que importa más en esta profesión que en la mayoría: el pase de IA ordena la gramática y la estructura, pero no verifica los hechos. Convertirá «2 millones de dólares» en una frase confiada tanto si eso es lo que dijo el cliente como si no. Lee cada memo limpio antes de enviarlo. La limpieza te ahorra la mecanografía y el trabajo con la puntuación; no te ahorra el juicio, y el juicio de un consultor es precisamente por lo que el cliente paga.
Ese mismo hábito de hablar y luego limpiar rinde frutos en cualquier lugar donde esté tu cursor — es la base de tomar notas por voz, de modo que una página de notas de reunión se convierte en unos minutos hablados en lugar de una sesión de mecanografía que sigues postergando.
Cuándo prescindir del dictado y usar una herramienta de transcripción

El dictado es para redactar con tu propia voz. No es para grabar y transcribir a otras personas. Esta es la línea que los consultores cruzan con más frecuencia, así que la trazaré con claridad: si quieres capturar una llamada completa con un cliente o un taller con múltiples participantes y obtener una transcripción con quién dijo qué, eso es un trabajo diferente y requiere una herramienta diferente. No nos unimos a tus llamadas. No grabamos la sala. Whisper escribe lo que tú dices mientras mantienes pulsada una tecla — no es una grabadora de reuniones, y pretender lo contrario te haría perder la tarde.
Para ese trabajo, recurre a un servicio de transcripción de reuniones diseñado para ello — la categoría con etiquetas de interlocutor, integración con el calendario y resúmenes posteriores a la llamada. Obtén el consentimiento del cliente antes de grabar a nadie, porque eso es un campo minado por sí solo en esta profesión. El dictado y la transcripción se agrupan en la cabeza de la gente, pero son direcciones opuestas: uno captura lo que tú dices a propósito, el otro captura una conversación a posteriori. Usa el correcto y te ahorrarás una tarde frustrante luchando contra una herramienta para hacer algo para lo que nunca fue diseñada.
Y para las cosas genuinamente breves, las opciones integradas gratuitas funcionan bien. En Windows, Win+H abre el Dictado por voz donde esté tu cursor — práctico para una nota de dos líneas, aunque enruta a través de los servidores de Microsoft y necesita internet, así que no es adecuado para nada confidencial. En Mac, Dictation escribe en cualquier campo y funciona en el dispositivo con Apple Silicon. Recurre a una herramienta dedicada de sistema cuando las opciones integradas se queden cortas: memos largos, propuestas con mucho argot, privacidad sin conexión en Windows, o un único atajo que funcione igual en Word, tu CRM y tu correo. La misma lógica de velocidad y privacidad aparece cuando simplemente quieres escribir más rápido con la voz en todas las aplicaciones. Por debajo de ese nivel, usa lo que ya tienes gratis.
No existe una edición de consultoría para el dictado, y nunca hace falta, porque el cursor es la integración. Repasa la reunión en voz alta mientras todavía está fresca en tu cabeza, deja que el pase de IA elimine el relleno, luego léelo como profesional antes de enviarlo al cliente. Redacté la mayor parte de esta guía hablando a un campo de texto que no sabía nada de consultoría, con una herramienta a la que no le importaba para qué era ese campo. Al memo sobre tu escritorio tampoco le importa. Solo quiere las palabras.
Redacta tu próximo memo hablando
Sal de la reunión, mantén pulsado el atajo, repasa el contenido en voz alta. La transcripción llega a tu documento — y puede quedarse completamente en tu equipo.
Modo local gratuito para cualquier cuenta con sesión iniciada. No se necesita tarjeta para empezar.



