Tutorial
Voz a texto en Salesforce: dicta cualquier campo
Salesforce no tiene dictado nativo para escribir en cualquier sitio del Lightning de escritorio. Un atajo de teclado global como Whisper cubre ese hueco: mantén pulsada una tecla, habla y las palabras se pegan en el campo de Salesforce donde tengas el cursor.
Última actualización: junio de 2026

Voz a texto en Salesforce significa dictar directamente en el campo de un registro en lugar de teclearlo. Salesforce no tiene dictado nativo para escribir en cualquier sitio del Lightning de escritorio; su función de voz integrada es la transcripción de llamadas, no la escritura en campos. Una herramienta de escritorio como Whisper cubre ese hueco: mantén pulsado un atajo, habla y las palabras se pegan en el campo de Salesforce donde tengas el cursor.
Una vez vi a un comercial teclear el mismo resumen de llamada tres veces porque la pestaña del CRM perdió el foco y se comió el borrador. Hablaba mucho más rápido de lo que tecleaba: la mayoría de la gente dicta unas 145 palabras por minuto frente a unas 40 tecleando. La parte honesta que ningún blog de proveedores dice en voz alta es esta: Salesforce sí tiene funciones de voz, pero no la que quieres cuando necesitas convertir en texto la nota de un caso. Así que esto son dos artículos en uno. Lo que Salesforce realmente ofrece, y cómo dictar en cualquier campo de todos modos.
Registros de actividad, notas de casos, descripciones de oportunidades, publicaciones de Chatter: cada uno es un cuadro de texto, y cada cuadro de texto es un pequeño impuesto para alguien que preferiría estar vendiendo. La solución no es un teclado más rápido. Es no abrir el teclado. Whisper es una app de escritorio para Windows y macOS que deja la transcripción justo donde está tu cursor, incluido cualquier campo de Salesforce en cualquier navegador. A continuación: cómo funciona, qué te da ya Salesforce y cuándo deberías recurrir más bien a una herramienta nativa de Salesforce.
Pulsa un atajo, habla y mira cómo se rellena el campo
Toda la interacción es un único gesto. Haz clic en el campo de Salesforce que quieres rellenar: un comentario de caso, una descripción de oportunidad, una publicación de Chatter. Mantén pulsado el atajo. Habla como una persona normal. Suelta. El texto aparece en el cursor un instante después.
El atajo predeterminado es Ctrl+Space en Windows y Command+Option en macOS. Es global, y esa es la parte que importa: no está atado a una pestaña del navegador ni es un complemento de Salesforce, funciona en cualquier app donde puedas escribir. La misma tecla dicta en la nota de un caso, luego en el mensaje de Slack avisando a tu jefe de que está resuelto, y luego en el correo al cliente. Una sola memoria muscular, todas las cajas. Las extensiones de navegador que aparecen en esta búsqueda viven dentro de una pestaña de Chrome o Edge; Whisper se sitúa a nivel del sistema operativo, así que le da igual con qué navegador abriste Salesforce.
¿Tiene Salesforce voz a texto integrada? En general, no

Aquí va la respuesta honesta, porque los resultados de búsqueda no son consistentes al respecto. Salesforce no tiene dictado nativo para escribir en cualquier sitio dentro del Lightning Experience de escritorio. No hay un botón de "dictar en este campo" en un caso o un candidato. Eso no significa cero voz: Salesforce tiene varias funciones de voz, solo que no la que la mayoría imagina al buscar esta frase.
Lo más parecido a la captura nativa de notas por voz que Salesforce llegó a lanzar fue el Einstein Voice Assistant. Salió en 2020 y se retiró en 2021. Ya no existe. Si estás buscando una "alternativa a Einstein Voice Assistant", es por esto: el producto fue real, y luego dejó de serlo.
Lo que sí está vigente hoy es otra categoría. La función de voz nativa permanente de Salesforce es Einstein Conversation Insights, que transcribe llamadas de ventas y reuniones y extrae conclusiones de ellas: quién habló demasiado, dónde se tambaleó el trato. Es inteligencia de llamadas, no dictado en campos; no pondrá una frase en el comentario de un caso. Service Cloud Voice transcribe llamadas telefónicas en directo para los agentes de los centros de contacto: de nuevo, llamadas, no escritura. Y Agentforce, el agente de IA conversacional de Salesforce, tiene voz a texto, pero como función móvil para hablar con el agente, no como un sistema que escriba tus palabras en el campo de escritorio que tiene el foco.
Así que Salesforce cubre de forma nativa las llamadas grabadas, y deberías usar esas herramientas para eso. Convertir en texto una nota de 90 palabras en el registro de actividad de un candidato es el hueco. Está en el Lightning de escritorio, y es donde un atajo de dictado global demuestra su valía.
El micrófono del teclado del móvil frente al dictado de escritorio
En el móvil ya tienes una solución, y está bien. Dentro de la app móvil de Salesforce puedes tocar el micrófono del teclado de tu teléfono —el dictado de iOS o Android— y hablar en un campo. El micrófono del teclado es una función del dispositivo, no de Salesforce. Por eso el móvil parece resuelto y el escritorio no. Windows incluye la escritura por voz con Win+H y macOS incluye Dictation, y ambos escriben en un campo del navegador, incluido Salesforce: la base gratuita a nivel del sistema operativo que la mayoría olvida. Son de una sola plataforma, la limpieza del texto es pobre y activarlos es más engorroso que mantener pulsado un atajo. Whisper es la versión de escritorio de ese micrófono del teclado del móvil, salvo que funciona igual en Windows y Mac, en cualquier navegador y en todas las demás apps que uses.
Cómo dictar en cualquier campo de Salesforce con Whisper
La configuración es breve.
- Instala Whisper en tu PC con Windows o tu Mac e inicia sesión. La canalización local es gratuita, sin tarjeta para empezar.
- Descarga un modelo una vez: un archivo en disco, de unos 140 MB a 3 GB según el que elijas. Este es el único paso que necesita internet.
- Abre Salesforce y haz clic en el campo que quieres rellenar: un comentario de caso, una descripción de oportunidad, una publicación de Chatter, el redactor de correo.
- Mantén pulsado el atajo —Ctrl+Space en Windows, Command+Option en Mac— y habla.
- Suelta. La transcripción se pega en el cursor. Edítala si lo necesitas y guarda.
Sin instalación desde AppExchange, sin aprobación de un administrador, sin complemento por usuario. Whisper no inicia sesión en Salesforce ni toca la configuración de tu organización: desde el punto de vista de Salesforce, simplemente apareció texto en un campo, igual que si lo hubieras tecleado. Por eso funciona en casos, candidatos, oportunidades, tareas, Chatter y el redactor de correo sin configuración por objeto.
Local o nube: qué modo usar para las notas del CRM

Esto importa más para los datos de un CRM que para casi cualquier otra cosa que dictes.
En modo local, Whisper funciona completamente sin conexión. El audio nunca sale de la máquina; la única vez que necesita internet es esa descarga única del modelo. Cuando el texto son nombres de clientes, importes de tratos, condiciones de contratos y la ocasional nota franca sobre un interlocutor, eso no es un capricho.
Aquí va la opinión que voy a defender: el dictado solo en la nube es un desastre de privacidad esperando a ser transcrito. Una vez vi a un equipo enviar cada palabra de un prototipo de dictado a una API en la nube. La factura de cierre de trimestre tenía cinco cifras, sobre todo por volver a transcribir las mismas grabaciones de la reunión diaria cuatro veces porque la lógica de reintentos era demasiado entusiasta (yo escribí esa lógica de reintentos; tengo un máster). La lectura del director financiero fue contundente: quizá no le pagues a un proveedor por guardar copias de reuniones que ya tienen notas. Los datos de un CRM tienen la misma forma. Tu pipeline de ventas no tiene por qué vivir en los registros de un proveedor porque alguien quiso hablar en lugar de teclear.
El modo nube también existe, para cuando quieres la máxima precisión o una limpieza con IA encima: una función de Whisper Pro que usa tu propia clave de OpenAI. Es la salida de emergencia, no la opción por defecto. Toda la canalización local es gratuita para los usuarios que han iniciado sesión, y la tarjeta solo se pide al pasar a Pro, nunca al registrarse. Las cifras están en la página de precios de Whisper. Para las notas del día a día del CRM, empieza en local, mantén los datos en tu escritorio y no pagues nada.
Limpia el dictado antes de que aterrice en el campo
El dictado en bruto tiene los "ehs" y las frases interminables del habla real. Whisper puede ejecutar una pasada opcional de limpieza con IA que ordena la transcripción antes de que aterrice: corrige la puntuación, elimina la muletilla y convierte una idea divagante en una nota de caso limpia. En el modo local gratuito esa pasada se ejecuta en tu máquina mediante Ollama; en Pro usa tu clave de OpenAI. "Sí, bueno, le devolví la llamada, quiere el presupuesto revisado para el viernes" se convierte en una línea que no te daría vergüenza dejar en la oportunidad. Es el mismo truco que te permite teclear más rápido con la voz en cualquier sitio, no solo en un CRM.
Whisper maneja más de 90 idiomas en ambos modos, llegando a 99 en sus variantes multilingües; las variantes solo en inglés son solo en inglés. Si tus cuentas abarcan distintas regiones, el dictado también.
El límite honesto, y cuándo saltarte Whisper

Primero la advertencia, porque las apps de AppExchange hacen una promesa que Whisper no hace. Whisper pega en el único campo que tiene tu cursor, de uno en uno. La nota del caso, la descripción del candidato, el campo de la oportunidad, la publicación de Chatter: donde sea que hayas hecho clic. No entiende el modelo de datos de Salesforce. No oirá "registra una llamada, fija el siguiente paso como una demo y actualiza la fecha de cierre" para repartir esos tres datos en tres campos de registro. Es lo más simple a propósito: pon el cursor, habla y el texto aterriza ahí. El mismo modelo de un campo a la vez es como funciona Whisper en una descripción de tarea de ClickUp y en HubSpot también.
Así que estos son los casos en los que preferiría que usaras otra cosa.
- Necesitas transcripción de llamadas, no dictado de notas. Usa Einstein Conversation Insights. Es nativo, transcribe las llamadas y extrae conclusiones de coaching que Whisper no puede. Whisper no graba llamadas; dicta texto.
- Necesitas que los campos se rellenen automáticamente. Si quieres que un párrafo hablado rellene varios campos de un registro, recurre a una app de AppExchange como Voice Assist, Outloud o Rollio. Conocen el CRM de una forma en la que Whisper no, y se distribuyen como paquetes gestionados con controles de administrador.
- Solo trabajas en el móvil. El micrófono del teclado de tu teléfono ya dicta gratis en los campos de la app móvil de Salesforce. Whisper es una herramienta de escritorio; se gana su sitio en el portátil, no en el móvil.
Recurre a Whisper cuando quieras dictado en el Lightning de escritorio en cualquier campo, sin conexión para que los datos del CRM se queden en tu máquina, gratis sin tarjeta y sin instalar desde AppExchange, y con un solo atajo para cada app, no solo una pestaña del navegador. ¿Lo estás configurando en un PC? La guía de voz a texto en Windows cubre el atajo y los detalles del sistema operativo.
La primera versión de Whisper se montó a las prisas en un vuelo porque teclear las notas de las reuniones se comía unas tardes que ya eran cortas. Los comerciales de Salesforce tienen el mismo problema, vestido de CRM. No necesitas que a Salesforce le salga un botón de dictado, y no necesitas esperar al próximo Einstein. Haz clic en el campo, mantén pulsada la tecla, di lo que tengas que decir. Descarga Whisper y deja de reescribir el resumen de la llamada.
Dicta tu próxima nota de Salesforce
Haz clic en el campo, mantén pulsada la tecla, habla y suelta. La transcripción aterriza donde está tu cursor, en Salesforce y en todas las demás apps también.
Modo local gratuito para cualquier cuenta con sesión iniciada. Sin tarjeta para empezar.



