Guía
Software de dictado para bloggers
La mayoría de los borradores de blog son lentos porque escribir a mano es lento. El software de dictado resuelve el borrador, no el editor: pulsa una tecla de acceso rápido, habla y el texto limpio aparece en tu cursor en WordPress, Ghost, Substack, Medium o Notion. Sin plugins que instalar, y funciona sin conexión.
Última actualización: junio de 2026

El software de dictado para bloggers convierte un primer borrador hablado en texto escrito dentro de cualquier editor. Una herramienta de sistema como Whisper funciona con una tecla de acceso rápido: habla, suelta y las palabras se pegan en el cursor dentro de WordPress, Ghost, Substack, Medium o Notion. No hace falta ningún plugin del CMS, funciona sin conexión y el nivel local es gratuito.
Una entrada de blog son dos trabajos con un solo plazo. Está el pensar —lo que realmente quieres decir— y está el escribir, que es la parte lenta donde las ideas esperan su turno. Yo escribo bastante por las tardes, y la distancia entre «sé lo que dice este párrafo» y «el párrafo está en la pantalla» siempre era teclear. Así que empecé a dictar el primer borrador en voz alta.
La gente busca «software de dictado para bloggers» y aterriza en listas de aplicaciones que todas quieren vivir dentro de un solo editor: un plugin de WordPress aquí, una extensión de Chrome allá. La respuesta honesta es más sencilla y un poco aburrida. No quieres el dictado dentro de tu CMS. Lo quieres encima de toda tu máquina, para que la misma tecla rellene un bloque de Gutenberg, una entrada de Substack y la respuesta al lector que te mandó un correo. Una sola herramienta, cualquier editor.
Aquí está lo que los artículos de listas omiten. Tu editor —Gutenberg, el compositor de Ghost, el cuadro de Substack, Medium, una página de Notion— es un campo de texto. Al dictado que pega en tu cursor le da igual cuál sea. El CMS no es la integración. El cursor sí lo es.
Así que la pregunta real no es «qué plataforma de blogging tiene el mejor dictado por voz». Ninguna tiene un dictado integrado excelente, y tampoco lo necesitas. La pregunta es «qué herramienta de dictado ejecuto por encima de todas ellas», y la respuesta depende de si quieres que sea gratuita, sin conexión y la misma en cada editor. Voy a explicar el porqué, configurar una en dos minutos, mostrarte el proceso de limpieza que convierte el revoltijo hablado en un borrador, y decirte cuándo saltarte el dictado por completo y usar otra herramienta.
Por qué los bloggers recurren al dictado

El cuello de botella es el borrador, no la edición. La mayoría de los bloggers que conozco pueden esbozar una entrada en dos minutos y luego pasan una hora convirtiendo el esquema en frases. Hablar es más rápido que escribir —en mi caso, unas tres o cuatro veces más rápido— y la investigación respalda esa proporción aproximada, aunque tu rendimiento exacto depende de tus manos y tu tema. El objetivo del dictado no es saltarse la escritura. Es sacar esa primera versión caótica de tu cabeza y ponerla en la página antes de perder el hilo.
Hay una segunda razón que importa más cuanto más tiempo llevas haciendo esto: tus manos. Los bloggers escriben mucho. Un boletín semanal, un par de entradas, los comentarios, los correos —se acumula en un volumen diario y silencioso de pulsaciones. El dictado te permite descansar las manos y seguir produciendo, lo cual es una decisión de productividad, no médica. No voy a decirte que soluciona nada; lo que sí te digo es que dictar un borrador es una hora menos de escritura, y en una semana de mucha escritura esa es la diferencia entre publicar o no.
Y las ideas no esperan pacientemente su turno. La buena frase para la intro llega mientras preparas el café, no mientras estás sentado al teclado. Con una tecla de acceso rápido, el costo de capturarla baja casi a cero: hablas diez segundos y la frase está en tu borrador. La forma honesta de plantearlo es que la voz te da las palabras rápido. La estructura —los encabezados, las citas destacadas, el orden de los párrafos— sigue siendo tu trabajo. El dictado simplemente elimina la parte en la que ibas a perder la frase por un teclado lento.
Pulsa una tecla, habla y el texto aparece en tu editor
Esta es toda la mecánica, y es aburrida en el mejor sentido. Pulsas una tecla de acceso rápido, hablas, la sueltas y la transcripción se pega en tu cursor —en el campo de texto que tenga el foco. Whisper mantiene un pequeño margen después de que sueltes la tecla, para que tu última palabra no quede cortada. Como pega en el cursor del sistema operativo, un bloque de Gutenberg, un párrafo de Ghost, el compositor de Substack y una historia de Medium son simplemente «cualquier cuadro de texto». La misma tecla, el mismo comportamiento, en cualquier pestaña en la que estés.
Esa es la parte que las páginas de presentación complican demasiado. No hay ningún plugin que instalar en WordPress, ninguna extensión que añadir al navegador, ningún token de API que pegar en Ghost. Tu cursor está en el editor, hablas y las palabras aparecen en el editor. Mientras hablas aparece una pequeña cápsula para que sepas que está escuchando:
La tecla de acceso rápido es lo único que vale la pena configurar bien desde el principio. En Windows es Ctrl+Space; en Mac es Command+Option, una combinación de modificadores que mantienes pulsada mientras hablas y sueltas para detener. Ambas se pueden cambiar en Ajustes si chocan con un atajo que ya uses. (Mi hija pequeña una vez me dijo que una tecla de acceso rápido «no funcionaba» en su aplicación de dibujo. Era un conflicto, no un error, y así aprendí que la mayoría de la gente no tiene ni idea de qué es un conflicto de teclas de acceso rápido. Por eso ahora todas las teclas son configurables.) Si ya has configurado el dictado en Windows o en Mac, esta es la misma memoria muscular apuntando a tu CMS.
Configúralo en dos minutos (Windows o Mac)
Necesitas un Mac con Apple Silicon o un PC con Windows 10 o posterior, un micrófono que funcione y tu editor de blog abierto en una pestaña del navegador o en su aplicación de escritorio. Todo el proceso local es gratuito para cualquier cuenta registrada, sin que se pida ningún método de pago al registrarse. Esta es la secuencia.
Paso 1 — Instala Whisper e inicia sesión.
Descarga desde la página de descargas, instala y crea una cuenta gratuita. Sin tarjeta. Todo el proceso de transcripción local queda disponible de inmediato.
Sabrás que funcionó cuando aparezca el icono de la app en la bandeja del sistema y el asistente de configuración te ofrezca elegir un modelo.
Paso 2 — Elige una vía de transcripción.
La app no elige por ti. Tienes tres opciones: Cloud (OpenAI, usa tu propia clave), Local Parakeet o Local Whisper. Para redactar entradas en tu propia máquina, empieza con la opción local —más detalles dos secciones más adelante.
Sabrás que funcionó cuando un modelo termine de descargarse y aparezca como listo.
Paso 3 — Confirma tu tecla de acceso rápido.
En Windows el valor predeterminado es Ctrl+Space; en Mac es Command+Option, mantenido como pulsar para hablar. En Mac, otorga el permiso de Accesibilidad cuando se solicite; sin él, el pegado en el cursor no puede acceder a tu navegador ni a tu editor.
Sabrás que funcionó cuando una grabación de prueba se pegue en cualquier campo de texto.
Paso 4 — Coloca el cursor en tu editor y habla.
Abre tu entrada en WordPress, Ghost, Substack, Medium o Notion, haz clic en el cuerpo del texto, mantén pulsada la tecla de acceso rápido, di una frase y suéltala. La transcripción aparece donde está el cursor.
Sabrás que funcionó cuando tu frase hablada esté en el editor como texto.
La parte lenta es la descarga del modelo, no la configuración. Todo lo demás son los cuatro pasos anteriores. Una vez en marcha, escribir el borrador deja de ser una tarea de teclear y pasa a ser una tarea de hablar, y el editor nunca nota la diferencia.
Dicta en WordPress, Ghost, Substack, Medium o Notion
Así es como funciona en cada editor, porque los bloggers lo preguntan. En WordPress Gutenberg, haz clic en un bloque de párrafo y dicta; las palabras rellenan el bloque y pulsas Enter para el siguiente bloque como siempre. El compositor de Ghost es igual —cursor en el cuerpo, hablas y el texto aparece. El editor de entradas de Substack y el editor de historias de Medium son cuadros de texto enriquecido estándar, así que el dictado cae directamente. Notion trata cada bloque como un campo de texto, por lo que una tecla de acceso rápido rellena el bloque donde está tu cursor. Ninguno de estos necesitó un plugin, una extensión ni un ajuste cambiado dentro del CMS. Instalaste una sola herramienta y todos los editores la heredaron.
La razón por la que esto funciona en todas partes es la misma razón por la que suena demasiado sencillo: la herramienta pega en el cursor del sistema operativo, no en la API de una app específica. Así que la misma tecla que rellena un bloque de Gutenberg también rellena la respuesta de correo a un lector, tu mensaje de Slack a un editor y el mensaje de confirmación del repositorio detrás de tu sitio. Una sola herramienta, cualquier campo de texto, tanto en Windows como en Mac. No tienes que reaprender nada al pasar de redactar a responder comentarios.
Lo que el dictado no hará es el formato, y prefiero decirlo claramente antes de que lo descubras en el peor momento. Te da las palabras. Los H2, la negrita, la cita destacada, el orden de los bloques —eso sigue siendo tuyo, con las teclas y botones que ya usas. Quien te venda «di encabezado dos y míralo formatear» te está vendiendo una demo, no un martes cualquiera. Escribe el texto con la voz y luego dale forma a la entrada como darías forma a cualquier borrador. Si trabajas principalmente en un editor, las guías específicas para el editor de Ghost y el editor de Substack profundizan en los detalles particulares de cada app.
Local o nube: qué modo usar para redactar entradas
Para blogging, prueba primero el modo local. Tus borradores son tus borradores —la entrada sin publicar, el boletín sobre el que no tienes del todo claro, la opinión arriesgada que igual recortas antes de publicar. Sería un hábito extraño enviar cada frase en bruto a un servidor en la nube solo para que llegue a tu editor, cuando tu portátil ya tiene micrófono y procesador. Si tu Mac es Apple Silicon o tu PC es de los últimos años, el modo local gestiona la redacción cotidiana sin quejarse, y la nube se convierte en la salida de emergencia en lugar del valor predeterminado.
Así es como difieren las tres vías, porque la app te obliga a elegir y prefiero que elijas bien:
- Local Parakeet — El motor TDT de NVIDIA, unos 600 MB, y la opción local más rápida: de 5 a 10 veces más rápido que Whisper en CPU. Cubre inglés más otros 24 idiomas europeos, 25 en total. Sin traducción al inglés. Si escribes tu blog en inglés u otro idioma europeo, esta es la opción rápida y totalmente sin conexión.
- Local Whisper — más lento que Parakeet en la misma máquina, pero las versiones multilingüe cubren 99 idiomas y pueden traducir al inglés. Las versiones solo en inglés son solo en inglés, no 99. Elige esta opción si escribes tu blog en chino, japonés, coreano o necesitas traducción, algo que Parakeet no puede hacer. El modelo de inglés predeterminado pesa unos 480 MB.
- Cloud (OpenAI, BYOK) — la mejor precisión y acceso a la web, usando tu propia clave de OpenAI facturada directamente por OpenAI. La transcripción usa gpt-4o-mini-transcribe de forma predeterminada. Necesita internet, así que es la única vía que sale de tu máquina. La funcionalidad Cloud forma parte de Whisper Pro.
La verdad aburrida es que para el tipo de texto que escribe la mayoría de los bloggers, el modo local es más que suficiente. Ambos motores locales se ejecutan completamente en tu máquina sin enviar nada a un servidor, que es el valor predeterminado correcto para trabajo sin publicar. La nube se gana su lugar cuando quieres máxima precisión en una grabación difícil o quieres que el modelo busque un dato en la web a mitad de frase. Para un hábito de escritura semanal, empieza con lo local y solo recurre a la nube cuando lo local te deje con ganas de más.
Convertir un borrador hablado en texto limpio
El dictado en bruto sale como una ristra continua. Dices «bueno pues la intro debería explicar por qué la mayoría de los borradores de blog son lentos y luego entrar en lo de la tecla de acceso rápido», y eso es el muro sin puntuación que cualquier motor de voz te entrega, muletillas incluidas. Limpiarlo es donde se bifurcan los caminos.
El Dictado por voz de Windows añade puntuación mientras hablas, y el Dictado de macOS gestiona la puntuación básica cuando dices «coma» o «punto». Para una limpieza más profunda —eliminar los «eh», corregir las frases interminables, convertir un párrafo hablado en algo que pegarías en una entrada— Whisper puede hacer una pasada de IA. Di la frase de activación «Hey whisper» y el texto se mejora antes de llegar. En modo local funciona a través de Ollama; en modo nube usa gpt-5-mini de forma predeterminada.
bueno pues la intro debería explicar por qué la mayoría de los borradores de blog son lentos y luego eh entrar en lo de la tecla de acceso rápido y cómo funciona en cualquier editor ya sabes
La intro debería explicar por qué la mayoría de los borradores de blog son lentos y luego entrar en la tecla de acceso rápido y cómo funciona en cualquier editor.
Esta es la parte que hace que el dictado sea útil para publicar de verdad, no solo para tomar notas. Un párrafo hablado y limpiado no es una entrada terminada —es un primer borrador terminado, que era la parte que más tiempo tomaba. Todavía lo relees, cortas la frase que se fue por las ramas, ajustas los verbos y haces la pasada de edición que necesita cada entrada. La voz te da un borrador limpio rápido; el criterio editorial es tuyo, igual que con cualquier cosa que hayas escrito a mano. La versión honesta del argumento es que acorta la mitad lenta del trabajo, no que escriba la entrada por ti.
Ese mismo flujo de hablar y limpiar da resultado en el momento en que dejas de redactar y empiezas con todo lo demás alrededor de un blog — también puedes escribir más rápido con tu voz en tu correo, tus publicaciones en redes y los pies de foto, todo con la misma tecla de acceso rápido que ya configuraste.
Cuándo saltarte el dictado y usar otra herramienta

A veces el dictado no es la herramienta adecuada para el trabajo, y fingir lo contrario te costará una tarde. El caso más claro: no estás redactando, estás transcribiendo. Si grabaste un episodio de pódcast, una entrevista o una nota de voz larga y quieres el texto de esa grabación, ese es un trabajo diferente. El dictado escribe lo que dices en vivo; no procesa un archivo de audio existente. Para eso, usa un servicio de transcripción diseñado para recibir un archivo y entregar una transcripción —esa es la herramienta con la forma correcta, y no es esta.
El otro caso es la captura rápida lejos de tu escritorio. Si se te ocurre una frase para la entrada de mañana mientras vas en el autobús, el teclado de tu teléfono ya tiene micrófono —tócalo, habla, listo. Whisper es una herramienta de escritorio para Windows y macOS, así que en el teléfono el micrófono del teclado es el camino práctico. Y para cosas realmente cortas en tu escritorio, las herramientas integradas son gratuitas: en Windows, la tecla Windows + H abre el Dictado por voz donde esté tu cursor, aunque lo enruta a través de los servidores de Microsoft y necesita internet, así que no funciona sin conexión. En Mac, el Dictado te permite hablar en cualquier campo de texto desde Ajustes del Sistema bajo Teclado, y en Apple Silicon el texto general puede procesarse en el dispositivo.
Recurre a una herramienta dedicada de todo el sistema cuando las integradas empiecen a quedarse cortas: borradores largos, entradas multilingüe, privacidad sin conexión en Windows, o querer una sola tecla que se comporte igual en tu CMS, tu correo y tu editor. Por debajo de ese umbral, usa lo que sea gratuito o la herramienta con la forma correcta. No voy a decirte que abras una app de dictado para capturar una sola frase en el autobús, y tampoco voy a decirte que transcribe tu pódcast —porque no lo hace, y el jueves siguiente estarías de vuelta aquí molesto.
Si la mayor parte de tu redacción ocurre en un solo editor, el tutorial específico para voz a texto en el editor de Substack cubre los detalles por app que esta guía general omite.
Ninguna plataforma de blogging llegó con un buen dictado incorporado, y después de escribir esto estoy bastante seguro de que ninguna necesita tenerlo. El cursor es la integración. Habla al editor, obtén un borrador limpio y dale forma con las teclas y botones que ya conoces. Dicté la mayor parte de esta guía en un cuadro de texto que no era mi CMS, con una herramienta a la que le da igual cuál sea, y luego lo pegué todo en la entrada que estás leyendo. La hora de escritura que me habría llevado es la hora que recuperé.
Redacta tu próxima entrada hablando
Mantén pulsada la tecla de acceso rápido, habla y suéltala. El borrador limpio aparece en cualquier editor donde esté tu cursor —WordPress, Ghost, Substack, Medium, Notion y cualquier otra app también.
Modo local gratuito para cualquier cuenta registrada. No se requiere tarjeta para empezar.



