Guía
Cómo dictar puntuación
Puedes decir los signos de puntuación en voz alta —"coma", "punto", "nuevo párrafo"— y se insertan como símbolo, no como palabra. O te olvidas de todo eso, hablas con naturalidad y dejas que una IA añada las comas y los puntos por ti. Ambos enfoques funcionan. Esta guía explica cuándo usar cada uno.
Última actualización: junio de 2026

Para dictar puntuación, di el nombre del signo mientras hablas: "coma" inserta una coma, "punto" inserta un punto, "signo de interrogación" inserta un signo de interrogación, "nueva línea" baja el cursor una línea y "nuevo párrafo" abre uno nuevo. Tanto la Escritura por voz de Windows como el Dictado de macOS reconocen estos comandos hablados.
La primera vez que dicté un correo, salió como una frase interminable sin ningún respiro. Sabía que podías decir "coma" para insertar una coma; la mayoría lo descubre en el primer minuto. Lo que nadie te dice es lo extraño que resulta decir "punto" en voz alta cuarenta veces seguidas, como si estuvieras leyendo un telegrama de 1910.
Esta guía hace dos cosas. Primero, enseña los comandos de puntuación hablada de forma honesta: los que realmente funcionan en la Escritura por voz de Windows y el Dictado de macOS, sin palabras mágicas inventadas. Luego muestra la otra opción: una pasada de IA que lee tus frases sin puntos ni comas y los añade por ti, para que dejes de narrar signos y simplemente hables.
Aquí está la diferencia que pocas páginas explican con claridad. Hay dos formas de añadir puntuación al texto dictado. La dices tú manualmente —"coma", "punto", "nuevo párrafo"— y el motor de dictado inserta el símbolo donde lo dijiste. O no dices nada y algo limpia el texto después.
El método manual te da control total: decides dónde va cada coma. El método automático te da fluidez: hablas como una persona y el software adivina la puntuación. Ninguno es «mejor» en abstracto; depende de si necesitas una coma en un sitio concreto o simplemente quieres que el párrafo suene bien. Voy a enseñarte los comandos, a mostrarte la alternativa con IA y a decirte cuál prefiero en cada caso.
Por qué el texto dictado sale como una sola frase interminable

Un motor de voz escucha sonido y escribe palabras. No oye el silencio donde normalmente pondrías una coma, ni puede ver el punto al final de tu idea. Así que, salvo que le indiques lo contrario, te da exactamente lo que oyó: un muro de palabras sin ningún signo. «bueno pues revisa el documento mándalo a maría y recuérdame el jueves» — esa es la forma bruta del dictado, y es igual en todas las herramientas.
Hay dos soluciones reales, y el resto de esta guía trata solo de esas dos. Puedes dictar la puntuación tú mismo, nombrando cada signo al hablar, algo que tanto Windows como macOS admiten de serie. O puedes dejar que el software añada los signos después: los sistemas operativos hacen una versión básica de esto, y una herramienta dedicada puede hacer una pasada completa que corrija la puntuación junto con las muletillas.
La mayoría empieza con los comandos hablados porque vienen integrados y funcionan desde el momento en que activas el dictado. Por eso empezaremos por ahí también. Luego te mostraré lo que me hizo dejar de decir «punto» en voz alta, algo que había estado haciendo durante casi un año como si fuera un taquígrafo judicial.
Di el signo y aparece el símbolo
El método de comandos hablados es sencillo una vez que lo has hecho. Mientras dictas, dices el nombre del signo de puntuación y el motor escribe el símbolo en lugar de la palabra. Di «Hola coma cómo estás signo de interrogación» y obtienes «Hola, ¿cómo estás?». El truco está en que el signo cae exactamente donde lo dijiste, así que vas colocando la puntuación en tiempo real mientras hablas.
Esto funciona igual tanto si usas una herramienta de dictado integrada como si usas un atajo de teclado global que pega en el cursor. Pulsas una tecla, hablas, nombras los signos, sueltas. Aparece una pequeña cápsula mientras hablas para que sepas que te está escuchando, y el texto cae donde esté tu cursor —un correo, un documento, un chat, todo igual para él:
El único hábito que hay que desarrollar es decir el signo sin pausa previa. Habla «la reunión es el jueves punto» como una sola frase, no «la reunión es el jueves… punto», o algunos motores escriben la palabra «punto» en lugar del signo. Al principio resulta antinatural durante un día, y después el cerebro lo archiva, igual que al final dejó de resistirse al atajo de teclado para dictar en Windows. Después de eso, ya no piensas en ello. La lista completa de qué palabras corresponden a qué signos está dos secciones más adelante.
Deja que una IA añada la puntuación por ti
La otra opción omite por completo los comandos hablados. Hablas en frases normales y una pasada de limpieza con IA lee la transcripción y añade las comas, los puntos y los saltos de párrafo por ti. Con Whisper esto es un paso integrado que activas por voz. Necesitas un Mac con Apple Silicon o un PC con Windows 10 o posterior, un micrófono que funcione y un par de minutos. Todo el proceso local es gratuito para cualquier cuenta registrada, sin tarjeta al crear la cuenta. Esta es la secuencia.
Paso 1 — Instala Whisper e inicia sesión.
Descárgalo desde la página de descarga, instálalo y crea una cuenta gratuita. Sin tarjeta. La cadena de transcripción local se abre enseguida.
Sabrás que funcionó cuando aparezca el icono de la bandeja del sistema y el asistente de configuración ofrezca elegir un modelo.
Paso 2 — Elige la vía de transcripción.
La aplicación no elige por ti. Tienes tres opciones: Cloud (OpenAI, con tu propia clave), Local Parakeet o Local Whisper. Para texto privado, empieza en local — más sobre eso dos secciones más adelante.
Sabrás que funcionó cuando un modelo termine de descargarse y aparezca como listo.
Paso 3 — Confirma tu atajo de teclado.
Windows usa Ctrl+Space por defecto; en Mac, Command+Option se mantiene pulsado como push-to-talk. En Mac, concede el permiso de Accesibilidad cuando se solicite; sin él, el pegado en el cursor no puede acceder a otras aplicaciones.
Sabrás que funcionó cuando una grabación de prueba se pegue en cualquier campo de texto.
Paso 4 — Di «Hey whisper» y habla con normalidad.
Mantén pulsado el atajo, empieza con la frase de activación «Hey whisper» y luego habla en frases normales sin dictar signos. La IA puntúa el texto antes de que llegue a tu cursor.
Sabrás que funcionó cuando una frase que dijiste sin pausas llegue ya con comas y puntos.
Esa es toda la propuesta de la vía automática: dejas de ser taquígrafo y vuelves a ser una persona que simplemente habla. La pega —y siempre hay una pega— es que la IA decide dónde van los signos, no tú. Para la mayoría del texto normal eso está bien. Para los casos en que no lo está, los comandos manuales están ahí, y la última sección explica exactamente cuándo usarlos.
Los comandos de puntuación hablada que realmente funcionan
Estos son los comandos de los que estoy seguro, porque están documentados por Microsoft y Apple y se comportan igual en ambos. Di «coma» para una coma, «punto» para un punto y «signo de interrogación» para un signo de interrogación. Para los saltos, «nueva línea» baja el cursor una línea —como pulsar Intro una vez— y «nuevo párrafo» abre un párrafo nuevo, como pulsar Intro dos veces. Esos cinco cubren la inmensa mayoría de la escritura cotidiana.
Algunas advertencias honestas, porque aquí es donde los artículos de listas venden más de lo que corresponde. Ambos sistemas operativos admiten una lista mucho más larga de signos —exclamación, dos puntos, comillas, guiones— pero para el conjunto completo te remitiría a las propias páginas de comandos de Microsoft y Apple, en lugar de recitar una lista de memoria que podría variar entre versiones del sistema. Las palabras de comando también pueden variar ligeramente según el idioma y la región. Si dictas en algo que no sea español o inglés, consulta la ayuda de dictado de tu sistema operativo para conocer los comandos localizados, porque «period» en inglés no es el comando en francés.
Otra cosa que vale la pena saber: tanto la Escritura por voz de Windows como el Dictado de macOS tienen ahora una opción de puntuación automática que añade comas y puntos básicos mientras hablas, sin necesidad de comandos. En Mac está en Configuración del sistema, luego Teclado, luego Dictado, donde puedes activar la Puntuación automática. En Windows, la escritura por voz también tiene una opción de puntuación automática en su configuración. Así que incluso las herramientas integradas te dan un adelanto del enfoque manos libres. La pasada de IA dedicada va más lejos —también corrige muletillas y frases sin estructura— pero para una nota rápida, activar la puntuación automática del sistema puede ser todo lo que necesitas.
Local o nube: qué modo gestiona la limpieza
Si optas por la puntuación con IA, la siguiente pregunta es dónde ocurre el trabajo. Tanto la transcripción como la pasada de limpieza pueden ejecutarse completamente en tu propio equipo, o en la nube a través de tu propia clave de OpenAI. Para la mayor parte del texto —correos, notas, borradores— yo empezaría en local. Funciona sin conexión, nada sale de tu portátil, y un mensaje privado sobre el colegio de tu hijo o el presupuesto de tu jefe no debería estar en los registros de ningún proveedor solo porque querías puntuación. Así es como difieren las tres opciones, porque la aplicación te pide que elijas y prefiero que elijas bien:
Las tres opciones, con claridad:
- Local Parakeet — El motor TDT de NVIDIA, unos 600 MB, y la opción local más rápida: de 5 a 10 veces más rápido que Whisper en CPU. Cubre inglés y otros 24 idiomas europeos, 25 en total. Sin traducción al inglés. Si escribes en inglés u otro idioma europeo, esta es la opción rápida y completamente sin conexión.
- Local Whisper — más lento que Parakeet en el mismo equipo, pero las versiones multilingües cubren 99 idiomas y pueden traducir al inglés. Las versiones solo en inglés son solo en inglés, no 99. Elige esto para chino, japonés, coreano o cualquier trabajo de traducción que Parakeet no puede hacer. El modelo en inglés por defecto pesa unos 480 MB.
- Cloud (OpenAI, BYOK) — la mejor precisión y acceso web, usando tu propia clave de OpenAI facturada directamente por OpenAI. La transcripción usa gpt-4o-mini-transcribe por defecto. Necesita internet, por lo que es la única opción que sale de tu equipo. El modo Cloud forma parte de Whisper Pro.
Para la limpieza con IA en particular, la pasada local se ejecuta a través de Ollama en tu propio equipo, y la pasada en la nube usa gpt-5-mini por defecto. La verdad sencilla es que para añadir comas y puntos a la escritura ordinaria, el modo local lo gestiona sin problema. El modo Cloud vale la pena cuando quieres la máxima precisión en una grabación difícil o necesitas que el modelo consulte algo de internet a mitad de la frase. Para puntuación únicamente, empieza en local.
Qué hace realmente la pasada de limpieza con IA a tu texto
Esta es la parte que me hizo dejar de decir «coma» en voz alta. El dictado bruto sale como una frase sin fin: dices «bueno pues revisa el documento de arquitectura etiquétalo como proyecto alfa y recuérdame el jueves eh antes del standup», y esa es la pared sin puntuación que te entrega cualquier motor de voz. La pasada de limpieza lo lee y lo recompone en algo que realmente enviarías.
Con Whisper lo activas empezando con la frase de activación «Hey whisper», y el texto se mejora antes de llegar a tu cursor. La pasada añade las comas y los puntos, divide la frase interminable en oraciones y elimina los «ehs» y los arranques en falso que no querías conservar. En un modelo local se ejecuta a través de Ollama; en modo cloud es gpt-5-mini por defecto. No has dicho ni un solo comando de puntuación: simplemente has hablado.
bueno pues revisa el documento de arquitectura etiquétalo como proyecto alfa y recuérdame el jueves eh antes del standup
Bueno, revisa el documento de arquitectura, etiquétalo como Proyecto Alfa y recuérdame el jueves antes del standup.
El límite honesto es que la IA está adivinando tu intención. Lo hace bien —para texto normal yo me fiaría nueve de cada diez veces— pero está tomando una decisión sobre dónde termina tu frase y dónde va la coma. Es el trato adecuado para un correo o un borrador, donde el significado sobrevive a una coma en un sitio ligeramente diferente. Es el trato equivocado cuando la posición de la coma cambia el significado, que es exactamente de lo que trata la siguiente sección.
El mismo flujo de hablar-y-limpiar también vale mucho más allá de la puntuación — también puedes escribir más rápido con voz en cualquier aplicación para que un párrafo que habrías tecleado se convierta en unas pocas frases habladas que llegan ya limpias.
Cuándo decir la puntuación tú mismo

A veces el movimiento correcto es el comando manual, y sería deshonesto fingir que la IA lo maneja todo. La regla general: cuando la posición exacta de un signo cambia el significado, dilo tú. La IA adivina bien, pero adivina; y hay lugares donde no quieres que adivine.
Tres casos en los que nombro los signos en voz alta. Primero, cualquier cosa donde la puntuación cambia el significado: una cláusula contractual, una instrucción médica, la diferencia entre «vamos a comer, abuelos» y la versión donde los abuelos son la comida. Segundo, código y texto estructurado, donde una coma o dos puntos son sintaxis, no estilo, y la IA no tiene idea de que estás escribiendo un archivo de configuración. Tercero, símbolos concretos que la puntuación automática no usará por sí sola: dos puntos antes de una lista, un signo de exclamación que realmente quieres, un signo de interrogación en una frase que gramaticalmente es una afirmación. En esos casos, el comando hablado es más rápido y seguro que dictar, leer el resultado y corregirlo.
Y para texto corto, las opciones integradas son más que suficientes. Si estás enviando un mensaje de dos líneas, la Escritura por voz de Windows (tecla Windows + H) y el Dictado de macOS añaden puntuación básica solos, sin necesidad de instalar nada. El inconveniente de la Escritura por voz de Windows es que pasa por los servidores de Microsoft y necesita conexión a internet, así que no funciona sin conexión. Recurre a una herramienta dedicada cuando el texto sea largo, multilingüe o privado, o cuando simplemente no quieras volver a decir «punto» en voz alta.
La misma disyuntiva aparece en Mac, donde la puntuación integrada del Dictado cubre notas cortas — la lógica en voz a texto en Mac es la misma: nombra los signos cuando la posición importa, deja que la herramienta lo gestione cuando no.
Así que eso es todo. Di «coma», «punto», «signo de interrogación», «nueva línea», «nuevo párrafo» cuando quieras el signo en un sitio exacto, y deja que una IA lo haga por ti cuando solo quieras hablar y que el texto suene bien. Dicté la mayor parte de esta guía de la segunda forma, dije «Hey whisper» en lugar de narrar cuatrocientas comas, y solo recurrí a los comandos manuales cuando escribía las frases de ejemplo: el único momento en esta guía donde decir «punto» en voz alta era, por fin, el objetivo.
Deja de decir «punto» en voz alta
Habla en frases normales, di «Hey whisper» y deja que la IA añada las comas y los puntos antes de que el texto llegue a tu cursor.
Modo local gratuito para cualquier cuenta registrada. No se necesita tarjeta para empezar.



