Por Denys Medvediev

Comparativa

Una alternativa a SpeechTexter que funciona fuera del navegador

SpeechTexter vive dentro de una pestaña de Chrome y necesita la nube para escucharte. La alternativa más sólida para la mayoría es una aplicación de dictado de escritorio que usa una tecla rápida, transcribe sin conexión y pega el texto en cualquier aplicación en la que ya estés trabajando.

Última actualización: junio de 2026

Portátil en un escritorio mostrando una página de búsqueda web, que ilustra herramientas de dictado basadas en el navegador

La mejor alternativa a SpeechTexter para la mayoría es una aplicación de dictado de escritorio con una tecla rápida global, porque SpeechTexter vive dentro de una sola pestaña de Chrome y no sale de ella. Whisper usa una tecla rápida, transcribe sin conexión en el propio equipo y pega el texto donde esté el cursor: Word, Slack, correo electrónico, cualquier sitio, no solo una ventana del navegador.

Probé SpeechTexter un martes por la noche para zanjar una discusión conmigo mismo. Haz clic en el micrófono, habla, aparecen las palabras. Sin descarga, sin cuenta, gratis. Es una herramienta genuinamente ordenada. Luego intenté insertar una frase en un mensaje de Slack y recordé el inconveniente: solo escribe dentro de su propia página. La propia web de SpeechTexter dice que la aplicación web de escritorio necesita la última versión de Chrome y nada más. La fricción no está en el dictado. La fricción está en las paredes que lo rodean.

Esa brecha es la razón por la que la gente busca una alternativa. El dictado por voz convirtió mi acumulación de correos del sábado en algo que podía hacer mientras doblaba la ropa. La calidad del doblado no ha mejorado, pero sí la escritura. El problema con una herramienta atada al navegador es que tu jornada no está atada al navegador. Escribes en un cliente de correo de escritorio, en una aplicación de chat, de notas, en un editor de código. Una herramienta que solo rellena un campo de texto web te obliga a copiar y pegar sin parar. La solución no es una página web mejor. La solución es un dictado que siga al cursor.

Abres una pestaña, hablas y ves cómo escribe. Eso es SpeechTexter.

Portátil abierto mostrando un buscador en un escritorio, que representa una herramienta gratuita dentro del navegador

Hay que reconocerle sus méritos: SpeechTexter hace un trabajo muy bien. Es una aplicación web gratuita y multilingüe de voz a texto para convertir notas, documentos, informes o entradas de blog en texto por voz, «escribe con tu voz», como dice el sitio. Abres la página, haces clic en el micrófono y transcribe en tiempo real usando el reconocimiento de voz de Google en el navegador, la Web Speech API que funciona del lado del servidor en Google. Más de 70 idiomas están en la lista.

Una función que SpeechTexter tiene y que la mayoría de las herramientas de dictado en navegador no tienen es una lista personalizable de comandos de voz. Puedes decir #newparagraph, #newline, #undo o #redo, además de tus propios comandos para insertar puntuación, añadir una frase o activar una acción, todo por voz. También capitaliza automáticamente, tiene un cuadro de vista previa de transcripción que puedes activar o desactivar, y exporta a un archivo .doc o .txt. La precisión que afirma SpeechTexter es «superior al 90%». Es su cifra, no un número que yo haya medido.

Si siempre dictas en ese único editor y luego copias el resultado, esto está bien. El problema empieza en el momento en que la escritura vive en otro lugar.

Dónde se detiene SpeechTexter: una pestaña de Chrome, sin modo sin conexión, sin otras aplicaciones

Ratón de ordenador enfocado en un escritorio de oficina con fondo desenfocado, que sugiere fricción en el flujo de trabajo

Tres paredes, y la gente choca con las tres.

La primera es el navegador. En escritorio, SpeechTexter requiere la última versión de Google Chrome, sin compatibilidad con otros navegadores, en Windows, Mac o Linux. Si usas Firefox o Safari, tienes que cambiar de navegador para dictar. La segunda pared es la propia pestaña: el texto aparece en la página de SpeechTexter, no en la aplicación en la que estás escribiendo. No hay pegado global en Word, Slack, Teams, tu cliente de correo o un editor de código. La tercera pared es la red. Funciona con el motor de voz en la nube de Google, así que necesita conexión a internet. La propia sección de solución de problemas del sitio señala un «error de red» cuando la conexión es mala, y no hay modo sin conexión para la versión web. La aplicación de Android que antes tenía soporte sin conexión ya no está disponible.

Ninguno de estos son fallos. Son lo que es una herramienta de dictado en el navegador. Una página web no puede acceder legalmente a tus aplicaciones de escritorio, y una herramienta Web Speech no puede transcribir sin conectarse a un servidor. Si esas tres paredes nunca te molestan, no necesitas una alternativa. Si alguna vez te has visto dictando en SpeechTexter y luego copiando y pegando en lo que en realidad querías escribir, ese paso de copiar y pegar es la señal de que necesitas algo mejor. Si el dictado no arranca en Chrome, eso es otro problema distinto. Escribí las soluciones habituales para cuando el dictado por voz no funciona en Chrome para cuando el permiso del micrófono o el propio motor es el problema.

Presiona una tecla, dicta en cualquier aplicación

Aquí está la diferencia clave en un solo gesto. Whisper es una aplicación de escritorio, no una página web. Presionas una tecla rápida, hablas, la sueltas y el texto aparece en el cursor de la aplicación que tengas abierta: un documento de Word, un hilo de Slack, un mensaje de Discord, un chat de Teams, VS Code, Notion, Obsidian, un borrador de correo, un campo del navegador, cualquier lugar donde puedas escribir. La tecla rápida predeterminada es Ctrl+Space en Windows y Command+Option en Mac.

No hay ninguna pestaña en la que estar. La aplicación en la que ya estás sigue siendo la aplicación en la que estás. Sin copiar, sin pegar, sin cambiar a Chrome antes. Pasé un número vergonzoso de tardes trabajando en la parte de «pegar en el cursor», el tipo de cosa que se demuestra en cinco segundos y tarda un mes en funcionar de forma fiable en todas las aplicaciones. Tengo un máster.

Whisper
La aplicación Whisper real: haz clic en Ajustes y en el panel de transcripción. Esta es la interfaz en vivo, no una captura de pantalla.

Esta es la parte que la gente subestima hasta que la experimenta. Con SpeechTexter, el dictado es un lugar al que vas. Con una tecla rápida global, el dictado es algo que haces donde ya estás. Mi hija menor, que tiene siete años, lo demostró mejor que cualquier especificación técnica. Se lo mostré una vez: presionar, hablar, soltar, pegar. Y escribió un correo de 90 palabras a su abuela en Ucrania sobre un diente que acababa de perder y el tipo de cambio del ratoncito Pérez. No hizo ninguna pregunta sobre la herramienta. Dos días después volvió con la única queja que importa: «no funciona en mi aplicación de dibujo». No sabía lo que era un conflicto de teclas rápidas. Solo sabía que las palabras debían aparecer donde ella miraba. Esa misma noche lanzamos las teclas rápidas personalizables. Ese es el único criterio que importa: el texto llega donde estás tú.

Funciona en más de 90 idiomas tanto en modo local como en la nube, y la línea de modelos multilingüe llega específicamente a más de 99 idiomas con detección automática. Los modelos solo en inglés se quedan en inglés, así que no los incluyas en esa cuenta. Los modelos multilingües también pueden traducir el habla al inglés en tiempo real, algo que un motor Web Speech del navegador no hace.

Sin conexión y en tu máquina, no en los servidores de Google

Teléfono inteligente envuelto en una cadena con un candado, que simboliza datos privados y protegidos

Aquí voy a compartir mi única opinión firme: el dictado sin opción sin conexión, donde la nube es el único camino y no una elección, es un desastre de privacidad esperando ser transcrito. La hoja de cálculo de sueldos de tu jefe, el correo al colegio de tu hijo, la nota legal que estás redactando en el tren. Nada de eso necesita pasar por los servidores de un proveedor porque quieras escribir con tu voz. La transcripción en la nube que puedes activar cuando quieres está bien. La transcripción en la nube que no puedes desactivar es el problema. SpeechTexter es transparente al respecto: usa el reconocimiento de voz de Google y necesita conexión para funcionar. Está bien para una lista de la compra. Es más difícil de justificar para cualquier cosa que no leerías en voz alta en una oficina de planta abierta.

El modo local de Whisper funciona completamente sin conexión: no se necesita internet durante la transcripción. La única vez que necesita conexión es la descarga inicial del modelo, entre unos 140 MB y 3 GB según el modelo que elijas. El motor local subyacente es la misma familia de modelos de código abierto OpenAI Whisper que impulsa gran parte de esta categoría. Después de eso, cada palabra se queda en tu máquina. En un avión, en un portátil corporativo bloqueado con la red cortada, en una sala donde el Wi-Fi es teórico: sigue escribiendo.

Vi a un equipo con el que trabajé acumular una factura de cinco cifras en la nube en un solo trimestre por transcribir grabaciones de reuniones, sobre todo porque un bucle de «reintento inteligente» transcribió el mismo audio cuatro veces. El director financiero abrió el panel en la revisión trimestral y el silencio en la sala fue absoluto. La nube tiene su lugar. Debería ser una elección que tomes, no el único camino disponible.

Gratis sin cuenta, pero «gratis» significa cosas distintas aquí

Las dos herramientas son gratuitas para empezar, y esa palabra hace un trabajo diferente en cada caso. SpeechTexter es gratuito en el sentido más puro: sin descarga, sin instalación, sin registro. Haces clic en el micrófono y ya estás dictando. Nada que configurar, nada en lo que iniciar sesión. Esa es una ventaja real y no voy a fingir lo contrario.

El pipeline local de Whisper también es gratuito, pero aquí gratis significa que descargas una aplicación de escritorio, creas una cuenta de Whisper y luego descargas un modelo la primera vez. Unos minutos de configuración inicial en lugar de cero. Lo que obtienes a cambio de esos minutos es la tecla rápida global, la transcripción sin conexión y el comportamiento de seguir al cursor. La capa en la nube, las funciones de OpenAI y la clave propia, es el nivel Pro de pago separado. No confundas la aplicación local gratuita con eso. El desglose completo está en la página de precios. La versión corta: el dictado local no cuesta nada y no caduca nunca.

El planteamiento honesto es un intercambio. SpeechTexter no te cobra configuración ni cuenta, y a cambio te mantiene en una pestaña en la nube. Whisper te cobra una descarga y un registro, y a cambio te da todas las aplicaciones y el modo sin conexión. Elige el coste que prefieras pagar.

Cuándo SpeechTexter sigue siendo la mejor opción

Espacio de trabajo minimalista y elegante con escritorio de madera y jarrón de cristal, una escena ligera y sencilla

Hay situaciones reales en las que no usaría la aplicación de escritorio, y SpeechTexter las gana sin duda.

Si estás en una máquina bloqueada donde no puedes instalar software, un ordenador de biblioteca, un laboratorio escolar, un portátil corporativo con restricciones de administrador, SpeechTexter funciona en una pestaña del navegador sin pedirle permiso a nadie. Si solo dictas de vez en cuando, un párrafo aquí y otro allá, el modelo sin instalación ni cuenta es genuinamente menos complicado que descargar cualquier cosa. Si realmente usas esa lista personalizable de comandos de voz, diciendo #newparagraph y #undo para formatear sobre la marcha, ese es un flujo de trabajo específico para el que SpeechTexter está diseñado y que una herramienta de tecla rápida de escritorio no replica igual. Y si la mayor parte de tu escritura ocurre dentro de un editor web y rara vez copias el resultado, la pestaña no es una pared, sino simplemente donde trabajas. En todos esos casos, abre speechtexter.com, haz clic en el micrófono y no le des más vueltas. Señalarte la herramienta gratuita adecuada cuando es la correcta es el objetivo.

Otras herramientas de dictado que vale la pena conocer

SpeechTexter y Whisper no son los únicos. Un mapa rápido y honesto del panorama:

  • Speechnotesotro bloc de notas de dictado gratuito basado en el navegador, con la misma forma atada a una pestaña que SpeechTexter. Si también lo estás considerando, aquí está la comparativa de alternativas a Speechnotes.
  • Dictation.io / Dictanoteherramientas gratuitas de escritura por voz basadas en Chrome; mismo techo de pestaña de navegador, sin pegado global.
  • Speechifyun producto de lectura con IA y voz que también hace escritura por voz; se posiciona como alternativa a SpeechTexter.
  • LilySpeechuna herramienta de dictado para Windows que usa un motor basado en Chrome para escribir en aplicaciones; útil en Windows pero atada a esa configuración.
  • Apple Dictationintegrada en macOS e iOS, gratuita, adecuada para fragmentos cortos, de una sola plataforma.
  • Windows Voice Typing (Win+H)integrada en Windows, dicta globalmente en la mayoría de los campos de texto, gratuita, sin instalación. Si te está dando problemas, la guía de alternativas a Win+H explica qué usar en su lugar.

La división es sencilla. Las herramientas de navegador (SpeechTexter, Speechnotes, Dictation.io) son gratuitas y no requieren instalación, pero están atadas a una pestaña y dependen de la nube. El dictado del sistema operativo (Win+H, Apple) es global y gratuito, pero de una sola plataforma y con calidad variable. Las aplicaciones de escritorio como Whisper son globales, funcionan sin conexión y son multiplataforma, a costa de una descarga.

Entonces, qué elegiría yo

Si quieres el dictado más rápido posible en una máquina donde no puedes instalar nada, quédate con SpeechTexter: es gratis, es instantáneo y la lista de comandos de voz es un buen detalle. Para todo lo demás, escribir en tus aplicaciones reales, trabajar sin conexión, mantener el texto sensible en tu propio equipo, yo elegiría una herramienta de escritorio con una tecla rápida global. El dictado funciona a unas 145 palabras por minuto frente a las aproximadamente 40 de la escritura manual, así que el cuello de botella nunca fueron tus dedos, sino las paredes alrededor de las palabras. Elige la herramienta con menos paredes para lo que haces. Si quieres sentir la diferencia, descubre cómo funciona el dictado por voz en cualquier aplicación.

SpeechTexter es una buena herramienta gratuita que hace exactamente lo que dice dentro de una sola pestaña de Chrome. El día en que tu escritura se mueva fuera de esa pestaña, al correo, al chat, al editor, a las notas, es el día en que empiezas a querer que el dictado te acompañe. Esa es la única diferencia real, y es grande. Mi hija de siete años lo descubrió en dos días y un informe de error. El resto de nosotros probablemente también podemos.

Prueba la diferencia tú mismo

SpeechTexter es una herramienta gratuita y limpia que vive en una sola pestaña de Chrome. El día en que tu escritura se mueva al correo, al chat, al editor, a las notas, es el día en que quieres que el dictado te acompañe. Descarga Whisper, mantén presionada la tecla rápida y observa cómo la transcripción aparece en la aplicación en la que estés justo ahora.

Transcripción local gratuita para siempre. Sin método de pago al registrarse. La prueba de 7 días en la nube solo pide tarjeta al actualizar.

Foto de Denys Medvediev

Denys Medvediev

Soy quien lee nuestro correo de soporte, probablemente dictando las respuestas.

Lecturas recomendadas