Comparativa
La alternativa honesta a Aqua Voice
Aqua Voice es una app de dictado en la nube para Mac, Windows y iPhone que escribe lo que dices en cualquier aplicación en tiempo real, corrigiendo la gramática y el formato sobre la marcha. La alternativa privada más sólida es Whisper by Remskill, cuyo flujo local funciona sin conexión, gratis, y nunca envía tu audio a ningún sitio.
Última actualización: junio de 2026

Dejemos clara desde el principio la posible parcialidad. Esto es una comparativa y yo construí uno de los dos productos que aparecen en ella. Así que voy a reconocer los méritos de Aqua Voice donde se los ha ganado, que son más sitios de los que esperarías en el blog de un competidor, y voy a ser concreto sobre el único punto en el que de verdad ganamos.
Whisper by Remskill es una alternativa privada a Aqua Voice cuyo flujo local funciona entero sin conexión y gratis para siempre, sin límite de palabras y sin método de pago al registrarte. Aqua Voice es rápido, está bien pulido y refina lo que dices en la nube mientras hablas. La diferencia que importa cabe en una palabra: nube.
Qué es esta comparativa y quién la escribe
La verdad sin adornos es que Aqua Voice hace bien lo que hace. Funciona en tiempo real, está pulido y procesa cada palabra mientras hablas, corrigiendo la redacción y la gramática al vuelo. Si ya pagas por él y estás contento, probablemente puedas cerrar esta pestaña. Hay una sección entera al final que te dice exactamente cuándo quedarte con él.
Para quienes sigan leyendo, la diferencia cabe en una palabra: nube. Aqua envía tu audio a sus servidores para hacer esa magia en tiempo real. Nosotros lo hacemos en tu portátil, gratis, y el audio nunca sale de la habitación.
Ese es todo el argumento, y dedicaré el resto del artículo a demostrarlo en lugar de a afirmarlo. Sin recuentos de reseñas falsos, sin cifras de usuarios inventadas. Solo dos listas de funciones y una tabla que puedes contrastar con ambas páginas de inicio.
Qué hace Aqua Voice en realidad
Aqua Voice funciona en Mac y Windows, y también tiene app para iPhone. Hace dictado en vivo, en tiempo real, que encaja en todas las aplicaciones que ya usas, sin ningún ritual de configuración. Pulsa, habla y aparece texto refinado. El refinamiento es su mayor atractivo: corrige la gramática, limpia la redacción y aplica formato mientras hablas.
Por dentro es un motor propietario en la nube. El marketing lo llama Avalon en el plan de pago y Aqua Engine en el gratuito, y no hay pesos abiertos que puedas inspeccionar. Entiende 49 idiomas. Es un número real en una página de inicio real, y no voy a quitarle mérito.
En cuanto al tratamiento de datos, Aqua es más cuidadoso que la mayoría de las herramientas en la nube. Su propia web dice que no se guarda nada en sus servidores en los planes Starter y Pro, y reserva la retención cero de datos para Enterprise. Es una política justa. Pero sigue siendo una política. Tu audio sale de tu máquina, viaja a su nube, se transcribe y vuelve. Estás confiando en una promesa en lugar de confiar en la física.
Hay un plan Starter gratuito limitado a 1.000 palabras, luego un plan Pro con facturación anual, un plan Team y Enterprise. No cito aquí las cifras, porque las páginas de precios cambian y deberías leer la suya y la nuestra directamente en la fuente. Lo que importa es la forma: el plan gratuito se agota, y todo lo que hay más allá es una suscripción.
Qué obtienes además con Whisper by Remskill
Esta es la parte en la que describo lo que yo construí y luego dejo que juzgues la tabla. Whisper by Remskill son dos productos en un solo atajo de teclado. El plan gratuito es todo el flujo local. Tienes los 8 modelos de transcripción Whisper, el motor Parakeet, limpieza con IA completamente sin conexión a través de Ollama, historial de transcripciones, ajustes preestablecidos, palabras de activación, aceleración por hardware, descargas de modelos y un atajo de teclado personalizado. Sin método de pago al registrarte y sin límite de palabras. Creas una cuenta, descargas la app, pulsas el atajo y hablas.
Eliges tu motor local según lo que necesitas, no según lo que nosotros queramos venderte. Whisper te da 99 idiomas, traducción al inglés, vocabulario personalizado, control del tamaño del haz y sesgo de palabras de activación, todo a costa de la velocidad. Parakeet es el motor NVIDIA TDT, ocupa unos 600 MB y funciona de 5 a 10 veces más rápido que Whisper en una CPU, cubriendo inglés más otros 24 idiomas europeos. Elige Parakeet por velocidad y para inglés. Elige Whisper para idiomas, traducción o control fino. Ninguno es la opción por defecto. La decisión es tuya.
La precisión local suele situarse entre el 95% y el 99%, y todo funciona en tu CPU sin necesidad de GPU. La app en sí ocupa unos 25 MB en disco. Todo eso sucede en tu máquina. Sin viaje de ida y vuelta, sin servidores, sin promesa en la que confiar.
Si quieres la nube, también la tenemos, y es con tu propia clave. El plan Pro añade transcripción en la nube de OpenAI. Pegas tu propia clave de OpenAI y eliges el modelo: gpt-4o-mini-transcribe por unos $0.003 el minuto, o gpt-4o-transcribe para mayor calidad. La mejora con IA funciona con gpt-5-mini por defecto, y también hay búsqueda web en tu cursor a través de la Responses API de OpenAI. No nos llevamos nada por encima de la tarifa de OpenAI. Tu clave, tu factura: consulta la página de precios para ver las cifras de Pro.
La parte de las plataformas es la honesta. Windows y macOS en Apple Silicon están disponibles hoy. No hay app para iPhone, ni para iPad, ni para Android. Si dictas desde el móvil, aquí Aqua va claramente por delante.
Aqua Voice frente a Whisper by Remskill, cara a cara
La tabla que nadie más parece rellenar con filas reales. Sin cifras: para eso, consulta ambas páginas de precios.
| Función | Aqua Voice | Whisper by Remskill |
|---|---|---|
| Plataformas | Mac, Windows, iOS | Mac (Apple Silicon) y Windows; sin app móvil |
| Dónde se procesa el audio | En la nube; el audio sale de tu máquina | En tu máquina, sin conexión |
| Plan gratuito | Gratis hasta 1.000 palabras | Todo el flujo local gratis para siempre, sin límite de palabras |
| Funciona sin internet | No, está basado en la nube | Sí, totalmente sin conexión en el flujo local |
| Motor | Nube propietaria (Avalon / Aqua Engine), sin pesos abiertos | 8 modelos Whisper + Parakeet, modelos abiertos |
| Usar tu propia clave de OpenAI | No disponible | Sí: la nube es con tu propia clave, sin recargo |
| Idiomas | 49 | 99 con Whisper multilingüe, 25 con Parakeet |
| Traducir al inglés | No indicado | Sí, en los modelos Whisper |
| Refinamiento en tiempo real mientras hablas | Sí; es su función estrella | La limpieza se aplica tras el enunciado, vía Ollama o IA en la nube |
| Dictado móvil | Sí: iPhone | Sin app móvil |
| Modelo de precios | Suscripción al superar el límite gratuito | Local gratis; Pro opcional para la nube |
Algunas lecturas honestas de esta tabla. El refinamiento en tiempo real de Aqua es realmente fluido, sus 49 idiomas cubren la mayor parte de lo que la gente dicta, y ofrece una app móvil, cosa que nosotros no. No son victorias menores. Pero en todas las filas que tratan de funcionamiento sin conexión, privacidad, el flujo local gratuito o el número de idiomas, la balanza se inclina hacia el otro lado.
Que tu audio nunca salga de la máquina es justo de lo que va todo esto
Esto es lo que la mayoría vino aquí a comparar, así que voy a ser concreto. La política de datos de Aqua es buena. Dice que no se guarda nada en sus servidores en los planes de consumo. Les creo. Pero «no lo guardamos» no es lo mismo que «nunca salió». Tu audio sigue viajando a una nube para transcribirse, porque así es como funciona un motor en la nube. Con el flujo local de Whisper by Remskill, no hay ningún servidor en el medio. El modelo se carga en tu RAM, tu micrófono lo alimenta y aparece el texto: en un vuelo en modo avión, en una sala segura, en un tren atravesando un túnel. No estás confiando en una promesa. No hay nada que prometer.
Esta es la única opinión que voy a gastar en este artículo. El dictado solo en la nube es un desastre de privacidad esperando a ser transcrito. La hoja de cálculo con los sueldos de tu jefe, el correo al colegio de tu hijo, el escrito legal que redactas en el tren: nada de eso debería salir de tu portátil solo porque quisiste escribir con la voz. Un equipo con el que trabajé una vez tenía a un colaborador construyendo un prototipo interno de dictado en la nube que llamaba a una API de IA por cada enunciado. Transcribió las mismas grabaciones de la reunión diaria cuatro veces porque la lógica de «reintento inteligente» era demasiado agresiva. El responsable abrió el panel de costes de la nube al final del trimestre y se encontró con una factura de cinco cifras. La solución del colaborador fue «optimicemos el prompt». La solución del director financiero fue «o dejamos de enviar a un servidor reuniones de las que ya tenemos notas». Lo local primero era la respuesta más barata y, en la misma frase, la más privada.
Tu portátil ya tiene micrófono y CPU. No necesita un servidor en el medio para escribir un párrafo. La nube es una salida de emergencia estupenda y un valor por defecto extraño.
Cuándo quedarte con Aqua Voice
Esta sección justifica el resto del artículo. Hay razones de verdad para quedarte, y no voy a fingir lo contrario.
Quieres una experiencia en la nube totalmente gestionada y el sin conexión te da igual
Esta es la grande. Aqua es en tiempo real, está alojado y no requiere configuración. Si que tu audio resida brevemente en el servidor de un proveedor no te molesta, y prefieres no descargar un modelo ni pensar en motores, la experiencia gestionada en la nube tiene de verdad menos fricción. Quédate con lo que funciona.
Quieres específicamente su formato en tiempo real
Aqua refina la redacción y corrige la gramática mientras hablas, en el momento, antes de que el texto aterrice. Nuestra limpieza se aplica tras el enunciado, no a media frase. Si ese refinamiento en vivo, palabra a palabra, es la función de la que te enamoraste, el suyo lo hace y el nuestro funciona de otra manera.
Dictas desde el móvil
Aqua ofrece una app para iPhone. Nosotros estamos en Windows y en Mac con Apple Silicon, y no hay app móvil en nuestra hoja de ruta. Si tu dictado diario ocurre en un móvil, necesitas su herramienta.
Para todos los demás —escritores que trabajan solos, profesionales del marketing, comerciales, estudiantes, padres y madres respondiendo el correo de un profesor mientras hacen la cena, cualquiera cuyas palabras no deberían salir de la habitación— empieza con nuestro plan local gratuito y comprueba si alguna vez topas con un límite. No hay límite de palabras ni hace falta internet.
Si solo te quedas con una cosa
La mayoría de los artículos que comparan apps de dictado terminan diciéndote que transformes tu flujo de trabajo. Este termina con algo más modesto. Lo que el dictado por voz arregla es la distancia entre tener algo que decir y conseguir meterlo en el documento. Aqua cierra esa distancia en tiempo real, en la nube, y cobra una vez superas el límite gratuito. Nosotros la cerramos en tu máquina, sin conexión, con la parte local gratis. Si tus palabras pueden vivir en el servidor de otra persona, Aqua es una buena elección. Si no pueden, o simplemente preferirías que no, ese es justo el caso para el que nos construimos.
Si quieres la versión más a fondo de ese argumento, lo desarrollé en nuestro artículo sobre voz a texto sin conexión, y también está nuestra comparativa de alternativas a superwhisper si estás sopesando opciones locales.
Prueba primero el flujo local gratuito
Descarga Whisper by Remskill, crea una cuenta sin tarjeta, pulsa el atajo y dicta. Tu audio se queda en tu máquina, y si nunca necesitas el plan de nube, nunca pagas.
Transcripción local gratis para siempre, totalmente sin conexión. Sin método de pago al registrarte. La prueba de 7 días de la nube solo pide tarjeta al mejorar el plan.



