Guía
Whisper para Mac
"Whisper para Mac" puede significar dos cosas. O bien el modelo de código abierto Whisper de OpenAI ejecutándose en un Mac a través de Python y la línea de comandos, o bien una app de Mac que usa Whisper por debajo. La mayoría de la gente quiere la segunda. Solo que todavía no lo sabe.
Última actualización: junio de 2026

Whisper para Mac son dos cosas distintas con un mismo nombre. El modelo es de código abierto y gratuito, pero la forma oficial de ejecutarlo necesita Python y la línea de comandos, y transcribe archivos en lugar de tu voz en directo. Si lo que quieres es pulsar un atajo y que tus palabras aparezcan en cualquier app de Mac, lo que buscas es una app de dictado como Whisper by Remskill, cuyo flujo local completo es gratis para cualquier usuario registrado.
Whisper es un modelo, no una app de Mac
Déjame aclarar la confusión de nombres, porque los resultados de búsqueda lo mezclan todo.
Whisper es un modelo de reconocimiento de voz de código abierto de OpenAI, publicado bajo la licencia MIT. El modelo es gratuito. El código es gratuito. Puedes descargar los pesos y ejecutarlos en tu propia máquina, sin necesidad de cuenta. Esa parte sí es "Whisper para Mac" en el sentido literal.
El truco está en cómo lo ejecutas. El Whisper oficial de OpenAI es una herramienta de Python y línea de comandos. Lo instalas con pip, también necesitas la herramienta de línea de comandos ffmpeg, y luego le indicas un archivo de audio. Transcribe grabaciones: audio.mp3, audio.wav, ese tipo de cosas. No escribe tu voz en directo en Mail o Slack. Convierte en texto un archivo que ya tienes.
Hay seis tamaños de modelo (tiny, base, small, medium, large y turbo), cuatro de ellos con variantes solo en inglés que sacrifican precisión por velocidad. Whisper es multilingüe y puede traducir voz al inglés con una sola opción. Buen modelo. La verdad aburrida es que el modelo nunca fue la parte difícil. Encajarlo en tu forma real de trabajar en un Mac, sí lo es.
Las herramientas de Mac que envuelven a Whisper, y para qué sirve cada una
La mayoría de quienes buscan "Whisper para Mac" no quieren saber nada de pip. Quieren una app. Hay varias buenas, y no son intercambiables. Se dividen en dos bandos.
Bando uno: transcribir archivos
whisper.cpp es un port puro en C/C++ de Whisper, con licencia MIT, y es ciudadano de primera clase en Apple Silicon, optimizado con ARM NEON, el framework Accelerate, Metal y Core ML. Funciona solo con CPU, lo compilas desde el código fuente y lo manejas desde la línea de comandos. Si te mueves con soltura en una terminal y quieres transcripción de archivos local, rápida y en crudo, es excelente. MacWhisper te da una versión gráfica de esa misma idea. Transcribe archivos de audio y vídeo en el propio dispositivo usando OpenAI Whisper y NVIDIA Parakeet, sin que ningún dato salga de tu máquina, además de una función de dictado para todo el sistema. Si tu trabajo es convertir grabaciones en transcripciones, ese bando es el adecuado.
Bando dos: escribir tu voz en directo
Esto es dictado. Pulsas un atajo, hablas, y el texto aparece en tu cursor en la app que tengas en primer plano. VoiceInk vive aquí. Es de código abierto bajo GPL-3.0, ejecuta modelos locales en el Apple Neural Engine, incluido Parakeet v3, y pega en el cursor con un atajo push-to-talk. Requiere Apple Silicon y macOS 14.4 o posterior. superwhisper también está aquí, con dictado en directo más transcripción de archivos, local o en la nube, en Mac, Windows e iOS.
Whisper by Remskill, la app que yo desarrollo, está en el bando dos. Dictado primero. Conviene saber en qué bando estás antes de descargar nada.
Qué hace Whisper by Remskill en un Mac
Te describo lo que he construido, y luego puedes juzgarlo frente al resto.
Es una app de dictado. Pulsas un atajo, hablas, y el texto aparece en tu cursor en cualquier app: Mail, Notas, Slack, tu editor de código, la casilla donde rellenas la autorización del colegio de este año. El atajo por defecto en un Mac es Command y Option pulsados a la vez, y es totalmente reasignable. Toda la transcripción ocurre en tu Mac. Ningún archivo que subir, ninguna grabación que gestionar.
Tampoco ejecutas Python. No hay pip, ni ffmpeg, ni terminal, ni GPU. Todo es puro Rust. Los motores Whisper y Parakeet funcionan a través de una librería llamada transcribe-rs, sin ningún sidecar de Python incluido. La transcripción local corre en tu CPU, sin GPU dedicada, y la app ocupa unos 25 MB en disco.
El modelo en sí lo eliges tú. El Whisper local te da 8 modelos, 99 idiomas, traducción al inglés, vocabulario personalizado, control del beam-size y sesgo por palabras clave. Más lento, pero con el máximo control. Parakeet es el motor TDT de NVIDIA, de unos 600 MB, y corre de 5 a 10 veces más rápido que Whisper en una CPU, cubriendo el inglés más otros 24 idiomas europeos, sin traducción al inglés. El modo nube es el tercer camino: traes tu propia clave de OpenAI, y nosotros no nos quedamos con nada. A propósito no elijo por ti. Detallamos las diferencias en Whisper vs Parakeet si quieres la versión larga.
La precisión local suele situarse entre el 95% y el 99%. El flujo local completo es gratis para cualquier usuario registrado: Whisper, Parakeet, limpieza con IA sin conexión a través de Ollama, historial de transcripciones, ajustes preestablecidos, palabras clave, aceleración por hardware, descargas de modelos y el atajo personalizado. Sin método de pago al registrarte. Puedes usarlo hasta en 3 dispositivos. El plan de pago, Whisper Pro, solo añade la capa de nube: transcripción en la nube de OpenAI, limpieza con IA en la nube y búsqueda web. Los precios están en la página de precios. No cito cifras aquí, porque las páginas de precios cambian y conviene que lo leas directamente en la fuente.
Una limitación honesta: nuestra versión para Mac es solo para Apple Silicon, del M1 al M4. Si tienes un Mac con Intel, esta app no es para ti, y enseguida te diré cuál sí lo es.
Así es como se ve tu primer dictado en la práctica. Pulsas el atajo, aparece un pequeño indicador de grabación, hablas, sueltas, y el texto ya limpio cae justo donde estaba tu cursor. La superposición de abajo es lo que la app muestra de verdad, no una maqueta.
La configuración es breve. Descarga la app, inicia sesión y deja que baje un modelo. Parakeet es el más pequeño, en torno a 600 MB, o un modelo de Whisper si quieres idiomas o traducción. Elige tu atajo o quédate con Command y Option. Luego abre Mail, mantén pulsado el atajo y di una frase. Eso es toda la puesta en marcha. Mi hija pequeña lo hizo sin hacerme ni una sola pregunta de seguimiento, que es la única prueba de usabilidad en la que confío del todo. Si quieres el recorrido más largo, captura a captura, con los tres caminos de modelo, escribí una guía dedicada: voz a texto en Mac.
Por qué lo mantengo local en un Mac
Esta es mi única opinión rotunda en este artículo: el dictado solo en la nube es un desastre para la privacidad.
La hoja de cálculo con los salarios de tu jefe, el correo al colegio de tu hijo, el escrito legal que redactas en el tren. Nada de eso debería pasar por los servidores de un proveedor solo porque querías escribir con la voz. Tu Mac ya tiene un micrófono y una CPU. Para un párrafo de dictado, no necesita un servidor de por medio. Con los motores locales, el audio nunca sale de tu máquina. Esa es la opción a la que yo recurriría por defecto, y es gratis.
El modo nube existe para cuando de verdad quieres los últimos modelos de OpenAI o respuestas de la web, con tu propia clave. Es la salida de emergencia, no la puerta principal.
Cuándo MacWhisper, VoiceInk o la línea de comandos son la mejor opción
Sería un mal guía si fingiera que una sola app gana en todos los casos. No es así. Aquí está dónde te enviaría a otro sitio.
Sobre todo transcribes grabaciones
Si tu día consiste en meter episodios de pódcast, grabaciones de entrevistas o capturas de reuniones en una transcripción, lo que quieres es una herramienta de transcripción de archivos, no una app de dictado. MacWhisper está hecho precisamente para eso: arrastras un archivo, sacas texto, en el propio dispositivo. Úsalo. Nosotros no hacemos subida de archivos. Escribimos tu voz en directo.
Quieres algo en crudo, automatizable y gratis, y vives en la terminal
Entonces whisper.cpp es la respuesta. Tiene licencia MIT, está optimizado para Apple Silicon, funciona solo con CPU y puedes encadenarlo con cualquier cosa. Si eres de los que disfrutan compilando desde el código fuente, serás más feliz ahí que en cualquier interfaz gráfica.
Quieres dictado totalmente de código abierto y estás en Apple Silicon
VoiceInk es GPL-3.0, puedes leer o auditar cada línea, y pega en el cursor igual que nosotros. Es una opción gratuita sólida. Nosotros somos una app gestionada, con cuentas, historial, nube con tu propia clave y soporte para Windows, y no somos de código abierto. Así que si el código abierto es un requisito ineludible, tú decides, y VoiceInk es una buena elección.
Tienes un Mac con Intel
Nuestra app no funcionará. El whisper.cpp de código abierto se puede compilar y ejecutar en Intel, y el propio Dictado integrado de Apple es gratis para notas cortas. Cualquiera de los dos es mejor que esperar a un Mac con Apple Silicon que todavía no has comprado.
Si solo recuerdas una cosa
El modelo es gratuito y abierto. La decisión que importa es qué pones a su alrededor: una terminal, una interfaz gráfica para transcribir archivos, o un atajo que escribe tu voz en directo en lo que estés mirando. Ajusta la envoltura al trabajo, y en un Mac, ignora Python a menos que de verdad disfrutes con él. Hay tres clases de personas que buscan Whisper en un Mac: las que tienen una carpeta de grabaciones, las que no quieren volver a teclear nunca, y las que simplemente les gustó el nombre. Dos de ellas están en el bando equivocado hasta que leen hasta aquí.
La mayor parte de este artículo la dicté en lugar de teclearla, lo cual parecía apropiado. El único párrafo que escribí a mano tenía más erratas.
Lecturas adicionales
Pruébalo en tu Mac
Descarga Whisper by Remskill, inicia sesión y dicta tu primera frase en tu Mac. El plan local es gratis, y más adelante puedes decidir si llegas a necesitar la nube.
Transcripción local gratis para siempre. Sin método de pago al registrarte. Solo Apple Silicon.



