asistente de voz con IA
Funciones
Dicte en cualquier lugar
Mantén pulsado un atajo, habla y las palabras aparecen donde está tu cursor. Mac y Windows, en cualquier app donde puedas escribir — Slack, Gmail, VSCode, Notes, tu ticket de Jira, el formulario de la escuela de tu hijo.
Modo local
Totalmente sin conexión. Transcripción con OpenAI Whisper o NVIDIA Parakeet, limpieza de IA con Ollama y el modelo open source en el que confíes. Sin nube, sin servidores, nada sale de tu máquina — para esas veces en que tu audio no es para compartir.
Modo nube
La mejor precisión de su clase y respuestas web en vivo en una sola tecla. Transcripción con gpt-4o-transcribe de OpenAI a $0.003/min — unos 18¢ por hora de audio. La misma key impulsa hechos en tiempo real vía la Responses API. Tú traes la key, nosotros no cobramos margen.
Busque en la web
A mitad de frase, pídele a Whisper que lo busque — el precio de una acción, el clima, el resultado del partido de anoche, cómo se escribe la ciudad natal de tu colega. La respuesta llega formateada y en línea. Sin cambiar de pestaña, sin perder el hilo.
Pulido mientras habla
Habla disperso, sale estructurado. "Hey Whisper, formatea como correo" convierte tu borrador balbuceado en un correo de tres párrafos con saludo y despedida. Escribe tu propio disparador para cualquier contexto.
Traduzca mientras habla
Habla polaco, pega inglés. Habla inglés, pega mandarín. Habla japonés, pega alemán. 90+ idiomas, en ambos sentidos, en modo nube y modo local — sin app extra, sin suscripción extra, sin pestaña de Google Translate.
Pregunta sobre lo que tienes en pantalla
Coloca el cursor sobre un error, un gráfico, un fallo de UI — pulsa el atajo de dictado y pregunta. La captura bajo tu cursor va a OpenAI junto con tu pregunta de voz, y la respuesta se pega de vuelta en el sitio. El coste de la imagen es muy inferior a un céntimo por pregunta. Modo en la nube, función Pro.
Silencia tu música cuando hablas
Spotify a media canción, un tutorial de YouTube abierto en una pestaña, un podcast sonando de fondo — Whisper silencia lo que el sistema esté reproduciendo en el momento en que empiezas a grabar, y restaura el volumen en cuanto paras. Combínalo con un aviso suave de inicio y fin en esta misma sección si quieres feedback sin mirar.
Reescribe lo que ya has escrito
Selecciona texto en cualquier app — Slack, Gmail, tu editor — pulsa el atajo de dictado y di la reescritura: "hazlo formal", "quita la palabrería corporativa", "tradúcelo al alemán". La selección se reemplaza en el sitio. El mismo atajo, sin menús. Funciona en modo en la nube y en modo local.
Instrucciones en un atajo
Guarda paquetes de instrucciones para cualquier contexto — prompts de desarrollo, correo formal, mensajes amables de Slack, viñetas para el boletín escolar. Asigna los primeros nueve a Ctrl/Cmd + 1..9 y cambia el estilo activo a mitad de grabación sin salir de tu app.
Sus palabras, bien escritas
Agrega nombres de marca, siglas, el apellido polaco de tu colega, el pueblo alemán que siempre escribes mal — una sola vez. Cada transcripción los respeta, en la nube o en local, sin gastar tokens de IA.
Um, eh, tipo — fuera
Un interruptor y cada "em" y "tipo" se eliminan a la salida. Determinista, gratis, funciona con cualquier motor. Ahora tu dictado suena al tercer borrador, no al primero.