Guía
Voz a texto en Logseq
Logseq no incluye dictado en el escritorio. La solución es una herramienta de todo el sistema: pulsa una tecla, habla y la transcripción se pega donde tienes el cursor en cualquier bloque de Logseq. El dictado de tu sistema operativo también sirve, para capturas cortas.
Última actualización: junio de 2026

La función de voz a texto en Logseq funciona a través de una herramienta de todo el sistema, no de Logseq en sí. La app de escritorio de Logseq no tiene dictado integrado. La solución es una herramienta como Whisper: pulsa una tecla, habla y la transcripción se pega donde tienes el cursor en cualquier bloque de Logseq. El dictado de tu sistema operativo también sirve, para notas cortas.
Llevo mi diario en Logseq porque confío más en una carpeta de markdown plano que en cualquier nube. Lo único que siempre quise fue hablarle a un bloque en lugar de escribirlo. Me puse a buscar la opción. No hay opción. Logseq no tiene un botón de micrófono y, tras buscar bastante, estoy convencido de que no me la está escondiendo.
La gente busca "voz a texto en Logseq", no encuentra nada en la app y supone que se le pasó un interruptor. No se les pasó. El interruptor nunca existió. La buena noticia es que la solución lleva unos dos minutos, funciona totalmente sin conexión si así lo quieres y, de paso, funciona en cualquier otra app que abras.
Aquí está lo que la mayoría de las páginas que rondan esta palabra clave no dicen sin rodeos. Un bloque de Logseq es solo una caja de texto, igual que Gmail o una barra de búsqueda. Al dictado que pega donde tienes el cursor le da igual en qué app esté ese cursor.
Así que la verdadera pregunta no es "cómo activo el dictado por voz en Logseq". No hay ningún interruptor. La pregunta es "qué herramienta de dictado ejecuto por encima de Logseq", y la respuesta depende de si quieres algo gratis e integrado, solo para Mac, o una única tecla sin conexión que se comporte igual en todas partes. Voy a repasarlo todo, configurar una en dos minutos y decirte cuándo saltarte la opción dedicada.
¿Logseq tiene dictado integrado?

No. La app de escritorio de Logseq no tiene ninguna función integrada de voz a texto, dictado o escritura por voz para escribir en un bloque hablando. No hay botón de micrófono en un bloque, ni comando de voz, ni una preferencia oculta. Si has estado revisando los Ajustes buscándola, puedes parar. No está ahí.
Lo que sí existe es un conjunto de plugins de la comunidad con "whisper" en el nombre, y aquí es donde la gente se lía. Esos plugins transcriben un archivo de audio o un enlace de YouTube a texto después de los hechos. Son útiles, pero no son dictado en vivo. No puedes poner el cursor en el diario de hoy, hablar y ver aparecer las palabras. Procesan una grabación; no escriben por ti mientras piensas. Confundir las dos cosas te cuesta una tarde, y prefiero que te ahorres esa tarde.
Lo del móvil es otro cantar, y merece una frase para que no lo persigas en el dispositivo equivocado: la app de móvil de Logseq más reciente ha añadido algo de transcripción por voz, pero eso es una función de teléfono, y en un teléfono usarías de todos modos el micrófono del teclado. En el grafo de escritorio donde la mayoría de la gente vive de verdad, necesitas una herramienta que se sitúe por encima de Logseq. Hay tres categorías honestas, y el resto de esta guía las cubre.
Pulsa una tecla, habla y el texto aterriza en el bloque
Esta es toda la mecánica, y es aburrida en el mejor sentido. Pulsas una tecla, hablas, sueltas y la transcripción se pega donde tienes el cursor, en el campo de texto que tenga el foco. Whisper aguanta una breve cola después de que sueltes la tecla, para que tu última palabra no quede cortada. Como pega donde está el cursor del sistema, un bloque de Logseq es simplemente "cualquier caja de texto". App de escritorio o versión del navegador, mismo comportamiento.
Esa es la parte que las páginas de aterrizaje complican de más. No hay ningún plugin que instalar en Logseq, ningún token de API que pegar, ningún trabajo de sincronización que vigilar. Tu cursor está en un bloque, hablas y las palabras aparecen en el bloque. Una pequeña cápsula aparece mientras hablas para que sepas que está escuchando:
La tecla es lo único que conviene dejar bien claro desde el principio. En Windows es Ctrl+Space; en Mac es Command+Option, una pulsación para hablar solo con modificadores que mantienes apretada mientras hablas. Ambas se pueden cambiar en los Ajustes si chocan con algo que ya usas. (Mi hija menor me dijo una vez que una tecla "no funcionaba" en su app de dibujo. Era un conflicto, no un fallo, y así aprendí que la persona promedio no tiene ni idea de lo que es siquiera un conflicto de teclas. Así que ahora todas las teclas son personalizables). Si alguna vez has configurado el dictado en Windows o en Mac, esto es la misma memoria muscular apuntada a otra app.
Configúralo en dos minutos (Windows o Mac)
Necesitas un Mac con Apple Silicon o un PC con Windows 10 o más reciente, un micrófono que funcione y Logseq abierto, ya sea en la app de escritorio o en el navegador. Todo el flujo local es gratuito para cualquier cuenta con sesión iniciada, sin que se pida un método de pago al registrarte. Esta es la secuencia.
Paso 1 — Instala Whisper e inicia sesión.
Descárgalo desde la página de descarga, instálalo y crea una cuenta gratuita. Sin tarjeta. Todo el flujo de transcripción local se abre de inmediato.
Sabrás que funcionó cuando aparezca el icono de la app en la bandeja del sistema y el asistente de configuración te ofrezca elegir un modelo.
Paso 2 — Elige una ruta de transcripción.
La app no elige por ti. Tienes tres opciones: Nube (OpenAI, con tu propia clave), Parakeet local o Whisper local. Para notas privadas de diario, empieza por local; más sobre esto dos secciones más abajo.
Sabrás que funcionó cuando un modelo termine de descargarse y aparezca como listo.
Paso 3 — Confirma tu tecla.
Windows usa por defecto Ctrl+Space, y Mac, Command+Option mantenido como pulsación para hablar. En Mac, concede el permiso de Accesibilidad cuando se te pida; sin él, el pegado donde está el cursor no puede llegar a otras apps.
Sabrás que funcionó cuando una grabación de prueba se pegue en cualquier campo de texto.
Paso 4 — Pon el cursor en un bloque de Logseq y habla.
Abre tu grafo, haz clic en un bloque, mantén pulsada la tecla, di una frase y suelta. La transcripción aparece donde está el cursor, en el bloque.
Sabrás que funcionó cuando tu frase hablada esté en el bloque de Logseq como texto.
La parte lenta es la descarga del modelo, no la configuración. Todo lo demás son los cuatro pasos de arriba. Una vez que está en marcha, el acto de capturar una idea en tu grafo deja de ser una tarea de escribir y pasa a ser una tarea de hablar.
Un plugin de Logseq frente a una tecla de todo el sistema
La mayoría de las páginas que se posicionan para esta palabra clave te dirigen a un plugin de Logseq o a Blurt, una herramienta dedicada de barra de menú para Mac que habla directamente en tu esquema. Son respuestas válidas, cada una con una pega estructural. Los plugins tipo whisper transcriben archivos de audio, no voz en vivo en el bloque que estás editando. Y Blurt, según su propia descripción, es solo para macOS; si estás en Windows, no es una opción en absoluto.
Una tecla de todo el sistema esquiva ambos límites. Pega donde está el cursor del sistema sin importar qué ventana lo tenga, así que la misma tecla que rellena un bloque de Logseq también rellena tu cuadro de redacción de Gmail, un mensaje de Slack y un mensaje de commit. Una herramienta, todos los campos de texto, en Windows y Mac. No reaprendes nada cuando cambias de app, y no necesitas una solución distinta según tu portátil.
Si estás en un Mac y solo capturas dentro de Logseq, Blurt es una opción ordenada y centrada que vale la pena mirar. En el momento en que estás en Windows, o quieres el mismo flujo en cada programa que abres, gana la ruta de todo el sistema. Yo recurriría a la única tecla porque cambio de app unas cuarenta veces por hora y no quiero recordar cuarenta botones de dictado distintos.
Local o nube: qué modo para un grafo privado
Para Logseq, prueba primero el modo local. La razón por la que muchos elegimos Logseq es que es texto plano local primero: un resumen de reunión, una idea a medio formar, una entrada de diario que nunca querrías en el servidor de alguien. Sería una elección rara guardar tus notas en tu propio disco y luego enrutar tu voz por una nube para que lleguen ahí. Si tu Mac es Apple Silicon o tu PC es de los últimos años, lo local maneja el dictado diario sin quejarse, y la nube se convierte en la salida de emergencia en lugar de la opción por defecto.
Así se diferencian las tres rutas, porque la app te obliga a elegir y prefiero que elijas bien:
- Parakeet local — El motor TDT de NVIDIA, unos 600 MB, y la opción local más rápida: de 5 a 10 veces más rápido que Whisper en CPU. Cubre el inglés más otros 24 idiomas europeos, 25 en total. Sin traducción al inglés. Si escribes tu diario en inglés u otro idioma europeo, esta es la opción rápida y totalmente sin conexión.
- Whisper local — más lento que Parakeet en la misma máquina, pero las versiones multilingües cubren 99 idiomas y pueden traducir al inglés. Las versiones solo en inglés son solo en inglés, no 99. Elige esta para chino, japonés, coreano o cualquier trabajo de traducción, que Parakeet no puede hacer. El modelo en inglés por defecto pesa unos 480 MB.
- Nube (OpenAI, BYOK) — la mejor precisión y acceso a la web, usando tu propia clave de OpenAI facturada directamente por OpenAI. La transcripción se ejecuta en gpt-4o-mini-transcribe por defecto. Necesita internet, así que es la única ruta que sale de tu máquina. La superficie de Nube forma parte de Whisper Pro.
La verdad aburrida es que, para el tipo de texto que la mayoría pone en Logseq, lo local sobra. Ambos motores locales se ejecutan por completo en tu máquina sin enviar nada a un servidor, que es justo el sentido de un grafo local primero. La nube se gana su lugar cuando quieres precisión de primera en una grabación difícil o necesitas que el modelo saque un dato de la web a media frase. Para el hábito de diario, empieza por local y recurre a la nube solo cuando lo local te deje con ganas de más.
Puntuación, bloques y markdown de Logseq por voz
El dictado en bruto sale como una frase sin pausas. Dices "vale entonces revisa el documento de arquitectura etiquétalo proyecto alfa y recuérdame el jueves", y eso es el muro sin puntuar que te entrega cualquier motor de voz. Limpiarlo es donde las rutas se separan.
El Dictado por voz de Windows añade puntuación mientras hablas, y el Dictado de macOS gestiona la puntuación básica cuando dices "coma" o "punto". Para una limpieza más a fondo —quitar los "eh", arreglar las frases sin pausas, convertir un párrafo hablado en algo que de verdad guardarías en tu grafo— Whisper puede hacer una pasada de IA. Di la frase de activación "Hey whisper" y el texto se mejora antes de aterrizar. En un modelo local eso pasa por Ollama; en modo nube es gpt-5-mini por defecto.
vale entonces revisa el documento de arquitectura etiquétalo proyecto alfa y recuérdame el jueves eh antes de la reunión diaria
Vale, entonces revisa el documento de arquitectura, etiquétalo Proyecto Alfa y recuérdame el jueves antes de la reunión diaria.
Para la estructura propia de Logseq —bloques anidados, los enlaces #etiqueta y [[página]], los marcadores TODO— la respuesta honesta es que la voz te da el texto y la sintaxis propia de Logseq te da la estructura. Dicta la frase, luego escribe el Tab para sangrar, el # para una etiqueta o el [[ para un enlace a una página como siempre lo haces. Ninguna herramienta de dictado conjura la sintaxis del esquema de Logseq de la nada a la orden; quien te prometa "di etiqueta proyecto alfa y mira cómo se enlaza" te está vendiendo una demo, no un martes cualquiera. Suelta las palabras rápido por voz, dale forma a los bloques con las teclas que ya conoces.
Ese mismo flujo de hablar y luego limpiar rinde mucho más allá de tu grafo: también puedes dictar prosa limpia en cualquier app con la única tecla, así que un bloque largo se convierte en unas pocas frases habladas en lugar de un párrafo que tecleas.
Cuándo saltarte una herramienta de dictado para Logseq

A veces la herramienta correcta es la gratuita que ya tienes en tu máquina, y fingir lo contrario sería deshonesto. Si solo sueltas capturas cortas en Logseq —una línea rápida de diario, un recordatorio de dos palabras— tu sistema operativo lo cubre por nada.
En Windows, pulsa la tecla Windows + H y la barra de Dictado por voz integrada se abre donde tengas el cursor, incluido un bloque de Logseq. Puntúa sola y va bien para ráfagas cortas. La pega: pasa por los servidores de Microsoft y necesita conexión a internet, así que no es una opción sin conexión, lo cual importa más de lo habitual cuando todo el sentido de tu grafo es mantenerlo local. En Mac, el Dictado te deja hablar para introducir texto en cualquier sitio donde puedas escribir, se configura en los Ajustes del Sistema en Teclado, y en Apple Silicon el texto general se puede procesar en el dispositivo. Y si eres usuario de Mac y vives por completo dentro de Logseq, Blurt es una opción nativa y centrada hecha justo para eso.
Recurre a una herramienta dedicada de todo el sistema cuando los integrados empiecen a doler: notas largas, trabajo multilingüe, privacidad sin conexión en Windows o querer una única tecla que se comporte igual en Logseq, tu correo y tu editor. Por debajo de ese listón, usa lo que es gratis. No voy a decirte que instales una app para un recordatorio de una línea.
El mismo dilema aparece si también guardas notas en otro sitio: la lógica de dictar en Obsidian es idéntica, porque ambas son apps de markdown local primero donde el cursor, no un plugin, es la verdadera integración.
Lecturas adicionales
Logseq nunca lanzó un botón de micrófono, y tras escribir esto estoy bastante seguro de que nunca lo hará. No le hace falta, porque el cursor es la integración. Habla al bloque, obtén texto, dale forma con la sintaxis que ya conoces. Yo dicté la mayor parte de esta guía en una caja de texto que no era Logseq, con una herramienta a la que le da igual qué caja sea, y luego pegué todo en mi propio grafo. Ese es todo el truco.
Pruébalo en tu próximo bloque de Logseq
Mantén la tecla, habla y suelta. La transcripción aterriza en el bloque donde esté tu cursor, y en cualquier otra app también.
Modo local gratuito para cualquier cuenta con sesión iniciada. No hace falta tarjeta para empezar.



