Av Denys Medvediev

Guide

Röst till text i Logseq

Logseq har ingen inbyggd diktering på datorn. Lösningen är ett systemövergripande verktyg: tryck på en kortkommando, prata, och transkriberingen klistras in vid markören i vilket Logseq-block som helst. Din OS-diktering fungerar också, för korta anteckningar.

Senast uppdaterad: juni 2026

Öppen anteckningsbok och penna bredvid en bärbar dator på ett mörkt skrivbord, som väcker associationer till anteckningar och diktering

Röst till text i Logseq fungerar via ett systemövergripande verktyg, inte via Logseq självt. Logseqs datorapp har ingen inbyggd diktering. Lösningen är ett verktyg som Whisper: tryck på en kortkommando, prata, och transkriberingen klistras in vid markören i vilket Logseq-block som helst. Ditt operativsystems diktering fungerar också, för korta anteckningar.

Jag för min dagliga journal i Logseq eftersom jag litar mer på en mapp med vanlig markdown än på något moln. Det enda jag alltid har önskat mig är att kunna prata in i ett block istället för att skriva det. Jag letade efter inställningen. Det finns ingen inställning. Logseq har ingen mikrofonknapp, och efter en hel del grävande är jag säker på att den inte gömmer någon för mig.

Folk söker efter "röst till text i Logseq", hittar ingenting i appen och antar att de missade en knapp. Det gjorde de inte. Knappen byggdes aldrig. Det goda är att lösningen tar ungefär två minuter, körs helt offline om du vill, och som bonus fungerar i alla andra appar du öppnar.

Här är det som de flesta sidor som cirklar runt det här sökordet inte säger rakt ut. Ett Logseq-block är bara en textruta, precis som Gmail eller en sökruta. Diktering som klistrar in vid markören bryr sig inte om vilken app markören befinner sig i.

Så den verkliga frågan är inte "hur slår jag på röstinmatning i Logseq". Det finns ingen knapp. Frågan är "vilket dikteringsverktyg kör jag ovanpå Logseq", och svaret beror på om du vill ha gratis-och-inbyggt, bara-för-Mac, eller en offline-kortkommando som beter sig likadant överallt. Jag går igenom allt, ställer in ett på två minuter, och berättar när du kan hoppa över den dedikerade vägen.

Har Logseq inbyggd diktering?

Händer som skriver i en pappersanteckningsbok bredvid ett tangentbord, som kontrasterar skrivande mot diktering

Nej. Logseqs datorapp har ingen inbyggd tal-till-text-, dikterings- eller röstinmatningsfunktion för att skriva i ett block med rösten. Det finns ingen mikrofonknapp på ett block, inget röstkommando, ingen dold inställning. Om du har finkammat Inställningar efter den kan du sluta. Den finns inte där.

Det som däremot finns är en uppsättning community-plugins med "whisper" i namnet, och det är här folk blir vilseledda. De pluginerna transkriberar en ljudfil eller en YouTube-länk till text i efterhand. De är användbara, men de är inte live-diktering. Du kan inte sätta markören i dagens journal, prata och se orden dyka upp. De bearbetar en inspelning; de skriver inte åt dig medan du tänker. Att blanda ihop de två kostar en eftermiddag, och jag besparar dig hellre den eftermiddagen.

Det mobila läget är en sak för sig, och värt en mening så att du inte jagar det på fel enhet: den nyare Logseq-mobilappen har lagt till viss rösttranskribering, men det är en telefonfunktion, och på en telefon skulle du ändå bara använda tangentbordets mikrofon. På datorgrafen där de flesta faktiskt lever behöver du ett verktyg som ligger ovanpå Logseq. Det finns tre ärliga kategorier, och resten av den här guiden täcker dem.

Tryck på en kortkommando, prata, texten landar i blocket

Det är hela mekaniken, och den är tråkig på bästa möjliga sätt. Du trycker på en kortkommando, du pratar, du släpper, och transkriberingen klistras in vid markören, i vilket textfält som har fokus. Whisper håller kvar en kort svans efter att du släpper knappen, så ditt sista ord inte klipps av. Eftersom den klistrar in vid OS-markören är ett Logseq-block bara "vilken textruta som helst". Datorapp eller webbversion, samma beteende.

Det är den delen som landningssidorna gör för krånglig. Det finns ingen plugin att installera i Logseq, ingen API-token att klistra in, inget synkjobb att passa. Markören är i ett block, du pratar, orden dyker upp i blocket. En liten kapsel visas medan du pratar så att du vet att den lyssnar:

Cancel
Inspelningsöverlägget: en liten kapsel som dyker upp medan du pratar, så att du vet att Whisper lyssnar.

Kortkommandot är det enda som är värt att få rätt från början. På Windows är det Ctrl+Space; på Mac är det Command+Option, en push-to-talk med enbart modifierare som du håller nere medan du pratar. Båda går att ändra i Inställningar om de krockar med något du redan använder. (Min yngre dotter sa en gång att en kortkommando "inte fungerade" i hennes ritapp. Det var en krock, inte ett fel, vilket är så jag lärde mig att en vanlig människa inte har någon aning om vad en kortkommandokrock ens är. Så nu är varje kortkommando anpassningsbar.) Om du någonsin har ställt in diktering på Windows eller på Mac så är det här samma muskelminne riktat mot en annan app.

Ställ in det på två minuter (Windows eller Mac)

Du behöver en Mac med Apple Silicon eller en Windows 10-eller-nyare-dator, en fungerande mikrofon och Logseq öppet i antingen datorappen eller webbläsaren. Hela den lokala pipelinen är gratis för alla inloggade konton, utan att någon betalmetod efterfrågas vid registreringen. Här är ordningsföljden.

Steg 1 — Installera Whisper och logga in.

Ladda ner från nedladdningssidan, installera och skapa ett gratis konto. Inget kort. Hela den lokala transkriberingspipelinen öppnas direkt.

Du vet att det fungerade när appens systemfältsikon dyker upp och installationsguiden erbjuder sig att välja en modell.

Steg 2 — Välj en transkriberingsväg.

Appen väljer inte åt dig. Du får tre: Moln (OpenAI, ta med din egen nyckel), lokal Parakeet, eller lokal Whisper. För privata journalanteckningar, börja lokalt — mer om det två avsnitt längre ner.

Du vet att det fungerade när en modell är färdignedladdad och visas som redo.

Steg 3 — Bekräfta din kortkommando.

Windows är som standard Ctrl+Space, Mac är Command+Option som hålls nere som push-to-talk. På Mac, bevilja behörigheten för Hjälpmedel när du blir tillfrågad; utan den når inte inklistringen-vid-markören andra appar.

Du vet att det fungerade när en testinspelning klistras in i vilket textfält som helst.

Steg 4 — Sätt markören i ett Logseq-block och prata.

Öppna din graf, klicka in i ett block, håll ner kortkommandot, säg en mening, släpp. Transkriberingen dyker upp där markören är, i blocket.

Du vet att det fungerade när din talade mening sitter i Logseq-blocket som text.

Whisper
Den riktiga Whisper-datorappen på inställningsskärmen, med panelerna Transkribering och AI öppna.

Det långsamma är modellnedladdningen, inte installationen. Allt annat är de fyra stegen ovan. När det väl är igång slutar handlingen att fånga en tanke i din graf att vara en skrivuppgift och börjar bli en pratuppgift.

röst till text på Windows · på Mac

En Logseq-plugin kontra en systemövergripande kortkommando

De flesta sidor som rankar för det här sökordet pekar dig mot en Logseq-plugin eller mot Blurt, ett dedikerat menyradsverktyg för Mac som talar rakt in i din disposition. Det är okej svar, med en strukturell hake var. Plugins av whisper-typ transkriberar ljudfiler, inte live-tal in i blocket du redigerar. Och Blurt är, enligt sin egen beskrivning, bara för macOS — om du sitter på Windows är det inget alternativ alls.

En systemövergripande kortkommando kringgår båda begränsningarna. Den klistrar in vid OS-markören oavsett vilket fönster som äger den, så samma tangent som fyller ett Logseq-block fyller också din Gmail-skrivruta, ett Slack-meddelande och ett commit-meddelande. Ett verktyg, varje textfält, på både Windows och Mac. Du behöver inte lära om något när du byter app, och du behöver ingen annan lösning beroende på din laptop.

Om du sitter på en Mac och bara någonsin fångar inuti Logseq är Blurt ett prydligt, fokuserat val värt att titta på. I samma stund du sitter på Windows, eller vill ha samma flöde i varje program du öppnar, vinner den systemövergripande vägen. Jag skulle ta den enda kortkommandon eftersom jag byter app ungefär fyrtio gånger i timmen och inte vill ha fyrtio olika dikteringsknappar att komma ihåg.

Lokalt eller moln: vilket läge för en privat graf

För Logseq, prova lokalt läge först. Hela anledningen till att många av oss valde Logseq är att den är lokal-först och vanlig text — ett mötesreferat, en halvformad idé, en journalanteckning du aldrig skulle vilja ha på någons server. Det vore ett märkligt val att hålla dina anteckningar på din egen disk och sedan dirigera din röst genom ett moln för att komma dit. Om din Mac har Apple Silicon eller din PC är från de senaste åren klarar lokalt vardagsdiktering utan att klaga, och molnet blir nödutgången snarare än standardvalet.

Så här skiljer sig de tre vägarna, eftersom appen tvingar dig att välja och jag vill hellre att du väljer väl:

  • Lokal ParakeetNVIDIAs TDT-motor, runt 600 MB, och det snabbaste lokala alternativet — 5 till 10 gånger snabbare än Whisper på CPU. Täcker engelska plus 24 andra europeiska språk, 25 totalt. Ingen översättning till engelska. Om du för journal på engelska eller ett annat europeiskt språk är det här det snabba, helt offline-valet.
  • Lokal Whisperlångsammare än Parakeet på samma maskin, men de flerspråkiga byggena täcker 99 språk och kan översätta till engelska. De engelska-bara-byggena är just det, engelska bara, inte 99. Välj det här för kinesiska, japanska, koreanska eller alla översättningsuppgifter, som Parakeet inte klarar. Standardmodellen för engelska är runt 480 MB.
  • Moln (OpenAI, BYOK)bäst noggrannhet och webbåtkomst, med din egen OpenAI-nyckel som faktureras direkt av OpenAI. Transkribering körs som standard på gpt-4o-mini-transcribe. Kräver internet, så det är den enda vägen som lämnar din maskin. Molnytan är en del av Whisper Pro.

Den tråkiga sanningen är att för den typ av text de flesta lägger i Logseq räcker lokalt gott och väl. Båda lokala motorerna körs helt på din maskin utan att något skickas till en server, vilket är hela poängen med en lokal-först-graf. Molnet förtjänar sin plats när du vill ha toppnoggrannhet på en svår inspelning eller behöver att modellen plockar ett faktum från webben mitt i en mening. För en daglig-journal-vana, börja lokalt och ta bara till molnet när lokalt lämnar dig önskande mer.

Skiljetecken, block och Logseq-markdown med rösten

Rå diktering kommer ut som en enda lång mening. Du säger "okej så granska arkitekturdokumentet tagga det projekt alpha och påminn mig torsdag", och det är den oskiljetecknade vägg som vilken talmotor som helst räcker dig. Att städa upp det är där vägarna går isär.

Windows röstinmatning lägger till skiljetecken medan du pratar, och macOS-diktering hanterar grundläggande skiljetecken när du säger "komma" eller "punkt". För tyngre städning — att stryka "ähm", fixa de långa meningarna, förvandla ett talat stycke till något du faktiskt skulle behålla i din graf — kan Whisper köra en AI-genomgång. Säg aktiveringsfrasen "Hey whisper" så förbättras texten innan den landar. På en lokal modell körs det via Ollama; i molnläge är det gpt-5-mini som standard.

Thinking...

okej så granska arkitekturdokumentet tagga det projekt alpha och påminn mig torsdag ähm innan standup-mötet

Städad

Okej, så granska arkitekturdokumentet, tagga det Project Alpha och påminn mig på torsdag innan standup-mötet.

För Logseqs egen struktur — nästlade block, #tag- och [[page]]-länkar, TODO-markörer — är det ärliga svaret att rösten ger dig texten och Logseqs egen syntax ger dig strukturen. Diktera meningen, skriv sedan Tab för att indentera, # för en tag, eller [[ för en sidlänk på det sätt du alltid gör. Inget dikteringsverktyg trollar fram Logseqs dispositionssyntax på kommando; den som lovar "säg tag projekt alpha och se den länka" säljer dig en demo, inte en tisdag. Få ner orden snabbt med rösten, forma blocken med tangenterna du redan kan.

Samma prata-sedan-städa-flöde lönar sig långt bortom din graf — du kan också diktera ren prosa in i vilken app som helst med den enda kortkommandon, så att ett långt block blir några talade meningar istället för ett stycke du skriver ut.

När du ska hoppa över ett dikteringsverktyg för Logseq

Två pilar ritade med krita på trottoaren som pekar åt olika håll, som illustrerar ett verktygsval

Ibland är rätt verktyg det gratisverktyg som redan finns på din maskin, och att låtsas något annat vore oärligt. Om du bara släpper korta anteckningar i Logseq — en snabb journalrad, en tvåordspåminnelse — täcker ditt operativsystem det gratis.

På Windows, tryck på Windows-tangenten + H så öppnas den inbyggda röstinmatningsraden där markören är, ett Logseq-block inräknat. Den sätter skiljetecken på egen hand och duger för korta utbrott. Haken: den går via Microsofts servrar och behöver en internetuppkoppling, så det är inget offline-alternativ, vilket spelar större roll än vanligt när hela poängen med din graf är att förbli lokal. På Mac låter Diktering dig prata för att mata in text varhelst du kan skriva, ställs in i Systeminställningar under Tangentbord, och på Apple Silicon kan generell text bearbetas på enheten. Och om du är en Mac-användare som lever helt inuti Logseq är Blurt ett fokuserat, inbyggt val byggt för precis det.

Ta till ett dedikerat, systemövergripande verktyg när de inbyggda börjar svida: långa anteckningar, flerspråkigt arbete, offline-integritet på Windows, eller en önskan om en enda kortkommando som beter sig likadant i Logseq, din e-post och din editor. Under den ribban, använd det som är gratis. Jag tänker inte säga åt dig att installera en app för en enradspåminnelse.

Samma avvägning dyker upp om du också för anteckningar någon annanstans — logiken i att diktera in i Obsidian är identisk, eftersom båda är lokal-först-markdown-appar där markören, inte en plugin, är den verkliga integrationen.

Vidare läsning

Logseq levererade aldrig en mikrofonknapp, och efter att ha skrivit det här är jag ganska säker på att den aldrig kommer att göra det. Den behöver inte, eftersom markören är integrationen. Prata in i blocket, få text, forma den med syntaxen du redan kan. Jag dikterade det mesta av den här guiden in i en textruta som inte var Logseq, med ett verktyg som inte bryr sig om vilken ruta det är, och klistrade sedan in alltihop i min egen graf. Det är hela tricket.

Prova det i ditt nästa Logseq-block

Håll ner kortkommandot, prata, släpp. Transkriberingen landar i vilket block markören än är i — och i varenda annan app också.

Gratis lokalt läge för alla inloggade konton. Inget kort krävs för att börja.

Foto av Denys Medvediev

Denys Medvediev

Jag är den som läser vår supportmejl, troligen genom att diktera svaren.