작성자: Denys Medvediev

가이드

음성을 텍스트로 Logseq에서

Logseq 데스크톱에는 받아쓰기 기능이 기본 내장되어 있지 않습니다. 해결책은 시스템 전역에서 작동하는 도구입니다. 단축키를 누르고 말하면, 어떤 Logseq 블록이든 커서 위치에 받아쓴 글이 붙여넣어집니다. 짧은 메모라면 OS의 받아쓰기도 충분히 쓸 만합니다.

마지막 업데이트: 2026년 6월

어두운 책상 위 노트북 옆에 펼쳐진 노트와 펜, 메모와 받아쓰기를 연상시키는 장면

Logseq에서의 음성 입력은 Logseq 자체가 아니라 시스템 전역 도구를 통해 이루어집니다. Logseq 데스크톱 앱에는 받아쓰기가 기본 내장되어 있지 않습니다. 해결책은 Whisper 같은 도구입니다. 단축키를 누르고 말하면 어떤 Logseq 블록이든 커서 위치에 받아쓴 글이 붙여넣어집니다. 짧은 메모라면 운영체제의 받아쓰기도 충분히 쓸 만합니다.

저는 매일 쓰는 일기를 Logseq에 기록합니다. 어떤 클라우드보다 일반 마크다운 파일 폴더가 더 믿음직하기 때문입니다. 늘 바라던 단 한 가지는, 블록에 타이핑하는 대신 말로 입력하는 것이었습니다. 그 설정을 찾아 헤맸지만, 그런 설정은 없었습니다. Logseq에는 마이크 버튼이 없고, 한참을 뒤져본 끝에 어딘가 숨겨져 있는 것도 아니라고 확신하게 되었습니다.

사람들은 "Logseq 음성 입력"을 검색하지만 앱 안에서 아무것도 찾지 못하고, 어떤 토글을 놓쳤겠거니 짐작합니다. 놓친 게 아닙니다. 그런 토글은 애초에 만들어진 적이 없습니다. 다행인 점은 해결에 2분쯤이면 충분하고, 원한다면 완전히 오프라인으로 돌아가며, 덤으로 여는 다른 모든 앱에서도 똑같이 작동한다는 것입니다.

이 키워드 주변을 빙빙 도는 대부분의 글이 솔직하게 말하지 않는 핵심이 있습니다. Logseq 블록은 그냥 텍스트 입력 상자입니다. Gmail이나 검색창과 다를 게 없죠. 커서 위치에 붙여넣는 받아쓰기는 그 커서가 어느 앱에 있든 신경 쓰지 않습니다.

그러니 진짜 질문은 "Logseq에서 음성 입력을 어떻게 켜는가"가 아닙니다. 그런 스위치는 없습니다. 진짜 질문은 "Logseq 위에서 어떤 받아쓰기 도구를 돌릴 것인가"이고, 답은 당신이 무료 내장형을 원하는지, Mac 전용이면 되는지, 아니면 어디서나 똑같이 작동하는 오프라인 단축키 하나를 원하는지에 달려 있습니다. 이 모든 걸 차근차근 짚어보고, 2분 만에 하나 설정해 보고, 전용 도구를 건너뛰어도 되는 경우까지 알려드리겠습니다.

Logseq에 받아쓰기가 기본 내장되어 있나요?

키보드 옆 종이 노트에 손으로 글을 쓰는 모습, 타이핑과 받아쓰기를 대비시키는 장면

아니요. Logseq 데스크톱 앱에는 블록에 음성으로 글을 쓰는 음성-텍스트 변환, 받아쓰기, 음성 입력 기능이 기본 내장되어 있지 않습니다. 블록에 마이크 버튼도, 음성 명령도, 숨겨진 환경설정도 없습니다. 설정을 샅샅이 뒤지고 있었다면 이제 멈춰도 됩니다. 거기에 없으니까요.

대신 존재하는 것은 이름에 "whisper"가 들어간 커뮤니티 플러그인 모음이고, 바로 여기서 사람들이 헷갈립니다. 그 플러그인들은 오디오 파일이나 YouTube 링크를 사후에 텍스트로 변환해 줍니다. 유용하긴 하지만 실시간 받아쓰기는 아닙니다. 오늘 일기에 커서를 두고 말하면서 단어가 나타나는 걸 지켜볼 수는 없습니다. 그것들은 녹음물을 처리할 뿐, 당신이 생각하는 동안 대신 타이핑해 주지 않습니다. 이 둘을 혼동하면 한나절을 날리게 되는데, 저는 당신이 그 한나절을 아꼈으면 합니다.

모바일은 또 별개의 이야기라 한 문장 짚어두겠습니다. 엉뚱한 기기에서 좇지 않도록 말이죠. 비교적 최신의 Logseq 모바일 앱에는 음성 변환 기능이 일부 추가되었지만, 그건 폰에서의 기능이고, 폰에서라면 어차피 키보드의 마이크를 쓰면 됩니다. 대부분의 사람이 실제로 머무는 데스크톱 그래프에서는 Logseq 위에 얹어 작동하는 도구가 필요합니다. 솔직히 따져보면 세 가지 부류가 있고, 이 가이드의 나머지가 그것들을 다룹니다.

단축키를 누르고 말하면, 텍스트가 블록에 들어옵니다

이게 작동 원리의 전부이고, 가장 좋은 의미에서 시시합니다. 단축키를 누르고, 말하고, 손을 떼면, 받아쓴 글이 현재 포커스가 있는 텍스트 입력란의 커서 위치에 붙여넣어집니다. Whisper는 키에서 손을 뗀 뒤에도 잠깐 여운을 잡아두기 때문에 마지막 단어가 잘리지 않습니다. OS 커서 위치에 붙여넣기 때문에 Logseq 블록은 그저 "임의의 텍스트 상자"일 뿐입니다. 데스크톱 앱이든 브라우저 버전이든 동작은 같습니다.

랜딩 페이지들이 괜히 복잡하게 만드는 부분이 바로 이겁니다. Logseq에 설치할 플러그인도, 붙여넣을 API 토큰도, 챙겨야 할 동기화 작업도 없습니다. 블록에 커서를 두고 말하면, 단어가 블록에 나타납니다. 말하는 동안 작은 캡슐이 떠서 듣고 있다는 걸 알려줍니다:

Cancel
녹음 오버레이: 말하는 동안 나타나는 작은 캡슐로, Whisper가 듣고 있음을 알려줍니다.

단축키 하나만큼은 처음부터 제대로 잡아두는 게 좋습니다. Windows에서는 Ctrl+Space, Mac에서는 Command+Option으로, 말하는 동안 누르고 있는 수정 키 전용 푸시투토크입니다. 둘 다 이미 쓰고 있는 것과 충돌하면 설정에서 바꿀 수 있습니다. (제 막내딸이 그림 그리는 앱에서 어떤 단축키가 "안 된다"고 한 적이 있습니다. 버그가 아니라 충돌이었죠. 그때 저는 보통 사람은 단축키 충돌이라는 개념조차 모른다는 걸 배웠습니다. 그래서 이제 모든 단축키를 바꿀 수 있게 만들었습니다.) 혹시 Windows에서 받아쓰기Mac에서의 받아쓰기를 설정해 본 적이 있다면, 같은 손동작을 다른 앱에 겨눈 것뿐입니다.

2분 만에 설정하기 (Windows 또는 Mac)

Apple Silicon 기반 Mac이나 Windows 10 이상 PC, 작동하는 마이크, 그리고 데스크톱 앱이나 브라우저에서 열어둔 Logseq가 필요합니다. 로컬 파이프라인 전체는 로그인한 모든 계정에 무료이며, 가입 시 결제 수단을 묻지 않습니다. 순서는 이렇습니다.

1단계 — Whisper를 설치하고 로그인합니다.

다운로드 페이지에서 받아 설치하고 무료 계정을 만드세요. 카드는 필요 없습니다. 로컬 변환 파이프라인 전체가 곧바로 열립니다.

앱의 트레이 아이콘이 나타나고 설정 마법사가 모델을 고르라고 안내하면 제대로 된 것입니다.

2단계 — 변환 방식을 선택합니다.

앱이 대신 골라주지 않습니다. 세 가지가 있습니다: 클라우드(OpenAI, 본인 키 사용), 로컬 Parakeet, 로컬 Whisper. 비공개 일기 메모라면 로컬로 시작하세요. 이건 두 섹션 뒤에서 더 다룹니다.

모델 다운로드가 끝나고 준비 완료로 표시되면 제대로 된 것입니다.

3단계 — 단축키를 확인합니다.

Windows 기본값은 Ctrl+Space, Mac은 푸시투토크로 누르고 있는 Command+Option입니다. Mac에서는 안내가 나오면 손쉬운 사용(Accessibility) 권한을 허용하세요. 이 권한이 없으면 커서 위치 붙여넣기가 다른 앱에 닿지 못합니다.

테스트 녹음이 아무 텍스트 입력란에나 붙여넣어지면 제대로 된 것입니다.

4단계 — Logseq 블록에 커서를 두고 말합니다.

그래프를 열고 블록을 클릭한 뒤, 단축키를 누른 채 한 문장 말하고 손을 떼세요. 받아쓴 글이 커서가 있는 블록 위치에 나타납니다.

말한 문장이 Logseq 블록에 텍스트로 자리 잡으면 제대로 된 것입니다.

Whisper
설정 화면을 띄운 실제 Whisper 데스크톱 앱, 변환(Transcription)과 AI 패널이 열려 있는 모습.

느린 부분은 모델 다운로드일 뿐, 설정 자체가 아닙니다. 나머지는 위의 네 단계가 전부입니다. 일단 돌아가기 시작하면, 떠오른 생각을 그래프에 담는 일이 타이핑 작업이 아니라 말하기 작업으로 바뀝니다.

Windows에서 음성을 텍스트로 · Mac에서의 받아쓰기

Logseq 플러그인 대 시스템 전역 단축키

이 키워드로 상위에 노출되는 대부분의 글은 Logseq 플러그인이나 Blurt를 가리킵니다. Blurt는 아웃라인에 곧장 말로 입력하는 Mac 메뉴바 전용 도구죠. 둘 다 괜찮은 답이지만, 각각 구조적인 한계가 하나씩 있습니다. whisper 계열 플러그인은 편집 중인 블록에 실시간으로 말하는 게 아니라 오디오 파일을 변환합니다. 그리고 Blurt는 스스로 밝히듯 macOS 전용이라, Windows를 쓴다면 아예 선택지가 되지 못합니다.

시스템 전역 단축키는 두 한계를 모두 비껴갑니다. 어느 창이 가지고 있든 OS 커서 위치에 붙여넣기 때문에, Logseq 블록을 채우는 그 키가 Gmail 작성 창도, Slack 메시지도, 커밋 메시지도 똑같이 채웁니다. 도구 하나로 모든 텍스트 입력란을, Windows와 Mac 양쪽에서요. 앱을 바꿔도 새로 배울 게 없고, 노트북에 따라 다른 해결책을 챙길 필요도 없습니다.

Mac을 쓰면서 오직 Logseq 안에서만 메모한다면 Blurt는 깔끔하고 집중된 선택지이니 한번 살펴볼 만합니다. 하지만 Windows를 쓰는 순간, 또는 여는 모든 프로그램에서 같은 흐름을 원하는 순간, 시스템 전역 방식이 이깁니다. 저는 한 시간에 앱을 마흔 번쯤 갈아타기 때문에 단축키 하나를 택합니다. 외워야 할 받아쓰기 버튼이 마흔 개나 되는 건 사양하고 싶거든요.

로컬이냐 클라우드냐: 비공개 그래프에는 어느 쪽인가

Logseq라면 로컬 모드부터 시도해 보세요. 많은 사람이 애초에 Logseq를 택한 이유는 그것이 로컬 우선의 일반 텍스트이기 때문입니다. 회의 요약, 설익은 아이디어, 누군가의 서버에는 절대 올리고 싶지 않은 일기 한 줄 말이죠. 노트를 자기 디스크에 두기로 해놓고는, 그걸 채우려고 음성을 클라우드로 우회시키는 건 이상한 선택입니다. Mac이 Apple Silicon이거나 PC가 최근 몇 년 안에 나온 것이라면, 로컬이 일상적인 받아쓰기를 군말 없이 처리하고, 클라우드는 기본값이 아니라 비상구가 됩니다.

세 가지 방식이 어떻게 다른지 정리해 보겠습니다. 앱이 어차피 고르게 하니, 잘 고르셨으면 합니다:

  • 로컬 ParakeetNVIDIA의 TDT 엔진으로, 약 600 MB이며 가장 빠른 로컬 옵션입니다. CPU에서 Whisper보다 5~10배 빠릅니다. 영어를 포함해 유럽어 24개, 총 25개 언어를 지원합니다. 영어로 번역하는 기능은 없습니다. 영어나 다른 유럽어로 일기를 쓴다면, 이것이 빠르고 완전히 오프라인인 선택지입니다.
  • 로컬 Whisper같은 기기에서 Parakeet보다 느리지만, 다국어 빌드는 99개 언어를 지원하고 영어로 번역할 수 있습니다. 영어 전용 빌드는 말 그대로 영어 전용이고 99개 언어는 아닙니다. 중국어, 일본어, 한국어, 또는 Parakeet이 못 하는 번역 작업이라면 이걸 고르세요. 기본 영어 모델은 약 480 MB입니다.
  • 클라우드 (OpenAI, BYOK)정확도와 웹 접근이 가장 뛰어나며, 본인의 OpenAI 키를 사용해 OpenAI에서 직접 요금이 청구됩니다. 변환은 기본적으로 gpt-4o-mini-transcribe로 실행됩니다. 인터넷이 필요하므로, 당신의 기기를 떠나는 유일한 방식입니다. 클라우드 영역은 Whisper Pro의 일부입니다.

시시하지만 진실은, 대부분의 사람이 Logseq에 넣는 종류의 글에는 로컬로도 차고 넘친다는 것입니다. 두 로컬 엔진 모두 서버로 아무것도 보내지 않고 기기에서 완전히 돌아가는데, 이것이 로컬 우선 그래프의 핵심 그 자체입니다. 클라우드는 까다로운 녹음에서 최고 수준의 정확도를 원하거나, 문장 중간에 모델이 웹에서 사실을 끌어와야 할 때 제값을 합니다. 매일 일기를 쓰는 습관이라면 로컬로 시작하고, 로컬이 아쉬울 때만 클라우드로 손을 뻗으세요.

구두점, 블록, 그리고 음성으로 Logseq 마크다운 작성하기

다듬지 않은 받아쓰기는 끊김 없는 한 덩어리로 나옵니다. "좋아 그럼 아키텍처 문서 검토하고 프로젝트 알파 태그 달고 목요일에 알려줘"라고 말하면, 어떤 음성 엔진이든 구두점 없는 그 벽을 건네줍니다. 이걸 정리하는 지점에서 방식이 갈립니다.

Windows 음성 입력은 말하는 동안 구두점을 붙여주고, macOS 받아쓰기는 "쉼표"나 "마침표"라고 말하면 기본 구두점을 처리합니다. 더 무거운 정리—"음" 같은 군더더기 빼기, 끊김 고치기, 말한 문단을 그래프에 실제로 간직할 만한 글로 바꾸기—를 위해서는 Whisper가 AI 보정을 한 번 돌려줄 수 있습니다. 활성화 문구 "Hey whisper"라고 말하면, 텍스트가 들어오기 전에 다듬어집니다. 로컬 모델에서는 Ollama를 통해 돌아가고, 클라우드 모드에서는 기본적으로 gpt-5-mini입니다.

Thinking...
원본

좋아 그럼 아키텍처 문서 검토하고 프로젝트 알파 태그 달고 목요일에 알려줘 음 스탠드업 전에

정리됨

좋아, 그럼 아키텍처 문서를 검토하고, 프로젝트 알파 태그를 달고, 목요일 스탠드업 전에 알려줘.

Logseq 고유의 구조—중첩 블록, #태그와 [[페이지]] 링크, TODO 표시—에 대해 솔직히 말하자면, 음성은 텍스트를 가져다주고 Logseq 자체의 문법이 구조를 만들어 줍니다. 문장을 받아쓰게 한 뒤, 늘 하던 대로 Tab으로 들여쓰고, # 으로 태그를 달고, [[ 로 페이지 링크를 거세요. 어떤 받아쓰기 도구도 명령 한마디로 Logseq의 아웃라인 문법을 불러내지 못합니다. "프로젝트 알파 태그라고 말하면 링크가 걸린다"고 약속하는 사람은 평범한 화요일이 아니라 데모를 파는 것입니다. 음성으로 단어를 빠르게 받아두고, 이미 아는 키로 블록을 빚으세요.

말하고-다듬는 그 흐름은 그래프를 훌쩍 넘어서도 톡톡히 값을 합니다. 단축키 하나로 어떤 앱에나 깔끔한 글을 받아쓸 수도 있어서, 길게 타이핑할 문단이 짧게 말한 몇 문장으로 바뀝니다.

Logseq에서 받아쓰기 도구를 건너뛰어도 될 때

포장 도로에 분필로 그린 서로 다른 방향을 가리키는 두 화살표, 도구 선택을 비유하는 장면

때로는 정답이 이미 당신 기기에 들어 있는 무료 도구이고, 그렇지 않은 척하는 건 정직하지 못합니다. Logseq에 짧은 메모만 떨어뜨린다면—빠른 일기 한 줄, 두 단어짜리 알림—운영체제가 공짜로 해결해 줍니다.

Windows에서는 Windows 키 + H를 누르면 내장 음성 입력 바가 커서가 있는 곳—Logseq 블록 포함—에 열립니다. 알아서 구두점을 찍고 짧은 입력에는 충분합니다. 단점: Microsoft 서버를 거치고 인터넷 연결이 필요해서 오프라인 옵션이 아니라는 점인데, 그래프의 핵심이 로컬을 지키는 것일 때는 이게 평소보다 더 중요해집니다. Mac에서는 받아쓰기로 타이핑할 수 있는 어디서나 말로 텍스트를 입력할 수 있고, 시스템 설정의 키보드에서 설정하며, Apple Silicon에서는 일반 텍스트를 기기에서 처리할 수 있습니다. 그리고 Logseq 안에서만 사는 Mac 사용자라면, Blurt는 바로 그 용도로 만들어진 집중된 네이티브 선택지입니다.

내장 기능이 버겁게 느껴지기 시작할 때—긴 메모, 다국어 작업, Windows에서의 오프라인 프라이버시, 또는 Logseq와 이메일과 에디터에서 똑같이 작동하는 단축키 하나가 필요할 때—전용 시스템 전역 도구로 손을 뻗으세요. 그 기준 아래라면 무료인 것을 쓰세요. 한 줄짜리 알림을 위해 앱을 설치하라고는 하지 않겠습니다.

다른 곳에도 메모를 한다면 같은 득실 계산이 그대로 적용됩니다. Obsidian에 받아쓰기의 논리도 똑같습니다. 둘 다 로컬 우선 마크다운 앱이고, 진짜 연동은 플러그인이 아니라 커서이기 때문입니다.

더 읽어보기

Logseq는 마이크 버튼을 내놓은 적이 없고, 이 글을 쓰고 나니 앞으로도 내놓지 않을 거라고 꽤 확신합니다. 그럴 필요가 없거든요. 연동은 곧 커서이니까요. 블록에 말하고, 텍스트를 받고, 이미 아는 문법으로 다듬으세요. 저는 이 가이드의 대부분을 Logseq가 아닌 텍스트 상자에, 어느 상자든 신경 쓰지 않는 도구로 받아쓴 다음, 그 전부를 제 그래프에 붙여넣었습니다. 그게 비결의 전부입니다.

다음 Logseq 블록에서 한번 써보세요

단축키를 누른 채 말하고 손을 떼세요. 받아쓴 글이 커서가 있는 블록에—그리고 다른 모든 앱에도—들어옵니다.

로그인한 모든 계정에 무료 로컬 모드. 시작하는 데 카드가 필요 없습니다.

Denys Medvediev의 사진

Denys Medvediev

저는 우리 고객지원 이메일을 읽는 사람입니다. 답장도 십중팔구 받아쓰기로 쓰고 있죠.