작성자: Denys Medvediev

가이드

음성을 텍스트로 메모 작성에 활용하기

타이핑 대신 말로 메모를 남기세요. 시스템 전역 단축키 하나면 어떤 메모 앱이든 커서 위치에 말한 내용이 그대로 붙습니다 — Notion, Obsidian, Apple Notes, OneNote, 일반 텍스트까지. 앱을 오갈 필요도, 앱마다 플러그인을 깔 필요도 없습니다. 마구 쏟아낸 생각은 그 뒤에 AI가 깔끔하게 정리해 줍니다.

마지막 업데이트: 2026년 6월

어두운 책상 위 노트북 옆에 펼쳐진 노트와 펜, 메모와 받아쓰기를 연상시키는 모습

메모를 위한 음성-텍스트 변환은 메모 앱 자체가 아니라 시스템 전역 도구로 동작합니다. 단축키를 누르고 말하면, 포커스가 있는 앱이 무엇이든 커서 위치에 받아쓴 내용이 붙습니다 — Notion, Obsidian, Apple Notes, OneNote, 일반 텍스트 파일까지. 로컬 모델로는 오프라인에서 무료로 돌아가고, 말로 쏟아낸 초안은 AI가 다듬어 줍니다.

메모란 대부분 그저 몇 단계가 더 붙은 타이핑일 뿐입니다. 어떤 생각이 떠오르면 앱을 열고, 알맞은 페이지를 찾고, 그 생각을 입력하는데 — 손가락이 따라잡을 즈음이면 그 생각은 이미 절반쯤 증발해 있죠. 제가 찾은 가장 빠른 방법은, 생각이 떠오른 바로 그 순간 마침 열려 있는 창에 대고 소리 내어 말하고, 그 말이 텍스트로 내려앉게 두는 것입니다.

사람들은 "메모용 음성-텍스트"를 검색하면서 받아쓰기가 가장 좋은 앱 하나를 고르려 합니다. 잘못된 질문이에요. 데스크톱에서 받아쓰기가 제대로 되는 메모 앱은 거의 없고, 그나마 되는 것들도 자기 안에서만 작동합니다. 어디서나 똑같이 작동하는 건 앱의 기능이 아닙니다. 커서 위치에 붙여 주는 단축키이고, 커서는 자기가 어떤 메모 앱에 들어 있는지 신경 쓰지 않죠.

이 키워드 주변을 빙빙 도는 대부분의 글이 분명하게 말하지 않는 부분이 여기 있습니다. 어떤 앱이든 메모 한 줄은 결국 텍스트 입력칸입니다. Notion의 에디터도 텍스트 입력칸이고, Obsidian의 노트도 텍스트 입력칸입니다. Apple Notes, OneNote, Stickies 창, 아무 에디터로 연 .txt 파일 — 전부 텍스트 입력칸이에요. 커서 위치에 붙여 주는 받아쓰기는 그게 어떤 입력칸인지 신경 쓰지 않습니다.

그러니 진짜 질문은 "어떤 메모 앱이 음성 입력이 제일 좋은가"가 아닙니다. "그 모든 앱 위에 어떤 받아쓰기 도구를 얹어 쓸 것인가"죠. 답은 시스템 전역에서 작동하고, 원한다면 오프라인으로 돌아가며, 말로 흩뜨린 내용을 나중에 정리해 주는 도구입니다. 이 글에서는 그 이유와 방법, 2분 만에 끝나는 설정, 각 메모 앱에 어떻게 녹아드는지, 그리고 — 아무도 쓰지 않는 부분인 — 전용 도구를 아예 건너뛰어도 되는 때까지 보여드리겠습니다.

메모를 타이핑하지 말고 말로 하는 이유

노트북 옆 종이 노트에 빠르게 메모를 적는 손, 재빠른 아이디어 포착을 연상시키는 모습

메모 앱이 실제로 하는 일은 떠오른 아이디어가 사라지기 전에 붙잡는 것입니다. 병목은 앱이 아니에요. 생각이 떠오른 순간과 그걸 적어 내려가는 순간 사이의 틈이죠. 대부분의 사람이 타이핑하는 속도는 분당 약 40단어입니다. 말하는 속도는 약 145단어죠. 작은 차이가 아니라, 아이디어를 통째로 붙잡느냐 키보드까지 가는 동안 살아남은 절반만 붙잡느냐의 차이입니다.

받아쓰기는 그 틈을 두 가지 방식으로 메웁니다. 첫째는 순수한 속도 — 메모 한 문단이 1분의 타이핑이 아니라 15초의 말하기가 됩니다. 둘째는 더 조용하지만 더 중요한데, 손이 바쁠 때도 붙잡을 수 있게 해 준다는 점입니다. 화이트보드 앞에 서 있을 때, 개를 산책시킬 때, 아이들을 재우고 설거지를 하다가 하루 중 유일하게 괜찮은 아이디어가 마침내 찾아올 때. 메모하려고 자리에 앉을 필요가 없습니다. 그냥 말하면 됩니다.

손 자체의 문제도 있죠. 오후 3시면 손목이 뻐근해진다면, 메모를 받아쓰는 것은 타건 수를 늘리지 않고 계속 일하는 방법입니다. 이걸 무슨 의학적인 일처럼 포장하지는 않겠습니다 — 그저 생산성 이야기예요. 타건은 줄고, 메모는 그대로. 긴 작업 세션이라면, 끝났을 때 손이 멀쩡한 것만으로도 충분한 이유가 됩니다.

단축키 누르고, 말하면, 텍스트가 메모에 내려앉습니다

이게 전부이고, 가장 좋은 의미로 심심한 동작입니다. 단축키를 누르고, 말하고, 떼면, 받아쓴 내용이 포커스가 있는 텍스트 필드의 커서 위치에 붙습니다. Whisper는 키를 뗀 뒤에도 짧은 꼬리를 잡아 두기 때문에 마지막 단어가 잘리지 않습니다. OS 커서 위치에 붙기 때문에 Notion 블록, Obsidian 노트, Apple Notes 카드가 전부 그저 "아무 텍스트 입력칸"이 됩니다. 같은 키, 같은 동작, 모든 앱에서요.

랜딩 페이지들이 괜히 복잡하게 만드는 부분이 여기예요. 메모 앱에 설치할 플러그인도, 붙여 넣을 API 토큰도, 신경 써서 돌릴 동기화 작업도 없습니다. 커서가 메모 안에 있고, 말을 하면, 그 말이 메모에 나타납니다. 말하는 동안 작은 캡슐이 떠서 잘 듣고 있다는 걸 알려 줍니다:

Cancel
녹음 오버레이: 말하는 동안 나타나는 작은 캡슐로, Whisper가 듣고 있다는 걸 알려 줍니다.

단축키 하나만큼은 처음부터 제대로 잡아 두는 게 좋습니다. Windows에서는 Ctrl+Space, Mac에서는 Command+Option — 말하는 동안 누르고 있는 수정자 전용 푸시투토크입니다. 둘 다 이미 쓰던 것과 겹치면 설정에서 바꿀 수 있습니다. (제 막내딸이 그림 앱에서 단축키가 "안 된다"고 한 적이 있어요. 버그가 아니라 충돌이었죠. 보통 사람은 단축키 충돌이 뭔지조차 모른다는 걸 그때 배웠습니다. 그래서 지금은 모든 단축키를 바꿀 수 있게 해 뒀어요.) 혹시 Windows에서 받아쓰기 또는 Mac에서 받아쓰기를 설정해 본 적이 있다면, 그 똑같은 손버릇을 모든 앱에 한꺼번에 겨눈 것일 뿐입니다.

2분 만에 설정하기 (Windows 또는 Mac)

Apple Silicon Mac이거나 Windows 10 이상 PC, 작동하는 마이크, 그리고 열려 있는 메모 앱 — 어느 것이든 — 이 필요합니다. 로컬 파이프라인 전체는 로그인한 계정이라면 누구에게나 무료이고, 가입 시 결제 수단을 요구하지 않습니다. 순서는 이렇습니다.

1단계 — Whisper 설치하고 로그인하기.

다운로드 페이지에서 받아 설치하고 무료 계정을 만드세요. 카드는 필요 없습니다. 로컬 받아쓰기 파이프라인 전체가 곧바로 열립니다.

앱의 트레이 아이콘이 나타나고 설정 마법사가 모델을 고르라고 안내하면 제대로 된 것입니다.

2단계 — 받아쓰기 경로 고르기.

앱이 대신 골라 주지 않습니다. 세 가지가 있습니다: 클라우드(OpenAI, 본인 키 사용), 로컬 Parakeet, 또는 로컬 Whisper. 비공개 메모라면 로컬로 시작하세요 — 자세한 건 두 섹션 아래에서.

모델 하나가 다운로드를 마치고 준비됨으로 표시되면 제대로 된 것입니다.

3단계 — 단축키 확인하기.

Windows는 기본값이 Ctrl+Space, Mac은 푸시투토크로 누르고 있는 Command+Option입니다. Mac에서는 안내가 뜨면 손쉬운 사용 권한을 허용하세요. 이게 없으면 커서 위치 붙여넣기가 다른 앱에 닿지 못합니다.

테스트 녹음이 아무 텍스트 필드에 붙으면 제대로 된 것입니다.

4단계 — 메모에 커서를 두고 말하기.

쓰는 메모 앱을 열고, 메모를 클릭해 들어간 뒤, 단축키를 누른 채 한 문장 말하고 떼세요. 받아쓴 내용이 커서가 있는 곳에 나타납니다.

말한 문장이 텍스트로 메모에 들어와 있으면 제대로 된 것입니다.

Whisper
받아쓰기와 AI 패널이 열려 있는 설정 화면의 실제 Whisper 데스크톱 앱.

오래 걸리는 건 모델 다운로드이지 설정이 아닙니다. 나머지는 전부 위의 네 단계가 다예요. 일단 돌아가기 시작하면, 어떤 메모 앱에든 생각을 담는 일이 타이핑 작업에서 말하기 작업으로 바뀝니다.

Windows에서 음성-텍스트 · Mac에서

Notion, Obsidian, Apple Notes, OneNote — 단축키 하나로

시스템 전역 단축키가 앱별 기능을 이기는 이유는, 다시 익힐 필요가 없기 때문입니다. 자체 받아쓰기를 가진 몇 안 되는 메모 앱들도 자기 안에서만 작동하고, 대부분은 데스크톱에서 아예 받아쓰기가 없습니다. 커서 위치에 붙여 주는 단축키 하나면, 오늘 아침 어떤 앱을 열었든 흐름이 똑같습니다.

Notion에서는 아무 블록이나 데이터베이스 필드를 클릭해 들어가 키를 누른 채 말하면 — 텍스트가 블록에 떨어집니다. Obsidian에서는 노트에 커서를 두면 그 말이 마크다운에 내려앉는데, 타이핑할 때와 똑같죠. Apple Notes와 OneNote 둘 다 평범한 텍스트 영역을 가지고 있어서 커서가 거기서도 받아쓴 내용을 잡아냅니다. 아무 에디터로 연 일반 .txt 파일도 됩니다 — 커서 위치 붙여넣기 도구에게 텍스트 파일은 화려한 에디터와 다를 게 없으니까요. 앱별 따라 하기는 Notion에 받아쓰기Obsidian에 받아쓰기에서 같은 흐름으로 다룹니다.

여기에 공짜로 얻는 생산성 한 수가 숨어 있습니다. 대부분의 사람은 메모를 두세 개 앱에 나눠 둡니다 — 업무 메모는 한 곳, 개인 메모는 다른 곳, 빠른 기록은 또 다른 곳. 앱별 도구라면 앱마다 음성 지원이 있어야 하고, 매번 버튼을 바꿔 가며 써야 하죠. 단축키라면 똑같은 동작 하나가 전부를 채우고, 메일과 채팅 앱까지 채웁니다 — 왜냐하면 음성 입력은 사실 메모 앱에 관한 게 아니라 커서에 관한 것이니까요. 저는 한 시간에 앱을 마흔 번쯤 오가는데, 마흔 개의 서로 다른 받아쓰기 버튼을 외우고 싶지는 않습니다.

로컬이냐 클라우드냐: 비공개 메모엔 어느 모드

메모라면 로컬 모드를 먼저 써 보세요. 메모 앱에 들어가는 것 중 상당수는 남의 서버에는 절대 두고 싶지 않은 바로 그런 것들입니다 — 채 영글지 않은 아이디어, 연봉 숫자, 까다로운 메일의 초안, 어떤 사람에 대한 생각. 그 모든 걸 로컬 메모 파일에 보관하면서 목소리만 클라우드로 우회시켜 거기까지 보내는 건 이상한 선택이겠죠. Mac이 Apple Silicon이거나 PC가 최근 몇 년 안의 것이라면, 로컬이 일상적인 메모 기록을 군말 없이 처리하고, 클라우드는 기본값이 아니라 비상구가 됩니다.

세 경로가 어떻게 다른지 정리하겠습니다. 앱이 고르게 하니, 잘 고르셨으면 해서요:

  • 로컬 ParakeetNVIDIA의 TDT 엔진으로 약 600 MB이며, 가장 빠른 로컬 옵션입니다 — CPU에서 Whisper보다 5~10배 빠릅니다. 영어에 더해 24개 유럽 언어, 총 25개를 지원합니다. 영어 번역 기능은 없습니다. 영어나 다른 유럽 언어로 메모한다면, 완전히 오프라인으로 돌아가는 빠른 선택입니다.
  • 로컬 Whisper같은 기기에서 Parakeet보다 느리지만, 다국어 빌드는 99개 언어를 지원하고 영어로 번역할 수 있습니다. 영어 전용 빌드는 99개가 아니라 영어 전용입니다. 중국어, 일본어, 한국어, 또는 Parakeet이 못 하는 모든 번역 작업에는 이걸 고르세요. 기본 영어 모델은 약 480 MB입니다.
  • 클라우드 (OpenAI, BYOK)정확도와 웹 접근이 가장 뛰어나며, 본인 OpenAI 키를 사용해 OpenAI가 직접 청구합니다. 받아쓰기는 기본적으로 gpt-4o-mini-transcribe로 돌아갑니다. 인터넷이 필요해서, 기기를 벗어나는 유일한 경로입니다. 클라우드 영역은 Whisper Pro의 일부입니다.

심심한 진실은, 대부분의 사람이 메모에 넣는 종류의 텍스트라면 로컬로 충분하다는 것입니다. 두 로컬 엔진 모두 서버로 아무것도 보내지 않고 기기에서 온전히 돌아가는데, 메모가 비공개라면 바로 그게 핵심이죠. 클라우드는 까다로운 녹음에서 최상급 정확도를 원하거나 말하는 도중에 모델이 웹에서 사실 하나를 끌어와야 할 때 제값을 합니다. 매일의 메모 습관이라면 로컬로 시작하고, 로컬이 아쉬울 때만 클라우드로 손을 뻗으세요.

말로 쏟아낸 생각을 깔끔한 메모로 바꾸기

날것의 받아쓰기는 마침표 없이 줄줄 이어진 문장으로 나옵니다. "자 출시 관련해서 세 가지 첫째 가격 페이지 둘째 베타 명단에 메일 셋째 인쇄소에 전화하라고 알려 줘"라고 말하면, 어떤 음성 엔진이든 그 구두점 없는 벽을 그대로 건네줍니다. 말로 쏟아낸 생각은 만들기는 빠르고 읽기는 흉합니다. 그걸 정리하는 데서 경로가 갈립니다.

Windows 음성 입력은 말하는 대로 구두점을 붙이고, macOS 받아쓰기는 "쉼표"나 "마침표"라고 말하면 기본 구두점을 처리합니다. 더 무거운 정리 — "음" 빼기, 줄줄 이어진 문장 고치기, 말한 문단을 실제로 간직할 만한 것으로 바꾸기 — 가 필요하면 Whisper가 AI 패스를 돌릴 수 있습니다. 활성화 문구 "Hey whisper"라고 말하면, 텍스트가 내려앉기 전에 다듬어집니다. 로컬 모델에서는 Ollama를 통해 돌아가고, 클라우드 모드에서는 기본값이 gpt-5-mini입니다.

Thinking...
날것

자 출시 관련해서 세 가지 첫째 가격 페이지 둘째 베타 명단에 메일 셋째 인쇄소에 전화하라고 알려 줘 음 금요일 전까지

정리됨

출시 관련 세 가지: 첫째, 가격 페이지; 둘째, 베타 명단에 메일 보내기; 셋째, 금요일 전에 인쇄소에 전화하라고 알려 주기.

이제 솔직한 한계입니다. 받아쓰기는 단어를 줍니다 — 깔끔하고 구두점 찍힌 단어를요. 메모 앱의 구조를 주지는 않습니다. 정리 패스가 줄줄 이어진 문장을 깔끔한 문장으로 바꿀 수는 있어도, Notion 토글을 만들거나, Obsidian 글머리를 들여쓰거나, OneNote 체크박스를 표시하거나, 제목 서식을 입히지는 못합니다. 그건 각 앱 고유의 단축키가 하는 일이죠. 문장을 받아쓴 다음, Tab을 눌러 중첩하고, 원하는 구조를 위해 늘 하던 대로 # 이나 - 를 입력하세요. "체크리스트 만들어 라고 말하면 알아서 서식이 잡히는 걸 보세요"라고 약속하는 사람은 화요일의 현실이 아니라 데모를 파는 겁니다. 단어는 말로 빠르게 적어 내려가고, 메모의 모양은 이미 아는 키로 잡으세요.

이 말하고-정리하는 흐름은 메모 작성을 훌쩍 넘어 제값을 합니다 — 단축키 하나로 어떤 앱에든 깔끔한 글을 받아쓸 수 있어서, 긴 메모가 타이핑하는 한 문단이 아니라 말로 한 몇 문장이 됩니다.

메모에 받아쓰기 도구를 건너뛰어야 할 때

보도에 분필로 서로 다른 방향을 가리키는 두 화살표, 도구 선택을 비유하는 모습

때로는 전용 받아쓰기 도구가 잘못된 답이고, 아닌 척하는 건 정직하지 못한 일입니다. 두 경우가 자주 나오는데, 둘 다 저라면 다른 곳을 가리킬 겁니다.

첫째는 나중에 옮겨 적으려고 회의나 강의를 녹음하는 것입니다. 그건 다른 일이에요. 받아쓰기는 말하는 내용을 실시간으로 커서에 입력합니다. 구석에 앉아 여러 사람의 90분짜리 대화를 담았다가 나중에 화자 표시가 된 전사본을 건네지는 않습니다. 그런 일에는 그걸 위해 만들어진 전사 도구 — 다중 화자, 회의 후 요약, 그 일체 — 가 필요합니다. 방 안을 녹음하겠다고 받아쓰기 단축키로 손을 뻗지 마세요. 모양이 안 맞습니다. 둘째는 휴대폰에서의 빠른 기록입니다. Whisper는 데스크톱 전용 — Windows와 macOS — 이라, 줄 서 있다가 생각이 떠오르면 휴대폰 키보드에 내장된 마이크가 이미 어떤 메모 앱에든 무료로 받아씁니다. 그걸 쓰세요. 휴대폰에서 한 줄 적은 기록을 위해 데스크톱 도구를 설치하라고는 하지 않겠습니다.

그리고 데스크톱에서의 짧은 메모라면, 내장 기능으로 충분합니다. Windows에서는 Windows 키 + H가 커서가 있는 곳 어디든 음성 입력을 열고 알아서 구두점을 찍습니다 — 단점은 Microsoft 서버를 거치며 인터넷이 필요해서 오프라인이 아니라는 점이죠. Mac에서는 받아쓰기가 아무 텍스트 필드에서 작동하는데, 시스템 설정의 키보드에서 설정하고, Apple Silicon에서는 일반 텍스트를 기기 내에서 처리할 수 있습니다. 내장 기능이 아쉬워지기 시작하면 시스템 전역 도구로 손을 뻗으세요: 긴 메모, 다국어 기록, Windows에서의 오프라인 비공개, 또는 모든 메모 앱에서 똑같이 동작하는 단축키 하나를 원할 때요. 그 선 아래라면, 공짜인 걸 쓰세요.

받아쓰기 대부분이 특정 앱 하나로 흘러간다면, Obsidian에 받아쓰기 집중 따라 하기가 로컬 우선 마크다운 앱 하나에 대해 같은 커서가-곧-통합 논리를 다룹니다.

더 읽어보기

어떤 메모 앱도 멋진 마이크 버튼을 만들 필요가 없습니다. 통합은 커서니까요. 메모에 대고 말하고, 텍스트를 얻고, 이미 아는 단축키로 모양을 잡으세요. 저는 이 가이드의 대부분을 텍스트 입력칸에 대고 받아썼습니다 — 어떤 입력칸인지 신경 쓰지 않는 도구로요 — 그러고는 그 전부를 제 메모에 붙였죠. 그 도구가 못 한 단 한 가지는 저 대신 메모를 정리해 주는 것이었는데, 그건 아마 다행일 겁니다.

다음 메모는 말로 남기세요

단축키를 누르고, 말하고, 떼세요. 받아쓴 내용이 커서가 있는 어떤 메모에든 내려앉습니다 — Notion, Obsidian, Apple Notes, OneNote, 일반 텍스트, 그리고 다른 모든 앱까지.

로그인한 계정이라면 누구나 로컬 모드 무료. 시작에 카드가 필요 없습니다.

Denys Medvediev의 사진

Denys Medvediev

저는 우리 지원 메일을 읽는 사람입니다 — 십중팔구 답장도 받아쓰기로 하고 있을 거예요.