작성자: Denys Medvediev

가이드

음성을 텍스트로 Substack 편집기에서

Substack의 글 편집기에는 받아쓰기 기능이 내장되어 있지 않습니다. 오디오 기능은 완성된 글을 읽어 줄 뿐, 글을 쓰는 데는 도움이 되지 않죠. 해결책은 시스템 전체에서 작동하는 도구입니다. 단축키를 누르고 말하면, 편집기 안 커서 위치에 단어가 그대로 들어옵니다.

마지막 업데이트: 2026년 6월

커피를 옆에 둔 채 어두운 책상의 노트북 앞에서 말로 글을 작성하는 작가

Substack 편집기에서의 음성-텍스트 변환은 Substack 자체가 아니라 시스템 전체에서 작동하는 도구를 통해 이루어집니다. Substack 글 편집기에는 받아쓰기 기능이 없고, 오디오 옵션은 완성된 글을 읽어 줄 뿐입니다. Whisper 같은 도구가 이를 해결합니다. 단축키를 누르고 말하면 받아쓴 내용이 편집기 커서 위치에 붙여넣어지고, 이어서 AI가 두서없는 말을 깔끔하게 다듬어 줍니다.

저는 작은 뉴스레터를 운영하는데, 제 가장 좋은 문단들은 대부분 키보드 앞에 앉아 있을 때가 아니라 강아지를 산책시킬 때 떠오릅니다. 그래서 초고를 말로 곧장 Substack 편집기에 넣을 방법을 찾아 나섰죠. Substack의 음성 해설(voiceover) 기능에 관한 글은 많이 찾았습니다. 하지만 제가 실제로 원했던 것, 즉 그 반대 방향에 관한 글은 하나도 없었습니다.

거의 모든 검색 결과가 걸려 넘어지는 혼동이 여기 있습니다. Substack은 완성된 글을 기꺼이 오디오로 바꿔 줍니다. 하지만 오디오를 글로 바꿔 주지는 않죠. 이 둘은 정반대 방향이며, 두 번째인 초고 받아쓰기는 편집기 어디에도 버튼이 없습니다. 해결책은 Substack 바깥에 있고, 설정에 약 2분이면 충분하며, 여러분이 글을 쓰는 다른 모든 앱에서도 똑같이 작동합니다.

음성 해설 관련 글들이 묻어 두는 핵심은 이것입니다. Substack 글 편집기는 브라우저 안의 서식 있는 텍스트 상자로, Gmail 작성 창이나 Google Docs와 같은 종류입니다. 커서 위치에 붙여넣는 받아쓰기는 그것이 어떤 상자에 입력되는지 신경 쓰지 않습니다.

그러니 진짜 질문은 "Substack에서 받아쓰기를 어떻게 켜지"가 아닙니다. 그런 스위치는 없고, 자꾸 찾게 되는 오디오 메뉴는 정반대 일을 합니다. 진짜 질문은 "Substack 편집기 위에서 어떤 받아쓰기 도구를 돌릴까"이며, 답은 무료에 기본 내장된 것을 원하는지, 아니면 어디서나 똑같이 작동하는 오프라인 단축키 하나를 원하는지에 따라 달라집니다. 제가 전부 짚어 드리고, 2분 안에 하나를 설정해 보이고, 전용 도구를 건너뛰어도 되는 때도 알려 드리겠습니다.

Substack 편집기에 받아쓰기 기능이 있을까요?

노트북 앞에서 생각에 잠겨 말하는 사람으로, 타이핑 대신 음성으로 초고를 작성하는 모습을 보여 줍니다

없습니다. Substack 글 편집기에는 음성으로 초고를 작성할 수 있는 음성-텍스트 변환, 받아쓰기, 음성 입력 기능이 내장되어 있지 않습니다. 대신 타이핑해 주는 마이크 버튼도, 음성 명령도, 숨겨진 설정도 없습니다. 편집기 도구 모음을 샅샅이 뒤지고 계셨다면, 이제 멈추셔도 됩니다. 거기엔 없습니다.

거기 있는 것은, 그리고 모든 검색 결과가 대신 자꾸 건네주는 것은, 헤드폰 아이콘 뒤에 있는 오디오 메뉴입니다. 그건 음성 해설(voiceover)과 텍스트 음성 변환(text-to-speech)입니다. 음성 해설은 이미 써 놓은 글을 직접 읽어 녹음하거나 오디오 파일을 올려 구독자가 들을 수 있게 해 줍니다. 일부 퍼블리케이션에서 제공되는 텍스트 음성 변환은 합성 음성이 완성된 글을 소리 내어 읽어 줍니다. 둘 다 텍스트를 받아 오디오를 만듭니다. 받아쓰기는 정확히 그 반대입니다. 음성을 받아 텍스트를 만들죠. 둘 다 마이크가 들어가고 "음성"이라는 단어가 붙다 보니 사람들이 이 둘을 혼동하고, 그 혼동 때문에 오후 한나절을 검색에 날립니다. 저는 여러분이 그 오후를 건너뛰셨으면 합니다.

이 구분이 중요한 이유는, 어디를 봐야 할지를 알려 주기 때문입니다. 오디오 패널을 아무리 오래 들여다봐도 Substack 안에서는 받아쓰기를 찾지 못합니다. 애초에 거기 만들어진 적이 없으니까요. 편집기는 타이핑을 기대하는 텍스트 상자입니다. 여러분의 음성을 그 안으로 넣으려면, 브라우저 위에 올라앉아 커서가 있는 곳으로 텍스트를 흘려보내는 도구가 필요합니다. 정직한 길은 두 가지이며, 이 가이드의 나머지가 둘 다 다룹니다.

단축키를 누르고 말하면, 편집기에 단어가 나타납니다

이게 전체 작동 원리이고, 가장 좋은 의미에서 지루합니다. 단축키를 누르고, 말하고, 떼면, 받아쓴 내용이 포커스가 가 있는 텍스트 필드의 커서 위치에 붙여넣어집니다. Whisper는 키에서 손을 뗀 뒤에도 잠깐의 여운을 잡아 두기 때문에 마지막 단어가 잘리지 않습니다. OS 커서 위치에 붙여넣기 때문에 Substack 편집기는 그냥 "아무 텍스트 상자"일 뿐입니다. 연동할 API도, 플러그인 자리도 없는 웹 편집기지만, 받아쓰기는 Substack의 코드를 전혀 건드리지 않기 때문에 그건 문제가 되지 않습니다. 이미 입력하고 있는 그 자리에 입력해 줄 뿐입니다.

이것이 바로 랜딩 페이지들이 지나치게 복잡하게 만드는 부분입니다. Substack에 설치할 것도, 퍼블리케이션 설정에 붙여넣을 토큰도, 승인할 연동도 없습니다. 커서가 편집기에 있고, 말하면, 편집기에 단어가 나타납니다. 말하는 동안 작은 캡슐이 떠서 듣고 있다는 걸 알려 줍니다:

Cancel
녹음 오버레이: 말하는 동안 나타나는 작은 캡슐로, Whisper가 듣고 있다는 걸 알려 줍니다.

처음부터 제대로 맞춰 둘 가치가 있는 한 가지는 단축키입니다. Windows에서는 Ctrl+Space이고, Mac에서는 Command+Option으로, 말하는 동안 누르고 있는 수정 키만으로 된 푸시투토크입니다. 둘 다 이미 쓰는 것과 충돌하면 설정에서 바꿀 수 있습니다. (제 작은딸이 언젠가 그림 앱에서 단축키가 "작동하지 않는다"고 한 적이 있어요. 버그가 아니라 충돌이었죠. 그렇게 저는 보통 사람은 단축키 충돌이 뭔지조차 모른다는 걸 배웠습니다. 그래서 이제 모든 단축키를 바꿀 수 있게 해 두었습니다.) 만약 Windows에서 받아쓰기Mac에서 설정해 본 적이 있다면, 이건 똑같은 손가락 감각을 여러분의 뉴스레터로 향하게 한 것뿐입니다.

2분 만에 설정하기 (Windows 또는 Mac)

Apple Silicon이 탑재된 Mac이나 Windows 10 이상 PC, 작동하는 마이크, 그리고 화면에 초고가 열린 채 브라우저에 띄워진 Substack이 필요합니다. 로컬 파이프라인 전체는 로그인한 모든 계정에 무료이며, 가입 시 결제 수단을 묻지 않습니다. 순서는 이렇습니다.

1단계 — Whisper를 설치하고 로그인하세요.

다운로드 페이지에서 받아 설치하고, 무료 계정을 만드세요. 카드는 필요 없습니다. 로컬 변환 파이프라인 전체가 바로 열립니다.

앱의 트레이 아이콘이 나타나고 설정 마법사가 모델을 고르라고 안내하면 제대로 된 것입니다.

2단계 — 변환 경로를 고르세요.

앱이 대신 골라 주지 않습니다. 세 가지 중에서 고르게 됩니다: Cloud(OpenAI, 본인 키 사용), Local Parakeet, Local Whisper. 자기 컴퓨터에서 글 초고를 쓰는 용도라면 로컬로 시작하세요. 자세한 내용은 두 섹션 아래에서 다룹니다.

모델 다운로드가 끝나고 준비됨으로 표시되면 제대로 된 것입니다.

3단계 — 단축키를 확인하세요.

Windows는 기본값이 Ctrl+Space, Mac은 Command+Option을 푸시투토크로 누르고 있는 방식입니다. Mac에서는 안내가 뜨면 손쉬운 사용(Accessibility) 권한을 허용하세요. 권한이 없으면 커서 위치 붙여넣기가 브라우저에 닿지 못합니다.

테스트 녹음이 아무 텍스트 필드에나 붙여넣어지면 제대로 된 것입니다.

4단계 — Substack 편집기에 커서를 놓고 말하세요.

초고를 열고 본문을 클릭한 뒤, 단축키를 누른 채 한 문장을 말하고 떼세요. 받아쓴 내용이 편집기 안 커서가 있는 곳에 나타납니다.

말한 문장이 Substack 초고에 텍스트로 들어와 있으면 제대로 된 것입니다.

Whisper
설정 화면이 열린 실제 Whisper 데스크톱 앱으로, 변환(Transcription) 패널과 AI 패널이 펼쳐져 있습니다.

느린 부분은 설정이 아니라 모델 다운로드입니다. 나머지는 전부 위의 네 단계뿐이죠. 일단 돌아가기 시작하면, 초고를 페이지에 올리는 일이 타이핑 작업이 아니라 말하기 작업이 됩니다. 뉴스레터에서는 그게 일의 대부분이죠.

Windows에서 음성을 텍스트로 · Mac에서

브라우저 편집기에 시스템 전체 도구가 필요한 이유

Substack 편집기는 브라우저에서 돌아가고, 그게 무엇이 가능한지를 좌우합니다. 받아쓰기를 넣고 싶은 대부분의 앱에는 깊숙이 연결할 후크가 있는 데스크톱 버전이 있지만, 웹 기반 서식 텍스트 편집기에는 그런 게 없습니다. 플러그인 마켓플레이스도 없고, Substack이 글 작성을 위해 열어 둔 확장 지점도 없습니다. 그러니 연동은 Substack 안에서 나올 수 없습니다. 브라우저 위쪽의 한 층에서 와야 합니다.

시스템 전체 단축키가 바로 그 층입니다. 어떤 창이 소유하고 있든 OS 커서 위치에 붙여넣기 때문에, Substack 초고를 채우는 그 키가 여러분의 Gmail 작성 창도, Slack 메시지도, 커밋 메시지도 똑같이 채웁니다. 도구 하나로, 모든 텍스트 필드를, Windows와 Mac 양쪽에서. 글 초고 작성에서 독자 이메일 답장으로 옮겨 가도 새로 익힐 게 없습니다. 어디서나 똑같은 누르고-말하고-떼기입니다.

이것이 또한, Substack에서만 작동하는 브라우저 확장 프로그램이 이 문제에 잘못된 모양인 이유입니다. 작가는 한 탭에서만 살지 않습니다. Substack에서 초고를 쓰고, 다른 창에서 자료를 찾고, 앱에서 댓글에 답하고, 다음 아이디어를 떠오르는 곳 어디서든 적어 둡니다. 한 사이트로 한정된 도구는 한 조각만 해결하지만, 커서로 한정된 도구는 전체를 해결합니다. 저는 한 시간에 대략 마흔 번 정도 앱을 바꾸는데, 외워야 할 받아쓰기 버튼을 마흔 개나 두고 싶지는 않습니다.

로컬이냐 클라우드냐: 글 초고 작성에는 어떤 모드일까

뉴스레터 초고라면 로컬 모드를 먼저 써 보세요. 절반쯤 쓴 글은 여러분만의 날것 그대로의 생각입니다. 아직 다 여물지 않은 의견, 잘라낼지도 모를 문단, 정말 발행하고 싶은지 아직 확신이 없는 무언가죠. 다듬지 않은 문장 하나하나를 그저 내 화면에 올리려고 남의 클라우드를 거치게 하는 건 이상한 선택일 겁니다. Mac이 Apple Silicon이거나 PC가 최근 몇 년 안에 나온 것이라면, 로컬이 일상적인 받아쓰기를 군말 없이 처리해 주고, 클라우드는 기본값이 아니라 비상구가 됩니다.

세 가지 경로가 어떻게 다른지 여기 정리합니다. 앱이 직접 고르게 만드니, 여러분이 잘 고르셨으면 해서요:

  • Local ParakeetNVIDIA의 TDT 엔진으로, 약 600MB이고 가장 빠른 로컬 옵션입니다. CPU에서 Whisper보다 5~10배 빠릅니다. 영어를 포함해 다른 유럽 언어 24개, 총 25개 언어를 지원합니다. 영어로의 번역은 없습니다. 뉴스레터를 영어나 다른 유럽 언어로 쓴다면, 이게 빠르고 완전히 오프라인인 선택입니다.
  • Local Whisper같은 기기에서 Parakeet보다 느리지만, 다국어 빌드는 99개 언어를 지원하고 영어로 번역할 수 있습니다. 영어 전용 빌드는 99개가 아니라 영어 전용입니다. 중국어, 일본어, 한국어, 또는 Parakeet이 못 하는 번역 작업에는 이걸 고르세요. 기본 영어 모델은 약 480MB입니다.
  • Cloud (OpenAI, BYOK)본인의 OpenAI 키를 사용해 OpenAI에 직접 청구되며, 정확도가 가장 좋고 웹 접근이 가능합니다. 변환은 기본으로 gpt-4o-mini-transcribe에서 실행됩니다. 인터넷이 필요하므로, 여러분의 기기를 벗어나는 유일한 경로입니다. Cloud 영역은 Whisper Pro의 일부입니다.

지루한 진실은, 대부분의 뉴스레터 작가가 페이지에 올리는 종류의 글에는 로컬이면 충분하다는 것입니다. 두 로컬 엔진 모두 서버로 아무것도 보내지 않고 여러분의 기기에서 완전히 돌아갑니다. 엉망인 녹음에서 최고 수준의 정확도를 원하거나, 초고를 쓰는 동안 모델이 웹에서 사실을 가져오길 원할 때 클라우드가 제값을 합니다. 꾸준히 글 쓰는 습관이라면, 로컬로 시작하고 로컬이 아쉬울 때만 클라우드로 손을 뻗으세요.

두서없이 말한 것을 깔끔한 문단으로 바꾸기

날것의 받아쓰기는 끊김 없이 이어지는 한 덩어리로 나옵니다. 우리는 생각하는 대로, 구두점도 없이 길게 한숨에 말하고, 그게 어떤 음성 엔진이든 건네주는 글자 벽입니다. 완성된 이메일이라면 거슬리는 정도지만, 자기 이름으로 발행할 글이라면 문제입니다. 누구도 받아쓴 글처럼 읽히는 문단을 내보내고 싶어 하지 않으니까요. 이걸 다듬는 데서 음성으로 초고를 쓰는 진짜 가치가 드러납니다.

Windows 음성 입력은 말하는 대로 구두점을 넣어 주고, macOS 받아쓰기는 "쉼표"나 "마침표"라고 말하면 기본 구두점을 처리합니다. 더 무거운 정리, 즉 "음" 같은 군더더기를 떼어내고 끊김 없는 문장을 바로잡아 실제로 발행할 만한 문단으로 바꾸는 일은 Whisper가 AI 패스를 돌려 해 줄 수 있습니다. 활성화 문구 "Hey whisper"라고 말하면 텍스트가 들어오기 전에 다듬어집니다. 로컬 모델에서는 Ollama를 통해 실행되고, 클라우드 모드에서는 기본으로 gpt-5-mini입니다. 전후 비교가 핵심 그 자체입니다:

Thinking...
날것

그러니까 이번 주에 하고 싶었던 말은 음 대부분의 생산성 조언이 사실 타이핑 조언을 그럴듯하게 포장한 거라는 건데 음 그러니까 더 좋은 앱이 필요한 게 아니라 타이핑을 그만큼 덜 해야 한다는 거예요

다듬은 것

이번 주에 하고 싶었던 말은, 대부분의 생산성 조언이 사실 타이핑 조언을 그럴듯하게 포장한 것이라는 점입니다. 더 좋은 앱이 필요한 게 아닙니다. 타이핑을 그만큼 덜 해야 합니다.

정직한 한계도 짚어 둘 가치가 있습니다. 데모는 그러지 않을 테니까요. 음성은 단어를 줍니다. 서식은 주지 않습니다. Substack의 머리글, 굵게, 인용 블록, 링크, 그리고 그 작은 구분선은 모두 편집기 자체의 도구 모음과 단축키에서 나옵니다. 문장을 받아쓰고 나서, 늘 하던 대로 도구 모음으로 손을 뻗어 H2를 만들거나 링크를 넣으세요. 어떤 받아쓰기 도구도 명령 한마디로 Substack 인용구를 뚝딱 만들어 내지 못합니다. 음성으로 글을 빠르게 받아 적고, 이미 알고 있는 편집기로 글의 모양을 잡으세요.

이 말하고-다듬는 흐름은 뉴스레터를 한참 넘어 제값을 합니다. 단축키 하나로 어떤 앱에든 깔끔한 글을 받아쓸 수 있어서, 손으로 끙끙대며 짜내던 한 문단이 몇 마디 말한 문장이 됩니다.

Substack에서 받아쓰기 도구를 건너뛰어도 될 때

다른 방향을 가리키며 보도에 분필로 그려진 두 화살표로, 도구 선택을 보여 줍니다

때로는 알맞은 도구가 이미 여러분의 기기에 있는 무료 도구이고, 아닌 척하는 건 정직하지 못한 일일 겁니다. 편집기에 짧은 한 줄만 떨어뜨릴 뿐이라면, 한 문장짜리 메모나 댓글에 빠른 답글 정도라면, 운영체제가 공짜로 다 해 줍니다.

Windows에서는 Windows 키 + H를 누르면 커서가 있는 곳 어디서나 내장 음성 입력 막대가 열립니다. Substack 편집기도 포함되죠. 알아서 구두점을 넣어 주고 짧은 분량에는 충분합니다. 다만 Microsoft 서버를 거치고 인터넷 연결이 필요해서 오프라인 옵션은 아닙니다. Mac에서는 받아쓰기로 입력할 수 있는 곳 어디서나 말로 텍스트를 넣을 수 있고, 시스템 설정의 키보드에서 설정하며, Apple Silicon에서는 일반 텍스트를 기기 내에서 처리할 수 있습니다. 초고에 한 문장 빠르게 넣는 정도라면 둘 다 정말 괜찮고, 저는 공짜를 마다하라고 말리지 않겠습니다.

내장 기능이 아파지기 시작할 때 전용 시스템 전체 도구로 손을 뻗으세요. 본격적인 분량의 글, 두서없는 말을 발행할 만한 글로 바꾸는 AI 정리 패스, 다국어 글쓰기, 오프라인 초고 작성, 또는 Substack과 이메일과 메모 앱에서 똑같이 작동하는 단축키 하나를 원할 때 말이죠. 뉴스레터는 긴 글의 경우라, 대부분의 작가는 그 선을 빠르게 넘습니다. 하지만 그 아래라면 공짜인 것을 쓰세요. 한 줄짜리 댓글 답글을 위해 앱을 설치하라고는 하지 않겠습니다.

같은 절충은 여러분이 글 쓰는 곳 어디서나 나타납니다. Gmail에 받아쓰기의 논리도 똑같습니다. 둘 다 플러그인이 아니라 커서가 진짜 연동인 브라우저 텍스트 상자이기 때문이죠.

더 읽어보기

Substack은 완성된 글을 소리 내어 읽어 주고, 그건 잘합니다. 다만 애초에 그 글을 쓰는 일은 도와주지 않을 뿐이고, 이 글을 쓰고 나니 Substack이 처음부터 그럴 생각이 없었다는 걸 꽤 확신하게 됐습니다. 괜찮습니다. 커서가 곧 연동이니까요. 편집기에 말하고, 텍스트를 얻고, AI 패스 한 번으로 다듬고, 이미 알고 있는 도구 모음으로 글의 모양을 잡으세요. 저는 이 가이드의 대부분을 Substack이 아닌 상자에, 그게 어떤 상자인지 신경 쓰지 않는 도구로 음성으로 받아 적은 다음, 그 전부를 초고에 붙여넣었습니다. 그게 전부의 비결입니다.

다음 Substack 초고에서 직접 써 보세요

단축키를 누르고, 말하고, 떼세요. 받아쓴 내용이 커서가 있는 편집기에 들어오고, 이어서 AI 패스 한 번이 두서없는 말을 발행할 만한 문단으로 바꿔 줍니다.

로그인한 모든 계정에 무료 로컬 모드. 시작하는 데 카드가 필요 없습니다.

Denys Medvediev의 사진

Denys Medvediev

저는 우리 지원 이메일을 읽는 사람이고, 답장도 십중팔구 말로 받아써서 보냅니다.