가이드
받아쓰기 소프트웨어 작가를 위한
말하는 속도가 타이핑보다 훨씬 빠릅니다. 해결책은 시스템 전체에서 작동하는 도구입니다. 단축키를 누르고 말하면, 단어가 Scrivener, Word, Google Docs, 또는 어떤 편집기에서든 커서 위치에 바로 입력됩니다. 그런 다음 AI가 초안을 다듬어줍니다.
최종 업데이트: 2026년 6월

작가를 위한 받아쓰기 소프트웨어는 말로 한 초안을 어떤 편집기에서든 텍스트로 변환합니다. Whisper 같은 시스템 전체 도구는 단 하나의 단축키로 Scrivener, Word, Google Docs의 커서 위치에 붙여넣고, Windows나 Mac에서 무료로 오프라인 실행되며, 선택적 AI 정제 기능이 흘러나온 말을 읽기 좋은 문장으로 다듬어줍니다.
타이핑은 글쓰기에서 가장 느린 단계입니다. 머릿속에 이미 완성된 문장이 있는데, 그걸 열 손가락을 통해 분당 겨우 마흔 단어로 내보내는 셈이죠. 말하기는 그것보다 세 배 빠릅니다 — 저도 그렇고, 여러분도 마찬가지입니다. 막히는 곳은 아이디어가 아니었습니다. 키보드였습니다.
작가들이 "받아쓰기 소프트웨어"를 검색하면 Dragon NaturallySpeaking, $699짜리 라이선스, 45분짜리 트레이닝 세션의 기억이 떠오릅니다. 그 시절은 끝났습니다. 2026년 소설가나 블로거에게 필요한 받아쓰기는 이미 쓰는 편집기 어디에든 말한 내용을 바로 넣어주는 단축키, 그리고 그걸 다듬어주는 AI 한 번입니다. 라이선스도 없고, 앱별 플러그인도 없습니다. 지금 쓰는 노트북에서 바로 실행됩니다.
받아쓰기를 작가에게 파는 대부분의 페이지가 건너뛰는 부분이 있습니다. 여러분의 편집기에는 받아쓰기 기능이 필요하지 않습니다. Scrivener 문서, Word 페이지, Google Docs 창 — 이것들은 모두 커서가 있는 텍스트 상자일 뿐입니다. 커서 위치에 붙여넣는 도구는 어떤 앱이 열려 있는지 신경 쓰지 않습니다.
그래서 진짜 질문은 "어떤 글쓰기 앱에 음성 입력이 가장 잘 내장되어 있나"가 아닙니다. 어떤 앱도 긴 글 받아쓰기에 최적화되어 있지 않고, 하나에 종속되고 싶지도 않을 것입니다. 진짜 질문은 "어떤 받아쓰기 도구가 모든 앱 위에서 작동하나"이고, 솔직한 답은 모든 프로그램에서 똑같이 작동하는 오프라인 단축키 하나입니다. 워크플로를 안내하고, 2분 안에 설정하고, 받아쓰기를 건너뛰어야 할 때도 알려드리겠습니다.
작가가 받아쓰기를 찾는 이유

초안 작성은 받아쓰기가 가장 빛을 발하는 작업입니다. 초안은 빠르고 거칠게 쓰는 것이 정상입니다 — 뼈대를 잡고, 나중에 다듬으면 됩니다. 타이핑은 그걸 방해합니다. 타이핑은 본질적으로 신중한 행위라, 단어가 나타나는 걸 보며 자꾸 고치게 됩니다. 말하기는 고칠 틈을 주지 않습니다. 문장을 말하면 입력되고, 다음으로 넘어갑니다. 챕터를 밀어붙이는 소설가든, 아이들이 깨기 전에 1,500단어 포스트를 끝내려는 블로거든, 그 앞으로 나아가는 추진력이 전부입니다.
속도 차이는 실제로 존재하고, 미묘하지도 않습니다. 대부분 사람의 지속적인 타이핑 속도는 분당 약 40단어입니다. 말하기는 145단어에 가깝습니다. 그 속도로 완성된 챕터를 쓸 수는 없습니다 — 누구도 그렇게 하지 않습니다 — 하지만 3분의 1의 시간 안에 원재료를 만들어낼 수 있고, 원재료를 다듬는 것이 빈 페이지를 바라보는 것보다 훨씬 빠릅니다. 글쓰기에서 가장 힘든 부분은 시작입니다. 받아쓰기는 그 시작을 쉽게 만듭니다.
조용한 이유도 하나 더 있습니다, 솔직하게 말씀드리겠습니다. 받아쓰기는 손을 쉬게 합니다. 글쓰기로 먹고 산다면 키보드 사용량이 쌓이고, 의자에 등을 기댄 채 긴 섹션을 받아쓸 수 있다는 것은 손목의 부담을 덜어줍니다. 이건 의학적 조언이 아니라 생산성 부가 설명입니다 — 하지만 제가 들은 작가들이 받아쓰기를 선택한 실제 이유이고, 키보드 부담을 줄이기 위해 음성으로 전환하는 논리와 같습니다. 같은 단어 수에 키 입력이 줄어드는 건 분명히 좋은 거래입니다.
단축키를 누르고, 말하면, 초안이 편집기에 나타납니다
작동 방식은 단순합니다 — 그래서 어디서나 작동합니다. 단축키를 누르고 문단을 말한 뒤 손을 떼면, 포커스가 있는 어떤 텍스트 필드에도 전사가 붙여넣어집니다. Whisper는 키를 놓은 뒤 잠깐 더 기다리기 때문에 문장의 마지막 단어가 잘리지 않습니다. 커서 위치에 붙여넣기 때문에 Scrivener 편집기, Word 페이지, Google Docs 창 모두 그냥 "어떤 텍스트 상자"입니다. 같은 키, 같은 동작, 항상.
그게 바로 예전 받아쓰기 도구들이 해결하지 못한 부분입니다. Scrivener에 플러그인을 붙일 필요도 없고, Word에서 별도의 받아쓰기 모드를 설정할 필요도 없고, Docs에서 확장 프로그램을 승인할 필요도 없습니다. 커서가 챕터 안에 있을 때 말하면, 단어가 챕터에 나타납니다. 말하는 동안 작은 캡슐이 나타나 듣고 있다는 것을 알려줍니다.
단축키는 처음부터 제대로 설정할 가치가 있는 유일한 것입니다. Windows에서는 Ctrl+Space이고, Mac에서는 말하는 동안 누르고 있는 푸시-투-토크 방식의 Command+Option입니다. 이미 사용 중인 것과 충돌하면 설정에서 변경할 수 있습니다 — 자체 단축키가 있는 글쓰기 앱이라면요. (첫 버전에서는 단축키가 고정되어 있었는데, 어느 사용자가 새벽 두 시에 음악 소프트웨어와 충돌한다는 것을 발견할 때까지 그랬습니다. 지금은 모든 것이 변경 가능합니다.) Windows에서 음성 텍스트 변환 또는 Mac에서 설정해본 적 있다면, 같은 근육 기억이 원고를 향하게 됩니다.
2분 안에 설정하기 (Windows 또는 Mac)
Apple Silicon Mac이나 Windows 10 이상의 PC, 작동하는 마이크, 그리고 원하는 편집기가 열려 있으면 됩니다. 로컬 파이프라인 전체는 로그인된 계정이라면 누구에게나 무료이며, 가입 시 결제 수단이 필요하지 않습니다. 순서는 다음과 같습니다.
1단계 — Whisper를 설치하고 로그인합니다.
다운로드 페이지에서 내려받아 설치하고 무료 계정을 만드세요. 카드 불필요. 로컬 전사 파이프라인 전체가 바로 열립니다.
앱의 트레이 아이콘이 나타나고 설정 마법사가 모델 선택을 안내하면 성공한 것입니다.
2단계 — 전사 방식을 선택합니다.
앱이 대신 선택해주지 않습니다. 세 가지 옵션이 있습니다: Cloud(OpenAI, 자신의 키 사용), Local Parakeet, 또는 Local Whisper. 아무도 보지 않은 원고를 서버 밖에 두고 싶다면 로컬로 시작하세요 — 두 섹션 아래에서 자세히 설명합니다.
모델 다운로드가 완료되고 준비 완료로 표시되면 성공한 것입니다.
3단계 — 단축키를 확인합니다.
Windows 기본값은 Ctrl+Space, Mac은 푸시-투-토크 방식의 Command+Option입니다. Mac에서는 묻는 대로 접근성 권한을 허용하세요. 없으면 다른 앱에 붙여넣기가 작동하지 않습니다.
테스트 녹음이 어떤 텍스트 필드에나 붙여넣어지면 성공한 것입니다.
4단계 — 초안에 커서를 두고 말합니다.
Scrivener, Word, 또는 브라우저 문서를 열고 페이지를 클릭한 뒤, 단축키를 누르고 문장을 말하고 손을 뗍니다. 커서 위치에 전사가 나타납니다.
말한 문장이 원고에 텍스트로 들어가 있으면 성공한 것입니다.
느린 부분은 모델 다운로드이지 설정이 아닙니다. 나머지는 위의 네 단계입니다. 실행되고 나면, 문단을 페이지에 올리는 행위가 타이핑 작업이 아니라 말하기 작업이 됩니다 — 실제로 원했던 유일한 변화입니다.
실제 챕터를 버텨내는 초안 워크플로
챕터 전체를 받아쓰는 것은 이메일을 받아쓰는 것과 다릅니다. 그걸 같다고 여기면 첫 주에 포기하게 됩니다. 비결은 작가들이 보통 동시에 하는 두 가지 작업을 분리하는 것입니다. 초안 작성은 하나의 작업입니다: 판단 없이 빠르게 순서대로 말을 쏟아내는 것. 편집은 다른 작업입니다: 구두점, 단락 나누기, 두 번 말한 문장. 받아쓰기는 첫 번째에는 탁월하고 두 번째에는 서툽니다. 그러니 나누세요. 초안을 처음부터 끝까지 말하고, 그런 다음 절대 완전히 은퇴시키지 않을 키보드로 돌아가 다듬으세요.
몇 가지 습관이 이것을 정착시킵니다. 단편이 아닌 완전한 문장으로 말하세요 — 완전한 생각이 있을 때 전사 결과가 더 정확합니다. 편집 패스에서 찾을 표시로 "새 단락"이라고 소리 내어 말하세요, 도구가 반응하지 않더라도, 말로 쓴 텍스트 덩어리는 나중에 다시 들어가기 어렵기 때문입니다. 자신만의 고유명사 목록을 가까이 두세요. 인물 이름, 창작한 지명, 전문 용어는 어떤 음성 엔진이든 추측하는 부분이고, Local Whisper는 커스텀 어휘를 설정해서 "Aelwyn"이 "Ellen"이 되는 일을 막을 수 있습니다. 이 중 특별한 것은 없습니다. 그냥 초안을 초안으로 대하는 것입니다.
솔직한 기대치: 받아쓰기로 만든 2,000단어 섹션은 뼈대는 갖추었지만 이어지는 문장에 잡담이 섞인 산문으로 나옵니다. 그래도 성공입니다. 타이핑으로 한 시간을 쓰는 대신 15분을 말했고, 이제 커서가 깜박이는 것 대신 편집할 무언가가 생겼습니다. 저는 긴 글을 이렇게 초안을 잡고 그런 다음 세밀한 편집은 키보드로 직접 합니다 — 분량은 음성으로, 다듬기는 키보드로. 둘은 경쟁자가 아닙니다.
로컬 또는 클라우드: 원고에 어떤 모드를
자신의 글쓰기라면 먼저 로컬 모드를 써보세요. 원고는 본인이 결정하기 전까지는 사적인 것이고, 미출판 챕터를 누군가의 서버를 통해 보낼 이유가 없습니다. Mac이 Apple Silicon이거나 PC가 최근 몇 년 내 제품이라면 로컬이 일상적인 초안 작성을 불편 없이 처리하고, 클라우드는 기본값이 아니라 비상구가 됩니다.
세 경로의 차이를 설명드리겠습니다. 앱이 선택하게 하는 만큼, 잘 선택하셨으면 합니다.
- Local Parakeet — NVIDIA의 TDT 엔진으로 약 600 MB이며, 가장 빠른 로컬 옵션입니다 — CPU 기준 Whisper보다 5~10배 빠릅니다. 영어 및 24개 유럽 언어, 총 25개를 지원합니다. 영어 번역 기능과 커스텀 어휘는 없습니다. 영어로 초안을 쓰고 속도가 중요하다면 빠르고 완전히 오프라인인 이 선택지가 맞습니다.
- Local Whisper — 같은 기기에서 Parakeet보다 느리지만, 다국어 빌드는 99개 언어를 지원하고 영어로 번역할 수 있으며, 커스텀 어휘를 지원합니다 — 인물 이름을 지키는 핵심 기능입니다. 영어 전용 빌드는 영어 전용이지 99개가 아닙니다. 인물 용어집, 다국어 작업, 번역이 필요하다면 이것을 선택하세요. 기본 영어 모델은 약 480 MB입니다.
- Cloud (OpenAI, BYOK) — 최고의 정확도와 웹 접근성을 제공하며, 자신의 OpenAI 키를 사용하고 비용은 OpenAI에 직접 청구됩니다. 전사는 기본적으로 gpt-4o-mini-transcribe로 실행됩니다. 인터넷이 필요하므로 기기를 떠나는 유일한 경로입니다. Cloud 기능은 Whisper Pro의 일부입니다.
재미없는 진실은, 작업 초안에는 로컬로 충분하다는 것입니다. 두 로컬 엔진 모두 서버로 아무것도 보내지 않고 기기에서만 실행되는데, 아직 아무도 읽지 않은 책 파일이라면 이것이 중요합니다. 클라우드는 까다로운 녹음에서 최고 수준의 정확도가 필요하거나 모델이 문장 중간에 웹에서 정보를 가져와야 할 때 그 가치를 발휘합니다. 일상적인 챕터 작업은 로컬로 시작하고, 부족할 때만 클라우드를 사용하세요.
말로 한 초안을 깔끔한 산문으로
원시 받아쓰기는 이어지는 문장으로 나옵니다 — 정상입니다. "그래서 탐정이 들어오는데 아직 아무 말도 안 해 음 그냥 시체를 바라보다가 갑자기 불이 꺼지는 거야"처럼 말하면 어떤 음성 엔진이든 구두점 없는 흐름으로 돌려줍니다. 초안의 내용은 다 있습니다. 쉼표만 없을 뿐입니다. 다듬는 단계에서 방식이 갈립니다.
Windows 음성 입력은 말하는 동안 구두점을 추가하고, macOS 받아쓰기는 "쉼표" 또는 "마침표"라고 말하면 기본 구두점을 처리합니다. 더 깊은 정리 — "음"을 제거하고, 이어지는 문장을 고치고, 말한 독백을 실제로 쓸 문장으로 나누는 것 — 은 Whisper의 AI 패스가 처리합니다. "Hey whisper"라는 활성화 구문을 말하면 텍스트가 입력되기 전에 개선됩니다. 로컬 모델에서는 Ollama를 통해 실행되고, 클라우드 모드에서는 기본값이 gpt-5-mini입니다.
그래서 탐정이 들어오는데 아직 아무 말도 안 해 음 그냥 시체를 바라보다가 갑자기 불이 꺼지는 거야
탐정이 들어온다. 아직 아무 말도 하지 않는다 — 그저 시체를 바라볼 뿐이다. 그때 불이 꺼진다.
작가들이 솔직하게 들어야 할 주의사항이 있습니다. AI 패스는 문법 교정을 위한 것이지 문체를 위한 것이 아닙니다. 구두점과 불필요한 말을 고칩니다. 여러분이 한 말을 밋밋하게 다시 쓰는 것이 아닙니다. 초안을 읽을 수 있게 만드는 데 사용하고, 실제 편집은 직접 하세요. 문장의 리듬은 어떤 모델도 가져갈 수 없는 부분이기 때문입니다. 솔직한 역할 분담은 이렇습니다: 음성이 말을 쏟아내고, AI 패스가 읽기 좋게 만들고, 여러분이 그것을 자신의 것으로 만듭니다.
말하고 다듬는 그 흐름은 원고를 훨씬 넘어섭니다 — 어떤 앱에나 받아쓰기로 음성 일기를 써둘 수도 있습니다그러면 하루의 메모가 자정에 타이핑하는 페이지 대신 몇 마디 말이 됩니다.
받아쓰기를 건너뛰고 다른 것을 쓸 때

받아쓰기는 자신의 말을 초안으로 쓰기에 적합한 도구입니다. 하지만 작가들이 받아쓰기와 혼동하는 두 가지 작업에는 잘못된 도구입니다. 이걸 명확히 해두면 답답한 오후 한 시간을 아낄 수 있습니다.
인터뷰 녹음, 팟캐스트, 회의 파일을 전사 문서로 만드는 일이라면 그건 전사이지 받아쓰기가 아닙니다 — 다른 카테고리입니다. 오디오 파일을 받아 타임스탬프와 화자 레이블이 붙은 문서를 돌려주는 전사 서비스가 필요합니다. 푸시-투-토크 단축키는 자신의 커서에서 실시간으로 말하기 위한 것이지, 이전에 녹음한 파일을 처리하기 위한 것이 아닙니다. 그리고 마트 계산대에서 떠오른 대사 한 줄처럼 전화기에서 짧게 메모할 필요만 있다면, 스마트폰 키보드의 내장 마이크가 이미 그 일을 합니다. Whisper는 Windows와 macOS 전용 데스크톱 앱이기도 합니다. 한 줄 입력하려고 데스크톱 앱을 설치하지 마세요.
짧은 순간을 위해 이미 기기에 무료 옵션이 있습니다. Windows에서는 Windows 키 + H를 누르면 커서 위치에 내장 음성 입력 바가 열립니다. 자동으로 구두점을 추가하고 한두 문장에는 괜찮지만, Microsoft 서버를 통해 라우팅되고 인터넷이 필요하므로 오프라인 옵션은 아닙니다. Mac에서는 키보드 아래 시스템 설정에서 받아쓰기를 설정하면 어떤 텍스트 필드에서든 말할 수 있고, Apple Silicon에서는 일반 텍스트를 기기에서 처리할 수 있습니다. 그것들이 불편해지기 시작할 때 전용 시스템 전체 도구를 사용하세요: 긴 초안, 원고의 오프라인 프라이버시, 인물 이름을 위한 커스텀 어휘, 또는 Scrivener, 이메일, 블로그 편집기에서 똑같이 작동하는 단축키 하나가 필요할 때입니다. 그 이하라면 무료 것을 쓰세요. 대사 한 줄 때문에 앱을 설치하라고 권하지는 않겠습니다.
그리고 애초에 음성에 관심을 가지게 된 이유가 긴 시간 키보드 앞에 앉아 있는 피로 때문이라면, 손 부담을 줄이기 위해 받아쓰기로 전환하는 것에서 그 절충점을 자세히 다룹니다 — 같은 생산성 논리, 같은 페이지 수에 더 적은 키 입력.
저는 Windows 98 기기에 64메가바이트 RAM으로 Dragon NaturallySpeaking을 쓰던 친척 근처에서 자랐습니다. 트레이닝은 45분이 걸렸습니다 — 단어 목록을 읽어 교정했죠 — 그런 다음 받아쓰기는 문장당 4초 지연에 70퍼센트 정확도로 작동했습니다. 연하장 한 단락을 받아쓰는 데 15분이 걸렸고, 결국 헤드셋이 방 건너편으로 날아갔습니다. 25년 후, 초안 챕터가 약 1.5초 만에 커서에 도착하고, 오프라인에, 무료입니다. 헤드셋은 살아남았습니다. 이 가이드의 대부분을 텍스트 상자에 말해 넣고 키보드로 편집했습니다. 제가 권하는 바로 그 워크플로입니다. 다음에 써야 할 것에 한번 써보세요.
다음 챕터를 말로 써보세요
단축키를 누르고, 소리 내어 문단을 초안으로 잡고, 손을 뗍니다. 텍스트가 편집기에 — 그리고 글을 쓰는 모든 앱에 — 입력됩니다.
로그인된 계정이라면 누구에게나 무료 로컬 모드. 시작하는 데 카드가 필요하지 않습니다.



