가이드
학술 연구자를 위한 받아쓰기 소프트웨어
연구자, 교수, 박사 과정생이 목소리로 논문과 연구비 신청서를 더 빠르게 작성합니다. 단축키를 누르고 말하면 텍스트가 Word, Overleaf 탭, Google Docs, 또는 Scrivener의 커서 위치에 바로 입력됩니다. 오프라인으로 작동하므로 미발표 연구 내용이 기기를 벗어나지 않습니다.
최종 업데이트: 2026년 6월

학술 연구자를 위한 받아쓰기 소프트웨어는 시스템 전체에 적용되는 단축키를 통해 말한 문장을 Word, LaTeX 편집기, Google Docs, Scrivener 등 어떤 글쓰기 앱에서도 텍스트로 변환합니다. Whisper 같은 도구는 완전히 오프라인으로 작동해 미발표 연구가 기기에 머물고, 전문 분야 용어와 저자 이름을 학습해 기술 용어도 정확하게 받아써 줍니다.
문헌 검토 보고서는 참 묘한 문서입니다. 이미 하고 싶은 말을 알고 있죠. 논문 40편을 읽었고, 논지도 머릿속에 있습니다. 그런데도 그 논지를 키 입력으로 바꾸는 데 한 시간을 씁니다. 생각은 끝났는데, 타이핑은 세금처럼 또 내야 합니다. 문장을 안다는 것과 그것을 손가락으로 찍어내는 것 사이의 그 간격, 바로 거기서 받아쓰기가 학술 작업 흐름에 자리를 잡습니다.
사람들은 '학술 연구자를 위한 받아쓰기 소프트웨어'를 검색할 때 인용 처리, 참고 문헌 관리자 같은 학계 전용 기능을 기대합니다. 하지만 그런 건 없고, 있다고 약속하는 도구는 과장하는 겁니다. 실제로 얻는 것은 더 단순하고 더 유용합니다. 이미 쓰는 편집기에서, 미발표 연구 음성이 서버에 닿지 않도록, 문단을 말로 만들어내는 방법이죠. 설정에 2분, 그러면 Word에서도 LaTeX 파일에서도 똑같이 작동합니다.
이 키워드를 노리는 대부분의 페이지가 슬쩍 넘어가는 부분이 있습니다. 초고는 그냥 텍스트 상자입니다. 방법 섹션도, 편집장에게 보내는 커버 레터도, 계속 고쳐 쓰는 초록도 마찬가지입니다. 커서 위치에 붙여 넣는 받아쓰기는 그 커서가 Microsoft Word에 있는지, Overleaf 편집기에 있는지, Google Doc에 있는지, Scrivener 카드에 있는지 신경 쓰지 않습니다. 가리키는 곳에 그냥 씁니다.
그러니 진짜 질문은 '학술 연구를 위한 전용 받아쓰기 소프트웨어가 있는가'가 아닙니다. 사실상 없고, 필요하지도 않습니다. 진짜 질문은 어떤 받아쓰기 도구를 편집기 위에 얹어 쓸 것인지, 유출 위험이 있는 작업에서 오프라인을 유지할 수 있는지, 분야 특유의 이름과 용어를 올바르게 쓸 수 있는지입니다. 이 모든 것을 안내하고, 실제로 설정하고, 완전히 다른 도구가 필요한 유일한 상황도 알려드리겠습니다.
연구자들이 받아쓰기를 찾는 이유

솔직한 이유는 분량입니다. 학술 글쓰기는 본질적으로 장문입니다. 논문 한 편이 8,000단어, 논문 챕터는 훨씬 많고, 연구비 신청서는 자체 분량 제한과 미뤄지지 않는 마감이 있습니다. 그 모든 것을 타이핑하는 건 느리고, 내용을 이미 알 때 그 느림은 배가됩니다. 대부분의 사람에게 말하는 속도는 타이핑보다 세네 배 빠릅니다. 그래서 초고를 구술하고 나중에 편집하는 방식이, 어차피 편집할 깔끔한 초고를 타이핑하는 것보다 낫습니다.
두 번째 이유는 손입니다. 오랜 글쓰기 세션이 반복성 긴장의 시작입니다. 많은 연구자들이 속도 향상이 아니라 손목이 아프던 날에도 글을 계속 쓰기 위해 받아쓰기를 택했다고 합니다. 분명히 말하지만, 이건 생산성 및 접근성 보조 도구이지 의료 기기도 아니고 의학적 조언도 아닙니다. 그저 키 입력을 줄여줄 뿐입니다. 하지만 논문 심사가 6주 앞이고 손이 병목이 됐을 때, 키 입력을 줄이는 것이야말로 정확히 원하는 것입니다.
세 번째 이유는 포착입니다. 토론 섹션의 좋은 아이디어는 커피 머신으로 걸어가는 중에 옵니다. 키보드 앞에 앉았을 때가 아니라. 단축키를 눌러 말할 수 있다면 그 아이디어가 증발하기 전에 초고의 문단이 됩니다. 타이핑이 아닌 초고 작성, 그게 바뀌는 지점입니다. 글자 하나씩 텍스트를 만들어내던 것을 멈추고 문장 단위로 만들기 시작합니다. 머릿속에서 논지가 실제로 살아있는 방식에 훨씬 가깝죠.
단축키를 누르고, 말하면, 초고에 텍스트가 내려앉는다
이게 전부입니다. 가장 좋은 의미에서 단순합니다. 단축키를 누르고, 말하고, 놓으면 포커스가 있는 텍스트 필드의 커서 위치에 텍스트가 붙여넣기 됩니다. Whisper는 키를 놓은 후 잠깐 더 기다리므로 마지막 단어가 잘리지 않습니다. 운영체제의 커서 위치에 붙여넣기 하기 때문에, 편집기는 그냥 '어떤 텍스트 상자'일 뿐입니다. Word 문서, Overleaf 소스 창, Google Docs 문단, Scrivener 카드, 학술지 투고 포털의 댓글 상자, 무엇이든 됩니다.
마케팅 페이지들이 복잡하게 만드는 부분이 바로 이겁니다. Word에 끼워 넣을 플러그인도, 추가할 LaTeX 패키지도, Google Docs에서 승인할 애드온도 없습니다. 커서가 원고에 있고, 말하면, 단어들이 원고에 나타납니다. 말하는 동안 작은 캡슐이 나타나 듣고 있다는 것을 알려줍니다.
단축키는 처음부터 제대로 설정할 가치가 있는 유일한 부분입니다. Windows에서는 Ctrl+Space이고, Mac에서는 말하는 동안 누르고 있는 Command+Option 푸시-투-톡 방식입니다. 편집기가 이미 사용하는 단축키와 충돌할 경우 설정에서 변경할 수 있습니다. 학술 도구들은 단축키 충돌이 많아서 이 부분이 다른 경우보다 더 중요합니다. 이전에 Windows에서 받아쓰기를 설정했거나 Mac에서 설정한 적 있다면, 그 익숙한 동작이 이제 초고를 향해 작동합니다.
2분 안에 설정하기 (Windows 또는 Mac)
Apple Silicon Mac이나 Windows 10 이상 PC, 작동하는 마이크, 그리고 편집기 하나가 열려 있으면 됩니다. Word, Overleaf나 Google Docs가 열린 브라우저 탭, Scrivener, 초고를 쓰는 무엇이든요. 전체 로컬 파이프라인은 로그인된 계정이라면 누구나 무료이며, 가입 시 결제 수단을 묻지 않습니다. 순서는 다음과 같습니다.
1단계 — Whisper 설치 및 로그인.
다운로드 페이지에서 내려받아 설치하고 무료 계정을 만드세요. 카드 불필요. 전체 로컬 받아쓰기 파이프라인이 바로 열립니다.
앱 트레이 아이콘이 나타나고 설정 마법사가 모델 선택을 제안하면 작동한 겁니다.
2단계 — 받아쓰기 경로 선택.
앱이 대신 선택해주지 않습니다. 세 가지 옵션이 있습니다: 클라우드(OpenAI, 자체 키 사용), 로컬 Parakeet, 또는 로컬 Whisper. 미발표 작업이라면 로컬로 시작하세요. 어떤 것을 고를지는 두 섹션 뒤에 자세히 다룹니다.
모델 다운로드가 완료되고 준비 상태로 표시되면 작동한 겁니다.
3단계 — 단축키 확인.
Windows 기본값은 Ctrl+Space, Mac은 말하는 동안 누르는 Command+Option 푸시-투-톡입니다. Mac에서는 메시지가 나타날 때 손쉬운 사용 권한을 허용하세요. 없으면 다른 앱의 커서 위치에 붙여넣기가 되지 않습니다.
테스트 녹음이 어떤 텍스트 필드에든 붙여넣기 되면 작동한 겁니다.
4단계 — 초고에 커서를 놓고 말하기.
원고를 열고, 다음 문장이 들어갈 곳을 클릭한 후, 단축키를 누른 채 문장을 말하고 놓으세요. 텍스트가 문서의 커서 위치에 나타납니다.
말한 문장이 초고에 텍스트로 앉아 있으면 작동한 겁니다.
느린 부분은 설정이 아니라 모델 다운로드입니다. 나머지는 위의 네 단계가 전부입니다. 한번 실행되면 문단 작성이 타이핑 작업에서 말하기 작업으로 바뀌고, 편집기는 아무것도 달라진 것을 모릅니다.
분야 전문 용어, 저자 이름, 그리고 오프라인 유지
학술 글쓰기에 특유한 두 가지 문제가 있고, 둘 다 실질적인 답이 있습니다. 첫 번째는 어휘입니다. 분야에는 일반 음성 모델이 한 번도 본 적 없는 용어들이 가득합니다. 유전자 이름, 화합물, 이것을 발명한 세 사람의 이름을 딴 방법론, 40번 인용하는 저자의 성. 기본 상태의 받아쓰기 엔진은 비슷하게 들리는 일반 단어를 추측하기 때문에 그 용어들을 잘못 받아쓸 것입니다. 로컬 Whisper는 핫워드와 사용자 정의 어휘로 이 문제를 해결합니다. 자주 쓰는 용어와 저자 이름을 입력해두면 일상적인 유사 단어 대신 정확하게 받아쓰는 방향으로 편향됩니다. 더 빠른 로컬 엔진인 Parakeet은 핫워드를 지원하지 않습니다. 원고에 전문 용어가 많다면, 이 차이가 Parakeet 대신 Whisper를 선택하는 이유입니다.
두 번째 문제는 개인 정보 보호입니다. 미발표 연구에서 이건 편집증이 아니라 업무 자체입니다. 발표 전 결과, 제출 전 연구비 신청서, 엠바고 중인 논문, NDA나 특허가 걸린 모든 것. 클라우드 받아쓰기는 오디오를 공급 업체 서버로 보내 변환합니다. 로컬 받아쓰기는 그렇지 않습니다. Whisper와 Parakeet 모두 자신의 기기에서만 완전히 실행되며 아무것도 외부로 나가지 않습니다. 즉, 미발표 연구 내용을 읽는 음성이 누군가의 로그 파일이 되는 일이 없습니다. 이 차이가 작업에서 중요하다면, 많은 연구에서 타협할 수 없는 부분이기도 하죠. 오프라인 우선 방식에 대한 전체 내용은 비공개 오프라인 음성-텍스트 변환에서 확인할 수 있습니다.
솔직히 말하면, 제가 그 논문을 쓰는 사람이라면 타협하지 않을 부분입니다. 초고는 작업물 중 가장 민감한 버전입니다. 실수가 아직 남아 있고, 경쟁자가 탐내고, 아직 우선권을 주장하지 않은 버전이죠. 모델 다운로드를 아끼려고 그걸 내가 통제하지 않는 서버에 라우팅하는 건 나쁜 거래입니다. 노트북에는 이미 마이크와 CPU가 있습니다. 문단 하나 텍스트 변환에 서버가 필요하지 않습니다.
로컬 vs 클라우드: 학술 작업에 맞는 모드는
대부분의 학술 초고 작업은 로컬로 시작하는 것이 좋습니다. 개인 정보 보호가 문제가 되는 이유 자체가 작업이 미발표 상태이기 때문이고, 로컬 모드만이 오디오를 기기에 보존합니다. Apple Silicon Mac이거나 최근 몇 년 내 PC라면 로컬이 일상적인 받아쓰기를 무리 없이 처리하고, 클라우드는 기본값이 아닌 비상구가 됩니다. 앱이 선택하게 하는 세 가지 경로가 실제로 어떻게 다른지 알아보겠습니다.
빨리 고르는 것보다 잘 고르는 게 낫습니다. 각각을 솔직하게 정리했습니다.
- 로컬 Parakeet — NVIDIA의 TDT 엔진으로 약 600 MB이며, CPU에서 Whisper보다 5~10배 빠른 가장 빠른 로컬 옵션입니다. 영어와 다른 유럽 언어 24개, 총 25개 언어를 지원합니다. 영어로 번역 기능이 없고, 핫워드도 없어서 분야 전문 용어에 맞게 조정할 수 없습니다. 어휘가 평범한 일반 산문에서 빠르고 완전한 오프라인 초고 작성에 선택하세요.
- 로컬 Whisper — 같은 기기에서 Parakeet보다 느리지만, 핫워드와 사용자 정의 어휘를 지원합니다. 저자 이름과 기술 용어에 필요한 기능이죠. 다국어 빌드는 99개 언어를 지원하고 영어로 번역할 수 있습니다. 영어 전용 빌드는 99개가 아닌 영어만입니다. 기본 영어 모델은 약 480 MB입니다. 전문 용어가 많은 원고에는 이것이 로컬 선택입니다.
- 클라우드 (OpenAI, BYOK) — 최고의 정확도와 웹 접근 기능을 제공하며, OpenAI에 직접 청구되는 자체 OpenAI 키를 사용합니다. 기본적으로 gpt-4o-mini-transcribe로 받아쓰기가 실행됩니다. 인터넷이 필요하므로 기기를 벗어나는 유일한 경로입니다. 민감하지 않은 글쓰기에는 괜찮지만, 엠바고 결과에는 잘못된 선택입니다. 클라우드 기능은 Whisper Pro의 일부입니다.
재미없는 사실은 이렇습니다. 대부분의 논문이 쓰인 산문에는 로컬 Whisper면 충분하고, 핫워드 지원이 연구에 특히 맞는 로컬 엔진으로 만드는 요소입니다. 클라우드는 어려운 녹음에서 최고 수준의 정확도가 필요하거나, 문장 도중 웹에서 사실 정보를 가져와야 하면서 작업이 기밀이 아닐 때 빛을 발합니다. 유출 위험 없는 초고라면 선택은 자연스럽게 됩니다.
구술 초고를 깔끔한 글로 다듬기
날 것의 받아쓰기는 줄줄이 이어집니다. "결과는 두 변수 간의 상관관계를 시사하지만 표본 크기가 작다는 점을 주목해야 한다"고 말하면, 그게 어떤 음성 엔진이든 내놓는 구두점 없는 덩어리입니다. 이걸 정리하는 방식에서 모드들이 갈립니다.
Windows 음성 입력은 말하면서 구두점을 추가하고, macOS Dictation은 "쉼표" 또는 "마침표"라고 말할 때 기본 구두점을 처리합니다. 더 무거운 정리, 즉 거짓 시작 제거, 연결문 수정, 구술 문단을 원고에 넣을 수 있는 문장으로 바꾸는 작업에는 Whisper가 AI 처리를 실행할 수 있습니다. 활성화 문구 "Hey whisper"라고 말하면 텍스트가 개선된 후 입력됩니다. 로컬 모델에서는 Ollama를 통해 실행되므로 정리 작업도 오프라인 상태로 유지됩니다. 클라우드 모드에서는 기본적으로 gpt-5-mini를 사용합니다.
so the results suggest a correlation between the two variables although we should note um the sample size was fairly small here
The results suggest a correlation between the two variables, although the sample size was fairly small.
도움이 안 되는 과장은 하지 않겠습니다. AI 처리는 문법과 군더더기를 정리하지만, 주장의 사실을 확인하거나 통계를 수정하지는 않습니다. 정확한 기술 용어를 비슷하게 들리는 일반 단어로 조용히 '수정'할 수도 있습니다. 결과물을 읽으세요. 어차피 읽을 것입니다. 이건 당신의 논문입니다. 정리 작업을 빠른 첫 번째 초고로 대하세요. 절대 최종본이 아닙니다. 솔직한 답은 이겁니다. 목소리가 단어를 빠르게 내려놓고, 과학은 여전히 본인의 판단이 합니다.
말하고 정리하는 그 흐름은 원고를 훨씬 넘어서 효과가 있습니다. 같은 방식으로 Google Docs에 깔끔한 산문을 구술할 수도 있습니다. 공동 저자 문서나 심사자 답신도 타이핑 문단이 아닌 몇 마디 말로 해결됩니다.
받아쓰기를 건너뛰고 전사 도구를 써야 할 때

받아쓰기와 전사는 항상 혼동됩니다. 하지만 학술 작업에서 그 차이는 전부입니다. 받아쓰기는 본인이 의도적으로, 실시간으로 말해 자신의 텍스트를 만드는 것입니다. 전사는 기존 녹음, 즉 인터뷰, 포커스 그룹, 강의, 수 시간의 현장 오디오를 사후에 텍스트로 변환하는 것입니다. 이 두 가지는 다른 작업이고, 받아쓰기 단축키는 두 번째에 맞는 도구가 아닙니다.
질적 연구 오디오, 즉 대면 인터뷰, 녹음 세션, 화자 레이블과 타임스탬프가 있는 전사물이 필요한 현장 녹음 모음이 작업이라면 전용 전사 서비스나 배치 오디오 파일용 도구를 찾으세요. 흔히 여러 화자가 등장하는 녹음을 처리하는 작업이고, 그에 맞게 설계된 소프트웨어가 필요합니다. 이 도구를 포함한 받아쓰기 소프트웨어는 말하는 사람이 본인이고, 그 단어들이 말하면서 바로 초고에 내려앉아야 하는 부분을 위한 것입니다.
정말 작은 것들에는 무료 기본 내장 도구로 충분합니다. Windows에서는 Windows 키 + H가 커서가 있는 곳 어디서든 음성 입력 바를 엽니다. 자동으로 구두점을 추가하지만 Microsoft 서버를 거치므로 오프라인이 아닙니다. Mac에서는 키보드 설정의 시스템 설정에 Dictation이 있고, Apple Silicon에서 일반 텍스트는 기기 내에서 처리될 수 있습니다. 한 줄 메모나 공동 저자에게 빠른 이메일 한 통에는 그것으로 충분합니다. 작업이 길어지거나, 어휘가 전문화되거나, 결과물이 기기를 벗어나면 안 될 때 전용 오프라인 시스템 전체 도구를 선택하세요.
초고가 데스크톱 앱보다 브라우저에서 더 많이 작성된다면, 같은 논리가 Google Docs에서 음성 입력에도 적용됩니다. 커서가, 애드온이 아닌, 진짜 연결 지점입니다.
학계를 위해 특별히 만들어진 받아쓰기 소프트웨어는 없습니다. 이 글을 쓰고 나니 그럴 필요도 없다는 확신이 생깁니다. 원고는 그냥 텍스트 상자이고, 커서가 연결 지점이며, 학술 연구에 특유한 부분들, 즉 미발표 작업을 오프라인으로 유지하고 분야 전문 용어를 가르치는 것, 이것들은 별도 제품이 아닌 설정입니다. 이 글의 대부분을 인용 기능 따위는 들어본 적 없는 일반 텍스트 편집기에 구술했습니다. 모든 단어를 노트북에 보관하는 도구로, 그 다음 초고인 것처럼 편집했습니다. 그게 전부입니다.
다음 논문을 목소리로 초고 작성하세요
단축키를 누른 채 말하고 놓으세요. 텍스트가 커서가 있는 곳 어디든, Word, LaTeX, Google Docs, Scrivener에, 오프라인으로 내려앉습니다. 미발표 작업이 기기에 머물도록.
로그인된 계정이라면 누구나 로컬 모드 무료. 시작에 카드 불필요.



