음성 입력 · 가이드
음성 입력 앱: 기기마다 무엇을 설치해야 할까
안드로이드와 아이폰에서는 키보드에 기본 탑재된 받아쓰기를 쓰세요. 무료이고 성능도 좋습니다. Windows와 Mac에서는 기본 도구가 짧은 순간에는 잘 되지만, 본격적인 글쓰기에는 금세 한계가 드러납니다. Whisper 같은 데스크톱 음성 입력 앱은 전역 단축키, 오프라인 로컬 모델, 그리고 어떤 앱에든 바로 들어가는 텍스트를 더해 줍니다.
최종 업데이트: 2026년 6월

음성 입력 앱은 커서가 있는 자리에 말을 그대로 텍스트로 바꿔 줍니다. 휴대폰에서는 이미 기본 키보드가 이 일을 해냅니다. 안드로이드의 Gboard, 아이폰 키보드의 마이크 키가 그것이죠. Windows와 Mac 데스크톱에서는 기본 도구에 제약이 더 많은데, 바로 이 지점에서 Whisper by Remskill 같은 전용 데스크톱 앱이 제 몫을 합니다.
앱 스토어에서 "음성 입력 앱"을 검색하면 키보드 앱이 수십 페이지씩 쏟아집니다. 하나하나가 마이크 버튼에 새 페인트만 덧칠한 모습이죠. 그동안 정작 바탕이 되는 숫자는 그대로입니다. 대부분의 사람은 1분에 약 40단어를 타이핑하고, 약 145단어를 말합니다. 이 격차가 바로 이 분야가 존재하는 이유 전부입니다.
저는 이런 앱을 직접 만들었는데도, 지난주에 400단어짜리 이메일을 엄지로 두드리고 있는 제 모습을 발견했습니다. 습관은 그 이유보다 오래 살아남습니다. 함정은 정답이 지금 손에 든 기기가 무엇이냐에 따라 달라진다는 점이고, 그중 한 기기에서는 정답이 공짜인 데다 이미 설치돼 있다는 것입니다.
"음성 입력 앱"이라는 한 이름 안에는 사실 전혀 다른 두 상황이 숨어 있는데, 대부분의 비교 글은 그 점을 짚지 않습니다. 휴대폰에서 받아쓰기는 이미 풀린 문제인데도 앱 스토어가 계속 다시 팔고 있고, 정작 긴 글을 쓰는 데스크톱에서는 기본 도구에 조건이 붙어 있습니다. 제대로 고르는 방법은 기기를 기준으로 삼는 것입니다.
이 페이지를 다 읽고 나면 휴대폰에는 무엇을 그대로 두면 되는지, 데스크톱 기본 도구는 어디서 멈추는지, 그 한계를 넘어설 때 무엇을 설치하면 되는지 알게 됩니다. 저는 데스크톱 음성 입력 앱을 만드는 일을 하고 있는데, 사람들에게 가장 먼저 하는 말은 "휴대폰에는 아무것도 설치하지 마세요"입니다.
휴대폰에는 이미 음성 입력 앱이 들어 있습니다

맥 빠지는 진실이지만, 당신의 휴대폰에 가장 좋은 음성 입력 앱은 처음부터 딸려 온 그 키보드입니다. 안드로이드에서는 Gboard가 해냅니다. 입력란을 누르고, 키보드 위쪽의 마이크를 누른 다음, "말하기"가 뜨면 말하세요. "마침표", "쉼표", "새 단락"처럼 문장 부호를 소리 내어 말할 수도 있습니다. 다만 Google은 문장 부호와 말로 입력하기가 모든 언어에서 지원되지는 않는다고 안내합니다. 아이폰에서는 키보드에 같은 일을 하는 마이크 키가 있습니다.
이것으로 문자, 이메일, 검색창, 메모가 모두 해결됩니다. 사람들이 휴대폰에서 쓰는 글의 대부분이죠. 전형적인 휴대폰 받아쓰기는 50~150단어짜리 이메일 답장, 약 30초 분량의 말입니다. 기본 마이크는 이를 군말 없이 처리합니다. 스토어 검색 결과를 채우는 서드파티 키보드 앱들은 바로 그 같은 마이크를 다른 브랜드로 포장했을 뿐이고, 때로는 구독료까지 붙어 있습니다. 설치하기 전에, 이미 가지고 있는 그 버튼부터 눌러 보세요. 무료로 기본 설치된 선택지가 동시에 가장 합리적인 선택이기도 한, 보기 드문 제품 분야입니다.
한 가지 솔직하게 밝히겠습니다. 보통은 이 대목에서 판매자가 자사 모바일 앱으로 화제를 돌리겠지만, 우리에게는 모바일 앱이 없습니다. Whisper by Remskill은 Windows와 macOS용 데스크톱 앱입니다. 그게 전부입니다. 받아쓰기 생활이 주로 휴대폰에서 이뤄진다면 기본 키보드를 권합니다. 그리고 이 탭은 제 축복과 함께 닫으셔도 됩니다.
데스크톱은 기본 도구가 바닥을 드러내는 곳입니다
두 데스크톱 운영체제 모두 음성 입력을 기본으로 갖추고 있고, 무엇이든 설치하기 전에 둘 다 알아 둘 만합니다. Windows 11에서는 Windows 키 + H를 누르면 작은 음성 입력 위젯이 나타납니다. 세 가지가 필요합니다. 인터넷 연결, 작동하는 마이크, 그리고 텍스트 상자에 놓인 커서. 40개 이상의 언어를 지원하고, 설정을 켜면 문장 부호도 대신 넣어 줍니다. 기억해 둘 선은 인터넷이 필요하다는 점입니다. Win+H는 호텔 Wi-Fi가 끊기기 전까지는 훌륭합니다.
음성 입력
듣는 중…
Mac에서는 받아쓰기를 기능 키 줄의 마이크 키, 키보드 단축키, 또는 편집 > 받아쓰기 시작에서 켤 수 있습니다. 길이 제한은 없지만 침묵이 30초간 이어지면 스스로 멈춥니다. 실제로는 천장을 올려다보며 단어를 고르는 사이에 꺼져 버린다는 뜻이죠. 지원 언어에서는 시키지 않아도 문장 부호를 넣어 주며, Apple은 받아쓰기가 모든 언어나 지역에서 제공되지는 않는다고 밝힙니다.
어느 도구도 나쁘지 않고, 둘 다 한두 문장에는 충분합니다. 한계는 글쓰기가 본격적으로 길어질 때 드러납니다. 제품명이나 고객사 이름을 위한 사용자 어휘 등록은 어느 쪽 기능 목록에도 없고, 말에 섞인 "음, 그러니까" 같은 군더더기를 AI로 다듬어 주는 기능도 없습니다. Mac에서는 받아쓰기가 기기 내에서 처리되는지 확인할 수 있지만, Windows에서는 오프라인이 되는 순간 도구가 먹통이 됩니다. 이런 한계들이 바로 데스크톱 음성 입력 앱이 하나의 분야로 존재하는 이유입니다.
데스크톱 음성 입력 앱이 정말로 해야 할 일

원리는 한 문장으로 설명됩니다. 데스크톱 음성 입력 앱은 백그라운드에 머물며 전역 단축키 하나를 지켜보다가, 당신이 누르고 있는 동안 녹음하고, 그 오디오를 음성 인식 모델에 통과시킨 뒤, 결과를 커서가 있는 자리에 붙여 넣습니다. 이 문장의 각 부분이 설치 전에 확인해야 할 항목입니다.
단축키가 중요한 이유는 받아쓰기를 일부러 찾아가는 기능이 아니라 반사 동작으로 바꿔 주기 때문입니다. "커서가 있는 자리"가 중요한 이유는 글쓰기가 이메일, Slack, CRM, 코드 편집기, 브라우저 양식에서 일어나기 때문입니다. 자기 창에서만 입력되는 도구는 마이크 달린 메모장일 뿐이죠. 모델은 두 가지 면에서 중요합니다. 하나는 정확도, 또 하나는 당신의 오디오가 어디로 가느냐입니다. 로컬 모델은 당신의 기기에서 돌아가며 오프라인에서 작동합니다. 클라우드 모델은 오디오를 서버로 보내고, 보통 더 잘 받아씁니다. 좋은 데스크톱 앱은 당신을 대신해 정해 버리지 않고, 상황마다 직접 고르게 해 줍니다.
속도 역시 체크리스트에 들어가야 합니다. 그것도 분명한 숫자로요. M1 MacBook Air에서 작은 로컬 영어 모델을 돌릴 때, Whisper는 키를 떼고 텍스트가 붙여질 때까지 약 1.4초 걸립니다. 괜찮은 연결의 클라우드 모드에서는 약 1.1초입니다. 이 정도 응답이면 받아쓰기는 "반사" 범주에 머뭅니다. 도구가 당신을 기다리게 하거나, 창을 띄우게 하거나, 패널에서 텍스트를 복사하게 만든다면, 그 번거로움이 당신이 찾아온 속도의 이점을 갉아먹습니다.
이 페이지에서 제 의견은 딱 하나입니다. 최고의 생산성 비결은 더 빠른 단계가 아니라 더 적은 단계입니다. 대부분의 도구는 타이핑을 빠르게 하려 합니다. 음성 입력은 타이핑을 아예 없앱니다. 흐름이 "멈추고, 앉고, 친다"에서 "말하면, 끝"으로 바뀌는데, 이것이 바로 누구도 새 기술을 배우지 않고 1분 145단어의 말이 40단어의 타이핑을 이기는 방식입니다. 단계를 다시 더하는 앱은 자기 분야의 요점을 놓친 것입니다.
이 분야 자체를 더 깊이 둘러보고 싶다면 — 엔진, 정확도, 로컬 대 클라우드의 득실 — 음성 입력 소프트웨어에 관한 별도의 설명을 따로 두고 있습니다. 이 페이지는 더 좁은 질문에 집중합니다. 기기마다 무엇을 설치할 것인가.
Whisper가 Windows와 Mac에서 음성 입력을 다루는 방식
Whisper by Remskill은 이 질문의 데스크톱 절반에 대한 우리의 답입니다. 단축키 하나를 누른 채(Windows에서는 Ctrl+Space, Mac에서는 Command+Option) 말하고 손을 떼면, 텍스트가 커서가 있는 자리에, 어떤 앱에든 들어갑니다. 말하는 동안에는 작은 오버레이가 화면에 떠서 듣고 있다는 걸 보여 줍니다.
내부적으로는 세 가지 경로 중에서 고르며, 앱이 당신 대신 정하지 않습니다.
- 로컬 Whisper — 영어에 최적화된 모델군과 다국어 모델군이 있으며, 약 140 MB의 Base 모델부터 약 3 GB의 Large v3까지 아우릅니다. 다국어 모델군은 자동 감지를 포함해 90개 이상의 언어를 지원합니다. 영어 전용 모델은 말 그대로 영어만 됩니다. 그러니 하루 중 언어를 바꿔 가며 쓴다면 다국어 모델군을 고르세요.
- 로컬 Parakeet — CPU에서 Whisper보다 5~10배 빠르게 돌아가며, 영어와 24개 유럽 언어를 지원합니다. 주로 영어로 받아쓸 때를 위한 빠른 차선입니다.
- 클라우드(본인의 OpenAI 키) — 본인의 API 키로 OpenAI에 연결합니다. 음성 자체는 gpt-4o-mini-transcribe나 gpt-4o-transcribe로, 선택 사항인 AI 다듬기는 gpt-5-mini로 처리합니다.
로컬에서 도는 것은 모두 무료입니다. 모델이 당신의 기기에서 돌아가고, 오프라인에서 작동하며, 아무 데도 무엇을 보내지 않고, 가입할 때 카드도 필요 없습니다.
알아 둘 만한 한 가지 비결이 더 있습니다. AI 키워드입니다. 녹음을 "Hey whisper"로 시작하면, 앱은 받아쓴 텍스트를 그대로 붙여 넣는 대신 AI 처리를 작동시킵니다. 일상적인 문장에는 받아쓰기를, 텍스트를 다시 손보고 싶은 순간에는 비서를. 어느 쪽이든 같은 단축키입니다.
제가 가장 믿는 테스트는 벤치마크가 아니었습니다. 어린 둘째 딸에게 Whisper를 줘 보고 한 번만 보여 줬더니(누르고, 말하고, 떼고, 붙여 넣고), 아이는 빠진 이와 이의 요정의 환율에 관해 할머니께 보내는 90단어짜리 이메일을 추가 질문 하나 없이 받아썼습니다. 이틀 뒤 아이는 "내 그림 그리는 앱에서는 단축키가 안 돼"라고 알려 왔는데, 보통 사용자는 단축키 충돌이 뭔지 모른다는 사실을 저는 그렇게 배웠습니다. 그저 안 된다는 것만 알 뿐이죠. 단축키를 바꿀 수 있는 설정은 그날 밤에 출시됐습니다. 일곱 살 아이가 그 흐름을 해낼 수 있다면, 그 흐름은 충분히 단순한 겁니다.
위에 임베드된 앱은 스크린샷이 아니라 진짜 데스크톱 프론트엔드입니다. 직접 눌러 보세요. 그리고 설치 의향에는 솔직한 답이 마땅하니 다시 한번 밝힙니다. Whisper는 Windows와 Apple Silicon Mac에서 돌아가며, 그 외에는 어디서도 돌아가지 않습니다.
무엇이든 설치하기 전, 짧은 체크리스트
소프트웨어 설치는, 그게 무료일 때조차 하나의 약속입니다. 다섯 가지 질문이 어떤 비교 글보다도 빠르게 이 문제를 정리해 줍니다.
- 솔직히, 당신은 어느 기기에서 글을 쓰나요? 주로 휴대폰: 기본 키보드 받아쓰기를 그대로 쓰고 한 푼도 쓰지 마세요.
- 모든 앱에서 입력되나요? 복사해 와야 하는 별도의 창이 아니라, 커서 자리에 붙여 넣는 전역 단축키를 찾으세요.
- 오프라인에서도 되나요? Windows 음성 입력은 안 됩니다. 로컬 모델은 됩니다. 당신이 쓰는 글에 서버로 보내선 안 되는 내용이 있다면, 이 질문이 가장 먼저입니다.
- 언어는 몇 개인가요? 엔진별로 세어 보세요. Windows 음성 입력은 40개 이상, Whisper의 다국어 모델은 90개 이상, Parakeet은 25개, .en 모델은 영어만.
- 마이크부터 손봤나요? 20달러짜리 USB 마이크가 어떤 모델 업그레이드보다 정확도에 더 보탬이 됩니다. 소프트웨어를 만드는 저조차도 마이크의 손을 들어 줍니다. 이 업계에서 그 말을 입 밖에 내고 싶어 하는 사람은 아무도 없습니다.
정확도 수치나 엔진 비교 같은 연구 관점에서 들어오셨다면, 음성-텍스트 변환 앱 설명이 그쪽을 다룹니다. 요금제와 그 안에 무엇이 담겼는지는 가격 페이지에 있습니다. 짧게 말하면, 로컬로 도는 것은 모두 무료입니다.
Whisper를 건너뛰어야 할 때
받아쓰기가 휴대폰에서 일어난다면 우리를 건너뛰세요. 우리에게는 모바일 앱이 없고, Gboard나 아이폰 키보드의 받아쓰기는 무료이며 충분히 제 몫을 합니다. Mac에서 하루에 한두 문장 쓰는 정도라면, Apple Dictation이 기본 탑재되어 있고 마이크 키로 시작되며 문장 부호도 넣어 줍니다.
여러 화자가 등장하는 회의 녹취와 요약이 필요하다면, 그건 말로 글쓰기와는 다른 제품 분야이니 그 분야에서 찾아보세요. 그리고 Linux나 Intel Mac을 쓰고 있다면 Whisper는 거기서 돌아가지 않으니, 기본 도구와 브라우저 도구가 당신의 솔직한 선택지입니다.
출처
20년 전 음성 입력이란 컴퓨터에 보정용 문장을 읽어 주며 잘되기를 비는 일이었습니다. 오늘의 솔직한 요약은 두 줄에 담깁니다. 당신의 휴대폰은 이미 그 일을 하고 있고, 당신의 데스크톱은 설치 한 번이면 제대로 해낼 수 있습니다. 마이크는 한동안 당신 책상에서 가장 빠른 입력 장치였습니다. 우리 대부분이 아직 그 키를 누르지 않았을 뿐이죠.
데스크톱에 음성 입력 앱을 두세요
Whisper를 내려받고, 단축키 하나를 누른 채, 텍스트가 커서 자리에 들어가는 걸 지켜보세요.
Windows와 Apple Silicon Mac에서 돌아갑니다. 로컬로 도는 것은 모두 무료입니다. 키보드는 필요할 때 늘 그 자리에 있을 겁니다.



