비교
Google 음성 입력 대안: 어디서나 받아쓰기
Google 음성 입력은 Google Docs 안에만 머무릅니다. 커서가 있는 곳이라면 어디든 글자를 입력해 주는 데스크톱 받아쓰기 앱과 솔직하게 나란히 비교해 보고, 무료 기본 도구가 여전히 제격인 경우가 언제인지도 분명하게 짚어 드립니다.
마지막 업데이트: 2026년 6월

가장 좋은 Google 음성 입력 대안은 Google Docs뿐 아니라 모든 텍스트 입력란에 글자를 써 주는 데스크톱 받아쓰기 앱입니다. Whisper by Remskill은 Windows와 Mac에서 작동하고, 무료 로컬 AI 모델로 오프라인에서 받아쓰기를 하며, 문장 부호를 자동으로 넣고, 커서가 있는 곳이라면 이메일이든 Slack이든 Word든 어떤 브라우저든 텍스트를 붙여 넣습니다.
화요일 아침, 등교 전에 보내야 할 80단어짜리 교사 이메일이 있었습니다. Google Docs에 음성 입력을 켜 두고 깔끔한 세 문단을 받아쓴 다음, 실제 답장을 쓰려고 Gmail로 넘어갔는데, 애초에 듣고 있지도 않던 작성 창에 대고 혼자 말하고 있는 저 자신을 발견했습니다. Google 음성 입력에는 규칙이 하나 있습니다. 문서 안에 머물러라. 마이크는 Docs의 도구 메뉴 안에 살고, 밖으로는 따라 나오지 않습니다.
그래서 한 탭에서 받아쓰고, 복사하고, 전환하고, 붙여 넣고, 입으로 말하는 걸 깜빡한 문장 부호를 고치고, 보냅니다. 이 자그마한 릴레이 경주가 바로 대안이 필요한 이유 전부입니다. 이 페이지의 결정은 단순합니다. 한 앱 안에만 사는 무료 도구를 계속 쓸 것인가, 아니면 어디서나 커서를 따라다니는 받아쓰기로 옮겨 갈 것인가.
차이는 이렇습니다. Google 음성 입력은 Google Docs 문서와 Slides 발표자 노트에 글자를 입력하는데, 당신의 하루치 글쓰기는 거기에 머물지 않습니다. 그사이 데스크톱 받아쓰기는 어른이 되었습니다. 이제 로컬 AI 모델이 평범한 노트북에서 돌아가고, 말하는 대로 표현을 다듬어 주며, 오디오를 어디로도 보내지 않습니다.
이 비교는 Google 음성 입력을 제가 만드는 데스크톱 받아쓰기 앱인 Whisper by Remskill과 다섯 가지 기준으로 나란히 놓습니다. 어디에 입력하는지, 문장 부호, 언어, 개인정보 보호, 오프라인 동작입니다. 끝까지 읽고 나면 당신의 글쓰기 방식에 어느 쪽이 맞는지 알게 됩니다. 솔직한 답이 "Google에 머물러라"라면, 페이지 아래쪽 섹션이 그렇다고 분명히 말해 줍니다. 저는 고객지원 답장까지 포함해 제 글의 대부분을 받아쓰기로 작성하므로, 이 내용은 기능 소개 페이지가 아니라 매일의 사용 경험에서 나온 것입니다.
Google 음성 입력이 잘하는 것, 그리고 멈추는 지점
먼저 인정할 건 인정하죠. Google 음성 입력은 Google 계정만 있으면 무료이고, 설치가 전혀 필요 없으며, 최신 버전의 Chrome, Edge, Safari에서 작동합니다. Docs 문서 안이나 Slides의 발표자 노트와 자막 안에서는 인식 성능도 괜찮고 지원 언어 목록도 깁니다. 모든 글을 Docs에서 초안 잡는다면 제값을 합니다. 자세한 설정은 Google Docs 음성 입력 사용법 안내에서 다룹니다.
멈추는 지점도 그만큼 구체적입니다. 문장 부호는 수동입니다. "마침표", "쉼표", "물음표", "새 단락"이라고 직접 말해야 합니다. 그리고 모든 언어에서 문장 부호를 쓸 수 있는 것도 아닙니다. 편집과 서식 명령은 영어에서만, 그것도 계정 언어와 문서 언어가 둘 다 영어일 때만 작동합니다. (Slides 발표자 노트는 음성 입력은 되지만 음성 명령은 전혀 안 됩니다. 이유는 저도 모릅니다.)
그리고 이 글을 시작하게 만든 그 경계선. 이 기능은 두 개의 Google 화면 안에만 존재하고 그 밖에는 어디에도 없습니다. Gmail, Slack, 당신의 CRM, 코드 편집기, 웹 양식 — 침묵입니다. 이건 버그가 아닙니다. 자기 도움말 페이지가 말하는 그대로, 그 이상도 이하도 아닌 일을 하는 무료 기능일 뿐입니다. 문제는 당신의 글쓰기가 그 상자 안에 들어맞느냐입니다. 그리고 문장 한가운데서 듣기를 멈춘다면 보통은 당신이 아니라 마이크 탓입니다 — Google Docs 음성 입력 문제 해결법에서 흔한 원인을 다룹니다.
모든 앱에서 작동하는 음성 입력 대안
Whisper는 정반대로 베팅합니다. 받아쓰기는 한 웹사이트가 아니라 운영체제에 속한다는 것이죠. 단축키를 누릅니다. Windows에서는 Ctrl+Space, Mac에서는 Command+Option을 누른 채 유지하는 푸시투토크 방식입니다. 말합니다. 손을 뗍니다. 텍스트는 커서가 있는 곳이면 어디든 — 이메일, 채팅 창, 스프레드시트 셀, 커밋 메시지 — 그대로 내려앉습니다. 복사할 "원본 문서"가 없으니, 복사 단계도 없습니다.
속도 이야기는 단순한 산수입니다. 받아쓰기는 분당 약 145단어로 돌아가고, 타이핑은 약 40단어니까 — 약 3.6배 차이입니다. small 영어 모델을 쓴 M1 MacBook Air에서는 키를 떼고 텍스트가 보이기까지의 간격이 1.4초입니다.
내부적으로는 세 가지 경로 중 하나를 직접 고르며, 앱이 대신 골라 주지 않습니다. 클라우드 모드는 당신의 API 키로 OpenAI에 연결해 gpt-4o-mini-transcribe 또는 gpt-4o-transcribe를 씁니다. NVIDIA의 로컬 엔진인 Parakeet은 CPU에서 Whisper 모델보다 5~10배 빠르게 돌아가고 영어와 유럽 24개 언어를 지원합니다. 그리고 로컬 오픈소스 Whisper 모델은 140 MB짜리 영어 모델부터 3 GB의 Large v3까지 다양합니다. 앱은 Windows용과 Apple Silicon Mac용으로 출시됩니다.
Google 음성 입력 대 Whisper, 나란히 비교
표를 만들기 전에 정한 기준은 이렇습니다. 어디에 입력하는지, 무엇 안에서 돌아가는지, 문장 부호, 음성 명령, 언어 지원 범위, 오프라인 동작, 가격 구조. 제가 아직 Docs 마이크를 쓰던 시절 결정을 가른 일곱 가지입니다. Google 쪽 열은 Google 자체 도움말 페이지에서, Whisper 쪽 열은 제가 여기서 들여다볼 수 있는 앱 소스 코드에서 가져왔습니다.
| Google 음성 입력 | Whisper | |
|---|---|---|
| 입력 위치 | Docs 문서, Slides 발표자 노트와 자막 | 컴퓨터의 모든 텍스트 입력란 |
| 작동 환경 | 최신 Chrome, Edge, Safari | 데스크톱 앱, Windows + macOS (Apple Silicon) |
| 문장 부호 | 직접 말해야 하며, 모든 언어에서 되는 건 아님 | AI 정리 과정에서 자동 추가 |
| 음성 명령 | 영어만, 계정 언어와 문서 언어가 둘 다 영어일 때 | "Hey whisper" 키워드 + 맞춤 프리셋 |
| 언어 | 긴 목록, 언어마다 문장 부호 지원 제한 있음 | 다국어 Whisper 모델 90개 이상, Parakeet 25개, 영어 전용 .en 빌드 |
| 오프라인 | 브라우저 기능, 오프라인 사용은 문서화되지 않음 | 로컬 모드는 인터넷 없이도 완전히 작동 |
| 가격 구조 | Google 계정만 있으면 무료 | 로컬 모드 무료, 클라우드 기능 유료 — 가격 보기 |
결론은 첫 문단과 같습니다. 당신의 글쓰기가 Google Docs를 벗어나는 순간 Whisper가 정답입니다. 글쓰기가 결코 Docs를 벗어나지 않는 사람에게는 Google 음성 입력이 여전히 옳은 답입니다. 그 경우는 아래에 따로 한 섹션을 두었고, 진심으로 하는 말입니다.
온라인 음성 입력 대 데스크톱 음성 입력

"온라인 음성 입력"은 대개 탭에서 여는 웹사이트를 뜻합니다. 마이크 버튼을 눌러 텍스트 상자에 받아쓰는 무료 페이지죠. 이런 도구는 브라우저의 음성 인식 엔진 위에 얹혀 있는데, MDN의 Web Speech API 문서는 그 작동 방식을 솔직하게 설명합니다. "오디오가 인식 처리를 위해 웹 서비스로 전송되므로 오프라인에서는 작동하지 않습니다." 같은 페이지가 두 가지 대가를 짚습니다. 음성이 기기를 떠난다는 개인정보 문제, 그리고 연결이 없으면 받아쓰기도 없다는 안정성 문제입니다.
한 번 쓰는 메모라면 온라인 음성 입력 페이지로 충분합니다. 비용은 반복할 때 드러납니다. 받아쓸 때마다 끝에 선택, 복사, 전환, 붙여 넣기가 따라붙죠. 한번은 장보기 목록을 엉뚱한 탭에 받아쓴 뒤 예산 스프레드시트에 붙여 넣은 적이 있습니다. 한 10초 동안 3분기 전망에 "요거트, 큰 거 말고 작은 거"가 들어가 있었습니다. 데스크톱 도구는 텍스트가 끝나는 자리, 즉 당신의 커서에서 시작되기 때문에 이런 종류의 사고를 통째로 없애 줍니다. 그리고 브라우저 마이크가 말썽을 부리면 해결책은 브라우저 설정 안에 있는데, 그것만으로도 오후 한나절이 갑니다. 그래서 Chrome 받아쓰기 문제 해결법을 정리해 두었습니다. 충분히 많은 분들이 물어보셨거든요.
문장 부호와 정리: 아무도 세지 않는 편집 비용
재미없는 진실은, 받아쓰기 자체가 느린 부분이었던 적은 한 번도 없다는 겁니다. 느린 건 정리예요. Google 음성 입력에서는 문장 부호를 직접 말해야 하는데("마침표", "새 단락"), 작동은 하지만 당신을 쉼표를 읊는 사람으로 만들어 버립니다. 이 글을 위해 명령들을 시험해 봤더니, 제 테스트 문서에 "쉼표"라는 단어가 열한 번 들어가 있더군요. 게다가 이 습관은 집까지 따라옵니다. 그 뒤로 저는 실제 대화에서 한 문장을 "마침표"로 끝낸 적도 있습니다.
Whisper는 대신 원본 받아쓰기를 AI 정리 과정에 통과시킵니다. 문법이 고쳐지고, 군더더기 말이 제거되고, 문장 부호가 제자리에 놓입니다. 로컬 모드에서는 Ollama로, 클라우드 모드에서는 OpenAI 모델로 처리하며 기본 정리 엔진은 gpt-5-mini입니다. 문장을 "Hey whisper"로 시작하면 AI는 그 뒤의 말을 입력할 텍스트가 아니라 지시로 받아들입니다. "Hey whisper, 이 답장을 정중하면서도 단호하게 만들어 줘"는 시연이 아니라 실제로 쓰는 작업 흐름입니다. 체감 차이는 아무리 강조해도 부족합니다. 한쪽 도구는 당신더러 서식을 연기하라고 합니다. 다른 쪽은 사람처럼 말하게 두고, 그대로 보내도 될 결과물을 돌려줍니다.
개인정보 보호: 당신의 음성이 가는 곳
제가 끝까지 옹호할 의견은 이겁니다. 당신이 통제하지 못하는 서버로 음성을 보내는 받아쓰기는 개인정보 문제이고, 어떤 일에는 거래를 깨는 결정적 결함입니다. 브라우저 기반 음성 입력은 처리를 위해 오디오를 밖으로 내보내는 방식으로 작동합니다. 장보기 목록이라면 괜찮습니다. 하지만 계약서 초안, 환자 기록, 아이의 학교 문제에 관한 이메일이라면 이야기가 완전히 달라집니다.
이 교훈의 비용 측면을 저는 가까이서 지켜봤습니다. 제가 함께 일하던 팀은 외주 개발자에게 내부용 AI 받아쓰기 시제품을 맡겼는데, 그게 발화 하나하나마다 클라우드 API를 호출했습니다. 분기 말, 매니저가 비용 대시보드를 열었습니다. 다섯 자리 청구서였고, 그 대부분은 재시도 로직이 너무 적극적이라 한 팀이 스탠드업 녹음을 네 번씩 다시 받아쓴 탓이었습니다. 외주 개발자는 프롬프트를 최적화하자고 제안했습니다. CFO는 이미 회의록이 있는 회의를 서버에게 돈 주고 듣게 하지 말자고 제안했습니다. 둘 다 어느 한 부분에서는 옳았습니다.
Whisper의 로컬 모드는 이 질문을 두고 논쟁하는 대신 아예 닫아 버립니다. 모델이 당신의 기기에서 돌아가고, 아무것도 기기를 떠나지 않으며, 인터넷도 전혀 필요 없습니다. 같은 단축키, 같은 흐름, 전송되는 오디오는 0입니다.
Whisper를 건너뛰고 Google에 머물러야 할 때
받아쓰는 모든 단어가 Google Doc에 내려앉는다면 Google 음성 입력에 머무세요. 비용이 들지 않고, 이미 도구 메뉴에 있으며, Docs 안에서는 제 몫을 합니다. 반박하기 어려운 조합이고, 저도 아닌 척하지 않겠습니다. 한 달에 두 번 받아쓰는 정도여도 마찬가지입니다. 복사·붙여 넣기 두 번 아끼자고 데스크톱 앱을 설치하는 건 과한 일이고, 이건 직업적으로 드리는 말씀입니다. Whisper는 당신의 글쓰기가 문서를 자주 벗어날 때(이메일, 채팅, 양식, 메모), 또는 AI 문장 부호, 오프라인 사용, 오디오를 내 기기에 두는 것이 중요할 때 제값을 합니다. 그 전까지는 무료 기본 도구가 옳은 도구입니다.
읽어 볼 만한 자료
맨 위에서 이야기한 그 교사 이메일은 결국 보냈습니다 — Doc을 거치는 릴레이 없이 Gmail에 바로 받아쓰고, 제가 한마디 하지 않아도 문장 부호까지 들어간 채로요. Google Docs 탭은 닫힌 채로 있었습니다. 그게 이 비교를 한순간에 담은 장면입니다. 무료 도구는 당신의 글쓰기에게 자기한테로 오라고 하고, 대안은 글쓰기가 이미 있는 곳으로 갑니다. 당신의 하루에 맞는 방향을 고르세요.
다음 이메일에서 단축키를 한번 써 보세요
Windows나 Mac용 Whisper를 내려받고, 한 번 누르고, 말하고, 텍스트가 커서가 이미 있는 곳에 내려앉는 걸 지켜보세요.
로컬 모드는 무료이고, 오프라인에서 작동하며, 오디오를 어디로도 보내지 않습니다.



