가이드
영어 학습자를 위한 음성 받아쓰기
영어가 모국어가 아니어도 말하면서 영어로 쓸 수 있습니다. 단축키를 누르고, 말하면, 깔끔한 영어 텍스트가 어떤 앱에서든 커서 위치에 바로 붙여넣어집니다. AI가 문법과 군더더기를 정리해 줍니다. 발음 교사가 아닌 글쓰기 보조 도구입니다.
최종 업데이트: 2026년 6월

영어 학습자를 위한 음성 받아쓰기를 사용하면 비원어민도 타이핑 대신 말로 영어 글을 쓸 수 있습니다. Whisper 같은 도구가 어떤 앱에서든 커서 위치에 영어 음성을 받아씁니다. AI 처리가 문법과 군더더기를 정리해 줍니다. 악센트 인식은 좋지만 완벽하지는 않으며, 발음 선생님이 아닌 글쓰기 보조 도구입니다.
영어는 제 세 번째 언어입니다. 우크라이나어와 러시아어를 먼저 배운 뒤, 주로 기술 문서와 버그 리포트를 통해 영어를 익혔습니다. 들어보면 딱 그 느낌이 나는 공부법이죠. 오랫동안 영어로 글을 쓸 때 느린 부분은 생각이 아니었습니다. 타이핑이 문제였습니다. 손가락이 따라가지 못하는 사이 맞는 단어를 찾아 헤매고, 철자를 의심하다 보면, 머릿속에 있던 문장이 키보드와 화면 사이 어딘가에서 사라져버렸습니다.
말하기는 어느 언어든 타이핑보다 빠릅니다. 아직 배우고 있는 언어도 마찬가지입니다. 음성 받아쓰기는 그 간극을 메워줍니다. 이미 소리 내어 말할 수 있는 영어 문장을 말하면, 도구가 받아써 줍니다. 아무도 언급하지 않는 함정이 하나 있습니다. 도구는 당신의 실력이 아닌 악센트를 듣는다는 것입니다. 요즘 악센트 인식이 진짜로 좋아졌습니다. 하지만 선생님은 아닙니다. 두 가지 모두 솔직하게 말씀드리겠습니다.
핵심을 간단히 말하면 이렇습니다. 최신 음성 인식은 Whisper 계열 모델을 기반으로 합니다. 다양한 악센트의 실제 음성 데이터로 훈련된 모델입니다. 그 덕분에 비원어민 영어 화자도 대부분의 경우 사용 가능한 영어 텍스트를 받아볼 수 있습니다. 완벽하지는 않지만, 수정할 수 있는 탄탄한 초안이 나옵니다.
그러니 영어 학습자에게 중요한 질문은 "나를 이해해줄까"가 아닙니다. 대부분 이해합니다. 진짜 질문은 어떤 모델이 악센트와 언어를 가장 잘 처리하는지, 로컬로 실행할지 클라우드로 실행할지, 그리고 AI 정리 기능을 어떻게 활용해 말로 한 초안을 깔끔한 영어 문장으로 만드는지입니다. 그 모든 것을 안내하고, 2분 안에 설정하는 방법을 알려드리겠습니다. 그리고 받아쓰기 도구가 당신에게 필요한 것이 아닐 때도 솔직하게 말씀드리겠습니다.
모국어가 아닐 때 목소리로 영어 쓰기가 도움이 되는 이유

제2외국어로 글을 쓸 때 어려운 부분은 거의 아이디어가 아닙니다. 아이디어와 종이 사이의 마찰입니다. 하고 싶은 말은 알고 있습니다. 소리 내어 말할 수도 있습니다. 하지만 타이핑을 하면 철자, 어순, 키보드 배열과 씨름하는 사이 머릿속에 있던 문장이 조용히 사라져버립니다. 말하기는 그 싸움의 대부분을 건너뜁니다.
받아쓰기 속도는 분당 약 145단어인 반면, 타이핑은 약 40단어입니다. 원어민에게도 꽤 빠른 속도입니다. 제2, 제3외국어로 글을 쓰는 사람에게는 그 이상입니다. 비모국어로 타이핑하는 것 자체가 느리고 실수가 많기 때문입니다. 절약된 노력을 정작 중요한 부분, 즉 올바르게 표현하는 것에 쓸 수 있습니다.
더 조용한 이점도 있습니다. 문장을 말하고 그게 화면에 쓰인 것을 보면, 실제로 말이 되는지 바로 알 수 있습니다. 어색한 표현은 머릿속에서 들릴 때와 달리 화면에서 어색하게 보입니다. 이 피드백 루프는 학습자에게 유용합니다. 강의 내용을 노트로 정리하는 학생에게도 마찬가지죠. 문법을 알아서 고쳐주지는 않습니다. 그건 두 섹션 뒤에 나오는 AI 처리 기능이 합니다. 하지만 자기 말이 종이에 적힌 것을 보는 것 자체가 작은 수업이 됩니다.
단축키를 누르고, 영어로 말하면, 커서 위치에 텍스트가 나타납니다
작동 방식은 단순합니다. 그게 매력의 전부입니다. 단축키를 누르고, 말하고, 손을 떼면, 포커스가 있는 텍스트 필드의 커서 위치에 받아쓴 내용이 붙여넣어집니다. Whisper는 키를 놓은 후 짧은 여운을 유지하므로 마지막 단어가 잘리지 않습니다. 영어 문장의 끝을 아직 찾고 있을 때 유용합니다. OS 커서에 붙여넣기 때문에 이메일, Google Doc, 채팅창, 과제 문서 어디서든 동일하게 작동합니다.
앱마다 따로 설정할 것이 없습니다. 브라우저 확장 프로그램도, 플러그인도, 토큰 붙여넣기도 필요 없습니다. 커서를 텍스트 박스에 놓고 말하면 단어가 나타납니다. 말하는 동안 작은 캡슐이 표시되어 수신 중임을 알 수 있습니다.
단축키는 한 번 설정하고 잊어도 됩니다. Windows는 Ctrl+Space, Mac은 Command+Option을 말하는 동안 누르고 있는 푸시 투 토크 방식입니다. 기존에 사용 중인 키와 충돌하면 설정에서 변경할 수 있습니다. Google Docs에서 음성 입력을 설정해본 적이 있다면 같은 개념입니다. 단, 하나의 앱에만 국한되지 않습니다. 같은 키가 화면의 모든 텍스트 박스에서 작동합니다.
2분 안에 설정하기 (Windows 또는 Mac)
Apple Silicon Mac 또는 Windows 10 이상의 PC, 작동하는 마이크, 그리고 글을 쓰고 싶은 앱만 있으면 됩니다. 로컬 파이프라인 전체가 로그인 계정이라면 누구에게나 무료이며, 가입 시 결제 수단이 필요하지 않습니다. 순서는 다음과 같습니다.
1단계 — Whisper 설치 및 로그인.
다운로드 페이지에서 내려받아 설치하고, 무료 계정을 만드세요. 카드 불필요. 로컬 받아쓰기 파이프라인 전체를 바로 사용할 수 있습니다.
앱의 트레이 아이콘이 나타나고 설정 마법사에서 모델 선택을 제안하면 성공입니다.
2단계 — 받아쓰기 방식 선택.
앱이 자동으로 선택하지 않습니다. 세 가지 중에서 선택합니다. Cloud (OpenAI, 직접 키 입력), Local Parakeet, 또는 Local Whisper입니다. 악센트 허용 범위와 번역을 위해서는 다국어 Whisper 모델이 가장 중요합니다. 자세한 내용은 다음 섹션에서 설명합니다.
모델 다운로드가 완료되고 준비 완료로 표시되면 성공입니다.
3단계 — 단축키 확인.
Windows 기본값은 Ctrl+Space, Mac은 푸시 투 토크 방식의 Command+Option입니다. Mac에서는 메시지가 표시될 때 접근성 권한을 허용하세요. 없으면 다른 앱에 커서 붙여넣기가 되지 않습니다.
테스트 녹음이 아무 텍스트 필드에 붙여넣어지면 성공입니다.
4단계 — 텍스트 박스에 커서를 놓고 말하기.
이메일, 문서, 채팅을 열고 텍스트 박스를 클릭한 뒤, 단축키를 누른 채로 영어 문장을 말하고 손을 뗍니다. 커서 위치에 받아쓴 내용이 나타납니다.
말한 영어 문장이 텍스트로 박스 안에 들어오면 성공입니다.
느린 부분은 모델 다운로드이지 설정이 아닙니다. 나머지는 위의 네 단계뿐입니다. 실행되고 나면 영어 이메일 쓰기가 타이핑 작업이 아닌 말하기 작업이 됩니다. 영어가 아직 연습 중인 부분이라면, 그게 바로 유지하고 싶은 부분입니다.
악센트 처리 성능과 99개 언어 활용법
악센트에 대해 솔직하게 말씀드리겠습니다. 여기서 정직한 답변이 중요합니다. Whisper 모델은 비원어민 영어를 포함해 다양한 실제 발화 데이터로 훈련되었습니다. 실제로 강한 비원어민 악센트도 대부분 정확하게 받아써집니다. 대부분이요. 악센트가 더 강하거나, 말이 빠르거나, 배경 소음이 있거나, 이름과 전문 용어가 같은 문장에 들어가면 가끔 틀릴 수 있습니다. 성능은 좋습니다. 마법이 아니라는 뜻입니다. 모든 악센트를 완벽하게 처리한다고 말하는 사람은 데모를 파는 것이지 현실을 말하는 게 아닙니다.
모델 선택보다 실질적인 차이를 만드는 두 가지 요소가 있습니다. 첫째, 마이크입니다. $20짜리 USB 마이크가 어떤 모델 업그레이드보다 정확도에 더 큰 영향을 미칩니다. 또렷하고 조금 더 천천히 말하는 것도 도움이 됩니다. 영어를 연습하는 중이라면 어렵지 않은 일입니다. 둘째, 모델 계열입니다. 다국어 Whisper 빌드는 99개 언어를 지원하며, 훨씬 다양한 세계 음성을 학습했기 때문에 영어 전용 빌드보다 악센트 있는 영어를 더 잘 처리하는 경향이 있습니다. Local Parakeet은 영어와 24개 유럽 언어, 총 25개를 지원하며 가장 빠른 로컬 옵션이지만 번역은 불가합니다. 영어 전용 `.en` 빌드는 이름 그대로 영어만, 번역 없이 지원합니다.
마지막 요점에서 학습자에게 정말 유용한 활용법이 나옵니다. 다국어 Whisper 모델은 받아쓰는 동시에 영어로 번역할 수 있습니다. 영어 문장이 떠오르지 않을 때, 모국어에서는 입에서 맴도는데 영어로는 기억나지 않을 때, 모국어로 말하면 영어 초안이 돌아옵니다. 다듬어진 번역이 아니라서 그대로 쓸 수는 없지만, 가장 자신 있는 언어로 초안을 쓰고 영어로 다듬는 방법으로는 실질적인 장벽을 없애줍니다. 생각하는 언어로 말하고, 배우는 언어로 고치세요.
로컬 vs 클라우드: 언어 학습자에게 맞는 방식은
대부분의 영어 쓰기, 이메일, 숙제, 메시지, 에세이 초안에는 로컬 모드로 충분합니다. 무료이고 오프라인입니다. 어려운 녹음에서 최고 정확도가 필요하거나 문장 중간에 검색이 필요할 때 클라우드가 제 역할을 합니다. 앱이 선택을 요구하는 만큼, 잘 선택할 수 있도록 세 가지 방식의 차이를 설명합니다.
차이는 속도, 언어 지원 범위, 음성이 어디로 가는지에 달려 있습니다.
- Local Parakeet — NVIDIA의 TDT 엔진, 약 600 MB, 가장 빠른 로컬 옵션입니다. CPU에서 Whisper보다 5~10배 빠릅니다. 영어와 24개 유럽 언어, 총 25개를 지원합니다. 영어 번역 불가. 모국어가 유럽 언어이고 영어로 쓰고 있다면, 빠르고 완전 오프라인인 이 방식이 적합합니다.
- Local Whisper — 같은 기기에서 Parakeet보다 느리지만, 다국어 빌드는 99개 언어를 지원하며 악센트 처리가 더 뛰어나고 영어 번역도 가능합니다. 중국어, 일본어, 한국어, 아랍어, 또는 Parakeet이 지원하지 않는 언어를 사용하거나, 모국어로 초안 쓰기 기능이 필요하다면 이 방식을 선택하세요. 기본 영어 모델은 약 480 MB입니다.
- Cloud (OpenAI, BYOK) — 최고 정확도와 웹 접근성을 제공하며, OpenAI에서 직접 청구되는 자신의 OpenAI 키를 사용합니다. 받아쓰기는 기본적으로 gpt-4o-mini-transcribe로 실행됩니다. 인터넷이 필요하므로 기기 외부로 음성이 전송되는 유일한 방식입니다. 클라우드 기능은 Whisper Pro에 포함됩니다.
솔직히 말하면, 일상적인 영어 글쓰기에는 로컬 다국어 Whisper 모델이 대부분의 학습자에게 충분합니다. 99개 언어, 적절한 악센트 허용 범위, 필요할 때 영어 번역, 그리고 서버로 전송되는 것이 없습니다. 로컬 엔진 두 가지 모두 기기에서 완전히 실행됩니다. 개인 에세이, 입사 지원서, 실수 없이 써야 하는 메시지처럼 비공개로 유지하고 싶은 내용을 받아쓸 때 중요한 장점입니다. 로컬로 시작하세요. 더 높은 정확도가 필요할 때만 클라우드를 사용하세요.
말로 한 초안을 깔끔한 영어 문장으로 만들기
어느 언어든 원시 받아쓰기는 이어달리기 문장으로 나옵니다. 소리 내어 말하듯 문장을 말하면, 군더더기 단어, 자기 수정, 입 밖으로 내지 못한 쉼표와 함께, 어떤 음성 엔진이든 구두점 없는 텍스트 덩어리를 돌려줍니다. 학습자에게는 여기서 음성 받아쓰기가 진가를 발휘합니다. 정리 기능이 제2외국어에서 가장 어려운 부분을 처리해 주기 때문입니다.
Whisper는 텍스트가 확정되기 전에 AI 처리를 실행할 수 있습니다. "Hey whisper" 활성화 문구를 말하면 말로 한 초안이 다듬어집니다. 군더더기 단어 제거, 구두점 추가, 이어달리기 문장 분리, 명백한 실수 수정이 이루어집니다. 로컬 모델에서는 Ollama를 통해, 클라우드 모드에서는 기본적으로 gpt-5-mini를 통해 실행됩니다. 의미를 다시 쓰는 것이 아니라 문법과 구조를 정리하므로, 결과물은 여전히 당신의 글처럼 들립니다. 더 깔끔하게요.
so um i want to ask about the the deadline for the assignment because i am not sure is it friday or next monday and also can i send it by email
I want to ask about the deadline for the assignment, because I'm not sure if it's Friday or next Monday. Also, can I send it by email?
솔직한 한계 하나. AI 처리는 문법과 형태를 고쳐주지만, 왜 바뀌었는지 가르쳐주지는 않습니다. 규칙을 배우는 것이 목표라면, 변경 전후를 나란히 읽어보세요. 그 차이가 수업이 됩니다. 마감 전에 깔끔한 메시지를 빠르게 보내는 것이 목표라면, 정리하고 넘어가세요. 둘 다 좋은 활용법입니다. 목표가 다를 뿐이고, 오늘 어떤 목표를 가지고 있는지는 당신만 압니다.
말하고 정리하는 같은 흐름이 하나의 앱에만 국한되지 않고 쓰는 모든 것에 적용됩니다. 목소리로 더 빠르게 입력할 수 있습니다. 이메일, 문서, 채팅 전반에서 긴 단락이 한 단어씩 신중하게 타이핑하는 벽이 아닌 몇 마디 말로 완성됩니다.
영어 학습자에게 음성 받아쓰기가 적합하지 않은 경우

시간을 낭비시키는 것보다 클릭을 잃는 편이 낫습니다. 받아쓰기 도구가 잘못된 답인 경우를 솔직하게 말씀드립니다. 발음을 향상시키는 것이 목표라면, 이 도구는 아닙니다. 음성 받아쓰기는 발화를 텍스트로 변환합니다. 악센트를 채점하거나, 단어 발음을 교정하거나, "thirty"가 "dirty"처럼 들렸다고 알려주지 않습니다. 발음을 위해서는 발음 전문 언어 앱, 튜터, 또는 대화 파트너가 필요합니다. 받아쓰기 도구는 글쓰기 보조 도구이지 말하기 코치가 아닙니다. 다른 척하는 것은 솔직하지 못한 일입니다.
솔직한 조언을 몇 가지 더 드립니다. 짧은 메시지만 받아쓰면 된다면, 이미 기기에 있는 무료 도구로 충분합니다. Windows에서는 Windows 키 + H를 눌러 내장 음성 입력 바를 사용하세요. Mac에서는 키보드 설정의 시스템 설정에서 받아쓰기를 켜면 됩니다. Apple Silicon에서는 일반 텍스트를 기기 내에서 처리할 수 있습니다. Windows의 경우 인터넷 연결이 필요하고 Microsoft 서버를 통해 처리되므로 오프라인이 아닙니다. 설명과 연습이 있는 문법 규칙을 실제로 가르쳐주는 도구가 필요하다면, 그건 문법 검사기나 학습 앱입니다. 여기의 AI 정리 기능은 텍스트를 고쳐주지, 수업을 진행하지 않습니다.
글쓰기 자체가 병목일 때, 즉 긴 이메일, 에세이, 지원서처럼 영어로 타이핑하는 것보다 말하는 게 더 빠를 때, 그리고 Windows와 Mac의 모든 앱에서 동일하게 작동하는 단 하나의 단축키를 원할 때 전용 시스템 전체 받아쓰기 도구를 사용하세요. 그 기준 이하라면, 무료 도구를 쓰거나 상황에 맞는 도구를 사용하세요. 올바른 선택이 때로 우리 쪽을 가리키지 않을 수도 있습니다. 그럴 때도 솔직하게 말씀드리겠습니다.
어디서 받아쓸지 선택하고 있다면, 플랫폼 가이드가 설정을 자세히 다루고 있습니다. Windows에서 음성 텍스트 변환 가이드는 PC에서 같은 과정을 단계별로 안내합니다.
영어는 제 세 번째 언어입니다. 이 가이드의 대부분을 텍스트 박스에 말로 입력하고, 정리 기능이 귀로는 절대 못 잡을 이음새를 고쳐주게 했습니다. 솔직한 이야기를 드리면, 이 도구는 영어를 완벽하게 만들어주지도, 규칙을 가르쳐주지도 않습니다. 하지만 머릿속의 문장을 손가락보다 훨씬 빠르게 페이지에 옮겨줍니다. 다듬는 것은 여전히 여러분 몫입니다. 빠른 부분만 도와드립니다.
다음 영어 이메일을 말로 써보세요
단축키를 누르고, 영어로 말하고, 손을 떼세요. 이메일, 문서, 그 외 모든 앱에서 커서 위치에 깔끔한 텍스트가 나타납니다.
로그인 계정이라면 로컬 모드 무료. 시작 시 카드 불필요.



