작성자: Denys Medvediev

튜토리얼

음성 텍스트 변환, Windows 11에서

키보드에서 Windows 키 + H를 누르고, 텍스트 박스에 커서를 놓은 뒤 말하기 시작하면 됩니다. 내장된 음성 입력은 Azure를 통해 온라인으로 작동합니다. 오프라인에서 어떤 앱에서든 받아쓰기를 하려면 전용 도구를 설치하세요. 이 가이드는 두 가지 방법 모두를 처음부터 끝까지 안내합니다.

최종 업데이트: 2026년 6월

실내에서 노트북 키보드를 타이핑하는 손, 타이핑보다 빠른 대안으로서 받아쓰기를 보여주는 이미지

키보드에서 Windows 키 + H를 누르고, 텍스트 박스에 커서를 놓은 뒤 말하기 시작하면 됩니다. 말한 내용이 커서 위치에 바로 입력됩니다. 내장 음성 입력은 Azure 온라인 음성 인식을 사용하므로 인터넷 연결이 필요합니다. 오프라인에서 어떤 앱에서든 받아쓰기를 하려면 전용 도구를 설치하세요. 이 가이드는 두 가지 방법 모두를 처음부터 끝까지 안내합니다.

큰딸이 한번은 제가 왜 이메일을 보내는 데 그렇게 오래 걸리냐고 물은 적이 있습니다. 솔직한 대답은, 저는 분당 약 40단어를 타이핑하고 90초마다 한 번씩 방해를 받는다는 것입니다. 음성 입력이 그 절반 문제를 해결해줬습니다. Windows 11에서의 요령은 대부분의 사람이 찾지 못하는 단축키 하나에 있습니다. Windows 키 + H를 누르고 있으면 현재 타이핑 중인 곳 위에 작은 마이크 툴바가 나타납니다.

그 다음 말을 하면 커서 위치에 텍스트가 입력됩니다. 아래에서 제가 주장할 의견은 이것입니다. 간단한 메모 이상의 작업에는 내장 도구를 선택하지 않겠다는 것입니다.

Windows 11에서 음성 텍스트 변환을 사용하는 방법은 두 가지이며, 차이점은 작업이 어디서 처리되느냐입니다. 방법 1은 내장 음성 입력으로, 오디오를 Microsoft의 Azure 서버로 보내 변환한 후 텍스트를 돌려받는 방식입니다. Teams 메시지에는 괜찮지만 Wi-Fi 없는 비행기 안에서 급여 스프레드시트를 작성할 때는 문제가 됩니다.

방법 2는 오프라인으로 어느 창에서든 자신의 PC에서 직접 변환을 처리하는 데스크톱 앱입니다. 이 가이드를 마치면 두 가지 모두 실행해보고 어느 것을 계속 쓸지 알게 됩니다. 제게 오는 지원 이메일 대부분은 첫날 잘못된 방법을 선택한 분들로부터 옵니다. 그 이메일을 읽는 사람이 바로 저입니다.

방법 1: Win+H를 누르고 말하기

Windows 11 · Win + H

Listening…
Windows 11 내장 음성 입력 툴바: 마이크 버튼, 설정 기어, 그리고 '듣는 중' 레이블.

사전 요건: Windows 11, 인터넷 연결, 작동하는 마이크, 텍스트 박스에 커서. 다운로드나 계정 불필요. 소요 시간: 1분 미만.

1

텍스트 박스를 엽니다. Word 문서, 이메일, 브라우저 검색창 등 타이핑할 수 있는 곳이면 어디든 됩니다.

2

키보드에서 Windows 키 + H를 누릅니다. 마이크 버튼이 있는 작은 플로팅 툴바가 나타납니다.

3

'듣는 중' 레이블이 나타나면 말을 시작합니다. 말한 내용이 커서 위치에 나타납니다.

4

'듣기 중지'라고 말하거나 마이크를 탭하여 중지합니다. 툴바가 닫히고 받아쓰기 내용은 커서가 있던 자리에 그대로 남습니다.

예상 결과: 툴바에 '듣는 중'이 표시되고, 말한 내용이 커서 위치에 실시간으로 나타납니다. 툴바의 기어 아이콘에서 자동 구두점을 켜면 말한 내용을 바탕으로 쉼표와 마침표가 자동으로 추가됩니다.

아무 반응이 없다면: 음성 입력은 Azure 기반 온라인 음성 인식을 사용하므로 인터넷 연결, 작동하는 마이크, 그리고 텍스트 박스 안에 커서가 있어야 합니다. 연결이 없으면 변환도 없습니다. 전체 해결 목록은 두 섹션 아래에 있습니다.

Windows Speech Recognition을 다루는 오래된 튜토리얼을 보고 오셨나요? 그 기능은 2024년 9월부로 Windows 11 22H2 이상에서 Voice Access로 대체되었습니다. 구 WSR 제어판은 이제 오래된 Windows 버전에서만 남아 있습니다. 가이드가 음성 인식 마법사를 열라고 하는데 찾을 수 없다면, 가이드가 낡은 것이지 PC가 문제인 게 아닙니다.

내장 음성 입력으로 충분한 경우

나무 책상 위의 노트북과 노트, 내장 받아쓰기로 충분한 부담 없는 작업 환경

필요하지도 않은 소프트웨어를 설치하라고 권하지 않겠습니다. 많은 작업에서 Win+H가 정답이고, 비용도 들지 않습니다.

받아쓰기 내용이 짧고, 인터넷이 연결되어 있으며, 중요도가 낮을 때 내장 도구를 사용하세요. Teams에서 동료에게 보내는 답장. OneNote의 빠른 메모. 직접 입력하기 번거로운 검색어. 자동 구두점을 지원하고 Windows 11의 모든 표준 텍스트 박스에서 작동합니다. 어차피 온라인 상태에서 30단어 정도 입력할 때는 두 번째 앱을 여는 것보다 그냥 말하는 게 더 빠릅니다.

헷갈리는 내장 기능이 하나 더 있어서 짚고 넘어가겠습니다. Voice Access는 음성 입력과 다릅니다. Voice Access는 음성으로 PC 전체를 제어하고 텍스트를 작성할 수 있으며, Win+H와 달리 일회성 언어 다운로드 후 기기 자체의 음성 인식을 사용해 오프라인으로 작동합니다. Windows 11 버전 22H2 이상이 필요합니다. 완전한 핸즈프리 PC 제어(클릭, 스크롤, 음성으로 앱 열기 등)가 필요하다면 Voice Access를 사용하세요. 음성 입력이 아닙니다. 용도가 다릅니다.

Win+H의 한계 (오프라인, 정확도, 언어)

내장 도구에는 세 가지 실제 한계가 있습니다. 짧은 메모에는 문제가 되지 않지만, 더 길거나 중요한 작업을 할 때는 세 가지 모두 걸림돌이 되기 시작합니다.

오프라인

음성 입력은 변환이 내 노트북이 아닌 Azure 서버에서 처리되기 때문에 인터넷이 필요합니다. 비행기 안, 터널을 지나는 기차 안, Wi-Fi가 안 잡히는 건물에서는 작동하지 않습니다.

정확도

Microsoft는 음성 입력의 정확도 수치를 공개하지 않으며, 제가 신뢰할 만한 중립적인 벤치마크도 없습니다. 말씀드릴 수 있는 것은, 불안정한 연결 위의 클라우드 모델, 노트북 내장 마이크, 그리고 강한 억양은 각각 수동으로 수정해야 하는 전사본을 만드는 세 가지 독립적인 원인이라는 점입니다.

언어

음성 입력은 Microsoft가 관리하는 약 40개 언어의 고정 목록을 지원하며, 각 언어로 전환하기 전에 설치해야 합니다. 대부분의 사람에게는 충분하지만, Microsoft가 추가하지 않은 언어로 작업하는 사람에게는 장벽이 됩니다.

내장 음성 입력의 세 가지 실제 한계: 오프라인 지원 불가, 정확도, 언어 지원 범위.

제가 가장 많이 생각하는 것은 개인정보 보호 측면입니다. 아이 학교에 보내는 이메일, 계약서 초안, 회의에서 절대 입 밖에 내지 않을 반쯤 완성된 아이디어 등 내가 받아쓰는 내용이 내 기기를 떠나 서버로 전송됩니다. 5분 늦게 진행되는 Teams 회의라면 별 문제 아닙니다. 하지만 소중한 내용이라면 오디오가 어디로 가는지 알 가치가 있습니다.

Win+H가 작동하지 않나요? 가장 흔한 세 가지 원인

Win+H가 반응하지 않을 때는 거의 항상 세 가지 중 하나입니다. 각각의 발생 빈도 순서대로 확인해보세요.

1. 인터넷이 없거나 마이크가 작동하지 않습니다.

음성 입력에는 연결과 Windows가 감지할 수 있는 마이크가 필요합니다. 설정 > 시스템 > 소리를 열어 말할 때 입력 장치가 반응하는지 확인하세요.

수정 확인: 툴바가 멈추지 않고 '듣는 중'에 도달해야 합니다.

2. 커서가 텍스트 박스 안에 있지 않습니다.

Win+H는 커서가 타이핑 가능한 필드 안에 있을 때만 작동합니다. 먼저 Word 문서나 이메일 본문을 클릭한 후 단축키를 누르세요.

수정 확인: 키를 누르는 즉시 마이크 툴바가 나타납니다.

3. 노트북 기능 키 레이어가 H 키를 가로채고 있습니다.

일부 노트북에서는 상단 행이나 미디어 키가 재매핑되며, 키보드 유틸리티가 단축키를 가로챌 수 있습니다.

수정 확인: 대신 터치 키보드의 마이크 버튼을 열어보세요. 거기서 받아쓰기가 작동한다면 하드웨어 단축키가 문제이며, 제조사의 키보드 유틸리티에서 키를 재매핑하면 됩니다.

세 가지 주요 원인을 순서대로 확인하세요. 이 순서가 각 원인의 발생 빈도입니다.

그래도 해결이 안 된다면, 더 깊은 문제는 보통 설치가 완료되지 않은 언어 팩이거나 진행 중인 Windows 업데이트입니다. 그 시점이 되면 저도 내장 도구와 씨름하는 것을 멈추고 처음부터 끝까지 제가 직접 제어할 수 있는 것, 즉 아래의 방법 2를 설정합니다. 그 후에도 계속 실패한다면 더 긴 체크리스트가 있는 Windows에서 음성 입력이 작동하지 않을 때의 별도 가이드를 작성해두었습니다.

방법 2: 전용 받아쓰기 앱 설정하기

Whisper는 제가 만든 데스크톱 앱으로, Win+H가 할 수 없는 세 가지를 해냅니다. 내 CPU에서 오프라인으로 변환하고, 모든 애플리케이션에서 시스템 전체 단축키 하나로 작동하며, 고정된 클라우드 모델 대신 하드웨어와 언어에 맞는 엔진을 직접 선택할 수 있습니다. 처음부터 끝까지 전체 설정을 안내합니다.

Whisper
실제 Whisper 데스크톱 앱 — 설정, 변환, AI 패널을 클릭해보세요.

사전 요건: Windows 11, 중간 크기 모델용 약 1 GB의 여유 디스크, 마이크, 무료 계정(시작 시 결제 수단 불필요). 일회성 다운로드 시에만 연결이 필요하며, 이후 변환은 오프라인으로 이루어집니다. 소요 시간: 5~10분, 대부분은 모델 다운로드 시간입니다.

1

Whisper를 다운로드하고 설치합니다. 다운로드 페이지에서 설치 파일을 받아 실행합니다. 예상 결과: 앱이 메인 창으로 열립니다.

2

로그인합니다. 안내에 따라 무료 계정을 생성하세요. 시작 시 카드는 필요 없습니다. 예상 결과: 설정이 가능한 메인 화면으로 이동합니다.

3

로컬 엔진을 선택하고 모델을 다운로드합니다. PC 사양에 맞는 Whisper 모델을 선택하거나, 가장 빠른 로컬 옵션인 Parakeet를 선택하세요. 예상 결과: 진행 막대가 완료되고 모델이 준비 상태로 표시됩니다.

4

단축키를 확인합니다. Windows 기본 단축키는 Ctrl+Space입니다. 누르고 유지한 채 말하고, 손을 떼세요. 다른 기능과 충돌하면 설정에서 변경하세요.

5

어느 앱에서든 테스트해봅니다. 텍스트 필드(브라우저, 코드 편집기, 채팅창 등)를 클릭하고, Ctrl+Space를 누르고 있으면서 문장을 말한 후 손을 떼세요. 커서 위치에 텍스트가 입력됩니다.

예상 결과: 모델을 다운로드한 후에는 어떤 애플리케이션에서든 Ctrl+Space를 누르고 있으면서 말하고 손을 떼면, 다운로드 이후에는 인터넷 없이 커서 위치에 내용이 붙여넣어집니다. Hey whisper라고 말하면 (해당 기능을 켜두었을 때) 텍스트가 입력되기 전에 AI 정리 작업이 실행됩니다.

단축키가 오작동한다면: 설정에서 다시 바인딩하세요. 저도 직접 경험한 일입니다. 단축키 핸들러의 첫 번째 버전은 Windows에서 실제 키 누름마다 녹음 중지 콜백을 여섯 번 실행했습니다. Windows 입력 프레임워크가 예측할 수 없는 간격으로 가상의 Ctrl+Space 키 해제 이벤트를 생성하기 때문이었습니다. 깔끔한 PC에서는 작동했지만 두 번째 언어 입력이 활성화된 노트북에서는 오류가 발생했습니다. 텔레메트리, 충분하지 않은 50ms 딜레이, 그리고 결국 300ms 디바운스가 필요했습니다. 딸아이의 평가는 변함없습니다. 그래서 아빠 이메일이 오래 걸리는 거라고.

언어 지원 측면에서, 로컬 Whisper 엔진은 다국어 모델에서 99개 언어를 지원하고, .en 빌드는 영어 전용이지만 그 작업에서는 조금 더 빠릅니다. Parakeet 엔진은 CPU에서 Whisper보다 5~10배 빠르며 영어와 24개 유럽 언어(총 25개)를 지원하지만 아시아 언어와 영어 번역은 지원하지 않습니다. 오프라인 우선이 중요하다면, 오프라인 음성 텍스트 변환 가이드에서 엔진을 더 자세히 다룹니다.

Win+H vs Voice Access vs 전용 앱

Windows 11에서 음성을 텍스트로 변환하는 세 가지 방법을 나란히 비교합니다. 표는 각 도구가 문서화한 내용만 다룹니다. 꾸며낸 정확도나 속도 점수는 없습니다.

도구유형오프라인 작동가격 정책언어적합한 용도
Win+H 음성 입력Windows 11 내장불가 (Azure 온라인)Windows 포함 무료~40개, 고정 목록텍스트 박스에서의 짧은 온라인 메모
Voice AccessWindows 11 내장 (22H2+)가능 (온디바이스)Windows 포함 무료제한된 목록핸즈프리 PC 전체 제어
Whisper (전용 앱)Windows + macOS 설치가능 (로컬 CPU)무료 로컬 티어, 유료 Cloud 추가 기능Whisper 다국어 모델 기준 99개어느 앱에서든 오프라인 받아쓰기

온라인 상태에서 Teams 답장 하나만 필요하다면 방법 1이 단순함에서 이깁니다. 이미 PC에 있으니까요. 오프라인, 앱 전체 지원, 또는 지원되지 않는 언어가 필요한 순간, 방법 2가 설치할 가치를 증명합니다.

로컬 vs 클라우드: 내 PC에 맞는 Whisper 모드

Whisper는 두 가지 모드로 작동하며, 선택은 하드웨어와 웹 접근 여부에 달려 있습니다.

로컬 모드는 모든 작업을 내 기기에서 처리합니다. PC 사양에 맞는 Whisper 모델을 선택하세요. Base는 약 140 MB로 거의 모든 기기에서 실행되고, Small은 약 480 MB, Medium은 약 1.5 GB, 최고 정확도를 원하고 RAM이 충분하다면 다국어 Large v3는 약 3 GB입니다. 또는 주로 영어나 유럽 언어로 작업한다면 가장 빠른 로컬 옵션으로 약 600 MB의 Parakeet를 선택하세요. 다운로드 후에는 인터넷에 접속하지 않습니다.

Thinking...
텍스트가 입력되기 전에 실행되는, 로컬과 클라우드 모드 공통의 AI 정리 작업.

클라우드 모드는 탈출구입니다. 직접 소유한 OpenAI 키를 사용합니다. gpt-4o-mini-transcribe 또는 gpt-4o-transcribe로 변환하고, 커서 위치에 실시간 답변을 붙여넣고 싶을 때 웹 검색도 할 수 있습니다. 키는 직접 가져오시며, 저희는 수수료를 받지 않습니다.

제가 확신을 갖고 말씀드리는 의견은 이것입니다. 로컬 모드를 먼저 시도해보세요. 최근 4년 이내의 Windows PC라면 일상적인 받아쓰기에 클라우드가 필요 없으며, 로컬 모드는 오디오를 마땅히 있어야 할 곳인 내 기기에 유지합니다. 클라우드는 벽에 부딪혔을 때의 대비책이지 기본값이 아닙니다. Whisper는 로그인 후 전체 로컬 파이프라인을 무료로 제공하며, 시작 시 결제 수단이 필요 없습니다. Cloud 기능은 유료 Pro 티어입니다. 자세한 내용은 가격 안내 페이지에서 확인하세요. 전체 로컬 단계별 안내는 Windows에서 음성을 텍스트로 변환하는 가이드에서 확인하실 수 있습니다.

전용 앱을 건너뛰어야 할 때

사용하지 않을 것을 설치하는 것보다 Win+H를 유지하는 편이 낫습니다. 다음 조건이 모두 해당된다면 전용 앱을 건너뛰고 내장 음성 입력을 사용하세요.

  • 짧게 끊어서 받아쓰기를 하고, 긴 문서는 작성하지 않습니다.
  • 받아쓰기할 때는 항상 온라인 상태입니다.
  • Microsoft 음성 입력이 이미 지원하는 언어로만 작업합니다.
  • 오디오 내용이 중요하지 않고, 기기를 벗어나도 상관없습니다.

Win+H는 무료이고, 이미 설치되어 있으며, 그 역할을 정확히 잘 수행합니다. 전용 앱이 필요해지는 순간은 그 선 중 하나를 넘었을 때입니다. 비행기, 계약서 초안, Microsoft가 건너뛴 언어, 또는 표준 텍스트 박스가 아닌 앱에서 작업할 때입니다.

솔직한 가격 안내

Whisper의 로컬 모드는 로그인한 모든 사용자에게 무료입니다. Whisper와 Parakeet 변환, AI 향상, 기록, 프리셋, 커스텀 핫워드, 하드웨어 가속, 모델 다운로드, 전역 단축키까지 모두 포함되며 시작 시 카드가 필요 없습니다. Whisper Pro는 여기에 Cloud 기능을 추가합니다. OpenAI 클라우드 변환, 클라우드 AI 향상, 음성 웹 검색이 포함됩니다. Windows 내장 음성 입력도 Windows의 일부이기 때문에 무료입니다. 전체 플랜 내역은 가격 안내 페이지에서 확인하세요. 날짜가 지난 블로그 글의 수치를 믿는 것보다 직접 정확한 숫자를 확인하시는 편이 낫습니다.

두 가지 방법, 한 가지 선택. 온라인 상태이고, 메모가 짧으며, 중요도가 낮다면 Windows 키 + H를 눌러 말하세요. 무료이고 이미 PC에 있습니다. 비행기 안에서, 어느 앱에서든, Microsoft가 건너뛴 언어로, 또는 오디오가 내 기기에 남아 있어야 할 때, 전용 앱을 설정하세요. 저는 도시락을 싸면서 한 손으로 세 번째 회의 메모를 받아쓰던 순간에 그 선을 넘었고, 그 이후로 긴 이메일을 타이핑한 적이 없습니다.

내 PC에서 오프라인으로 직접 해보세요

Whisper를 다운로드하고, Ctrl+Space를 누른 채 말하고, 손을 떼세요. 어느 앱에서든 인터넷 없이 커서 위치에 내용이 붙여넣어집니다.

로그인한 모든 계정에 무료 로컬 모드 제공. 시작 시 카드 불필요. Win+H가 이미 필요한 모든 것을 해결해준다면 그 단축키를 사용하세요. 좋은 단축키입니다.

Denys Medvediev 사진

Denys Medvediev

지원 이메일을 읽는 사람이 바로 저입니다. 아마도 답장을 받아쓰기로 작성하면서요.

추가 자료