작성자: Denys Medvediev

튜토리얼

Word에서 음성으로 입력하기: Win+H, 받아쓰기, 아니면 더 나은 방법

Word에 기본으로 들어 있는 음성 입력 방식 두 가지, 그리고 시스템 전체에서 쓰는 업그레이드 하나. 각각 어디에 있고, 어떻게 켜고, 어디서 한계에 부딪히는지 알려드립니다.

마지막 업데이트: 2026년 6월

노트북에 문서를 입력하는 손, 주변에 흩어진 서류 — 음성 입력이 대체하는 작업 방식

Word의 음성 입력은 기본적으로 두 가지로 동작합니다. 어떤 텍스트 필드에서든 Win+H를 눌러 Windows 음성 입력을 열거나, Word의 홈 탭에서 받아쓰기 버튼을 클릭하는 것입니다. 둘 다 받아쓰려면 인터넷 연결이 필요합니다. Whisper 같은 로컬 도구를 더하면 Word는 물론 다른 모든 앱에서도 오프라인으로 받아쓸 수 있습니다.

지난달 700단어짜리 현황 보고서를 손으로 입력하는 데 19분이 걸렸고, 분당 145단어로 받아쓰니 5분이 채 안 걸렸습니다. 같은 문서, 같은 Word 창, 같은 작성자. 달라진 건 마이크로소프트의 가장 유명한 앱이 무엇을 듣고 있었는가, 그것뿐이었습니다. Word는 수년 전부터 귀가 있었습니다. 다만 대부분이 그 귀를 켜는 두 개의 버튼을 끝내 찾지 못했을 뿐입니다. (저는 통화를 음소거하려고 Win+H를 눌렀다가 민망하게 발견했습니다.)

문제는 이렇습니다. Word 사용자는 기본 받아쓰기 도구 두 개 중 하나를 발견하고는 그게 전부인 줄 알고, 처음 만난 도구를 기준으로 음성 입력 전체를 판단해 버립니다. 지금 Windows 11에는 Win+H로 여는 음성 입력이 들어 있고, Microsoft 365에는 Word 안에 받아쓰기가 들어 있는데, 이 둘은 요구 조건이 다른 별개의 도구입니다. 이 글에서는 Word 안에서 두 가지를 모두 켜는 법, 각각이 어디서 멈추는지, 그리고 시스템 전체용 도구가 이들이 놓치는 부분을 어떻게 메우는지 다룹니다.

다 읽고 나면 Word에서 음성 입력을 1분 안에 돌릴 수 있고, 필요하다면 오프라인 환경까지 갖추게 됩니다. 우리 지원 메일함에 들어오는 받아쓰기 관련 질문은 대부분 "내가 쓰는 게 둘 중 어느 거냐"로 귀결됩니다. 그 메일을 직접 읽는 사람이라 표정 하나 안 바꾸고 이렇게 말할 수 있습니다.

Word의 음성 입력 경로는 하나가 아니라 둘이다

둘 다 마이크로소프트가 만들었습니다. 그래서 아무도 구분하지 못하는 겁니다. Windows 음성 입력은 운영체제의 일부입니다. Win+H로 열리고, 어떤 앱이 활성화되어 있든 그 위에 떠서, 커서가 있는 곳에 입력됩니다. Notepad나 브라우저 양식에서 동작하는 것과 똑같은 방식으로 Word에서도 동작합니다. 받아쓰기는 Microsoft 365의 일부입니다. Word의 홈 탭에 자리하고, Office 앱 안에서만 존재하며, 활성화된 Microsoft 365 구독이 있어야 합니다.

심심한 진실 하나: Word에서 평범한 문단을 받아쓰는 경우라면 둘은 거의 똑같은 결과를 냅니다. 둘 다 음성을 마이크로소프트의 온라인 음성 서비스로 보내기 때문입니다. 정작 중요한 차이는 적용 범위와 요구 조건입니다. Win+H는 Windows와 함께 따라오고 모든 앱을 가로질러 당신을 따라다닙니다. 받아쓰기는 Microsoft 365 요금제에 묶여 있고, 서식 명령 같은 Word 전용 기술을 압니다. Microsoft 365 구독이 있고 하루 종일 Word 안에서 산다면 받아쓰기부터 시작하세요. Word, Outlook, Slack, 브라우저를 오가며 글을 쓴다면 Win+H부터 시작하세요. 둘 다 이미 가진 것 위에 추가 비용이 들지 않습니다.

Win+H: Word가 아니라 Windows에 사는 음성 입력

듣는 중…
Windows 11 음성 입력 알약 — 마이크로소프트 UI를 단순하게 재현한 것으로, Whisper 앱이 아닙니다.

1단계 전에 필요한 것: Windows 11 PC(Windows 10은 같은 단축키에 예전 받아쓰기 도구 모음이 뜹니다), 작동하는 마이크, 그리고 인터넷 연결. Windows 음성 입력은 마이크로소프트의 온라인 음성 인식을 거쳐 받아쓰기 때문입니다. 연결이 없으면 입력도 없습니다. 전체 설정 시간은 1분이 채 안 됩니다.

1. 문서를 열고 글자가 들어갈 자리를 클릭하세요

음성 입력은 커서가 텍스트 상자 안에 있어야 합니다. 아무 데도 포커스가 없으면 알약은 떠도 입력은 되지 않습니다.

확인: 커서가 Word 페이지 안에서 깜빡이고 있다.

2. Win+H를 누르세요

화면 위쪽이나 아래쪽 근처에 음성 입력 알약이 나타납니다.

확인: 말을 시작하기 전에 "듣는 중…"이 표시된다.

3. 단어 하나가 아니라 구절로 말하세요

한 단어씩 받아쓰는 것보다 완전한 문장이 더 깔끔하게 나옵니다.

4. 자동 문장 부호를 켜세요

알약의 톱니바퀴를 클릭해 자동 문장 부호를 켜거나, 직접 말하세요. "마침표", "쉼표", "물음표".

확인: 문장을 끝내고 잠깐 멈추면 당신이 말하지 않아도 마침표가 찍힌다.

5. 목소리로 또는 같은 단축키로 멈추세요

"듣기 중지"라고 말하거나, Win+H를 다시 누르세요.

Win+H는 편집 명령도 받습니다. "방금 거 삭제", "방금 거 선택", "엔터 눌러". 숙제하라고 어르고 달래는 사람처럼, 인내심을 가지고 동작합니다. 단순한 요청에는 깔끔하게 통하고, 복합적인 요청에는 가끔 깜짝 놀라게 합니다. 긴 교정 작업이라면 키보드와 마우스가 여전히 무적입니다. 알약은 뜨는데 아무 일도 일어나지 않는다면, Win+H 작동 안 함 해결법 에서 흔한 원인들을 다루고, 마이크로소프트 음성 입력 문서 에는 모든 명령어와 40개가 넘는 지원 언어가 나와 있습니다.

주름 하나 더: Copilot+ PC에서는 유동 받아쓰기(fluid dictation)라는 기능이 말하는 동안 문법과 철자를 다듬어 주고, 비밀번호 입력란에서는 스스로 꺼집니다.

받아쓰기 버튼, 간단히

받아쓰기
Word 홈 탭의 받아쓰기 버튼 — 마이크로소프트 UI를 단순하게 재현한 것입니다.

받아쓰기는 Word 홈 탭에 있는 마이크 버튼입니다. 클릭하고, 듣는 중이라고 표시될 때까지 기다린 다음, 말하면 됩니다. Microsoft 365 구독과 마이크, 그리고 안정적인 인터넷 연결이 필요하고, Word for Windows, Mac, 웹, 모바일 전반에서 동작합니다. Mac에서는 Option+F1로 켜고 끕니다. 하루 종일 Mac에서 Word로 글을 쓴다면, 받아쓰기와 이 단축키 하나면 필요한 음성 입력이 다일 수도 있습니다.

Win+H에 대한 강점은 Word를 안다는 점입니다. 자동 문장 부호는 지원 언어 대부분에서 쓸 수 있고(설정의 토글), 서식 명령을 알아듣습니다. "방금 거 굵게", "글머리 기호 목록 만들기", "마지막 단어 삭제". 약점은 미치는 범위입니다. Office를 벗어나는 순간 받아쓰기는 뒤에 남겨집니다. 이 부분은 일부러 짧게 둡니다. 우리에게는 Word 기본 받아쓰기 기능 전체 안내서 가 있어 모든 명령어, 언어, 설정을 다루고, 마이크로소프트 받아쓰기 문서 가 정본 참고 자료입니다. 받아쓰기가 회색으로 비활성화되어 있거나 보이지 않는다면, Word 받아쓰기 문제 해결 안내서 가 해결 방법을 차근차근 짚어 줍니다.

두 기본 도구가 모두 벽에 부딪히는 지점

실제로 부딪히는 한계는 세 가지인데, 얼마나 자주 발목을 잡는지 순서대로 적습니다.

첫째, 둘 다 오프라인에서 동작하지 않습니다. Win+H는 마이크로소프트의 온라인 서비스를 거쳐 받아쓰고, 받아쓰기는 안정적인 인터넷 연결을 요구 조건으로 명시합니다. 기차 안에서, 비행기 안에서, 40초마다 끊기는 호텔 Wi-Fi에서 둘 다 입을 다뭅니다. 우리끼리 이야기지만, 오프라인에서 못 쓰는 받아쓰기는 누군가가 당신 대신 내린 프라이버시 결정이기도 합니다. 아이 학교에 보내는 이메일, 연봉 평가서, 법률 초안 — 음성으로 입력하고 싶었다는 이유만으로 전부 어느 업체의 서버를 거칩니다. 로컬 받아쓰기는 어디로도 아무것도 보내지 않으며, 어떤 문서에는 그것이 취향이 아니라 필수 조건입니다.

둘째, 언어의 한계가 다릅니다. Win+H는 40개가 넘는 언어를 지원합니다. 받아쓰기는 약 15개 언어와 지역 변형을 완전히 지원하고, 약 25개를 미리 보기로 더 지원하지만 정확도는 더 낮습니다. 우크라이나어로 받아쓰거나 문서 중간에 언어를 섞으면 금세 들쭉날쭉해집니다.

셋째, 적용 범위입니다. 받아쓰기는 Office의 경계에서 끝납니다. Win+H는 어디든 가지만 Windows 기능에 머무릅니다. Mac에는 이에 해당하는 게 없습니다. 그리고 저는 매일 쓰는 프로젝트 이름, 고객사 이름, 제품 전문 용어를 어느 도구에든 가르칠 자리를 끝내 찾지 못했습니다. "Remskill"은 몇 번을 고쳐도 "rem skill"로 들어옵니다.

Word에서도, 그 밖의 모든 곳에서도 입력되는 단축키 하나

1990년대 후반, 제 친척 한 분이 RAM 64MB짜리 Windows 98 데스크톱에서 Dragon NaturallySpeaking을 돌렸습니다. 보정용 텍스트를 읽으며 학습시키는 데 45분이 걸렸고, 받아쓰기는 문장마다 4초씩 지연되며 기어갔으며, 명절 편지 한 문단에 15분이 걸렸습니다. 헤드셋이 방 건너편으로 날아갔습니다. 헤드셋은 살아남았지만 실험은 그러지 못했습니다. 저는 음성 입력을 "아직 때가 오지 않은 아이디어"로 분류해 두고 20년간 그 파일을 건드리지 않았습니다. 이 단락은 다시 열린 그 파일입니다.

Whisper는 시스템 전체 위에 단축키 하나를 얹는 데스크톱 앱입니다. Word에서(또는 입력할 수 있는 어디서든) Ctrl+Space를 누르고, 말하고, 손을 떼면, 텍스트가 커서 자리에 떨어집니다. 같은 키가 Outlook, Slack, 브라우저, 코드 편집기에서 동작합니다. 찾아야 할 도구 모음도, 앱마다 켜야 할 기능도 없습니다. 바로 이것이 두 기본 도구와의 구조적 차이입니다.

Whisper
실제 Whisper 앱을 그대로 띄운 화면 — 설정을 이리저리 눌러 보세요. 설치되는 게 바로 이것입니다.

설정에는 10분쯤 걸리는데, 대부분은 내려받는 시간입니다:

1. 앱을 설치하세요

Windows 10 이상, macOS 11 이상에서 실행되며 크기는 약 25MB입니다.

확인: Whisper 창이 설정 화면으로 열린다.

2. 로그인하세요

로컬 파이프라인 — 모델, 기록, 사전 설정, 단축키 — 에는 계정만 있으면 됩니다.

3. 로컬 모델을 고르고 내려받으세요

기본값은 약 480MB의 다국어 Small입니다. 약 600MB의 Parakeet v3는 CPU에서 5~10배 빠르게 돌고 영어와 24개 유럽 언어를 지원합니다. 자세한 내용은 NVIDIA Parakeet 모델 카드 에 있습니다. Whisper 모델 계열은 약 3GB의 Large v3까지 올라가며, 다국어 변형에서는 90개가 넘는 언어를 지원합니다(영어 전용 빌드는 말 그대로 영어만 지원합니다).

확인: 모델이 설정에서 다운로드 완료로 표시된다.

4. Word에 커서를 두고, Ctrl+Space를 누른 채로, 말하고, 손을 떼세요

받아쓴 글이 커서가 있는 자리에 붙습니다.

확인: 문장 부호까지 포함된 당신의 말이 문서에 들어가 있다.

Cancel
녹음 중에 뜨는 떠다니는 오버레이 — 어떤 앱으로 들어가든 당신을 따라옵니다.

모델을 내려받은 뒤에는 받아쓰기가 당신의 기기에서 네트워크 활동 없이 이루어집니다. Wi-Fi를 끈 채 고도 11,000미터에서도 똑같이 받아쓸 수 있습니다. 로컬 모드의 정확도는 보통 모델 크기에 따라 95%에서 99% 사이에 들고, 사용자 사전을 더하면 기본 도구가 계속 망가뜨리던 이름들을 가르칠 수 있습니다. 클라우드 모드도 있어서 자신의 OpenAI 키를 가져와 최신 받아쓰기 모델을 쓸 수 있지만, Word 받아쓰기라면 제가 쓰는 쪽은 로컬입니다. 주전자가 티백과 흥정하는 동안 저는 이 단락을 초안에 받아썼습니다. 단락에는 두 번의 교정이 필요했고, 차에는 한 번도 필요 없었습니다.

기본 도구로 충분한 경우

데스크톱 마이크, 키보드, 화면이 있는 홈 오피스 — 기본 받아쓰기로 충분한 단순한 환경

일주일에 한 문단을 받아쓰고, 인터넷이 좋은 책상에서, Word에서만, 받아쓰기가 완전히 지원하는 약 15개 언어 중 하나로만 쓴다면 Whisper는 건너뛰세요. 받아쓰기는 이미 Microsoft 365 요금제에 들어 있고 그 일을 잘합니다. Win+H도 마찬가지입니다. 받아쓰기가 Windows를 벗어나지 않고 지원하는 40개가 넘는 언어가 당신 언어를 포함한다면, 단축키 하나면 되고 추가 비용도 들지 않습니다. 서드파티 음성 입력은 매일 받아쓰거나, 오프라인에서 일하거나, 사용자 사전이 필요하거나, 모든 앱에서 도구 하나로 쓰고 싶을 때 비로소 제 몫을 합니다. 그 전에는 아닙니다.

방 건너편으로 날아간 Dragon 헤드셋과, 당신이 차를 끓이는 동안 스스로 입력되는 Word 문서 사이에는 25년의 세월이 있습니다. 도구가 따라잡았습니다. 남은 일은 당신의 한 주에 맞는 청자를 고르는 것뿐입니다. 오늘 Win+H를 눌러 진짜 문단 하나를 받아써 보세요 — 현황 보고든, 미뤄 두었던 답장이든. 그게 버텨 준다면 새 기본값을 얻은 겁니다. 오프라인의 벽이나 어휘의 한계에 부딪힌다면, 업그레이드가 어디 있는지 이제 압니다.

같은 문단을 단축키 하나로 해 보세요

Whisper를 내려받고, Word에서 Ctrl+Space를 누른 채로, 받아쓴 글이 커서 자리에 떨어지는 걸 지켜보세요.

Windows 10 이상, macOS 11 이상에서 동작합니다. 로컬 모드는 오프라인으로 실행됩니다.

Denys Medvediev 사진

Denys Medvediev

우리 지원 이메일을 읽는 사람이 바로 저입니다. 답장도 십중팔구 받아쓰기로 합니다.