문제 해결
Windows 받아쓰기가 초기화 중에서 멈춤
음성 입력(Win+H)이 "초기화 중"에서 멈춰 있다면 거의 항상 백그라운드 프로세스가 멈춘 것입니다. 작업 관리자에서 Microsoft Text Input Application을 종료하고 Win+H를 다시 누르면 대개 다시 시작됩니다. 그래도 계속 멈춘다면, 더 근본적인 원인은 이 기능이 의존하는 온라인 음성 서비스에 있습니다.
마지막 업데이트: 2026년 6월

Windows 받아쓰기가 초기화 중에서 멈췄다면 작업 관리자에서 Microsoft Text Input Application을 종료한 뒤 Win+H를 다시 누르면 해결됩니다. 다시 멈춘다면 개인 정보 및 보안에서 온라인 음성 인식을 껐다 켜고 재부팅하세요. 로컬 변환은 Microsoft의 온라인 음성 서비스를 기다릴 필요가 없으므로, 오프라인 전용 받아쓰기 도구를 쓰면 이 문제를 통째로 피할 수 있습니다.
Win+H를 누르면 작은 음성 입력 막대가 나타나는데, 그러고는 그냥 가만히 있습니다. "초기화 중." 어쩌면 "준비하는 중." 점들이 빙빙 돕니다. 기다립니다. 그래도 말을 걸어봅니다. 분명히 잠든 스마트 스피커에 말을 거는 것처럼요. 아무것도 입력되지 않습니다. 저는 서로 다른 세 대의 컴퓨터에서 정확히 이 일이 벌어지는 걸 봤고, 처음 겪었을 때는 무엇이 실제로 멈춰 있는지 알아내기까지 족히 20분을 날렸습니다.
긴 설명에 앞서 짧게 요약하면, 이건 거의 마이크 문제가 아니라 거의 항상 Windows가 시작은 했지만 끝내지 못했고 스스로 다시 시도하지도 않는 백그라운드 프로세스 문제입니다. 해결에는 작업 관리자에서 약 30초면 됩니다. 그런데도 자꾸 되돌아오는 이유는, Win+H가 조용히 의존하고 있는 온라인 음성 서비스에 얽힌 또 다른, 더 느린 이야기입니다. 그 부분도 다루겠습니다.
첫 검색 결과에서 아무도 또렷이 말해주지 않는 것: Windows 음성 입력은 자체적으로 완결된 기능이 아닙니다. Win+H를 누르면 Windows는 헬퍼 프로세스를 띄우고, 보이지 않는 곳에서 실제 인식을 처리하기 위해 Microsoft의 클라우드 음성 서비스에 연결을 시도합니다. "초기화 중"은 그 연결 과정 동안 보이는 화면입니다. 그 헬퍼 프로세스가 멈추면 — 보통 Windows 업데이트 후나 절전/깨우기 이후에 — 연결은 끝내 완료되지 않고, 막대는 영원히 그대로 있습니다.
그래서 진짜 질문은 이렇습니다. 지금 당장 어떻게 멈춤을 풀까, 어떻게 다시 안 멈추게 할까, 그리고 이런 것에 전혀 의존하지 않고 받아쓰기를 할 방법은 없을까. 세 가지를 모두, Microsoft의 정확한 단계와 함께 다루겠습니다. 그리고 기본 기능만으로 정말 충분한 경우에 대해서도 솔직하게 말하겠습니다.
Windows 받아쓰기가 "초기화 중"에서 멈추는 이유

Windows 11에서 받아쓰기는 음성 입력이라고 불리며, 온라인 음성 인식을 사용해 말을 텍스트로 변환합니다. 바로 그 마지막 부분이 핵심입니다. Win+H는 앞단일 뿐입니다. 인식은 Microsoft의 클라우드 음성 서비스를 통해 이루어지고, Microsoft Text Input Application이라는 로컬 헬퍼가 그 연결을 중개합니다. 그 헬퍼가 멈추면 끝이 보이지 않는 "초기화 중"을 만나게 됩니다.
Microsoft의 자체 지원 스레드와 문서를 보면, 반복되는 원인은 짧고 구체적입니다. Microsoft Text Input Application 프로세스가 멈추는데, 보통 Windows 업데이트 후나 PC가 절전에서 깨어난 뒤입니다. 온라인 음성 인식 개인 정보 토글이 꺼져 있어서 클라우드 연결이 아예 시작될 수 없습니다. 입력 언어 또는 음성 언어가 설치된 인식 팩과 일치하지 않습니다. 마이크 접근이 개인 정보 수준에서 차단되어 있습니다. 또는 Windows 업데이트가 음성 서비스를 비정상 상태로 남겼는데 재부팅으로도 풀리지 않았습니다.
분명히 짚고 넘어가면, 이건 하드웨어 문제가 아닙니다. 통화에서 마이크가 작동한다면 받아쓰기에서도 작동합니다. 고장은 마이크보다 상위, 즉 인식기를 깨워야 하는 Windows의 그 부분에 있습니다. 그래서 아래의 해결책들이 새 헤드셋 구매가 아니라 프로세스 재시작과 서비스 토글에 관한 것인 이유도 여기에 있습니다.
대부분의 사람에게 통하는 빠른 해결책
헬퍼 프로세스를 재시작하세요. 이것이 대다수의 사람에게 문제를 풀어주는 방법이고, 1분도 안 걸립니다. Microsoft 지원 스레드에서 그대로 가져온 단계는 다음과 같습니다.
작업 관리자를 엽니다(작업 표시줄을 마우스 오른쪽 버튼으로 클릭해 작업 관리자를 선택하거나, Ctrl+Alt+Delete를 눌러 고릅니다). 간단히 보기 화면이라면 "자세히"를 클릭합니다. 백그라운드 프로세스에서 "Microsoft Text Input Application"을 찾아 마우스 오른쪽 버튼으로 클릭하고 "작업 끝내기"를 선택합니다. 그런 다음 Win+H를 다시 누릅니다. 음성 입력 막대가 헬퍼를 처음부터 다시 시작하고, 연결이 완료되며, 막대는 "초기화 중"에서 듣는 상태로 바뀝니다. 목록에 해당 프로세스가 보이지 않으면 그냥 재부팅해도 같은 효과를 냅니다. 다만 시간이 더 걸릴 뿐입니다.
이것이 당장의 문제를 해결하는 처방입니다. 위의 오버레이는 다른 도구, 즉 시스템 전역 받아쓰기 앱의 것이며, 한 가지 대비를 보여주려고 여기 있습니다. 로컬 녹음기는 듣고 있다는 것을 보여주거나 오류를 보여주거나 둘 중 하나입니다. 영원히 시작하는 척하며 가만히 있는 제3의 상태란 없습니다. 먼저 깨워야 할 클라우드 서비스가 없기 때문입니다. 다음 섹션에서 더 다루겠지만, 만약 이 문제가 매주 반복된다면 영구적인 해답은 자꾸 멈추는 그것에 의존하지 않는 것입니다.
영구적인 해결책: 초기화가 아예 없는 받아쓰기
이틀에 한 번꼴로 같은 작업을 종료하고 있다면, 지속 가능한 해결책은 작동하기 전에 본부에 전화부터 걸어야 하는 기능에 의존하는 걸 그만두는 것입니다. 로컬 받아쓰기 도구는 자신의 컴퓨터에서 변환합니다. 깨워야 할 온라인 음성 서비스가 없으니 멈출 "초기화 중"도 없습니다. Windows 10 이상의 PC와 작동하는 마이크만 있으면 됩니다. Whisper로 하는 4단계 설정은 다음과 같습니다.
1단계 — Whisper를 설치하고 로그인하세요.
다운로드 페이지에서 받아 설치하고 무료 계정을 만드세요. 카드는 필요 없습니다. 로컬 변환 파이프라인 전체가 곧바로 열립니다.
앱의 트레이 아이콘이 나타나고 설정 마법사가 모델 선택을 제안하면 제대로 된 것입니다.
2단계 — 로컬 변환 경로를 고르세요.
앱이 대신 정해주지 않습니다. 오프라인 해결을 원하면 Local Parakeet(가장 빠른 영어) 또는 Local Whisper(다국어, 번역)를 고르세요. 둘 다 전적으로 자신의 컴퓨터에서 실행됩니다. 클라우드도 제공되지만, 그것은 네트워크를 사용하는 유일한 경로입니다.
모델 하나가 다운로드를 끝내고 준비됨으로 표시되면 제대로 된 것입니다.
3단계 — 단축키를 설정하세요.
Windows 기본값은 Ctrl+Space이며, 누르고 있는 동안 말하는 방식입니다. Ctrl+Space가 다른 앱과 충돌하면 설정에서 다른 키를 고르세요. 전용 키이므로 Win+H처럼 포커스를 빼앗거나 자동으로 멈추지 않습니다.
테스트 녹음이 아무 텍스트 필드에나 붙여 넣어지면 제대로 된 것입니다.
4단계 — 커서를 아무 데나 두고 말하세요.
아무 텍스트 상자(이메일, 문서, 검색창)에 커서를 두고 단축키를 누른 채로 한 문장 말한 뒤 손을 떼세요. 변환된 텍스트가 커서가 있는 자리에 붙고, 로컬에서 변환되며, 초기화 화면은 없습니다.
말한 문장이 텍스트로 나타나고 클라우드 연결을 기다리지 않으면 제대로 된 것입니다.
느린 부분은 한 번뿐인 모델 다운로드뿐입니다. 그 후로는 앱이 로컬에서 동작하므로, 여러분을 여기까지 오게 한 그 고장 방식 — 서버를 기다리며 멈춘 헬퍼 — 은 설계에 아예 없습니다. 녹음하고, CPU에서 변환하고, 붙여 넣습니다. 매달릴 온라인 음성 서비스가 그 흐름 속에 없습니다.
기본 기능을 고쳐서 쓰고 싶다면
많은 사람은 그저 Win+H가 다시 작동하길 바랄 뿐 또 다른 앱은 원치 않습니다. 충분히 이해합니다. 제가 시도해볼 순서대로, 모두 Microsoft의 자체 지원 문서와 스레드에서 가져온, 더 깊은 Windows 쪽 문제 해결법을 소개합니다. 이 중 어느 것도 레지스트리를 건드리지 않으므로, 컴퓨터를 망가뜨릴 만한 것은 여기 없습니다.
먼저, 대부분이 놓치는 토글. 음성 입력은 온라인 음성 인식이 켜져 있어야 합니다. 시작, 설정, 개인 정보 및 보안, 음성으로 가서 온라인 음성 인식을 켜세요. 이미 켜져 있는데 받아쓰기가 멈춰 있다면, 껐다가 잠시 기다린 뒤 다시 켜서 서비스가 다시 연결되도록 강제하세요. 둘째, 언어를 확인하세요. 설정, 시간 및 언어, 음성에서 음성 언어가 입력하려는 언어와 일치하는지, 그에 맞는 인식 팩이 설치되어 있는지 확인하세요. 여기서의 불일치는 막대가 멈추는 조용한 원인입니다.
셋째, 시스템 수준의 마이크 권한. 설정, 개인 정보 및 보안, 마이크에서 "마이크 액세스"가 켜져 있고 앱이 마이크를 사용하도록 허용되어 있는지 확인하세요. 음성 입력도 그 앱 중 하나입니다. 넷째, 내장 음성 문제 해결사를 실행하세요. 예전 빌드에서는 설정, 업데이트 및 보안, 문제 해결, 추가 문제 해결사, 음성에 있습니다. 다섯째, Windows가 완전히 업데이트되었는지 확인하세요. 이 스레드들 여럿이 "나중 업데이트로 해결됐다"로 끝나기 때문입니다. 반대로 어떤 업데이트가 문제를 일으키기도 했다는 점이 그 이면입니다. 그리고 그 모두가 실패하면, 재부팅이 업데이트로 비정상 상태가 된 음성 서비스를 정리해 줍니다. 이 모든 것에 정직하게 따라붙는 함정은, 이들이 증상은 고쳐도 의존성은 고치지 못한다는 점입니다. Win+H는 누를 때마다 여전히 클라우드 연결을 완료해야 하고, 그것이 바로 자꾸 망가지는 그 부분입니다.
로컬 또는 클라우드: 어느 모드가 실제로 이 문제를 피하나
여러분이 여기 온 이유가 서버를 끝없이 기다리는 기능 때문이라면, 답은 로컬 모드입니다. 더 볼 것도 없습니다. 두 로컬 엔진 모두 아무것도 어디로도 보내지 않고 전적으로 자신의 컴퓨터에서 실행됩니다. 그게 바로 핵심입니다. 온라인 음성 서비스가 없으면 멈출 "초기화 중"도 없습니다. 앱이 고르라고 하는 세 가지 경로가 실제로 어떻게 다른지 보겠습니다.
앱이 선택을 강제하니, 이 특정 문제에 대해 제가 어떻게 생각할지 정리하면 이렇습니다:
- Local Parakeet — NVIDIA의 TDT 엔진으로 약 600 MB이며, 가장 빠른 로컬 옵션입니다. CPU에서 Whisper보다 5~10배 빠릅니다. 영어와 함께 24개 유럽 언어, 총 25개를 지원합니다. 영어로의 번역은 없습니다. 완전히 오프라인입니다. 영어나 유럽 언어를 쓴다면, 클라우드 연결의 쳇바퀴에서 가장 빠르게 벗어나는 길입니다.
- Local Whisper — 같은 컴퓨터에서 Parakeet보다 느리지만, 다국어 빌드는 99개 언어를 지원하고 영어로 번역할 수 있습니다. 영어 전용 빌드는 영어 전용이며 99개가 아닙니다. 중국어, 일본어, 한국어, 또는 Parakeet이 못 하는 번역 작업에는 이것을 고르세요. 기본 영어 모델은 약 480 MB입니다. 이것도 완전히 오프라인입니다.
- Cloud (OpenAI, BYOK) — 최고의 정확도와 웹 접근을 제공하며, 자신의 OpenAI 키를 사용해 OpenAI에서 직접 청구됩니다. 변환은 기본적으로 gpt-4o-mini-transcribe에서 실행됩니다. 인터넷이 필요하므로, Win+H처럼 네트워크에 의존하는 유일한 경로입니다. Cloud 영역은 Whisper Pro의 일부입니다.
재미없는 진실은, 일상적인 받아쓰기에는 로컬로 충분하고, 여러분을 여기까지 오게 한 그 특정 불편함에는 로컬이 실제 해결책이라는 점입니다. 클라우드는 까다로운 녹음에서 최고 수준의 정확도를 원하거나 문장 중간에 웹에서 사실 하나를 끌어와야 할 때 제값을 합니다. 하지만 여러분의 불만이 "계속 서버를 기다린다"는 것이라면, 또 다른 서버 의존 경로를 고르는 건 요점을 놓치는 일입니다. 로컬로 시작하세요.
받아쓰기가 실제로 작동한 다음의 더 깔끔한 텍스트
받아쓰기가 — 기본 기능이든 아니든 — 작동하기 시작하면, 다음 현실에 부딪힙니다. 날것의 말은 끊김 없이 한 덩어리로 쏟아집니다. "좋아 그럼 비밀번호를 재설정하고 고객에게 답장 보내서 점심 전에 처리됐다고 알려줘"라고 말하면, 어떤 음성 엔진이든 구두점 없는 그 벽을 건네줍니다. 그것을 다듬는 부분에서 도구가 갈립니다.
Windows 음성 입력은 일단 실행되면 말하는 대로 구두점을 추가할 수 있습니다. 더 무거운 정리 — "음" 같은 군말 제거, 끊김 없는 문장 정돈, 말한 문단을 실제로 보낼 만한 것으로 바꾸기 — 를 위해 Whisper는 텍스트가 입력되기 전에 AI 처리를 한 번 거칠 수 있습니다. 활성화 문구 "Hey whisper"를 말하면 텍스트가 먼저 다듬어집니다. 로컬 모델에서는 Ollama를 통해, 클라우드 모드에서는 기본적으로 gpt-5-mini로 동작합니다.
좋아 그럼 비밀번호를 재설정하고 고객에게 답장 보내서 점심 전에 처리됐다고 알려줘 음 그리고 내 매니저도 참조에 넣어줘
좋아, 그럼 비밀번호를 재설정하고, 고객에게 답장을 보내서 점심 전에 처리됐다고 알려줘 — 그리고 내 매니저를 참조에 넣어줘.
정리 단계는 전용 도구가 단지 "초기화 중" 멈춤을 피하는 것 이상으로 제값을 하는 이유이기도 합니다. 안정적인 입력만 얻는 게 아니라, 완성에 더 가까운 텍스트를 얻습니다. 이것의 더 넓은 버전을 원한다면, 바로 그 말하고-다듬는 흐름이 Win+H가 우연히 머물게 된 한 창에서만이 아니라 여러분이 여는 모든 앱에서 음성으로 더 빠르게 입력할 수 있게 해줍니다.
그리고 어떤 필드에서든 커서 위치에 붙여 넣기 때문에, 같은 흐름이 브라우저 탭에서도 통합니다. Google Docs에 받아쓰기는 데스크톱 편집기에 받아쓰는 것과 똑같이 동작하는데, 포커스가 옮겨가면 Win+H는 늘 그것을 보장하지는 못합니다.
기본 기능만으로 충분할 때

여기서는 무언가를 설치하지 말라고 여러분을 설득하는 부분입니다. Microsoft Text Input Application을 종료해서 해결됐고 다시 안 돌아왔다면, 또 다른 앱은 필요 없습니다. 업데이트 후 한 번 초기화에서 멈춘 일은 딱 그것뿐, 일회성입니다. Win+H는 무료에 기본 내장되어 있고, 짧게 쓰기에는 정말 괜찮습니다. 두 줄짜리 답장을 받아쓰겠다고 소프트웨어를 설치하라고 말하지는 않겠습니다.
기본 경로는 몇 가지가 참일 때 옳은 선택입니다. 주로 짧은 텍스트를 받아쓰고, 어차피 늘 온라인이며, 자신의 음성이 인식을 위해 Microsoft의 클라우드로 가는 것이 괜찮을 때입니다. 그 마지막 지점이 진짜 갈림길입니다. Win+H는 설계상 여러분의 음성을 Microsoft의 온라인 음성 서비스로 보냅니다. 장보기 목록에는 괜찮지만, 고객 이메일이나 자신의 컴퓨터에 두고 싶은 무언가에는 한 번 더 생각해볼 만합니다.
기본 기능이 반복적으로 거슬리기 시작하면 전용 오프라인 도구로 손을 뻗으세요. 업데이트 때마다 멈춤이 다시 돌아오거나, 긴 글을 받아쓰거나, 오프라인으로 일하거나 음성을 로컬에 두고 싶거나, 가끔 초기화되고 가끔 안 되는 막대 대신 모든 앱에서 똑같이 동작하는 단축키 하나를 원할 때입니다. 그 선 아래라면 무료인 것을 쓰세요. 이 가이드 앞부분의 해결책들은 바로 그럴 수 있도록 있는 것입니다.
진짜 문제가 이 한 가지 멈춤보다 넓다면 — Win+H가 아무것도 안 하거나, 텍스트가 전혀 안 나오거나, 언어가 틀렸다면 — Windows에서 음성 텍스트 변환이 작동하지 않음 가이드의 더 넓은 점검 목록이 엄밀히 "초기화 중" 멈춤이 아닌 나머지 고장 방식들을 다룹니다.
더 읽어보기
Windows는 단어 하나를 입력하기 전에 클라우드 서비스를 먼저 깨워야 하는 음성 기능을 내놨으면서, 정작 그 깨우기가 실패했을 때 다시 시도하는 방법은 만들지 않았습니다. 그래서 우리는 이름이 세 단어쯤 너무 긴 백그라운드 작업을 종료하고, 같은 두 키를 다시 누르고는, 해결됐다고 부릅니다. 보통은 정말 해결됩니다. 하지만 어떤 기능을 쓰려고 작업 관리자를 처음 열게 되는 순간, 그러지 않아도 되는 것을 조용히 물색하기 시작하게 됩니다. 저는 이 가이드의 대부분을 "초기화 중"이라는 단어를 단 한 번도 보여준 적 없는 도구로 받아썼습니다. 그게 핵심의 전부입니다.
초기화 화면 없이 받아쓰세요
단축키를 누른 채 말하고 손을 떼세요. 변환된 텍스트가 어떤 앱에서든 커서 자리에 들어옵니다. 로컬에서 변환되고, 먼저 깨울 클라우드 서비스도 없습니다.
로그인한 계정이라면 누구나 무료 로컬 모드를 쓸 수 있습니다. 시작할 때 카드가 필요 없습니다.



