작성자: Denys Medvediev

가이드

음성을 텍스트로 타이핑하기 어려울 때

타이핑이 어렵다면 — 손이 아프거나, 깁스를 했거나, 그냥 치기 싫더라도 — 음성을 텍스트로 변환해 말로 어떤 앱에든 글을 쓸 수 있습니다. 단축키를 누르고, 말하면, 그 말이 커서 위치에 입력됩니다. 이 글은 생산성 가이드이며, 의학적 조언이 아닙니다.

마지막 업데이트: 2026년 6월

마이크와 노트북이 놓인 차분하고 정돈된 책상, 키보드는 사용하지 않아 음성으로 글을 쓰는 모습을 보여줍니다

타이핑이 어려운 사람을 위한 음성-텍스트 변환은 글을 쓰는 앱이 아니라 시스템 전체에서 동작하는 도구를 통해 이뤄집니다. 단축키를 누르고 말하면, 변환된 텍스트가 어떤 프로그램에서든 커서 위치에 붙여넣어집니다. Whisper 같은 도구는 Windows나 Mac에서 오프라인으로 동작하며, 무료 로컬 등급도 제공합니다. 이것은 생산성 보조 도구이며, 의학적 조언이 아닙니다.

어떤 주에는 타이핑보다 받아쓰기를 더 많이 하는데, 항상 제가 원해서는 아닙니다. 떨어지는 접시를 잡다가 손가락이 삐끗하거나, 손목이 한동안 도저히 안 된다고 버틸 때 — 키보드는 선택지에서 빠지지만 일은 사라지지 않습니다. 그래서 대신 컴퓨터에게 말하면, 컴퓨터가 받아 적습니다. 타이핑을 못 하거나, 편하게 타이핑할 수 없거나, 오늘은 타이핑을 그만하고 싶은 사람을 위한 음성-텍스트 변환의 핵심이 바로 이것입니다.

무엇보다 먼저, 솔직하게 짚고 넘어가겠습니다. 저는 받아쓰기 소프트웨어를 만드는 사람입니다. 의사가 아니며, 이 글은 의학적 조언이 아닙니다 — 여기 있는 어떤 내용도 어떤 질환을 치료하거나, 예방하거나, 고치지 않습니다. 받아쓰기가 하는 일은 좁고 유용합니다. 키를 두드리지 않고 텍스트를 만들어 줍니다. 키를 누르는 것이 문제라면, 누르지 않고 텍스트를 만드는 것이 실제로 당길 수 있는 지렛대입니다. 그게 핵심이고, 저는 그 작동 원리를 그럴듯하게 포장하기보다 있는 그대로 설명하는 쪽을 택하겠습니다.

대부분의 글이 건너뛰는 부분이 여기 있습니다. 텍스트 입력칸은 그냥 텍스트 입력칸입니다 — 이메일이든, Google 문서든, 채팅 창이든, 검색창이든. 커서 위치에 붙여넣는 받아쓰기는 그게 어떤 칸인지 신경 쓰지 않습니다. 그래서 진짜 질문은 "이 앱이 음성 입력을 지원하는가"가 아닙니다. "모든 것 위에서 어떤 도구를 돌릴 것인가"이고, 답은 모든 프로그램에서 똑같이 동작하는 단축키 하나입니다.

일찍 꺼내 둘 만한 두 번째 솔직한 말이 있습니다. 받아쓰기 도구는 텍스트를 씁니다. 컴퓨터 전체를 조작하지는 않습니다. 메뉴를 클릭하거나, 마우스를 움직이거나, 창을 음성으로 넘겨 주지는 않습니다. 많은 사람에게 키보드 통증의 핵심은 글을 쓰는 일이므로, 그 글쓰기를 넘겨 버리는 것만으로도 큰 도움이 됩니다. 손을 완전히 떼고 — 클릭, 스크롤, 전부 — 컴퓨터를 다뤄야 한다면, 마지막에 적절한 도구를 안내하는 섹션이 있습니다. 그건 저희 도구가 아니니까요.

사람들이 키보드 없는 글쓰기를 찾는 이유

닫힌 노트북 옆에 차분히 놓인 두 손, 타이핑에서 잠시 쉬는 모습을 보여줍니다

이유는 몇 가지 솔직한 갈래로 나뉘는데, 그중 어느 것도 진단을 받아야만 진짜가 되는 것은 아닙니다. 어떤 사람은 손이 아파서 오늘은 손을 쉬게 하고 싶어 합니다 — 그 생산성 측면은 별도의 가이드에서 다룹니다: 타이핑이 무리를 줄 때의 받아쓰기. 어떤 사람은 일시적인 제약이 있습니다: 부목, 깁스, 붕대 감은 손가락. 어떤 사람은 키보드에서 손을 떼야 하는 영구적인 이유가 있습니다. 그리고 많은 사람은 그냥 열 손가락으로 쳤던 것보다 말로 할 때 더 빠르게 씁니다.

이유가 무엇이든, 할 일은 똑같습니다. 존재해야 하는 텍스트가 있고 — 이메일, 한 단락, 답장, 메모 — 키보드는 아프거나, 느리거나, 쓸 수 없습니다. 받아쓰기는 그 텍스트를 음성으로 만들어 냅니다. 당신이 눌렀어야 할 키를, 누르지 않습니다. 평소라면 40분 동안 타이핑해서 답해야 할 받은편지함이라면, 그냥 건너뛰는 수백 번의 키 입력이 되는 셈입니다.

대부분의 사람은 말하기가 분당 약 145단어로 진행되고, 타이핑은 40단어에 더 가깝습니다. 그래서 손을 쉬게 하는 것 외에도, 약 3.5배 빠르게 움직이게 됩니다 — 느린 쪽이 유일한 선택지였을 때는 이게 기분 좋은 부수 효과죠. 중요하니 분명하게 거듭 말하겠습니다. 이것은 생산성과 접근성을 위한 보조 도구입니다. 치료도 아니고, 처치도 아니며, 통증이 관련되어 있다면 물어볼 사람은 블로그 글이 아니라 임상의입니다.

단축키를 누르고, 말하면, 말이 커서 위치에 입력됩니다

이게 전부이고, 가장 좋은 의미에서 지루합니다. 단축키를 누르고, 말하고, 떼면, 변환된 텍스트가 포커스가 있는 텍스트 필드 어디든 커서 위치에 붙여넣어집니다. Whisper는 키에서 손을 뗀 뒤 짧은 꼬리를 유지하므로, 마지막 단어가 잘리지 않습니다. 운영체제 커서 위치에 붙여넣기 때문에, 이메일 클라이언트도, 문서도, 채팅 앱도 모두 그냥 "아무 텍스트 칸"일 뿐입니다. 어디서나 똑같이 동작합니다.

랜딩 페이지들이 지나치게 복잡하게 만드는 부분이 바로 이겁니다. 앱 하나에 연결할 확장 프로그램도, 붙여넣을 토큰도, 입력한 말을 따로 꺼내야 하는 별도 창도 없습니다. 텍스트가 들어가야 할 곳이 커서이고, 당신이 말하면, 그 자리에 말이 나타납니다. 말하는 동안 작은 캡슐이 나타나 듣고 있다는 걸 알려 줍니다:

Cancel
녹음 오버레이: 말하는 동안 앱의 파란색으로 떠오르는 작은 떠 있는 캡슐로, Whisper가 듣고 있다는 것을 알려 줍니다.

단축키는 제대로 설정해 둘 가치가 있는 단 하나입니다. Windows에서는 Ctrl+Space, Mac에서는 Command+Option — 말하는 동안 누르고 있다가 떼면 멈추는 보조 키 전용 푸시투토크입니다. 조합 키를 누르고 있는 것 자체가 불편하다면, 설정의 Recording 항목에서 탭 토글 방식으로 바꾸세요 — 한 번 탭하면 시작, 한 번 탭하면 멈춤이라 아무것도 누르고 있을 필요가 없습니다. 단축키 패널 전체가 존재하는 이유는, 제가 예전에 하드코딩된 단축키를 출시했다가 새벽 두 시에 누군가의 음악 소프트웨어와 충돌했기 때문입니다. 저는 석사 학위가 있는 사람입니다. 일단 돌아가기 시작하면, 당신이 한 거래는 모든 앱에서 타이핑 대신 받아쓰기에서와 똑같습니다: 키보드가 선택 사항이 됩니다.

2분 만에 설정하기 (Windows 또는 Mac)

Apple Silicon 기반 Mac이나 Windows 10 이상 PC, 작동하는 마이크, 그리고 글을 쓰려는 앱을 눈앞에 열어 두면 됩니다. 로컬 파이프라인 전체는 로그인한 모든 계정에 무료이며, 가입 시 결제 수단을 요구하지 않습니다. 순서는 다음과 같습니다.

1단계 — Whisper 설치하고 로그인하기.

다운로드 페이지에서 받아 설치하고, 무료 계정을 만드세요. 카드 필요 없습니다. 로컬 변환 파이프라인 전체가 바로 열립니다.

앱의 트레이 아이콘이 나타나고 설정 마법사가 모델을 고르도록 안내하면 제대로 된 것입니다.

2단계 — 변환 방식 고르기.

앱이 대신 골라 주지 않습니다. 세 가지가 주어집니다: Cloud (OpenAI, 본인 키 사용), Local Parakeet, 또는 Local Whisper. 프라이버시나 오프라인 유지가 중요하다면, 로컬로 시작하세요 — 자세한 내용은 두 섹션 아래에 있습니다.

모델 하나가 다운로드를 마치고 준비됨으로 표시되면 제대로 된 것입니다.

3단계 — 손이 닿는 단축키 설정하기.

Windows는 기본값이 Ctrl+Space, Mac은 Command+Option을 누르고 있는 푸시투토크입니다. 키를 누르고 있는 게 손에 힘들다면, 탭 토글로 바꿔 한 번 탭하면 시작, 한 번 탭하면 멈추게 하세요. Mac에서는 안내가 나오면 손쉬운 사용 권한을 허용하세요. 그게 없으면 커서 위치 붙여넣기가 다른 앱에 닿지 못합니다.

테스트 녹음이 아무 텍스트 필드에든 붙여넣어지면 제대로 된 것입니다.

4단계 — 텍스트가 들어갈 곳에 커서를 두고 말하기.

아무 텍스트 칸이든 클릭해 들어가서, 녹음을 시작하고, 한 문장을 말한 뒤, 멈추세요. 변환된 텍스트가 커서가 있는 자리에, 마치 당신이 타이핑한 것처럼 나타납니다.

당신이 말한 문장이 텍스트가 되어 텍스트 필드에 들어가 있으면 제대로 된 것입니다.

Whisper
설정 화면에 있는 실제 Whisper 데스크톱 앱 — 변환 엔진을 고르고 손에 부담이 적은 단축키 동작을 설정하세요.

느린 부분은 설정이 아니라 모델 다운로드입니다. 나머지는 모두 위의 네 단계뿐입니다. 일단 돌아가기 시작하면, 어떤 생각을 어느 앱에든 옮기는 일이 타이핑 작업이 아니라 말하기 작업이 됩니다 — 타이핑이 바로 당신이 할 수 없는 일일 때, 그게 핵심 전부입니다.

어떤 앱에서든 글쓰기 — 그리고 음성으로 할 수 없는 것

솔직히 거의 다 됩니다. 이메일이 가장 큽니다: 답장, 후속 메일, 그동안 미뤄 온 길고 미안한 메시지까지. 커서와 싸우기보다 소리 내어 생각하고 싶은 문서와 보고서. Slack, Teams, Discord 등 팀이 머무는 어디서든 하는 채팅. 회의 메모든 밤 11시의 알림 메모든. 텍스트가 칸에 들어가는 거라면, 타이핑하는 대신 말할 수 있고, 같은 단축키가 어디서나 그 일을 합니다.

한계는 여기 있으니, 힘들게 알아내지 않도록 분명히 말해 두겠습니다. Whisper는 당신의 커서가 이미 있는 곳에 말을 넣습니다. 커서를 움직이거나, 메뉴를 클릭하거나, 스크롤하거나, 창을 전환하거나, 음성으로 컴퓨터를 조작하지는 않습니다. 텍스트 칸까지는 평소처럼 — 마우스, 트랙패드, 탭으로 — 도달한 뒤, 그 안에 받아쓰기를 합니다. 대부분의 사람에게 키보드 부담의 대부분은 탐색이 아니라 글쓰기이므로, 그 글쓰기를 넘기는 것이 승리의 대부분입니다. 하지만 타이핑뿐 아니라 모든 것에서 손을 쉬게 해야 한다면, 받아쓰기 도구가 완전한 답은 아닙니다.

그 빈틈은 실수가 아니라 의도된 것입니다. 저희는 음성으로 글 쓰는 행위를 모든 앱에서 빠르고 안정적으로 만들고, 완전한 핸즈프리 데스크톱을 어설프게 절반만 만드느니 그 한 가지를 잘하는 쪽을 택합니다. 완전한 제어가 필요할 때는, 알맞은 도구들이 있고 마지막에 이름을 밝히겠습니다. 솔직히 말하면, 어떤 도구가 정확히 어디서 멈추는지 아는 것이 모든 걸 다 한다고 가장하는 기능 목록보다 더 유용합니다.

로컬이냐 클라우드냐: 타이핑이 선택지가 아닐 때 어느 모드를

로컬 모드를 먼저 시도해 보세요. 키보드가 힘들어서 받아쓰기에 기대고 있다면, 그 도구마저 안정적인 인터넷 연결이나 분당 요금에 의존하는 것은 가장 원치 않는 일일 겁니다. 로컬 모드는 전적으로 당신의 기기에서, 완전히 오프라인으로 동작하며, 서버로 아무것도 보내지 않습니다. Mac이 Apple Silicon이거나 PC가 최근 몇 년 내 것이라면, 로컬은 군말 없이 일상적인 받아쓰기를 처리하고, 클라우드는 기본값이 아니라 비상 탈출구가 됩니다.

앱이 당신에게 고르게 하니, 잘 고르도록 세 가지 방식이 어떻게 다른지 알려 드리겠습니다:

  • Local ParakeetNVIDIA의 TDT 엔진으로, 약 600 MB이며, 가장 빠른 로컬 옵션입니다 — CPU에서 Whisper보다 5~10배 빠릅니다. 영어를 포함해 다른 24개 유럽 언어, 총 25개를 지원합니다. 영어로의 번역은 없습니다. 영어나 다른 유럽 언어로 쓴다면, 이것이 빠르고 완전히 오프라인인 선택입니다.
  • Local Whisper같은 기기에서 Parakeet보다 느리지만, 다국어 빌드는 99개 언어를 지원하고 영어로 번역할 수 있습니다. 영어 전용 빌드는 99개가 아니라 영어 전용입니다. Parakeet가 할 수 없는 중국어, 일본어, 한국어, 또는 모든 번역 작업에는 이것을 고르세요. 기본 영어 모델은 약 480 MB입니다.
  • Cloud (OpenAI, BYOK)최고의 정확도와 웹 접근을 제공하며, 본인의 OpenAI 키를 사용해 OpenAI가 직접 청구합니다. 변환은 기본적으로 gpt-4o-mini-transcribe에서 실행됩니다. 인터넷이 필요하므로, 당신의 기기를 벗어나는 유일한 방식입니다. Cloud 영역은 Whisper Pro의 일부입니다.

지루한 진실은, 일상적인 글쓰기에는 로컬이면 충분하다는 것입니다. 두 로컬 엔진 모두 전적으로 당신의 기기에서 돌아가는데, 이건 여기서 평소보다 더 중요합니다: 의사에게 보내는 이메일, 보험 양식, 업체의 로그를 거치고 싶지 않은 메시지 — 그 무엇도 당신의 노트북을 떠나지 않습니다. 당신의 컴퓨터에는 이미 마이크와 CPU가 있습니다. 한 단락을 위해 굳이 서버가 끼어들 필요는 없습니다. 클라우드는 어려운 녹음에서 최상급 정확도를 원하거나 문장 중간에 웹에서 사실을 가져와야 할 때 제 값을 합니다. 로컬로 시작하고, 로컬이 아쉬울 때만 클라우드로 손을 뻗으세요.

키보드로 돌아가지 않고 다듬고 편집하기

말은 지저분합니다. "음" 하고, 문장을 다시 시작하고, 말끝을 흐립니다. 그걸 전부 타이핑으로 고쳐야 한다면, 키 입력을 도로 끌어들인 셈이라 — 타이핑이 바로 피하려던 것일 때 핵심이 무너집니다. 그래서 다듬는 단계가 대부분의 사람에게보다 여기서 더 중요합니다.

Whisper에는 선택적인 AI 처리가 있어, 텍스트가 입력되기 전에 군더더기를 다듬고 표현을 정리해 거의 완성된 결과를 붙여넣게 해 줍니다. 활성화 문구 "Hey whisper"라고 말하면 다듬어진 버전이 나타납니다. 로컬 모델에서는 Ollama를 통해, 무료로, 당신의 기기에서 실행됩니다. 클라우드 모드에서는 기본적으로 gpt-5-mini입니다. 어느 쪽이든, 고칠 게 적어진다는 것은 누를 키가 적어진다는 뜻입니다.

Thinking...
원본

어 네 그래서 보고서는 거의 다 끝난 것 같고 목요일에 회의 전에 보내드릴게요 음 괜찮으시면

정리됨

보고서는 거의 다 끝난 것 같습니다. 괜찮으시면 목요일 회의 전에 보내드리겠습니다.

편집은 어떤 음성 작업 흐름에서도 솔직한 약점이고, 저는 아닌 척하지 않겠습니다. 잘못된 단어 하나를 음성으로 고치는 것은 손을 뻗어 다시 치는 것보다 더 번거롭습니다 — 가끔 키 입력을 감당할 수 있다면 괜찮지만, 그럴 수 없다면 문제입니다. 두 가지가 도움이 됩니다. 짧게 끊어서 받아쓰세요. 그러면 실수가 한 단락 전체를 다시 하는 게 아니라 빠른 한 번의 재녹음이 됩니다. 그리고 AI 정리가 군더더기와 구두점을 앞에서 잡아내게 해, 고칠 게 애초에 적어지게 하세요. 더 깊은 음성 편집 — 단어를 명령만으로 선택하고 완전히 바꾸는 것 — 은 다음 섹션의 완전 제어 도구가 정확히 맡는 일입니다.

그 말하고-다듬는 흐름이 바로 어떤 앱에든 깔끔한 텍스트 받아쓰기의 일상적인 습관이며, 그 덕에 긴 메시지가 타이핑해야 하는 한 단락이 아니라 입으로 말하는 몇 문장이 됩니다.

받아쓰기 도구가 알맞은 도구가 아닐 때

서로 다른 방향을 가리키는 두 개의 이정표, 도구 사이의 선택을 보여줍니다

이 가이드에서 가장 중요한 솔직함이 여기 있고, 친구라면 제게 똑바로 말해 줬으면 하는 그 말입니다. 컴퓨터 전체를 손 없이 다뤄야 한다면 — 텍스트만 쓰는 게 아니라 클릭하고, 스크롤하고, 커서를 움직이고, 앱을 전환하고, 음성으로 탐색해야 한다면 — Whisper는 잘못된 도구입니다. 저희는 포커스가 있는 필드에 텍스트를 받아씁니다. 컴퓨터를 제어하지는 않습니다. 완전한 핸즈프리 제어에는, 바로 그것을 위해 만들어진 소프트웨어를 원할 텐데, 솔직한 답이 세 가지 있습니다.

Windows 11에는 OS에 내장된 Voice Access가 있어, 받아쓰기뿐 아니라 음성으로 화면을 제어하고, 클릭하고, 탐색할 수 있습니다. Mac에는 Voice Control이 같은 일을 합니다 — 시스템 설정의 손쉬운 사용에서 켜면, 음성 명령으로 클릭하고, 스크롤하고, 커서를 움직일 수 있고, 그 위에 받아쓰기까지 됩니다. 둘 다 무료이고, 둘 다 컴퓨터 전체 제어를 위해 만들어졌으니, 그게 필요하다면 무엇을 설치하기 전에 거기서 시작하세요. 그리고 가장 강력하고 스크립트 가능한 핸즈프리 환경 — 시선 추적, 소리 기반 클릭과 결합된 음성 명령에, 전부 Python으로 프로그래밍 가능한 것 — 으로는 Talon Voice가 Mac, Windows, Linux에서 돌아가며 진짜 핸즈프리 용도로는 차원이 다릅니다.

더 작은 건너뛰기는 늘 같은 것입니다: 가끔 짧은 메시지를 칸에 넣을 뿐이라면, 운영체제에 내장된 음성 입력이 무료로 처리해 줍니다. Windows에서는 Windows 키 + H 바, Mac에서는 받아쓰기 단축키이며 Apple Silicon에서는 기기 내에서 동작합니다. 전용 도구는 분량과 마찰에서 제 값을 합니다 — 군더더기 정리, 키를 누르고 있을 필요 없는 탭 토글, 오프라인 동작, 모든 앱에서 똑같이 동작하는 단축키 하나. 그 기준 아래라면, 무료인 것을 쓰세요. 한 줄짜리 답장을 위해 앱을 설치하라고 말하지는 않겠습니다.

여기 온 이유가 손이 아니라 읽기나 쓰기의 어려움이라면, 관점이 조금 달라집니다 — 글쓰기 보조 도구로서의 음성-텍스트 변환의 논리가 그 경우를 다루며, 그것 역시 의학 가이드가 아니라 생산성 가이드입니다.

키보드는 컴퓨터에 텍스트를 넣는 한 가지 방법입니다. 유일한 방법은 아니고, 그게 선택지가 아닌 날에는 그 사실을 떠올리는 것만으로 안도가 됩니다. 칸에 대고 말하고, 텍스트를 얻고, 정리가 매끄럽게 다듬게 하고, 짧게 끊어 편집해서 잘못 들어간 단어가 번거로운 일이 아니라 빠른 재녹음이 되게 하세요. 텍스트를 넘어선 모든 것 — 음성으로 기기 전체를 다루는 것 — 에는 Voice Access, Voice Control, Talon이 그 용도로 만들어졌으니, 망설임 없이 그쪽으로 안내하겠습니다. 저는 이 가이드의 대부분을 한 손으로, 제가 타이핑하지 않는다는 걸 알지도 신경 쓰지도 않는 앱들에 받아썼습니다. 그게 비결입니다: 커서는 그 말이 어떻게 거기 왔는지 묻지 않습니다.

다음 메시지를 키보드 없이 써 보세요

손이 닿는 단축키를 설정하고, 말하면, 변환된 텍스트가 커서가 있는 어느 앱에든 입력됩니다 — 오프라인으로, 당신의 기기에서.

로그인한 모든 계정에 무료 로컬 모드. 시작에 카드가 필요 없습니다.

Denys Medvediev 사진

Denys Medvediev

저는 저희 지원 이메일을 읽는 사람입니다 — 아마도 답장은 받아쓰면서요.

더 읽어보기