작성자: Denys Medvediev

가이드

음성 텍스트 변환 관절염을 위한

타이핑이 불편하다면, 음성 텍스트 변환으로 말만 하고 손은 쉴 수 있습니다. 단축키를 누르고 말하면, 단어가 어떤 앱에서든 커서 위치에 그대로 붙습니다. 의료 기기나 의학적 조언이 아니라, 편안함과 생산성을 위한 도구입니다.

최종 업데이트: 2026년 6월

차분하고 정돈된 책상 위, 키보드 옆에 손을 가만히 올려놓은 모습 — 타이핑을 잠시 쉬는 장면

관절염을 위한 음성 텍스트 변환은 손을 쉬게 하면서 음성으로 타이핑하는 방법입니다. Whisper 같은 시스템 전역 도구는 단축키 하나로 어떤 앱에서든 음성을 텍스트로 바꿔주며, 오프라인으로 작동하고 무료 로컬 등급을 제공합니다. 의료 기기나 의학적 조언이 아니라 편안함과 생산성을 돕는 도구입니다.

무엇보다 먼저 솔직하게 한마디 하자면, 저는 받아쓰기 소프트웨어를 만드는 사람이지 의사가 아니며, 여기에 적힌 어떤 내용도 관절염을 치료하거나 완화하거나 진단하지 않습니다. 이것은 의학적 조언이 아니며 Whisper는 의료 기기가 아닙니다. 손이나 관절이 아프다면 이야기를 나눠야 할 상대는 블로그 글이 아니라 임상의입니다.

그 점을 전제로, 받아쓰기가 실제로 하는 일은 좁지만 유용합니다. 키를 누르지 않고도 텍스트를 만들 수 있게 해줍니다. 타이핑이 불편한 부분이라면, 타이핑을 줄이는 것이 오늘 당장 당길 수 있는 지렛대입니다. 사람들이 "관절염을 위한 음성 텍스트 변환"을 검색하는 것은 긴 이메일이나 문서를 쓰는 동안 손을 쉬게 해줄 스위치를 바라기 때문입니다. 그런 스위치는 실제로 있습니다 — 다만 특정 앱 하나 안에 있는 게 아니라 그 밖에 있고, 설정에는 2분쯤 걸립니다.

이 키워드를 다루는 대부분의 페이지가 건너뛰는 부분이 바로 여기입니다. 텍스트 입력란은 그냥 텍스트 입력란입니다 — Gmail이든, Word 문서든, 채팅 창이든, 검색창이든 말이죠. 커서 위치에 붙여 넣는 받아쓰기 도구는 커서가 어떤 앱 안에 있는지 신경 쓰지 않습니다. 그래서 앱마다 마이크 버튼을 추가할 필요가 없습니다. 모든 앱 위에 얹혀 있는 도구 하나만 있으면 됩니다.

그러니 진짜 질문은 "어떤 앱이 관절염을 위한 음성 입력을 지원하는가"가 아닙니다. "무엇 위에서든 실행할 받아쓰기 도구가 무엇인가"이고, 답은 무료이면서 기본 내장된 것을 원하는지, 가장 손이 덜 가는 키 입력을 원하는지, 아니면 모든 프로그램에서 똑같이 작동하는 오프라인 단축키 하나를 원하는지에 따라 달라집니다. 전부 짚어보고, 직접 하나 설정해보고, 전용 도구를 건너뛰어야 할 때도 솔직하게 말씀드리겠습니다 — 텍스트만이 아니라 컴퓨터 전체를 음성으로 조작하고 싶은 경우까지 포함해서요.

사람들이 덜 타이핑하려고 음성에 손을 뻗는 이유

책상 위 키보드 옆에 손을 가만히 올려놓고 타이핑하지 않는 사람의 모습

이 면책 문구는 중요하니 계속 반복하겠습니다. 이것은 의학적 조언이 아니며, 받아쓰기 소프트웨어는 아무것도 치료하지 않습니다. 그것이 하는 일은 하루 동안 누르는 키의 수를 줄이는 것입니다. 당신이 말하면 컴퓨터가 타이핑하고, 원래 눌렀어야 할 키 입력을 건너뛰게 됩니다. 평소라면 40분 넘게 타이핑해서 답하던 받은편지함이라면, 그건 그냥 안 누르게 되는 수백 번의 키 입력입니다. 그게 전부이고 따분한 이점이며, 그것이 솔직한 이점입니다.

사람들이 실제로 해결하고 싶은 일은 이메일보다 큽니다. 손이 따라주지 않아 계속 미뤄둔 긴 문서이기도 합니다. 채팅 답장, 양식, 부담만 없다면 끄적였을 메모이기도 하죠. 떠오른 생각이 사라지기 전에, 타이핑할 수 있는 속도가 아니라 생각하는 속도로 붙잡는 일이기도 합니다. 키보드가 불편한 부분일 때, 텍스트를 목소리에 맡기는 것은 그 일을 고된 일로 만들지 않고 계속 해나가는 방법입니다.

한 문장만 적을 가치가 있는 속도라는 부수 효과가 있습니다. 말하기는 대부분의 사람에게 분당 약 145단어 정도이고, 타이핑은 40단어에 가깝습니다. 그래서 손을 쉬게 하는 것을 넘어, 보통 약 세 배 반쯤 빠르게 움직이게 되는데, 더 느린 쪽이 당신을 괴롭히던 쪽이기도 했다면 이건 기분 좋은 덤입니다. 이 중 어느 것도 건강에 관한 주장이 아닙니다. 그저 키 입력에 관한 산수일 뿐입니다.

단축키를 누르고 말하면, 텍스트가 어떤 앱에든 떨어집니다

이게 전체 작동 방식이고, 의도적으로 따분합니다. 단축키를 누르고, 말하고, 떼면, 전사된 글이 커서가 있는 곳, 즉 포커스가 있는 어떤 텍스트 필드든 거기에 붙습니다. Whisper는 키에서 손을 뗀 뒤 짧은 꼬리 시간을 유지하므로, 마지막 단어가 잘리지 않습니다. OS 커서 위치에 붙이기 때문에, 모든 앱이 그냥 "아무 텍스트 입력란"이 됩니다 — 이메일 클라이언트, Word 문서, Slack, 브라우저 양식, 메모 앱까지요. 어디서나 같은 키, 같은 흐름입니다.

랜딩 페이지들이 과하게 복잡하게 만드는 부분이 바로 이겁니다. 프로그램마다 끼워 넣을 플러그인도 없고, 붙여 넣을 API 토큰도 없고, 단어를 끄집어낼 별도의 창도 없습니다. 커서가 입력란에 있고, 당신이 말하면, 단어가 그 입력란에 나타납니다. 말하는 동안 작은 캡슐이 떠서 듣고 있다는 걸 알려줍니다:

Cancel
녹음 오버레이: 말하는 동안 떠오르는 작은 캡슐로, Whisper가 듣고 있다는 것을 알려줍니다.

처음부터 제대로 정해둘 가치가 있는 한 가지가 단축키이고, 편안함도 바로 여기서 나옵니다. Windows의 기본값은 Ctrl+Space이고, Mac에서는 Command+Option으로, 말하는 동안 누르고 있는 모디파이어 전용 푸시투토크입니다. 코드(조합 키)를 누르고 있는 것 자체가 불편하다면 그러지 않아도 됩니다 — 설정의 녹음에서 탭투토글로 바꾸면 한 번 누르면 시작되고 한 번 누르면 멈추니, 키를 누르고 있을 일이 전혀 없습니다. (모든 단축키를 바꿀 수 있게 만든 이유는, 제가 처음에 하드코딩된 단축키를 내보냈다가 새벽 2시에 누군가의 음악 소프트웨어와 충돌했기 때문입니다. 저는 석사 학위가 있습니다.) 예전에 Windows에서 받아쓰기 또는 Mac에서 설정해본 적이 있다면, 이건 똑같은 손의 기억을 한 번에 모든 곳으로 향하게 한 것입니다.

2분 만에 설정하기 (Windows 또는 Mac)

Apple Silicon 기반 Mac이나 Windows 10 이상 PC, 작동하는 마이크, 그리고 타이핑하고 싶은 앱을 백그라운드에 열어두기만 하면 됩니다. 전체 로컬 파이프라인은 로그인한 모든 계정에 무료이며, 가입 시 결제 수단을 요구하지 않습니다. 순서는 다음과 같습니다.

1단계 — Whisper를 설치하고 로그인하세요.

다운로드 페이지에서 받아 설치하고 무료 계정을 만드세요. 카드는 필요 없습니다. 전체 로컬 전사 파이프라인이 바로 열립니다.

앱의 트레이 아이콘이 나타나고 설정 마법사가 모델 선택을 제안하면 제대로 된 것입니다.

2단계 — 전사 방식을 고르세요.

앱이 대신 골라주지 않습니다. 세 가지가 있습니다: 클라우드(OpenAI, 본인 키 사용), 로컬 Parakeet, 또는 로컬 Whisper. 메모를 본인 컴퓨터에만 두려면 로컬로 시작하세요 — 두 섹션 아래에서 더 자세히 다룹니다.

모델 하나가 다운로드를 마치고 준비됨으로 표시되면 제대로 된 것입니다.

3단계 — 손에 부담이 적은 단축키를 설정하세요.

Windows는 기본값이 Ctrl+Space이고, Mac은 푸시투토크로 누르고 있는 Command+Option입니다. 코드를 누르고 있는 게 불편하다면 탭투토글로 바꿔 한 번 누르면 시작되고 한 번 누르면 멈추게 하세요. Mac에서는 안내가 뜰 때 손쉬운 사용 권한을 허용하세요. 그게 없으면 커서 위치에 붙이는 기능이 다른 앱에 닿지 못합니다.

테스트 녹음이 아무 텍스트 필드에 붙으면 제대로 된 것입니다.

4단계 — 어디든 커서를 두고 말하세요.

아무 텍스트 입력란을 클릭하고, 녹음을 시작하고, 한 문장을 말하고, 멈추세요. 전사된 글이 마치 직접 타이핑한 것처럼 커서가 있는 곳에 나타납니다.

말한 문장이 텍스트로 입력란에 들어와 있으면 제대로 된 것입니다.

Whisper
설정 화면의 실제 Whisper 데스크톱 앱 — 전사 엔진을 고르고 손에 가장 편한 단축키 동작을 설정하세요.

느린 부분은 모델 다운로드이지 설정이 아닙니다. 나머지는 위의 네 단계가 전부입니다. 일단 작동하기 시작하면, 생각을 화면에 옮기는 행위가 타이핑 작업이 아니라 말하기 작업이 됩니다 — 타이핑이 불편한 부분일 때 바로 그게 핵심입니다.

Windows에서 음성 텍스트 변환 · Mac에서

이미 쓰는 모든 앱에서 통하는 단축키 하나

시스템 전역 도구가 앱별 기능을 이기는 이유는, 프로그램을 바꿔도 다시 배울 게 없기 때문입니다. 이메일 작성란을 채우는 그 키가 Word 문서, Slack 메시지, 브라우저 양식, 스프레드시트 셀, 그리고 커밋 메시지까지 채웁니다. 컴퓨터 입장에서는 당신이 타이핑하고 있는 것이므로, 타이핑이 통하는 곳이면 어디서든 작동합니다. 도구 하나, 모든 텍스트 필드, Windows와 Mac 양쪽에서요.

손을 쉬게 하는 게 목표일 때, 이건 들리는 것보다 더 중요합니다. 앱마다 자체 받아쓰기 버튼이 있다면, 하루 종일 서로 다른 컨트롤을 찾아 헤맬 테고, 그중 절반은 아예 존재하지도 않을 겁니다. 단축키 하나면 시작의 마찰이 거의 0으로 떨어집니다: 누르고, 말하고, 끝. "이걸 쓰고 싶다"와 "써졌다" 사이의 단계가 적을수록, 손이 원치 않을 때 습관적으로 키보드에 손을 뻗는 일도 줄어듭니다.

놀라지 않도록 솔직한 범위를 말하면: 이 도구는 커서가 있는 곳에 단어를 넣습니다. 커서를 옮기거나, 메뉴를 클릭하거나, 창을 탐색해주지는 않습니다. 대부분의 사람에게 키보드 부담의 대부분은 텍스트 자체입니다 — 이메일, 문서, 메시지, 메모 — 그래서 텍스트만 넘겨도 이미 부담의 대부분이 덜어집니다. 음성으로 그 이상을 컴퓨터에 시켜야 한다면, 아래에 더 나은 곳을 안내하는 섹션이 있습니다.

로컬이냐 클라우드냐: 어떤 모드를 고를까

로컬 모드로 시작하세요. 당신이 받아쓸 내용의 상당수는 개인적인 것입니다 — 병원에 보내는 메모, 보험 양식, 가족에게 보내는 메시지 — 그게 타이핑된 텍스트가 되겠다고 노트북을 떠나 서버로 갈 이유는 없습니다. 로컬 전사는 전적으로 당신의 기기에서 오프라인으로 실행되며, 아무것도 서버로 보내지 않습니다. Mac이 Apple Silicon이거나 PC가 최근 몇 년 안의 것이라면, 로컬이 불평 없이 일상 받아쓰기를 처리하고, 클라우드는 기본값이 아니라 비상구가 됩니다.

세 가지 방식이 어떻게 다른지 보겠습니다. 앱이 당신에게 고르게 하니, 잘 고를 수 있도록 말이죠:

  • 로컬 ParakeetNVIDIA의 TDT 엔진으로, 약 600 MB이며 가장 빠른 로컬 옵션입니다 — CPU에서 Whisper보다 5~10배 빠릅니다. 영어에 더해 다른 유럽어 24개, 총 25개 언어를 지원합니다. 영어로의 번역은 없습니다. 영어나 다른 유럽어로 글을 쓴다면, 이게 빠르고 완전히 오프라인인 선택입니다.
  • 로컬 Whisper같은 기기에서 Parakeet보다 느리지만, 다국어 빌드는 99개 언어를 지원하고 영어로 번역할 수 있습니다. 영어 전용 빌드는 99개가 아니라 영어 전용입니다. 중국어, 일본어, 한국어, 또는 Parakeet이 할 수 없는 번역 작업에는 이걸 고르세요. 기본 영어 모델은 약 480 MB입니다.
  • 클라우드 (OpenAI, BYOK)본인의 OpenAI 키를 사용해 OpenAI가 직접 청구하는 방식으로, 최고의 정확도와 웹 접근을 제공합니다. 전사는 기본적으로 gpt-4o-mini-transcribe로 실행됩니다. 인터넷이 필요하므로, 당신의 기기를 떠나는 유일한 방식입니다. 클라우드 영역은 Whisper Pro의 일부입니다.

따분한 진실은, 대부분의 일상 텍스트에는 로컬이면 충분하다는 것입니다. 두 로컬 엔진 모두 아무것도 어디로도 보내지 않고 당신의 기기에서 완전히 실행되며, 개인적인 내용을 음성으로 타이핑할 때 이게 올바른 기본값입니다. 클라우드는 까다로운 녹음에서 최상급 정확도를 원하거나, 말하는 도중에 모델이 웹에서 사실을 끌어와야 할 때 제값을 합니다. 하루치 이메일과 메모라면, 로컬로 시작하고 로컬이 아쉬울 때만 클라우드에 손을 뻗으세요.

직접 손으로 고치지 않도록 AI가 정리

이 단계는 손을 쉬게 하는 데 있어 처음 보이는 것보다 더 중요합니다. 말은 어수선합니다. "음" 하고, 문장을 다시 시작하고, 말끝을 흐립니다. 그걸 다시 돌아가 타이핑으로 고쳐야 한다면, 방금 줄인 키 입력을 도로 넣는 셈이라 의미가 없어집니다. 그래서 Whisper에는 텍스트가 붙기 전에 군더더기를 다듬고 표현을 정리하는 선택적 AI 패스가 있습니다. 고칠 게 적을수록 누를 키도 적습니다.

Windows 음성 입력은 말하는 동안 기본 문장 부호를 넣어주고, macOS 받아쓰기는 "쉼표"나 "마침표"라고 말하면 처리해줍니다. 더 무거운 정리 — 군더더기 제거, 이어진 문장 고치기, 말한 문단을 실제로 보낼 만한 글로 바꾸기 — 가 필요하면 Whisper가 요청 시 그 AI 패스를 실행합니다. 활성화 문구 "Hey whisper"라고 말하면 텍스트가 떨어지기 전에 다듬어집니다. 로컬 모델에서는 Ollama를 통해 당신의 기기에서 무료로 실행되고, 클라우드 모드에서는 기본적으로 gpt-5-mini입니다.

Thinking...
원본

어 그러니까 그 그 보고서는 거의 다 됐어요 제 생각엔 금요일 전에 마리아한테 보내기만 하면 될 것 같아요

정리됨

보고서는 거의 다 된 것 같아요. 금요일 전에 마리아에게 보내기만 하면 됩니다.

이 정리의 핵심은, 이 용도에서는 결과를 한 번 읽고 넘어가는 것이지 키보드로 텍스트를 다시 손보는 게 아니라는 점입니다. 다듬을 필요가 없을 때는 기능을 꺼두고 원본 전사를 그대로 붙일 수도 있습니다. 어느 쪽이든 손으로 하는 편집이 줄어들고, 그게 바로 당신의 손이 알아챌 부분입니다.

그 똑같은 말하고-나서-정리하는 흐름은 당신이 쓰는 모든 글에서 효과를 냅니다 — 음성으로 더 빠르게 타이핑하기도 가능해서, 긴 메시지가 키를 하나씩 눌러 짜내는 문단 대신 몇 문장 말하는 것으로 바뀝니다.

이런 받아쓰기 도구를 건너뛰어야 할 때

포장도로에 분필로 그린 서로 다른 방향을 가리키는 두 개의 화살표 — 도구 선택을 비유한 모습

때로는 알맞은 도구가 제 것이 아닐 때가 있고, 아닌 척하는 건 당신에게 못 할 짓입니다. 자주 나오는 두 경우가 있는데, 둘 다 텍스트로 받아쓰기는 틀린 답입니다.

첫째, 텍스트만 입력란에 넣는 게 아니라 컴퓨터 전체를 음성으로 조작하고 싶다면 — 마우스를 옮기고 클릭하고, 앱을 열고, 메뉴를 탐색하고, 스크롤하고 — 받아쓰기 도구로는 거기에 닿지 못합니다. Whisper는 텍스트를 처리하지, 기기를 운전하지는 않습니다. 완전한 핸즈프리 사용을 원한다면 먼저 운영체제의 접근성 도구를 보세요: macOS 음성 제어는 인터페이스 전체를 음성으로 조작하게 해주고, Windows에는 음성 액세스가 있습니다. 기본 내장 기능 너머로는, Dragon(Windows)이 마우스와 메뉴를 위한 음성 명령을 더해주고, Talon Voice(Mac, Windows, Linux)가 가장 멀리 가서, 음성 명령을 시선 추적 및 소리 기반 클릭과 짝지어 진정한 핸즈프리 제어를 제공합니다. 그게 필요한 거라면, 여기가 아니라 거기서 시작하세요.

둘째, 가끔 짧은 메시지만 받아쓰면 된다면 아직 아무것도 설치하지 마세요. Windows에서는 Windows 로고 키 + H를 누르면 커서가 있는 곳 어디서든 내장 음성 입력 막대가 열립니다. 알아서 문장 부호를 넣어주고 무료지만, Microsoft 서버를 거치며 인터넷이 필요합니다. Mac에서는 받아쓰기로 아무 텍스트 필드에 말할 수 있는데, 시스템 설정의 키보드에서 설정하며 Apple Silicon에서는 기기 내에서 실행될 수 있습니다. 그리고 빠른 휴대폰 사용에는 휴대폰 키보드의 마이크가 이미 어떤 필드에든 받아쓰기를 해줍니다. 전용 도구는 분량에서 제값을 합니다 — 긴 글쓰기, 가장 마찰이 적은 키, 오프라인 사용, 그리고 어디서나 똑같이 작동하는 단축키 하나죠. 그 기준 아래라면, 무료인 것을 쓰세요.

여기서의 틀은 더 폭넓은 가이드인 RSI를 위한 받아쓰기 소프트웨어에서 제가 쓰는 것과 같습니다 — 키 입력을 줄이고, 솔직함을 지키고, 타이핑이 아니라 키보드 자체가 문제일 때만 더 무거운 도구에 손을 뻗으세요.

더 읽어보기

이 중 어느 것도 관절염의 해결책이 아니며, 저는 그런 척하지 않겠습니다. 이것은 키를 누르지 않고 텍스트를 만드는 방법이고, 키를 누르는 게 불편한 부분일 때 작지만 유용한 것입니다. 통합 지점은 커서입니다: 아무 입력란에 말하고, 텍스트를 얻고, 키보드로 돌아가지 않고 정리하세요. 저는 이 가이드의 대부분을 똑같은 단축키로 텍스트 편집기에 받아썼고, 손은 대체로 키에서 뗀 채, 한 번 다시 읽어봤습니다. 그게 비법의 전부입니다 — 그리고 관절이 타이핑 휴식 이상을 필요로 한다면, 물어볼 사람은 제가 아니라 의학 학위가 있는 분들입니다.

다음 이메일에서 손을 쉬게 하세요

단축키를 누르고 있거나 가볍게 누르고 말하면, 전사된 글이 커서가 있는 곳 어디든 떨어집니다 — 모든 앱에서, 키보드 없이요.

로그인한 모든 계정에 무료 로컬 모드. 시작에 카드가 필요 없습니다.

Denys Medvediev 사진

Denys Medvediev

저는 우리 고객 지원 이메일을 읽는 사람입니다 — 답장은 십중팔구 받아쓰기로 하고 있고요.