작성자: Denys Medvediev

튜토리얼

VS Code에서 음성을 텍스트로, 솔직한 버전

VS Code Speech는 에디터 안에서, 기기에서 직접, 무료로 받아쓰기를 해줍니다. 솔직히 말하면, 커밋 메시지나 터미널, 브라우저에서는 시스템 전체에서 동작하는 단축키가 에디터 확장 프로그램이 닿지 못하는 곳까지 닿습니다.

마지막 업데이트: 2026년 6월

코드 에디터 화면 가득 표시된 선명한 프로그래밍 코드, 개발자의 일상적인 작업 공간

VS Code의 음성 입력은 Microsoft의 무료 공식 확장 프로그램인 VS Code Speech로 동작합니다. 이 확장은 에디터 안에서 기기에서 직접 받아쓰기를 하고 Copilot과의 음성 대화도 지원합니다. 에디터 밖에서의 받아쓰기 — 터미널, 브라우저, 다른 곳의 커밋 메시지 — 에는 Whisper 같은 시스템 전체 도구가 어떤 앱에서든 커서 위치에 텍스트를 붙여 넣습니다. 둘 다 오프라인으로 동작합니다.

그래서 짧은 답은 "가능하다"이고, 게다가 꽤 좋습니다. VS Code가 음성을 지원하지 못한다고 생각했다면 검색을 멈추세요. Microsoft는 2024년 2월 1.87 버전과 함께 VS Code Speech를 출시했고, 로컬에서 동작하며, 무료입니다. 에디터 안에서 받아쓰기를 하고 싶은 개발자 대부분은 이 두 문단이면 충분합니다. 그래도 괜찮습니다. 정작 흥미로운 부분은, 받아쓰고 싶은 내용이 에디터 안에 있지 않을 때 무슨 일이 벌어지느냐입니다.

아무도 처음부터 말해주지 않는 부분이 여기 있습니다. 음성으로 코드를 작성하는 건 좋은 생각이 아닙니다 — "여는 괄호, 카멜 케이스, 유저 아이디, 닫는 괄호"를 소리 내어 말해 보면 점심 먹기도 전에 포기하게 됩니다. 하지만 코드 주변의 글 — 커밋 메시지, 주석, README, 그동안 미뤄 온 PR 설명 — 을 음성으로 입력하는 건 타이핑을 이깁니다. 받아쓰기는 분당 약 145단어인데, 타이핑은 대략 40단어 정도입니다. 바로 그 격차가 10분 설정에 투자할 만한 이유 전부입니다.

VS Code의 음성 상황: VS Code Speech 확장 프로그램

커피잔 옆에서 코딩 소프트웨어를 실행 중인 노트북 클로즈업, 음성 입력을 더하기 전의 전형적인 에디터 환경

VS Code는 기본적으로 음성 입력이 켜져 있지 않습니다. 공식 확장 프로그램 하나로 추가하면 됩니다. Extensions 뷰를 열고 VS Code Speech를 검색한 뒤, 게시자가 Microsoft (ms-vscode.vscode-speech 마켓플레이스 페이지)가 맞는지 확인하고 설치하세요. API 키도, 가입도, 유료 플랜도 없습니다. 작은 온디바이스 음성 모델을 내려받고 나면 바로 동작합니다.

에디터에 받아쓰기를 하려면 Voice: Start Dictation in Editor 명령을 실행하세요 — Windows와 Linux에서는 Ctrl+Alt+V, Mac에서는 Opt+Cmd+V입니다. 멈추려면 Voice: Stop Dictation in Editor를 쓰고, 이는 Escape에 연결되어 있습니다. 같은 단축키를 누른 채로 유지하면 Microsoft가 말하는 "무전기(walky-talky) 모드"가 됩니다. 키를 누르고 있는 동안 인식이 계속되고, 손을 떼는 순간 입력이 제출됩니다. 에디터가 가진 푸시투토크 버튼에 가장 가까운 기능입니다.

같은 확장 프로그램은 두 번째 별개의 일도 합니다: GitHub Copilot과의 음성 대화입니다. Chat: Start Voice Chat (Ctrl+I / Cmd+I)을 실행하거나, "Hey Code" 호출어를 켜고 손을 쓰지 않고 Copilot Chat과 대화하세요. 어떤 범용 받아쓰기 도구도 이 기능을 똑같이 해내지 못합니다. Copilot과 대화하려고 찾아온 거라면, VS Code Speech가 정답이고, 두 번째 선택지는 없습니다.

한 가지 정리해 둘 점: 공식 VS Code 문서는 26개 지원 언어를 나열하며, 이는 accessibility.voice.speechLanguage 설정으로 지정합니다. "영어만 지원"이라고 적힌 오래된 microsoft/vscode 위키 페이지를 만날 수도 있지만 — 그건 옛 정보입니다. 최신 문서가 맞습니다.

내 컴퓨터에서, 오프라인으로 동작합니다 — 그런데 생각만큼 중요하진 않습니다

파란색과 흰색 줄무늬 문을 잠근 자물쇠, 비공개 받아쓰기가 자신의 컴퓨터에만 머문다는 것을 상징

VS Code Speech는 온디바이스로 동작합니다. 공식 VS Code 음성 지원 문서에 따르면 "녹음 내용은 어떤 온라인 서비스로도 전송되지 않고 사용자의 컴퓨터에서 로컬로 처리됩니다." 모델을 한 번 내려받고 나면 인터넷이 필요 없고, 음성으로 단 주석은 노트북 안에 머뭅니다.

이 부분은 솔직하게 짚고 넘어가고 싶습니다. 많은 "대안" 글들이 슬쩍 넘어가는 지점이거든요. Whisper의 로컬 모드 역시 완전히 오프라인이며, 오디오가 컴퓨터를 떠나지 않습니다. 그러니 오프라인은 Whisper만의 장점이 아니라 동등한 조건입니다. 가격도 마찬가지입니다 — VS Code Speech는 무료이고, Whisper의 로컬 파이프라인도 가입 시 카드 없이 무료입니다. 누군가 "오프라인이고 무료니까" 도구를 바꾸라고 한다면, 이미 가진 걸 팔고 있는 겁니다.

솔직한 차이는 도달 범위입니다. VS Code Speech는 VS Code 안에서 온디바이스이고 무료입니다. 문제는 텍스트가 다른 곳에 있을 때 무엇을 하느냐입니다.

VS Code Speech가 닿지 못하는 곳: VS Code 밖의 모든 것

VS Code Speech는 에디터와 채팅에 받아쓰기를 합니다. 의도된 범위가 그렇습니다 — 통합 터미널에 일반 입력으로 타이핑하지 않고, 브라우저에 닿지 않으며, Slack이나 Jira, 깃 GUI를 건드리지 않습니다. 그게 결함은 아닙니다. 키보드 전체를 조용히 가로채는 에디터 확장 프로그램이라면 오히려 더 나쁜 확장일 겁니다.

하지만 개발자의 글이 실제로 어디에 머무는지 생각해 보세요. 터미널이나 별도의 깃 클라이언트에 쓰는 커밋 메시지. 브라우저에서 GitHub에 올리는 PR 설명. Jira 티켓이나 GitHub 이슈에 붙여 넣는 버그 재현 단계. 빌드가 왜 빨간불인지 설명하는 Slack 메시지. 이 중 거의 어느 것도 에디터 창에서 일어나지 않습니다. 다른 다섯 개의 창에서 일어나고, 에디터 확장 프로그램은 거기까지 따라가지 못합니다.

그게 바로 빈틈입니다 — 에디터는 여덟 개의 창 중 하나일 뿐입니다.

코드 주변의 글을 위한 Whisper, 어떤 앱에서든

Whisper는 VS Code 확장 프로그램이 아니라 Windows와 macOS용 데스크톱 앱입니다. 운영체제 수준에서 동작하기 때문에, 타이핑할 수 있는 어떤 앱에서든 커서 위치에 받아쓰기 결과를 붙여 넣습니다 — VS Code 에디터와 통합 터미널은 물론, 브라우저, Slack, Teams, Gmail, JetBrains IDE, Notion까지요. 단축키 하나로, 모든 창에서.

Cancel
녹음 오버레이: 말하는 동안 나타나는 작은 캡슐로, Whisper가 듣고 있다는 걸 알려 줍니다.

단축키는 Windows에서 Ctrl+Space, macOS에서는 Command+Option (푸시투토크)입니다. 누른 채로 말하고 손을 떼면, 텍스트가 커서가 이미 있던 자리에 내려앉습니다. Command+Option이 VS Code Speech의 Opt+Cmd+V와 꽤 비슷해 보인다면 — 눈썰미가 좋으시네요. 같은 보조 키, 다른 방식입니다: 하나는 VS Code 내부 명령이고, 다른 하나는 설정에서 다시 지정할 수 있는 시스템 전체 단축키입니다. 둘은 충돌하지 않습니다. 서로 다른 계층에서 살고 있으니까요.

여기서 한 가지 의견만은 분명히 하겠습니다: 최고의 생산성 비법은 더 빠른 단계가 아니라 더 적은 단계입니다. 창을 바꾸고, 그 앱에 맞는 음성 명령을 찾고, 어떤 도구가 어디서 받아쓰는지 기억하는 것 — 이 모두가 단계입니다. 터미널에서든 브라우저에서든 똑같이 동작하는 시스템 전체 단축키 하나가 그 단계를 없애 줍니다. 속도도 좋지만, 진짜 이점은 지금 어느 창에 있는지 신경 쓰지 않아도 된다는 것입니다.

앱 전체를, 실시간으로

Whisper
진짜 Whisper 데스크톱 앱 — 받아쓰기 경로를 고른 뒤, 어디서든 단축키를 누르고 있으면 텍스트가 커서 위치에 나타납니다.

위에 있는 게 진짜 데스크톱 앱입니다 — 설정, 모드, 전부 다요. Whisper는 로컬과 클라우드 모드 모두에서 90개가 넘는 언어를 지원합니다(다국어 모델 계열은 99개 이상에 이르고, .en 빌드는 영어 전용입니다). VS Code Speech는 26개를 지원합니다. 그래도 숫자 때문에 바꾸라고는 절대 말하지 않겠습니다. 바꾼다면 도달 범위 때문이겠죠.

받아쓴 내용을 자동으로 다듬기

Thinking...

날것 그대로의 받아쓰기가 해줄 수 없는 한 가지가 여기 있습니다. Whisper에는 선택형 AI 정리 단계가 있어, 두서없이 말한 커밋 메시지를 깔끔한 문장으로 바꿔 줍니다 — 무료 모드에서는 Ollama로 로컬에서, Pro에서는 OpenAI로요. "어, 그 로그인 버튼이, 그러니까, Safari에서 안 되는 거 고친 거"라고 말하면, 실제로 커밋에 넣을 만한 문장으로 나옵니다. 예전에 저는 "그거 고침"이라고만 적힌 커밋을 올린 적이 있습니다. 미래의 저는 과거의 저에게 고마워하지 않았죠. VS Code Speech는 있는 그대로 받아쓰기만 합니다. 정리 단계는 Whisper만의 기능입니다. 커밋 메시지와 PR 설명에서는, 그것이 시간을 아껴 주는 받아쓰기와 손으로 다시 해야 하는 받아쓰기의 차이입니다.

코드 자체는 받아쓰지 마세요

이게 경계선입니다. 개발자 독자라면 제가 두루뭉술하게 말하는 순간 바로 눈치챌 테니, 직설적으로 말하겠습니다: 음성으로 소스 코드를 작성하지 말고, 그게 가능하다고 주장하는 어떤 도구도 믿지 마세요. TypeScript 한 줄에 들어가는 열일곱 개의 기호 때문에, 음성으로 코드를 짜는 건 피하려던 트랙패드보다 더 느립니다. Whisper는 코드가 아니라 코드 주변의 글을 위한 것입니다. 주석, 커밋 메시지, 마크다운 문서, README, PR 본문, Slack 스레드. 영어를 쓰는 곳에서는 음성이 이깁니다. 문법을 쓰는 곳에서는 키보드가 이미 이겼습니다.

반대 방향으로도 똑같이 분명히 해 두겠습니다: Whisper는 Copilot 음성 대화를 하지 않습니다. VS Code Speech의 대체품이 아니라 — 나머지 여덟 개 창을 위한 도구입니다.

VS Code Speech가 더 나은 선택일 때

검은 키보드 방향키의 세밀한 클로즈업, 에디터 명령과 도구 내 단축키를 떠올리게 함

잘못된 도구에 붙들어 두느니, 제대로 된 도구에 여러분을 넘겨드리는 편이 낫습니다. 그러니 솔직히 말하면: VS Code 에디터 안에서 받아쓰거나 Copilot Chat과 음성으로 대화하는 게 필요한 전부라면, VS Code Speech를 설치하고 Whisper는 아예 건너뛰세요. 무료이고, 공식이며, 온디바이스이고, 26개 언어를 지원하며, 어떤 범용 받아쓰기 도구도 따라 하지 못하는 "Hey Code" 호출어까지 됩니다. 내장 기능이 이미 해주는 일에 두 번째 앱을 더하지 마세요.

두 가지 경우가 더 있습니다. 첫째, Linux — VS Code Speech는 Linux에서도 제공됩니다. Whisper 데스크톱은 Windows와 macOS 전용입니다. Linux를 쓴다면 답은 이미 나와 있습니다. 둘째, 철저히 에디터 안에서만 이뤄지는 작업 흐름 — 받아쓰기가 정말로 에디터 창에서만 일어난다면, 시스템 전체 단축키는 있지도 않은 문제를 푸는 셈입니다. 글이 VS Code 밖에 머물 때 Whisper를 꺼내세요. 그렇지 않다면 내장 기능으로 충분하고, "충분함"은 멈추기 좋은 지점입니다.

받아쓰는 곳이 에디터뿐이라면, 이 글은 세 섹션 전에 이미 끝났고, 그건 좋은 결말입니다. VS Code Speech가 맞는 기본값이고, 무료이며, Copilot과 대화합니다. 어느 날 음성이 어느 창에 있는지 신경 쓰지 않고도 터미널, 브라우저, 커밋 메시지에 닿아야 할 때 — 바로 그때 시스템 전체 단축키가 제값을 합니다. 이 글의 대부분을 저는 에디터를 건드리지 않고 받아썼습니다. 코드는, 당연히, 타이핑했고요.

다음 커밋 메시지를 받아써 보세요

Whisper를 내려받고, 단축키를 누른 채로, 텍스트가 터미널이든 브라우저든 에디터든 — 커서가 이미 있는 자리에 내려앉는 걸 지켜보세요.

Mac을 쓴다면, 여기 macOS 설정 안내가 있습니다.

로그인한 모든 계정에 무료 로컬 모드를 제공합니다. 시작하는 데 카드가 필요 없습니다.

Denys Medvediev 사진

Denys Medvediev

저는 우리 지원 이메일을 읽는 사람이고, 십중팔구 그 답장도 받아쓰기로 씁니다.