작성자: Denys Medvediev

가이드

강의 녹음

"강의 녹음 앱"이라는 말 안에는 서로 다른 두 가지 작업이 있습니다. 하나는 녹음된 강의를 텍스트로 변환하는 파일 변환이고, 다른 하나는 복습하면서 본인의 학습 노트를 음성으로 남기는 일입니다. Whisper by Remskill은 두 번째 작업을 담당합니다. Windows와 Mac 전체에서 시스템 수준으로 동작합니다.

최종 업데이트: 2026년 6월

단상과 칠판이 있는 텅 빈 대학 강의실, 학습과 노트 필기를 연상시키는 장면

강의 녹음 앱은 두 가지 별개의 작업을 다룹니다. 녹음된 강의를 텍스트로 변환하는 것은 파일 변환으로, 전용 변환 서비스가 처리합니다. 내가 말한 학습 노트와 요약을 노트 앱에 담는 것은 받아쓰기로, Whisper 같은 시스템 전체 도구가 처리합니다. 단축키를 누르고, 말하면, 텍스트가 커서 위치에 나타납니다.

"강의 녹음 앱"을 검색하면 같은 결과 페이지에서 전혀 다른 것을 원하는 두 부류의 사람을 만납니다. 한 부류는 90분짜리 강의를 녹음해 두고 그 음성을 읽을 수 있는 텍스트로 바꾸길 원합니다. 다른 부류는 강의를 들었고 대부분 이해했으며, 이제 한 시간씩 타이핑하지 않고 본인의 노트를 정리하고 싶어 합니다. 이 둘은 같은 작업이 아닙니다. 하나의 도구가 둘 다 잘하는 경우는 드뭅니다.

이 글이 어디에 솔직한지 바로 말씀드리겠습니다. Whisper by Remskill은 받아쓰기 도구입니다. 여러분이 말하는 내용을 커서가 있는 위치에, 현재 사용 중인 앱 어디서든 입력해 줍니다. 강의실 뒤에 조용히 앉아 교수님을 녹음하고 대본을 건네주지는 않습니다. 그게 필요하다면 몇 섹션 아래에서 적합한 도구를 안내해 드리겠습니다. "말로 빠르게 내 학습 노트를 작성하고 싶다"는 쪽이라면, 그게 바로 저희가 잘하는 일이고, 이 가이드의 대부분이 그 내용입니다.

이 검색어가 숨기고 있는 차이점이 있습니다. 강의를 녹취한다는 것은 오디오 파일, 즉 다른 사람이 말한 녹음을 사후에 텍스트로 변환하는 작업입니다. 이것은 녹음-변환 방식으로, 전용 도구가 따로 있습니다. 받아쓰기는 반대 방향입니다. 내가 의도적으로 마이크에 말하면, 그 단어들이 커서가 있는 곳에 실시간으로 나타납니다.

결국 핵심 질문은 어느 쪽에 해당하느냐입니다. 교수님의 말씀을 녹음에서 텍스트로 옮기고 싶다면 변환 서비스가 필요하고, 전용 가이드를 읽어보셔야 합니다. 음성으로 복습 노트, 요약, 플래시카드 문구를 타이핑 대신 작성하고 싶다면, 시스템 전체에서 동작하는 받아쓰기 단축키가 필요합니다. 두 가지를 솔직하게 설명하고, 받아쓰기 방식을 2분 안에 설정하는 법과 언제 이 도구가 맞지 않는지도 정확히 알려드리겠습니다.

하나의 검색어 뒤에 숨은 두 가지 작업

학습 환경에 놓인 노트, 펜, 그리고 열린 노트북, 강의 자료를 복습하는 모습

첫 번째 작업은 녹음된 강의의 변환입니다. 수업 중 녹음 버튼을 눌렀거나 교수님이 올려둔 강의 음성이 있고, 이제 파일이 생겼습니다. 그 파일을 읽고, 훑어보고, 인용할 수 있는 검색 가능한 텍스트로 바꾸고 싶습니다. 입력값은 이미 갖고 있는 오디오이고, 작업은 녹음을 변환하는 것입니다. 이것이 파일 변환이며, 이를 위한 전용 도구가 있는 실제 카테고리입니다.

두 번째 작업은 음성으로 학습 노트 작성하기입니다. 슬라이드를 다시 보거나, 교재를 공부하거나, 강의가 아직 생생할 때 수업을 마치고 걸어오면서, 타이핑하지 않고 내 생각을 남기고 싶습니다. 말하면 단어들이 노트 앱에 나타납니다. 입력값은 내 목소리이고, 의도적으로, 실시간으로 진행됩니다. 이것이 받아쓰기이며, 완전히 다른 방식입니다. 하나는 다른 사람의 녹음을 처리하고, 다른 하나는 생각하는 동안 대신 타이핑해 줍니다.

Whisper by Remskill은 두 번째 작업을 합니다. 조용히 공간을 녹음해서 변환해 주지 않으며, 저도 그런 척하지 않겠습니다. 그건 녹음 도구의 역할이지 받아쓰기 도구의 역할이 아닙니다. 이 도구가 하는 일은 내용을 정리할 때 키보드를 없애주는 것입니다. 많은 학생들에게 두 번째 작업이 실제로 저녁 시간을 잡아먹는 일이고, 그래서 이 도구가 의미 있습니다.

단축키를 누르고 말하면, 노트가 저절로 써집니다

작동 방식은 단순합니다. 그게 요점이기도 합니다. 단축키를 누르고, 말하고, 손을 떼면 텍스트가 커서 위치에 붙여넣기 됩니다. Notion, Google Docs, OneNote, 메모 앱, 포커스가 있는 모든 텍스트 입력란에서요. Whisper는 키를 놓은 후 짧은 여유 시간을 두어 마지막 단어가 잘리지 않게 합니다. 운영체제 커서에 붙여넣기하기 때문에, 노트 앱은 그냥 "어떤 텍스트 상자"일 뿐입니다. 플러그인도 필요 없고 어떤 앱인지도 상관없습니다.

학생 입장에서 이것이 실제 공부에 어떻게 연결되는지 보면 이렇습니다. 독서를 마치고 나서 챕터 내용을 본인의 말로 소리 내어 요약하면, 타이핑하는 것보다 훨씬 빠르게 요약이 노트에 남습니다. 슬라이드 하나를 나중에 스스로 퀴즈를 낼 질문으로 바꾸기도 합니다. 강의가 아직 생생할 때 복습 문서에 핵심을 받아쓰기도 하죠. 말하는 동안 작은 캡슐이 나타나 Whisper가 듣고 있다는 걸 알려줍니다:

Cancel
녹음 오버레이: 말하는 동안 나타나는 작은 캡슐로 Whisper가 듣고 있음을 알려줍니다.

단축키는 처음에 제대로 설정해 두어야 할 유일한 것입니다. Windows에서는 Ctrl+Space이고, Mac에서는 말하는 동안 누르고 있는 Command+Option, 즉 수정키만으로 동작하는 푸시투토크 방식입니다. 둘 다 이미 사용 중인 단축키와 충돌한다면 설정에서 변경할 수 있습니다. (제 막내딸이 드로잉 앱에서 단축키가 "작동 안 한다"고 말한 적이 있습니다. 버그가 아니라 충돌이었는데, 그때 일반 사용자들이 단축키 충돌이 무엇인지 전혀 모른다는 걸 깨달았습니다. 그래서 이제 모든 단축키를 변경할 수 있도록 했습니다.) 학생용 받아쓰기 소프트웨어를 써본 적이 있다면, 같은 근육 기억이 이번에는 노트를 향하게 됩니다.

2분 안에 설정하기 (Windows 또는 Mac)

Apple Silicon Mac 또는 Windows 10 이상의 PC, 작동하는 마이크, 그리고 노트 앱이 열려 있으면 됩니다. 로컬 파이프라인 전체는 로그인된 계정이라면 무료이며, 가입 시 결제 수단을 요구하지 않습니다. 순서는 다음과 같습니다.

1단계 — Whisper 설치 및 로그인.

다운로드 페이지에서 내려받아 설치하고, 무료 계정을 만드세요. 카드 불필요. 로컬 변환 파이프라인 전체가 바로 열립니다.

앱 트레이 아이콘이 나타나고 설정 마법사가 모델 선택을 제안하면 잘 된 겁니다.

2단계 — 변환 경로 선택.

앱이 대신 선택해 주지 않습니다. 세 가지 옵션이 있습니다: Cloud (OpenAI, 본인 키 사용), 로컬 Parakeet, 또는 로컬 Whisper. 개인 학습 노트라면 로컬로 시작하세요. 두 섹션 아래에서 더 자세히 설명합니다.

모델 다운로드가 완료되고 준비 상태로 표시되면 잘 된 겁니다.

3단계 — 단축키 확인.

Windows 기본값은 Ctrl+Space, Mac은 푸시투토크로 누르고 있는 Command+Option입니다. Mac에서는 접근성 권한을 요청할 때 허용해야 합니다. 없으면 다른 앱에 커서 위치 붙여넣기가 안 됩니다.

테스트 녹음이 텍스트 입력란에 붙여넣기 되면 잘 된 겁니다.

4단계 — 노트에 커서를 놓고 말하기.

노트 앱을 열고, 텍스트를 원하는 곳을 클릭하고, 단축키를 누른 채 문장을 말하고, 손을 떼세요. 커서가 있는 위치에 텍스트가 나타납니다.

말한 요약 내용이 노트에 깔끔한 텍스트로 나타나면 잘 된 겁니다.

Whisper
변환 및 AI 패널이 열린 설정 화면의 실제 Whisper 데스크톱 앱.

느린 부분은 설정이 아니라 모델 다운로드입니다. 나머지는 위의 네 단계가 전부입니다. 실행되고 나면 강의 내용을 정리하는 것이 타이핑 작업이 아니라 말하기 작업이 됩니다. 수업 후 30분을 훨씬 잘 활용할 수 있게 됩니다.

말하기 중심의 학습 노트 워크플로

학생들에게 실제로 효과 있는 방법은 "강의 전체를 그대로 받아쓰기"가 아닙니다. 소리 내어 복습하는 것입니다. 강의나 독서 후에 내 말로 개념을 스스로 설명하면, 그 설명이 노트에 남습니다. 말하는 행위 자체가 공부의 절반이고, 그것을 기록하는 것이 나머지 절반인데, 키보드를 건드리지 않고 둘 다 해낸 겁니다. 단순한 진실은, 최고의 학습 도구는 종종 그냥 자료를 소리 내어 이야기하는 것이라는 점입니다. 음성 입력은 그 행위가 허공으로 사라지지 않고 노트로 남도록 만들어 줍니다.

구체적인 방법 몇 가지. 챕터의 각 섹션을 두세 문장으로 소리 내어 요약하면, 노트가 복사한 문장이 아니라 내 표현으로 채워집니다. 진행하면서 자가 퀴즈 질문을 받아쓰고, 나중에 플래시카드로 만들 수 있습니다. 어려운 단락을 읽은 다음, 혼란스러운 점을 소리 내어 말하세요. "두 번째 단계가 왜 첫 번째 단계에 의존하는지 모르겠다"처럼요. 그러면 복습 문서에 사실만이 아니라 내 실제 질문들이 담깁니다. 90분짜리 강의가 몇 분간 말하는 것으로 600단어짜리 요약이 될 수 있는데, 이것은 줄 단위로 타이핑하는 저녁과는 전혀 다른 경험입니다.

전공 분야에 특수 용어가 많다면, 해부학, 법령, 유기화학 명칭처럼, 로컬 Whisper에서 사용자 어휘와 핫워드를 추가하면 엔진이 그 단어를 더 잘 인식하도록 편향됩니다. 그렇다고 임상이나 법률 도구가 되는 건 아니고, 어떤 인증을 해주지도 않습니다. 단지 "심근"이 "심근 운동"으로 잘못 인식되는 것을 막아줄 뿐입니다. 음성으로 단어를 빠르게 입력한 다음, 이미 익숙한 키보드로 제목, 목록, 링크 등 구조를 잡으세요. 받아쓰기 도구는 단어를 만들어 주지만, 노트 앱의 레이아웃을 만들어 주지는 않으니까요.

학습 노트에는 로컬 모드와 클라우드 모드 중 어느 쪽이 좋을까요

학습 노트라면 로컬 모드를 먼저 써보세요. 어떤 주제에 대한 반쯤 형성된 이해, 시험에 무엇이 나올지에 대한 추측, 절반만 따라간 강의, 이런 내용은 내 노트북 밖으로 나갈 필요가 없습니다. Apple Silicon Mac이나 최근 몇 년 안에 나온 PC라면 로컬이 일상적인 받아쓰기를 무리 없이 처리하고, 클라우드는 기본이 아닌 비상구가 됩니다. 그리고 무료입니다. 학생일 때는 그게 더 중요하죠.

앱이 선택을 요구하므로, 세 가지 경로가 어떻게 다른지 알고 잘 선택하시길 바랍니다:

  • 로컬 ParakeetNVIDIA의 TDT 엔진, 약 600 MB, 가장 빠른 로컬 옵션으로 CPU에서 Whisper보다 5~10배 빠릅니다. 영어를 포함해 유럽 언어 24개, 총 25개 언어를 지원합니다. 영어로 번역 기능은 없습니다. 영어나 다른 유럽 언어로 공부한다면, 빠르고 완전히 오프라인으로 사용할 수 있는 선택입니다.
  • 로컬 Whisper같은 기기에서 Parakeet보다 느리지만, 다국어 모델이 99개 언어를 지원하고 영어로 번역할 수 있으며, 전공 용어에 도움이 되는 사용자 어휘와 핫워드를 지원합니다. 영어 전용 모델은 영어만 지원하며 99개가 아닙니다. 중국어, 일본어, 한국어, 번역 작업, 또는 용어가 많은 전공이라면 이것을 선택하세요. 기본 영어 모델은 약 480 MB입니다.
  • 클라우드 (OpenAI, BYOK)최고의 정확도와 웹 접근성을 제공하며, 본인의 OpenAI 키를 사용해 OpenAI에 직접 청구됩니다. 변환은 기본적으로 gpt-4o-mini-transcribe로 실행됩니다. 인터넷이 필요하므로 기기 밖으로 나가는 유일한 경로입니다. 클라우드 기능은 Whisper Pro의 일부입니다.

솔직히 말하면, 대부분의 학생이 받아쓰는 텍스트, 즉 요약, 질문, 내 표현으로 바꾼 내용에는 로컬로 충분합니다. 두 로컬 엔진 모두 서버로 아무것도 보내지 않고 기기에서 완전히 실행됩니다. 클라우드가 빛을 발하는 경우는 어려운 녹음에서 최고 수준의 정확도가 필요하거나, 모델이 문장 중간에 웹에서 사실을 찾아와야 할 때입니다. 일상적인 노트 작성이라면 로컬로 시작하고, 로컬이 아쉬울 때만 클라우드를 사용하세요.

정리와 구조: 음성 요약을 제대로 된 노트로 만들기

날것의 받아쓰기는 문장이 끊기지 않고 쭉 이어집니다. "자 미토콘드리아는 에너지를 만드는 부분인데 ATP 만들고 자체 DNA도 있는데 이게 신기하잖아요 시험에 나올 것 같아요"라고 말하면, 이것이 어떤 음성 엔진이든 그대로 건네주는 구두점 없는 덩어리입니다. 이것을 정리하는 방법에서 경로가 갈립니다.

Windows 음성 입력은 말하는 동안 구두점을 추가하고, macOS 받아쓰기는 "쉼표"나 "마침표"라고 말하면 기본 구두점을 처리합니다. 더 심층적인 정리, 즉 "음"을 제거하고, 이어지는 문장을 끊고, 말한 내용을 실제로 편집할 수 있는 글로 만들려면 Whisper가 AI 처리를 실행할 수 있습니다. "Hey whisper" 활성화 문구를 말하면 텍스트가 개선된 상태로 나타납니다. 로컬 모델에서는 Ollama를 통해 실행되고, 클라우드 모드에서는 기본적으로 gpt-5-mini가 사용됩니다.

Thinking...
원본

자 미토콘드리아는 에너지를 만드는 부분인데 atp 만들고 자체 dna도 있는데 이게 신기하잖아요 시험에 나올 것 같아요

정리 후

미토콘드리아는 에너지(ATP)를 생산하며 자체 DNA를 보유합니다. 이는 특이한 특성으로, 시험에 출제될 가능성이 높습니다.

노트 앱의 구조, 즉 제목, 중첩 목록, 태그, 링크에 대해 솔직히 말하면, 음성은 텍스트를 만들어 주고 앱이 구조를 만들어 줍니다. 요약을 받아쓴 다음, 항상 하던 방식으로 제목, 목록, 링크를 추가하세요. 명령 하나로 개요를 만들어 내는 받아쓰기 도구는 없습니다. 그런 것을 약속한다면 시연용 데모를 파는 것이지, 실제 매일 쓸 수 있는 도구가 아닙니다. 음성으로 단어를 빠르게 입력하고, 이미 아는 키로 노트를 정리하세요.

이 말하고 정리하는 흐름은 공부 이외에도 충분히 활용됩니다. 하나의 단축키로 어떤 종류의 노트 작성에도 음성을 깔끔한 텍스트로 바꿀 수 있어, 타이핑했을 문단이 몇 마디 말로 대체됩니다.

강의 오디오 변환이 실제로 필요할 때

흐릿한 강의 배경 앞에 스탠드에 놓인 마이크, 녹음된 오디오 변환을 나타냄

명확하게 선을 긋겠다고 약속한 부분입니다. "강의 녹음이 있고 전체를 텍스트로 바꾸고 싶다"는 작업이라면, 받아쓰기 도구는 잘못된 카테고리입니다. 그렇지 않다고 하면 오히려 불친절한 것입니다. Whisper by Remskill은 커서 위치에 말한 내용을 입력해 줍니다. 교수님의 오디오 파일을 받아서 대본을 만들어 주지 않습니다. 그 작업이라면 녹음-변환 워크플로가 필요하고, 전용 가이드가 있습니다.

강의 오디오 변환이 필요한 경우는 강사의 정확한 발언이 필요할 때입니다. 논문 인용, 초청 강사의 말 그대로의 기록, 빠진 수업이지만 오디오만 있을 때처럼요. 이런 도구들은 오디오나 비디오 파일을 받아 텍스트로 반환하며, 종종 타임스탬프와 화자 레이블이 포함되기도 합니다. 이건 받아쓰기 단축키와는 근본적으로 다른 도구이며, 입력값이 실시간 목소리가 아닌 녹음일 때 적합한 도구입니다. 녹음된 강의를 변환하는 방법에서 그 작업에 맞는 워크플로를 확인하세요.

가벼운 작업이라면 이미 기기에 있는 무료 도구가 맞을 수도 있습니다. 노트에 두 줄짜리 메모만 남기는 거라면, Windows 음성 입력(Windows 키 + H)과 macOS 받아쓰기가 무료로 처리해 줍니다. 둘 다 포커스가 있는 입력란에 입력하지만, Windows 버전은 인터넷 연결이 필요합니다. 전용 시스템 전체 도구가 빛을 발하는 건, 노트가 길어지거나, 주제가 다국어이거나 용어가 많거나, 노트, 이메일, 에세이 초안 어디서든 같은 방식으로 동작하는 하나의 단축키가 필요할 때입니다. 그 수준 이하라면 무료 도구를 쓰세요. 두 줄짜리 메모 하나 때문에 앱을 설치하라고 하지 않겠습니다.

빠른 메모보다 에세이나 과제 작성이 주된 작업이라면, 음성으로 더 빠르게 타이핑하기의 논리가 그대로 적용됩니다. 단축키는 커서가 노트 앱에 있든 워드프로세서에 있든 상관하지 않으니까요.

강의 녹음 앱은 사실 하나의 검색어를 두 가지 도구가 나눠 쓰고 있습니다. 녹음이 있다면 변환 도구로 변환하세요. 내 이해와 빈 노트 페이지가 있다면, 소리 내어 말하고 커서 위치에 단어가 쌓이게 하세요. 이 가이드의 대부분은 제 노트 앱이 아닌 텍스트 입력란에 받아쓰기 하면서 작성했습니다. 어느 입력란이든 상관없는 도구를 사용해서요. 그 다음 전부 제 개요에 붙여넣었습니다. 공부 자체는, 안타깝게도, 여전히 본인의 머릿속에서 해야 합니다.

다음 강의 내용을 말로 정리해 보세요

단축키를 누르고 자료를 소리 내어 요약하고, 손을 떼세요. 커서가 있는 노트 앱 어디에나, 그리고 다른 모든 앱에도 텍스트가 남습니다.

로그인된 계정이라면 로컬 모드 무료. 시작 시 카드 불필요.

Denys Medvediev 사진

Denys Medvediev

저는 고객 지원 이메일을 읽는 사람입니다. 아마도 답장도 받아쓰기로 쓸 겁니다.

더 읽어보기