작성자: Denys Medvediev

가이드

음성을 텍스트로 Standard Notes에서

Standard Notes 데스크톱에는 받아쓰기 기능이 내장되어 있지 않습니다. 해결책은 시스템 전역에서 작동하는 도구입니다. 단축키를 누르고 말하면, 어떤 노트든 커서 위치에 텍스트가 붙여넣어집니다. 로컬에서 실행하면 음성이 기기를 벗어나지 않습니다. 암호화 노트 앱에서 이것이야말로 핵심입니다.

마지막 업데이트: 2026년 6월

어두운 책상 위 노트북 키보드에 놓인 잠긴 자물쇠. 안전하게 암호화된 메모 작성을 떠올리게 한다.

Standard Notes에서 음성을 텍스트로 바꾸는 일은 앱 자체가 아니라 시스템 전역 도구를 통해 이뤄집니다. Standard Notes 데스크톱 편집기에는 받아쓰기 기능이 없습니다. Whisper 같은 도구가 이를 해결합니다. 단축키를 누르고 말하면, 어떤 노트든 커서 위치에 텍스트가 붙여넣어집니다. 로컬에서 실행하면 음성이 기기를 절대 벗어나지 않습니다.

제가 개인 메모를 Standard Notes로 옮긴 이유는 단 하나였습니다. 노트북을 떠나기 전에 모든 것을 암호화해 주고, 그 사실을 그저 믿고 맡길 필요가 없기 때문입니다. 한 가지 아쉬웠던 건, 타이핑 대신 노트에 대고 말하는 일이었습니다. 그래서 받아쓰기 설정을 찾아봤습니다. 그런 건 없더군요. Standard Notes는 의도적으로 깔끔한 편집기 외에는 별다른 기능을 두지 않았고, 한참 뒤져본 끝에 마이크 버튼을 어딘가 숨겨둔 게 아니라는 확신이 들었습니다.

사람들은 "Standard Notes 음성을 텍스트로"를 검색하고, 앱 안에서 아무것도 못 찾고는 토글 하나를 놓친 거라고 생각합니다. 그렇지 않습니다. 그 토글은 애초에 만들어진 적이 없습니다. 좋은 소식은, 해결에 2분쯤이면 충분하고, 완전히 오프라인으로 돌릴 수 있으며, 제가 곧 설명할 방식대로 설정하면 이미 노트를 암호화하고 있는 바로 그 기기 안에 음성도 그대로 남는다는 점입니다.

이 키워드를 빙빙 돌려 다루는 페이지들이 대놓고 말하지 않는 핵심이 여기 있습니다. Standard Notes 편집기는 그냥 텍스트 입력란일 뿐입니다. Gmail이나 검색창과 똑같습니다. 커서 위치에 붙여넣는 받아쓰기는 커서가 어느 앱에 있든 신경 쓰지 않습니다.

그러니 진짜 질문은 "Standard Notes에서 음성 입력을 어떻게 켜느냐"가 아닙니다. 켜고 끌 스위치 자체가 없으니까요. 질문은 "그 위에 어떤 받아쓰기 도구를 돌릴 것이며, 그 도구가 슬그머니 내 음성을 서버로 보내지는 않느냐"입니다. 기본값이 암호화인 노트 앱에서는 이 두 번째 부분이 평소보다 더 중요합니다. 선택지를 하나씩 살펴보고, 2분 만에 하나를 설정해 보고, 전용 도구를 아예 건너뛰어도 되는 경우는 언제인지도 알려드리겠습니다.

Standard Notes에 받아쓰기 기능이 내장되어 있나요?

조용한 방에서 노트북 앞에 앉아 사려 깊게 말하는 사람. 말하기와 타이핑을 대비시킨다.

아니요. Standard Notes 데스크톱 앱에는 음성을 텍스트로 바꾸거나, 받아쓰거나, 음성으로 노트에 입력하는 기능이 내장되어 있지 않습니다. 편집기에 마이크 버튼도 없고, 음성 명령도, 숨겨진 설정도 없습니다. 이건 실수가 아닙니다. Standard Notes는 의도적으로 미니멀함을 지향합니다. 온갖 기능을 다 욱여넣은 작업 공간이 아니라, 그저 암호화된 편집기일 뿐입니다. 받아쓰기 토글을 찾아 설정을 뒤지고 있었다면, 이제 그만둬도 됩니다. 거기엔 없습니다.

여기서 Standard Notes가 무엇을 중심으로 만들어졌는지 알면 도움이 됩니다. 노트 텍스트는 기기를 떠나기도 전에 종단 간 암호화됩니다. 그것이 이 앱의 전부입니다. 거기에 덧붙이는 받아쓰기는 정의상 그 경계 바깥에 있습니다. 음성을 글자로 바꾼 다음, 키보드가 그러듯 그 글자를 편집기에 건네주는 별개의 도구이니까요. 정작 중요한 질문은 편집기가 내 말을 들을 수 있느냐가 아닙니다. 그 말을 듣는 도구가 내 음성을 기기 안에 두느냐, 아니면 어딘가로 보내느냐입니다. 이 생각을 붙들고 계세요. 이 가이드의 나머지 전체를 좌우합니다.

엉뚱한 기기에서 헤매지 않도록 한 문장만 짚어두겠습니다. 휴대폰에서는 이런 게 전혀 필요 없습니다. 휴대폰 키보드의 마이크를 누르고 다른 텍스트 입력란과 똑같이 Standard Notes 노트에 받아쓰기를 하면 됩니다. Whisper는 Windows와 macOS용 데스크톱 도구라서, 휴대폰에서는 키보드 마이크가 현실적인 방법입니다. 대부분이 실제로 글을 쓰는 데스크톱 앱에서는 Standard Notes 위에 얹어 동작하는 도구가 필요하며, 그 도구는 개인정보 보호를 염두에 두고 골라야 합니다.

단축키를 누르고, 말하면, 텍스트가 노트에 들어온다

이게 작동 원리의 전부이고, 가장 좋은 의미로 따분합니다. 단축키를 누르고, 말하고, 손을 떼면, 그 순간 포커스가 있는 텍스트 입력란의 커서 위치에 텍스트가 붙여넣어집니다. Whisper는 키에서 손을 뗀 뒤에도 짧은 여운을 잡아두기 때문에 마지막 단어가 잘리지 않습니다. OS 커서 위치에 붙여넣기 때문에 Standard Notes 편집기는 그저 "아무 텍스트 입력란"일 뿐입니다. 데스크톱 앱이든 웹 버전이든 동작은 똑같습니다.

이게 바로 랜딩 페이지들이 괜히 복잡하게 만드는 부분입니다. Standard Notes에 설치할 확장 프로그램도 없고, 앱에 붙여넣을 API 토큰도 없고, 챙겨야 할 동기화 작업도 없습니다. 커서를 노트에 두고 말하면 단어가 노트에 나타납니다. 말하는 동안에는 작은 캡슐이 떠서 듣고 있다는 걸 알려줍니다:

Cancel
녹음 오버레이: 말하는 동안 나타나는 작은 캡슐로, Whisper가 듣고 있음을 알려준다.

단축키 하나만큼은 처음부터 제대로 맞춰둘 가치가 있습니다. Windows에서는 Ctrl+Space, Mac에서는 Command+Option으로, 말하는 동안 누르고 있는 수정키 전용 푸시투토크 방식입니다. 둘 다 이미 쓰고 있는 것과 겹친다면 설정에서 바꿀 수 있습니다. (제 막내딸이 한번은 그림 그리는 앱에서 단축키가 "안 먹힌다"고 한 적이 있습니다. 버그가 아니라 충돌이었죠. 그때 보통 사람은 단축키 충돌이 뭔지조차 모른다는 걸 배웠습니다. 그래서 이제 모든 단축키는 바꿀 수 있게 해뒀습니다.) 한 번이라도 Windows에서 받아쓰기를 설정해 본 적이 있다면, 이건 그 손에 익은 동작을 다른 앱에 그대로 적용하는 것일 뿐입니다.

2분 만에 설정하기 (Windows 또는 Mac)

필요한 건 Apple Silicon Mac이거나 Windows 10 이상 PC, 작동하는 마이크, 그리고 데스크톱 앱이나 웹 버전에서 열어둔 Standard Notes입니다. 로컬 파이프라인 전체는 로그인한 계정이라면 누구나 무료이며, 가입할 때 결제 수단을 묻지 않습니다. 순서는 이렇습니다.

1단계 — Whisper 설치 후 로그인.

다운로드 페이지에서 받아 설치하고 무료 계정을 만드세요. 카드는 필요 없습니다. 로컬 변환 파이프라인 전체가 곧바로 열립니다.

앱의 트레이 아이콘이 나타나고 설정 마법사가 모델을 고르라고 안내하면 제대로 된 겁니다.

2단계 — 로컬 변환 경로 선택.

앱이 대신 골라주지 않습니다. 세 가지가 있습니다. Cloud(OpenAI, 직접 키 입력), Local Parakeet, Local Whisper. 개인 노트라면 두 가지 로컬 경로 중 하나를 고르세요. 왜 그런지는 두 섹션 뒤에 더 다룹니다.

모델 다운로드가 끝나고 준비됨으로 표시되면 제대로 된 겁니다.

3단계 — 단축키 확인.

Windows 기본값은 Ctrl+Space, Mac은 누르고 있는 푸시투토크 방식의 Command+Option입니다. Mac에서는 안내가 뜨면 손쉬운 사용 권한을 허용하세요. 이 권한이 없으면 커서 위치 붙여넣기가 다른 앱에 닿지 못합니다.

테스트 녹음이 아무 텍스트 입력란에 붙여넣어지면 제대로 된 겁니다.

4단계 — Standard Notes 노트에 커서를 두고 말하기.

노트를 열고 편집기를 클릭한 다음, 단축키를 누른 채 한 문장 말하고 손을 떼세요. 커서가 있던 자리, 노트 안에 텍스트가 나타납니다.

말한 문장이 Standard Notes 편집기 안에 텍스트로 들어와 있으면 제대로 된 겁니다.

Whisper
설정 화면의 실제 Whisper 데스크톱 앱. Transcription 및 AI 패널이 열려 있다.

느린 부분은 모델 다운로드이지, 설정이 아닙니다. 나머지는 위의 네 단계가 전부입니다. 일단 돌아가기 시작하면, 떠오른 생각을 암호화된 노트에 담는 일이 타이핑 작업이 아니라 말하기 작업이 됩니다. 그리고 로컬 모델을 골라뒀다면, 그 생각에 관한 어떤 것도 노트북을 벗어나지 않습니다.

노트만큼 음성도 비공개로 지키기

이 섹션이 Standard Notes 사용자에게 가장 중요하니 솔직하게 말하겠습니다. 종단 간 암호화 노트 앱을 골랐으면서, 말한 단어를 클라우드 변환 서비스를 거쳐 그 앱에 집어넣는 건 모순입니다. 노트 텍스트는 기기를 떠나기 전에 암호화되지만, 그런 설정에서 음성은 그렇지 않습니다. 현관문은 잠가놓고, 그 문을 여는 자기 자신의 음성 녹음은 남의 서버에 그대로 두는 셈입니다.

로컬 모드가 그 틈을 메웁니다. 두 로컬 엔진 — Parakeet와 로컬 Whisper — 모두 순수 Rust 변환 코어를 통해 전적으로 내 기기에서 돌아갑니다. 오디오 업로드도, API 호출도, 업체 로그에 남는 계정 연동 변환본도 없습니다. 네트워크 케이블을 뽑아도 받아쓰기가 그대로 작동합니다. 제가 실제로 믿는 시험이 바로 이겁니다. 텍스트는 Standard Notes 안 커서 위치에 들어가고, 앱은 다른 모든 것과 똑같이 그것을 암호화합니다. 음성과 노트가 처음부터 끝까지 같은 기기에 머뭅니다.

이 문제에서 저는 중립이 아니고, 말로만 떠들기보다 실제 사례를 보여드리겠습니다. 예전에 함께 일하던 팀이 외주 개발자에게 사내용 "AI 받아쓰기" 시제품을 맡긴 적이 있는데, 그건 발화 하나하나마다 클라우드 API를 호출했습니다. "스마트 재시도" 로직이 조금 과해서 같은 스탠드업 녹음을 네 번이나 변환해 버렸죠. 분기 말에 매니저가 클라우드 비용 대시보드를 열었더니 다섯 자릿수 청구서가 떠 있었고, CFO가 내린 결론은 "프롬프트를 최적화하자"가 아니라 "애초에 우리 회의를 서버로 보내는 데 돈을 안 쓰면 되잖아"였습니다. 개인 메모 습관에서야 청구서가 위험은 아니지만, 원칙은 똑같습니다. 앱의 존재 이유 자체가 내 데이터를 내 것으로 지키는 것이라면, 거기에 데이터를 넣어주는 받아쓰기도 같은 선을 지켜야 합니다.

로컬이냐 클라우드냐: 암호화 노트에는 어느 모드가 맞을까

Standard Notes라면 저는 로컬로 시작하고 클라우드는 예외로 다룹니다. 여기 온 이유가 개인정보 보호이고, 두 로컬 경로는 서버에 절대 닿지 않는 받아쓰기를 줍니다. 클라우드 모드가 몇 가지에서 정말 더 낫긴 하지만, 기기를 벗어나는 유일한 경로이기도 합니다. 그러니 기본값으로 손이 가게 두지 말고 의식적으로 골라 쓰세요. 앱이 선택을 강요하니, 잘 고르도록 세 가지가 어떻게 다른지 설명하겠습니다:

  • Local ParakeetNVIDIA의 TDT 엔진으로, 약 600 MB이며 가장 빠른 로컬 옵션입니다. CPU에서 Whisper보다 5~10배 빠릅니다. 영어에 더해 24개 유럽 언어, 총 25개 언어를 지원합니다. 영어로 번역하는 기능은 없습니다. 노트를 영어나 다른 유럽 언어로 쓴다면, 이게 빠르고 완전히 오프라인인 선택입니다.
  • Local Whisper같은 기기에서 Parakeet보다 느리지만, 다국어 빌드는 99개 언어를 지원하고 영어로 번역할 수 있습니다. 영어 전용 빌드는 99개가 아니라 영어만 됩니다. 중국어, 일본어, 한국어나 번역 작업에는 이걸 고르세요. Parakeet은 못 하는 일입니다. 기본 영어 모델은 약 480 MB입니다. 역시 완전히 오프라인입니다.
  • Cloud (OpenAI, BYOK)정확도와 웹 접근성이 가장 뛰어나며, 본인의 OpenAI 키를 써서 OpenAI에 직접 청구됩니다. 변환은 기본적으로 gpt-4o-mini-transcribe로 돌아갑니다. 인터넷이 필요하므로 오디오가 기기를 벗어납니다. 로컬 약속을 깨는 유일한 경로입니다. Cloud 영역은 Whisper Pro의 일부입니다.

재미없지만 사실은, 대부분이 암호화 노트에 담는 종류의 글 — 일기 한 줄, 설익은 아이디어, 클라우드 문서에는 절대 붙여넣지 않을 비밀번호 힌트 — 에는 로컬이면 충분하다는 것입니다. 두 로컬 엔진 모두 서버로 아무것도 보내지 않고 전적으로 기기에서 돌아갑니다. 이는 Standard Notes가 노트 자체에 대해 이미 맺고 있는 약속과 정확히 같습니다. 클라우드는 어려운 녹음에서 최고 수준의 정확도를 원하거나, 문장 도중에 모델이 웹에서 사실을 끌어와야 할 때 제값을 합니다. 개인 노트에서는 좀처럼 하고 싶지 않은 거래입니다.

특정 노트에서 정말로 클라우드급 정확도가 필요하다면, 솔직한 선택은 그 녹음만큼은 오디오가 기기를 벗어난다는 걸 알고 의식적으로 결정한 뒤, 비공개 내용에는 다시 로컬로 돌아가는 것입니다. 앱은 클릭 한 번으로 토글을 둘 수 있게 해두었으니 막힐 일이 없습니다. 저는 대부분의 날, 대부분의 노트에서 클라우드를 손도 안 댑니다.

기기를 벗어나지 않고 구두점과 다듬기까지

받아쓰기를 그대로 받으면 죽 이어진 한 덩어리로 나옵니다. "좋아 그러면 복구 코드를 암호화 노트로 옮기고 보안 태그를 달고 다음 달에 교체하라고 알림 설정해"라고 말하면, 어떤 음성 엔진이든 구두점 없는 벽처럼 넘겨주는 게 바로 그겁니다. 이걸 다듬는 데서 경로가 갈립니다. 개인정보 앱에서는 그 다듬기가 어디서 일어나는지도 중요합니다.

Windows 음성 입력은 말하는 동안 구두점을 넣어주고, macOS 받아쓰기는 "쉼표"나 "마침표"라고 말하면 기본 구두점을 처리합니다. 더 묵직한 다듬기 — "음" 같은 군더더기를 걷어내고, 이어진 문장을 정리하고, 말로 한 문단을 노트에 실제로 남길 만한 것으로 바꾸는 일 — 에는 Whisper가 AI 패스를 돌릴 수 있습니다. 활성화 문구 "Hey whisper"라고 말하면 텍스트가 들어가기 전에 다듬어집니다. 로컬 모델에서는 그 패스가 내 기기의 Ollama를 거쳐 돌아가므로 다듬기조차 오프라인으로 유지됩니다. 클라우드 모드에서는 기본적으로 gpt-5-mini를 쓰며, 이때는 텍스트가 밖으로 나갑니다.

Thinking...
AI 다듬기 패스 중의 오버레이. 정리된 텍스트가 커서 위치에 들어가기 직전이다.
원본

좋아 그러면 복구 코드를 암호화 노트로 옮기고 보안 태그를 달고 다음 달에 교체하라고 알림 설정해 음 갱신 전에

정리됨

좋아, 그러면 복구 코드를 암호화 노트로 옮기고, 보안 태그를 달고, 갱신 전에 다음 달에 교체하라고 알림을 설정해 줘.

정직하게 기대치를 맞춰두자면, 받아쓰기는 단어를 가져다줄 뿐 Standard Notes 자체의 구조까지 만들어주진 않습니다. 앱의 태그, 노트 제목, 편집기 선택 — 이런 건 이미 쓰고 있는 키와 클릭으로 직접 설정합니다. 문장을 받아쓴 다음, 태그를 달거나 노트 이름을 바꾸는 건 늘 하던 방식대로 하세요. 어떤 받아쓰기 도구도 명령 한 번에 앱의 정리 체계를 뚝딱 만들어내지 않습니다. "보안 태그를 달아라고 말하면 알아서 분류된다"고 약속하는 쪽은 평범한 일상이 아니라 데모를 파는 겁니다. 단어는 음성으로 빠르게 받아내고, 노트는 이미 아는 컨트롤로 다듬으세요.

이 말하고 다듬는 흐름은 노트를 훌쩍 넘어서까지 빛을 발합니다. 어떤 앱에든 깔끔한 글을 받아쓸 수도 있으니, 단축키 하나로 긴 글 한 편이 타이핑하는 한 문단 대신 몇 마디 말이 됩니다.

Standard Notes에서 받아쓰기 도구를 건너뛰어도 될 때

포장 도로에 분필로 그려진 서로 다른 방향을 가리키는 두 화살표. 도구 선택을 나타낸다.

때로는 알맞은 도구가 이미 기기에 있는 공짜 도구이고, 아닌 척하는 건 정직하지 않은 일입니다. Standard Notes에 짧은 메모만 떨어뜨린다면 — 한 줄, 두 단어짜리 알림 — 운영체제가 공짜로 처리해 줍니다.

Windows에서는 Windows 키 + H를 누르면 내장 음성 입력 막대가 커서가 있는 곳, Standard Notes 편집기를 포함해 어디든 열립니다. 알아서 구두점을 넣고 짧은 입력에는 충분합니다. 다만 이 독자층에게 특별히 짚어둘 한 가지가 있습니다. Win+H는 음성을 Microsoft 서버를 거쳐 보내며 인터넷 연결이 필요하므로 오프라인 옵션이 아닙니다. 데이터가 기기에 머무는 것이 존재 전제인 노트 앱에서는 이건 진짜 어긋남입니다. 개인정보가 핵심이라면 로컬 Whisper 모델이 더 일관된 선택입니다. Mac에서는 받아쓰기로 타이핑이 가능한 어디서든 음성으로 텍스트를 입력할 수 있고, 시스템 설정의 키보드에서 설정하며, Apple Silicon에서는 일반 텍스트를 기기 내에서 처리할 수 있어 로컬로 유지됩니다. 둘 다 짧은 단편에는 정말 괜찮습니다.

내장 도구가 버거워지기 시작하면 전용 시스템 전역 도구로 손을 뻗으세요. 긴 노트, 다국어 작업, 다듬기가 필요할 때, 또는 Standard Notes와 이메일과 편집기에서 똑같이 동작하는 단축키 하나를 원하면서도 전부 오프라인으로 유지하고 싶을 때 말입니다. 그 기준 아래라면 공짜인 걸 쓰세요. 단, Windows에서 "공짜"는 "Microsoft를 거친다"는 뜻이라는 한 가지 단서는 있습니다. 한 줄짜리 알림 때문에 앱을 설치하라고 하진 않겠습니다.

노트를 다른 곳에도 둔다면 같은 절충이 똑같이 나타납니다. Notion에 받아쓰기의 논리도 동일합니다. 두 앱 모두 내장 기능이 아니라 커서가 진짜 통합 지점이기 때문입니다.

더 읽어보기

Standard Notes는 마이크 버튼을 단 한 번도 내놓은 적이 없고, 미니멀하고 비공개로 남으려 그토록 애쓰는 걸 보면 앞으로도 그러지 않을 것 같습니다. 그럴 필요가 없으니까요. 커서가 곧 통합 지점이기 때문입니다. 노트에 대고 말해 텍스트를 얻고, 로컬로 유지하면 암호화를 하고 있는 바로 그 기기 안에 음성이 그대로 남습니다. 저는 이 가이드의 대부분을 Standard Notes가 아닌 텍스트 입력란에, 그게 어떤 입력란이든 신경 쓰지 않고 음절 하나 서버로 보내지 않는 도구로 받아쓴 다음, 통째로 제 암호화 노트에 붙여넣었습니다. 그게 비결의 전부입니다.

다음 Standard Notes 노트에서 직접 써보세요

단축키를 누르고, 말하고, 손을 떼세요. 커서가 있는 노트에 텍스트가 들어가고 — 로컬로 유지하면 기기 안에 그대로 남습니다.

로그인한 계정이라면 누구나 로컬 모드 무료. 시작에 카드가 필요 없습니다.

Denys Medvediev의 사진

Denys Medvediev

저희 지원 이메일을 읽는 사람이 바로 저입니다. 답장은 아마 대부분 받아쓰기로 쓰고 있을 겁니다.