비교
Whisper vs Parakeet
Whisper와 Parakeet는 Whisper by Remskill에 내장된 두 가지 로컬 음성 엔진이며, 선택은 결국 하나의 트레이드오프로 귀결됩니다. Parakeet은 CPU에서 Whisper보다 5~10배 빠르지만 영어와 24개 유럽 언어를 처리합니다. Whisper는 더 느리지만 99개 언어를 지원하고 영어로 번역하며 세밀한 제어 기능을 제공합니다.
마지막 업데이트: 2026년 6월

Whisper와 Parakeet 모두 Whisper by Remskill에 무료로 포함되어 있으며, 드롭다운에서 둘 사이를 전환할 수 있습니다. Parakeet은 CPU에서 5~10배 빠르고 영어와 24개 유럽 언어를 지원합니다. Whisper는 더 느리지만 99개 언어를 지원하고 영어로 번역하며 사용자 정의 어휘와 빔 제어 기능을 제공합니다. 좋고 나쁨이 아니라, 빠름과 유연함의 차이입니다.
Whisper와 Parakeet는 Whisper by Remskill에 내장된 두 가지 로컬 음성 엔진이며, 선택은 결국 하나의 트레이드오프로 귀결됩니다. Parakeet은 CPU에서 Whisper보다 5~10배 빠르지만 영어와 24개 유럽 언어를 처리합니다. Whisper는 더 느리지만 99개 언어를 지원하고 영어로 번역하며 세밀한 제어 기능을 제공합니다.
우리는 둘 다 제공합니다, 그러니 이건 영업 멘트가 아닙니다
대부분의 "X vs Y" 글은 X를 파는 사람이 씁니다. 이 글은 다릅니다. 우리는 같은 앱에 두 엔진을 모두 담았습니다. 드롭다운에서 원하는 엔진을 고르고, 한 번 내려받은 뒤, 언제든 전환할 수 있습니다.
그러니 제가 여러분을 엉뚱한 쪽으로 끌어들일 이유가 없습니다. Parakeet이 맞다면 저는 여러분이 Parakeet을 쓰길 바랍니다. Whisper가 필요하다면 Whisper를 쓰길 바랍니다. 앱이 대신 골라주지 않듯, 저도 그러지 않겠습니다. 그저 각각이 실제로 무엇에 강한지를 펼쳐 보이겠습니다.
둘 다 완전히 오프라인으로 동작합니다. 둘 다 로그인한 모든 사용자에게 무료입니다. 카드도, 분당 클라우드 요금도, 두 번째 엔진에 대한 추가 비용도 없습니다.
Parakeet은 빠른 쪽입니다
Parakeet은 NVIDIA의 TDT 모델입니다. Token-and-Duration Transducer의 줄임말로, FastConformer 인코더에 디코더를 결합해 단어와 각 단어가 얼마나 지속되는지를 함께 예측합니다. 이걸 다 기억할 필요는 없습니다. 정작 중요한 건 다음 문장에 있습니다.
보통의 CPU에서 Whisper보다 5~10배 빠릅니다. GPU도 필요 없고, 기다릴 일도 없습니다. 단축키에서 손을 떼는 순간 텍스트는 사실상 이미 거기에 있습니다.
기본 제공되는 모델은 Parakeet v3로, 디스크에서 약 600 MB이며 영어에 24개 유럽 언어를 더해 총 25개 언어를 지원합니다. 품질은 좋습니다. Whisper-large만큼은 아니지만, 일상적인 받아쓰기에는 충분하고도 남습니다. 이메일, 메모, 메시지 등 우리 대부분이 온종일 타이핑하는 것들 말이죠.
Parakeet이 못 하는 것: 말한 내용을 영어로 번역하지 않으며, 사용자 정의 어휘나 핫워드 힌트도 받지 않습니다. 프랑스어로 말하면 프랑스어 텍스트가 나옵니다. 이는 대부분의 프랑스어 사용자가 정확히 원하는 바이므로, 번역이 여러분이 찾아온 유일한 이유일 때에만 문제가 됩니다.
Whisper는 꼼꼼한 쪽입니다
Whisper는 OpenAI의 오픈 모델이며, 우리 앱 안에서는 여덟 가지 종류로 제공됩니다. 영어 전용 네 가지와 다국어 네 가지로, 약 140 MB의 Base 모델부터 약 3 GB의 Large v3까지 있습니다. 여러분의 기기와 인내심에 맞는 크기를 고르면 됩니다.
다국어 모델은 25개가 아니라 99개 언어를 지원합니다. 여기에는 Parakeet이 아예 건너뛰는 중국어, 일본어, 한국어, 아랍어가 포함됩니다. Whisper는 이들 언어를 한 번에 영어로 번역도 해주는데, 이는 Parakeet이 할 수 없는 일입니다.
그리고 Whisper는 Parakeet에 없는 제어 기능을 제공합니다. 사용자 정의 어휘, 빔 크기 설정, 그리고 동료의 이름이나 제품명을 더 이상 망가뜨리지 않도록 해주는 핫워드 편향 기능까지요. 온종일 기술 용어를 받아쓴다면, 이 제어 기능이야말로 깔끔한 텍스트와 찾아 바꾸기 노동의 차이를 만듭니다.
그 대가는 속도입니다. 같은 CPU에서 Whisper는 더 느리고, 더 큰 모델에서는 때때로 훨씬 더 느립니다. 따분하지만 진실은 이렇습니다. Whisper를 고르는 대부분의 사람은 Parakeet보다 정확도를 택한다기보다, 속도 대신 언어와 제어를 택하는 것입니다.
솔직한 비교, 표 하나로
전체 결정을 일곱 줄에 담았습니다. 금액은 없습니다. 두 엔진 모두 같은 등급에서 무료니까요.
| 기능 | Parakeet | Whisper |
|---|---|---|
| 엔진 | NVIDIA TDT (FastConformer + Token-and-Duration Transducer) | OpenAI Whisper |
| 다운로드 크기 | ~600 MB (모델 1개) | ~140 MB ~ ~3 GB (모델 8개) |
| 언어 | 25개, 영어 + 24개 유럽 언어 | 99개 (다국어 모델) |
| 영어로 번역 | 불가 | 가능 |
| CPU 속도 | 5~10배 빠름 | 더 느림 |
| 사용자 정의 어휘 / 핫워드 / 빔 제어 | 불가 | 가능 |
| 이럴 때 좋음 | CPU에서 빠른 영어 / EU 언어 받아쓰기 | 99개 언어, 번역, 세밀한 제어 |
둘 다 로컬이고, 둘 다 오프라인이며, 둘 다 같은 등급에서 무료입니다. 이 표는 "좋음 대 나쁨"이 아닙니다. "빠름 대 유연함"입니다.
그래서 어느 쪽을 골라야 할까요
대부분의 비교 글이 슬쩍 피해 가는 부분이니, 여기 솔직하게 말씀드립니다.
대부분의 영어 사용자라면 Parakeet을 고르세요. 속도는 매일 이깁니다. 하루에 수십 번 받아쓰기를 하다 보면, "텍스트가 즉시 나타난다"와 "한 박자 뒤에 나타난다"의 차이가 곧 생각의 흐름을 이어가느냐 놓치느냐의 차이가 됩니다. 약 2초만 넘어가도 뇌가 다시 원래 쓰던 앱으로 돌아가기 시작하고, 무슨 말을 하려 했는지 잊어버립니다. Parakeet이 CPU에서 5~10배 빠르다는 건 사양표 자랑이 아닙니다. 하루에 백 번씩 몸으로 느끼는 차이입니다.
Parakeet이 줄 수 없는 세 가지 중 하나가 필요할 때 Whisper를 고르세요. 25개 유럽 언어 밖의 언어(중국어, 일본어, 한국어, 아랍어), 영어로의 번역, 또는 이름과 전문 용어를 위한 사용자 정의 어휘와 핫워드 제어입니다.
저는 런타임을 설치하기도 전에 아키텍처 다이어그램부터 그리는 부류의 사람이라, 본능적으로 늘 "더 강력한 도구를 쓰자"고 생각합니다. 그런데 여기서는 그 본능이 틀립니다. 더 강력한 도구는 Whisper지만, 매일 영어로 받아쓰는 습관에 맞는 도구는 대개 더 빠른 쪽입니다. 쓰지 않는 기능은 그저 다운로드 용량일 뿐입니다.
Whisper가 이기는 실제 사례
출시 초기, 3주 차에 한 사용자가 이메일을 보내 앱이 문장 중간에 우크라이나어를 영어로 처리할 수 있는지 물었습니다. 그는 키이우 뉴스를 실시간으로 읽으면서 몇 단어마다 언어를 바꾸고 있었죠. 저는 "다국어"가 세션당 하나의 언어를 고르는 것이라고 생각했었습니다. 그런데 그가 말한 건 진짜 코드 스위칭이었고, 그 워크플로에서는 Parakeet의 25개 언어로도 온전히 감당되지 않는 언어였습니다. Whisper의 다국어 모델은 이를 해냈습니다. 99개 언어, 자동 감지, 그리고 같은 처리 안에서 영어로 번역까지요. 그는 잘 됐다고 다시 답장을 주지는 않았습니다. 저는 그걸 좋은 신호로 받아들이기로 했습니다.
이 한 편의 이야기에 규칙 전부가 담겨 있습니다. 여러분의 하루가 그의 하루와 같다면 Parakeet의 속도는 도움이 되지 않습니다. Parakeet은 애초에 그 일을 할 수 없으니까요. 회의 사이사이 영어 이메일을 받아쓰는 게 하루의 모습인 사람이라면, 바로 그 속도가 핵심입니다.
둘 사이를 전환하는 방법
하나에 묶일 필요가 없습니다. 모델 선택 화면을 열어 Parakeet이나 아무 Whisper 모델이나 고르면, 한 번 내려받습니다. 일이 바뀔 때마다 다시 전환하세요. 아침 이메일 묶음은 Parakeet으로, 일본어 인터뷰를 받아쓰는 오후에는 Whisper Large v3로.
어느 쪽이든 같은 단축키, 같은 오버레이, 같은 설정입니다. Windows에서는 기본값이 Ctrl+Space입니다. Mac에서는 Command+Option 푸시투토크 조합이며, 다른 것과 충돌하면 다시 매핑할 수 있습니다. 엔진은 드롭다운이지, 재설치가 아닙니다.
딱 하나만 기억한다면
속도와 영어에는 Parakeet. 99개 언어, 번역, 제어에는 Whisper. 설치 시점에 고를 필요가 없습니다. 둘 다 같은 앱에 들어 있고, 전환은 한번 정하면 발이 묶이는 다운로드 결정이 아니라 드롭다운이니까요.
오디오를 서버로 보내는 것보다 내 기기에서 직접 돌리는 게 왜 더 나은지에 대한 더 긴 그림이 궁금하다면, 제가 오프라인 음성-텍스트 변환에 대해 써둔 글이 있습니다. 그리고 특정 유료 앱과 우리를 저울질하는 중이라면, superwhisper 대안 글이 그 정면 대결을 다룹니다.
두 엔진을 모두 설치하고, 첫 오후가 결정하게 하세요
앱을 내려받아 Parakeet과 Whisper 모델을 설치하고 — 둘 다 무료입니다 — 여러분의 첫 오후가 그 논쟁을 마무리하게 하세요.
두 로컬 엔진은 영원히 무료입니다. 가입 시 결제 수단이 필요 없습니다. 7일 클라우드 체험은 업그레이드 시점에만 카드를 요청합니다.



