오프라인이 중요한 이유.
의료 노트, 법률 초안, NDA, 내부 코드 — '클라우드로 보내기'가 애초에 불가능한 작업 범주가 있습니다.
오프라인 모드는 모든 바이트를 기기에 유지합니다. 오디오 업로드 없음, 텍스트 업로드 없음, 전사 내용에 대한 텔레메트리 없음. 에어갭 네트워크, 규제 산업, 편집증적인 창업자 모두 환영합니다.
두 엔진, 하나의 단축키.
설정 → 모델에서 세션별로 선택하세요. 정확도, 언어, AI 기능에는 Whisper를. CPU에서 원시 속도에는 Parakeet을.
같은 단축키, 같은 오버레이, 같은 사전. 어떤 모델이 전사하는지만 바뀝니다.
엔진 비교
세션별로 선택. 같은 단축키, 다른 백엔드.
| Whisper (OpenAI, 로컬) | Parakeet TDT 0.6B v3 (NVIDIA, 로컬) | |
|---|---|---|
| 속도 | GPU에서 빠름, CPU에서 중간 | CPU에서 최대 약 10배 빠름 — 노트북에서 실시간 |
| 정확도 | 최상의 기준 — 모델 크기로 조정 가능(Base → Large v3) | NVIDIA 벤치마크에 따르면 유럽 언어에서 Whisper와 동등 |
| 언어 | 90개 이상 | 24개 유럽 언어 |
| 번역 | 어떤 언어로 말하기 → 영어 붙여넣기 | 전사 전용 |
| 성능 프로필 | 빠름 / 균형 / 정확 | 고정 |
| AI 프리셋 + 트리거 워드 | (Ollama를 통해) | 전사 전용 |
| 필러 제거 + 사전 | ||
| 런타임 | whisper.cpp와 CUDA / Vulkan / Metal 가속 | ONNX Runtime |
| 적합한 용도 | 정확도, 번역, 전체 AI 기능 세트 | 원시 속도, 순수 받아쓰기, CPU 전용 기기 |
빠름, 균형, 정확.
Whisper 모드는 세 가지 성능 프로필을 노출합니다. 각각 모델 크기, 청킹, GPU 설정을 조정합니다 — 속도와 정확도를 명시적으로 맞바꿉니다.
배터리로 구동되는 오래된 노트북? 빠름을 선택하세요. GPU가 있는 워크스테이션? 정확이 더 선명한 결과를 제공합니다. Whisper는 CUDA, Vulkan, Metal을 자동 감지합니다.
로컬 AI 재작성을 위한 Ollama.
Whisper를 localhost의 Ollama 인스턴스로 가리키면 같은 트리거 워드, 같은 프리셋, 같은 올웨이즈온 모드를 얻습니다 — 하지만 LLM이 기기에서 실행됩니다.
풀한 어떤 모델이든 선택하세요: Llama 3.1, Mistral, Qwen, 하드웨어에 맞는 것이면 뭐든. 한 번 구성하면 단축키가 작동하는 모든 곳에서 사용할 수 있습니다.
어떤 언어든 영어로 번역 — 네이티브로.
Whisper의 다국어 모델에는 내장된 번역 작업이 있습니다. 일본어, 우크라이나어, 폴란드어, 또는 90개 이상 언어 중 어느 것이든 말하고 — 영어를 붙여넣습니다. 한 번의 패스, 추가 모델 없음, API 호출 없음.
이 카테고리에서 내장 오프라인 번역기를 제공하는 곳은 아무도 없습니다. 설정에서 '영어로 번역'을 켜면 모든 받아쓰기가 모드를 전환합니다.
프리셋, 로컬로.
클라우드 모드의 모든 프리셋이 오프라인에서 작동합니다. 지시사항을 저장하고, 쌓고, 오버레이에서 전환하세요.
OpenAI 대신 Ollama를 통해 실행됩니다 — 같은 형태, 같은 구문, 같은 결과.
커스텀 단어 — 결정적이고 보편적.
사전은 오프라인에서도 온라인과 동일하게 작동합니다. 한 번 추가하면 모든 전사에 적용되며, 토큰 소비 없음.
언어 무관, 모델 무관. 이름, 약어, 제품 용어 — 모두 존중됩니다.
필러 제거, 후처리.
같은 결정적 필러 단어 정리기가 오프라인 모드에서 실행됩니다. 어느 엔진과도 작동합니다. 어느 언어와도 작동합니다.
AI 불필요 — 전사가 완료된 후 빠른 패턴 매칭만 있습니다.
어떤 선택 영역이든 음성으로 다시 쓰세요.
어떤 앱에서든 텍스트를 선택하세요 — Slack, Gmail, Notion, 에디터. 받아쓰기 단축키를 누르고 원하는 작업을 말하면 — 「격식 있게 만들어줘」, 「불필요한 회사 말투 빼줘」, 「독일어로 번역해줘」 — 선택한 텍스트가 다시 쓴 버전으로 그 자리에서 교체됩니다.
다듬기와 같은 방식이지만, 이미 써 놓은 텍스트에서 시작합니다. 로컬 모드에서는 구성해 둔 Ollama 모델 위에서 다시 쓰기가 실행되며, 절대 기기를 벗어나지 않습니다. 두 번째 단축키도, 메뉴도, 복사·붙여넣기 번거로움도 없습니다.
개인정보 태도, 한 줄로.
오디오 업로드 없음. 텍스트 업로드 없음. 전사 내용에 대한 텔레메트리 없음.
오프라인 모드의 유일한 네트워크 트래픽은 라이선스 확인과 업데이트 체크입니다 — 둘 다 어떤 네트워크 모니터로도 감사할 수 있습니다.
한번 사면, 공짜.
월간은 $9입니다. 평생은 일회성 결제입니다 — 한 번 사면 영원히 소유하며, 반복 청구 없음.
모델은 무료입니다. 추론은 무료입니다. 분당 비용 없음, 토큰당 비용 없음. 앱만 유료입니다.
자주 묻는 질문
오프라인 모드에는 NVIDIA GPU가 필요한가요?
모델은 얼마나 큰가요?
오프라인 모드는 정말 인터넷 트래픽이 없나요?
기본은 비공개. 선택에 따라 강력.
평생 라이선스는 한 번 지불하고 소유함을 의미합니다. 오프라인 모드는 오디오가 절대 기기를 벗어나지 않음을 의미합니다.