설명
Whisper는 무료인가요?
네 — OpenAI의 Whisper는 MIT 라이선스 하에 오픈소스로 공개되어 있어, 상업적 용도를 포함해 무료로 다운로드하고 사용할 수 있습니다. 문제는 실행 환경입니다. 직접 설치하려면 설정, 의존성, 본인 하드웨어가 필요합니다. 가장 쉬운 무료 방법은 데스크탑 앱을 통해 Whisper를 로컬에서 실행하는 것입니다.
마지막 업데이트: 2026년 6월

Whisper는 무료입니다. OpenAI는 코드와 모델 가중치 모두를 허용적인 MIT 라이선스로 공개했습니다. 누구든 이 음성-텍스트 변환 모델을 무료로 다운로드하고, 실행하고, 상업적으로 활용할 수 있습니다. 단 하나의 걸림돌은 설정입니다. 직접 Whisper를 실행하려면 Python, ffmpeg, 그리고 본인 하드웨어가 필요합니다. 데스크탑 앱을 쓰면 그 걸림돌이 사라집니다.
'Whisper가 무료냐'고 묻는 사람들은 어딘가 함정이 있을 것이라 예상합니다. 2026년에 정말로 좋은 것이 완전히 무료인 경우는 드물기 때문입니다. 그래서 단도직입적으로 말씀드리겠습니다. 맞습니다, 무료입니다. OpenAI는 Whisper를 MIT 라이선스로 공개했습니다. 코드도, 모델 가중치도 모두 포함해서요. MIT는 소프트웨어 라이선스 중 가장 허용적인 축에 속합니다. 다운로드해도, 실행해도, 수정해도, 자신의 제품에 포함시켜 돈을 받고 팔아도 됩니다. OpenAI는 단 한 푼도, 크레딧 하나도 요구하지 않습니다.
이것이 핵심이고, 사실입니다. 그런데 핵심에서 빠진 부분이 있습니다. '모델이 무료다'와 '모델을 사용하는 게 무료다'는 다른 이야기입니다. 모델은 파일입니다. 그 파일을 화면에 글자로 바꾸려면 설정이 필요하고, 커맨드 라인을 다룰 줄 알아야 하며, 연산을 감당할 수 있는 컴퓨터도 있어야 합니다. 이 사실이 숨겨진 건 아닙니다. 그냥 손이 가는 일이고, 그게 오픈소스 버전의 실질적인 비용입니다.
이 키워드를 노리는 많은 페이지들이 뭉뚱그려 설명하는 부분이 있습니다. 대화 속에는 두 개의 Whisper가 존재합니다. 하나는 OpenAI가 GitHub에 공개한 오픈소스 모델 — 무료, MIT, 직접 실행 가능합니다. 다른 하나는 OpenAI의 호스팅 방식 트랜스크립션 API로, 동일한 계열 모델을 사용하지만 분당 요금이 청구됩니다. 이름은 같지만 청구서는 완전히 다릅니다.
그래서 'Whisper가 무료냐'는 질문에 대한 솔직한 답은 세 가지입니다. 모델 자체는 완전히 무료입니다. 직접 실행하면 돈은 들지 않지만 설정과 본인 하드웨어라는 비용이 발생합니다. 누군가에게 호스팅을 맡기면 돈이 필요합니다. OpenAI API든 유료 앱의 클라우드 플랜이든 마찬가지입니다. 이 가이드는 세 가지 경로를 모두 다루고, 가장 쉬운 무료 경로를 안내하며, 정말로 무료가 아닌 것에 대해 솔직하게 말합니다.
Whisper가 정확히 무엇인가

Whisper는 OpenAI가 2022년 말에 공개한 음성-텍스트 변환 모델입니다. 오디오를 넣으면 텍스트가 나옵니다. 성능은 뛰어납니다. 방대한 다국어 오디오 데이터로 훈련되어 있어, 우리 대부분이 예전부터 욕하며 써온 받아쓰기 소프트웨어보다 억양, 배경 소음, 수십 가지 언어를 훨씬 잘 처리합니다. 다른 언어 음성을 영어 텍스트로 번역하는 기능도 있는데, 이전 도구들이 깔끔하게 해내지 못했던 능력입니다.
핵심 단어는 '모델'입니다. Whisper는 더블클릭해서 실행하는 앱이 아닙니다. 두뇌에 해당하는 파일, 즉 훈련된 가중치와 그것을 실행하는 코드입니다. 그 자체로는 창도, 버튼도, 마이크 연결도 없습니다. 엔진이지 자동차가 아닙니다. 우리가 들어본 수많은 제품들이 사실은 조용히 Whisper에 껍데기를 씌운 것에 불과합니다. 그게 나쁜 건 아닙니다만, 그 모든 제품의 내부 엔진이 같은 무료 부품이라는 것은 알아두면 좋습니다.
바로 이 차이 때문에 이 질문이 헷갈리는 겁니다. 누군가 'Whisper는 월 $30이다'라고 말할 때, 그 사람은 모델을 말하는 게 아닙니다. 모델을 감싸서 비용을 청구하는 앱을 말하는 것입니다. 누군가 'Whisper는 무료다'라고 말할 때는 OpenAI가 무상으로 공개한 엔진을 말하는 것입니다. 두 말이 동시에, 서로 다른 대상에 대해 맞습니다. 그래서 여러분이 명확한 답을 찾아 검색하게 된 것입니다.
MIT 라이선스 덕분에 진짜로 무료
이것은 마케팅 용어로서의 '무료'가 아닙니다. 얼마 후 끝나는 체험판이나 계속 업그레이드를 유도하는 플랜이 아닙니다. OpenAI는 Whisper의 코드와 모델 가중치를 MIT 라이선스로 공개했습니다. MIT 라이선스는 널리 알려진 허용적 오픈소스 라이선스로, 상업적 이용을 포함해 소프트웨어를 사용, 복사, 수정, 배포할 수 있습니다. 단 하나의 조건은 저작권 고지를 유지하는 것뿐입니다. 수수료도, 로열티도, 좌석당 비용도, 허가 요청도 없습니다.
실질적으로는 이렇습니다. 개인 용도로 Whisper를 다운로드할 수도, 사업에 활용할 수도, 판매하는 제품에 탑재할 수도, 클라이언트를 위해 팟캐스트를 번역할 수도 있습니다. OpenAI에 한 푼도 내지 않아도 됩니다. 훈련된 모델 가중치 — 만드는 데 비용이 상당히 드는 핵심 부분 — 도 무료입니다. 코드 래퍼만이 아니라요. 이 부분을 선뜻 믿기 어렵습니다. 기업들은 보통 훈련된 가중치는 꽁꽁 잠가두거든요. OpenAI는 이번에 그러지 않았습니다.
나중에 오해하지 않도록 솔직하게 한 가지 덧붙이겠습니다. 'MIT 라이선스로 무료'는 라이선스에 관한 이야기지, 운영 비용이 없다는 보장이 아닙니다. 전기는 무료가 아닙니다. 컴퓨터도 무료가 아닙니다. 여러분의 시간도 무료가 아닙니다. 하지만 소프트웨어와 모델 — 기업들이 보통 구독료를 받는 부분 — 은 진짜로, 영구적으로, 별표 없이 무료입니다. (라이선스를 두 번 읽게 되는 그런 종류의 무료입니다. 뭔가 빠뜨린 것 같아서요. 빠뜨린 게 없습니다.)
걸림돌은 직접 실행하는 것
여기서 무료 버전에 비용이 붙습니다. 돈이 아닌 시간으로요. 원래의 오픈소스 방식으로 Whisper를 실행하려면 커맨드 라인을 거쳐야 합니다. 기본 설치는 Python 패키지로, Python이 제대로 설정되어 있어야 합니다. 또 오디오 도구인 ffmpeg를 별도로 설치해 시스템 경로에 추가해야 합니다. 어떤 컴퓨터에서는 토크나이저 의존성 빌드를 위해 Rust도 필요합니다. 개발자에게는 낯설지 않은 과정입니다. 그 외의 사람들에게는 오후 내내 걸릴 수 있는 작업입니다.
그다음은 하드웨어입니다. Whisper는 상당한 연산을 처리합니다. 크고 정확한 모델일수록 더욱 많이요. 일반 CPU에서는 large 모델이 오디오 클립 자체보다 더 오랜 시간이 걸리기도 합니다. 속도를 원한다면 제대로 된 GPU가 필요한데, 대부분의 노트북엔 없습니다. 그래서 무료 버전의 실질적 비용은 돈이 아니라, 직접 관리해야 하는 Python 환경, 파일마다 손으로 실행해야 하는 명령어, 그리고 기다림을 유발하지 않을 만큼 빠른 컴퓨터입니다. (개발자가 아닌 분이 '5분 만에 Whisper 설치하기' 블로그 포스트를 따라 하는 걸 지켜본 적이 있습니다. 5분이 아니었습니다. 토요일 하루 내내였고, 저한테 전화도 왔습니다.)
그리고 원시 버전이 제공하지 않는 게 하나 더 있습니다. 바로 실시간 받아쓰기입니다. 커맨드 라인 Whisper는 이미 녹음된 파일을 변환합니다. 백그라운드에서 대기하다가 단축키를 누르면 커서 위치에 텍스트를 붙여넣는 기능은 없습니다. 이것이야말로 대부분의 사람들이 실제로 원하는 것인데 말이죠. 그것을 원한다면 모델을 감싸는 래퍼가 필요합니다. 좋은 소식은 최고의 래퍼도 무료라는 것입니다. 바로 다음 섹션에서 다룹니다.
무료로, 쉽게: 앱에서 Whisper 실행하기
오픈소스 모델의 '무료'는 그대로 누리면서 '직접 실행'의 번거로움은 건너뛸 수 있습니다. 우리가 Whisper by Remskill을 만든 이유가 바로 그것입니다. 동일한 오픈소스 Whisper 모델을 여러분의 컴퓨터에서 로컬로 실행합니다. Python도, ffmpeg도, 커맨드 라인도 없이요. 전체 로컬 파이프라인은 로그인한 모든 계정에 무료로 제공되며, 가입 시 결제 정보를 요구하지 않습니다. 오픈소스 엔진을 오픈소스 숙제 없이 누릴 수 있습니다. 설정 방법은 다음과 같습니다.
1단계 — 앱 설치 후 로그인.
다운로드 페이지에서 내려받아 설치하고 무료 계정을 만듭니다. 카드 불필요. 로컬 트랜스크립션 파이프라인이 바로 열립니다. Python도, ffmpeg도, 그 어떤 것도 없이요.
트레이 아이콘이 나타나고 설정 마법사가 모델 선택을 안내하면 성공입니다.
2단계 — 로컬 모델 선택.
앱이 자동으로 선택하지 않습니다. 로컬 모드에서는 Whisper(모델 8개, 99개 언어, 영어 번역 지원) 또는 Parakeet(더 빠름, 영어 포함 24개 유럽 언어)을 선택할 수 있습니다. 모델은 한 번 다운로드되어 완전히 여러분의 컴퓨터에서 실행됩니다.
모델 다운로드가 완료되어 준비 완료 상태로 표시되면 성공입니다.
3단계 — 단축키 확인.
Windows 기본 단축키는 Ctrl+Space, Mac은 Command+Option을 누른 채 유지하는 방식입니다. Mac에서는 메시지가 나타날 때 손쉬운 사용 권한을 허용해야 다른 앱에 텍스트를 붙여넣을 수 있습니다.
테스트 녹음이 텍스트 필드에 붙여넣어지면 성공입니다.
4단계 — 커서를 두고 말하기.
이메일, 문서, 검색창 등 텍스트 입력 칸 어디든 클릭하고, 단축키를 누른 상태로 문장을 말한 뒤 놓으세요. 트랜스크립트가 커서 위치에 나타납니다. Whisper가 여러분의 컴퓨터에서, 무료로 변환한 결과입니다.
말한 문장이 텍스트로 입력 칸에 나타나면 성공입니다.
느린 부분은 일회성 모델 다운로드뿐, 복잡한 설정 절차는 없습니다. 그 후에는 Python 환경과 매번 명령어가 필요하던 그 오픈소스 모델이 트레이에 조용히 앉아 단축키를 누르면 텍스트를 붙여넣어 줍니다. Windows 또는 Mac에서 받아쓰기 옵션을 고민 중이라면, 이 버전이 바로 Whisper가 프로젝트가 아닌 앱처럼 느껴지게 만드는 방식입니다.
로컬 Whisper는 무료, 클라우드는 유료
'무료냐'는 질문에 선을 하나 명확히 그어야 합니다. Whisper를 로컬에서 실행하는 것은 무료입니다. 여러분의 컴퓨터, 여러분의 CPU, 서버 없음, 분당 요금 없음. 유료인 부분은 클라우드입니다. OpenAI의 호스팅 트랜스크립션 API는 분당 요금이 청구되고, 앱의 클라우드 플랜도 그것을 전달합니다. 저희 앱에서는 전체 로컬 파이프라인이 무료이며, Whisper Pro 뒤에 있는 것은 오직 클라우드 기능뿐입니다. 세 가지 경로가 실제로 어떻게 다른지 살펴보겠습니다. 선택권은 여러분에게 있습니다.
- 로컬 Parakeet — 무료 — NVIDIA의 TDT 엔진으로, 약 600 MB 크기이며 가장 빠른 로컬 옵션입니다. CPU 기준 Whisper보다 5~10배 빠릅니다. 영어를 포함해 유럽 언어 24개, 총 25개 언어를 지원합니다. 영어 번역 기능은 없습니다. 주로 영어를 사용하고 일반 하드웨어에서도 속도를 원한다면, 빠르고 완전 오프라인인 이 무료 옵션이 정답입니다.
- 로컬 Whisper — 무료 — 실제 오픈소스 Whisper 모델을 여러분의 컴퓨터에서 무료로 실행합니다. 다국어 빌드는 99개 언어를 지원하며 영어 번역도 가능합니다. 영어 전용 빌드는 영어만 지원합니다. 같은 하드웨어에서 Parakeet보다 느리지만, 중국어, 일본어, 한국어, 또는 번역 작업에는 이쪽이 맞습니다. 기본 영어 모델 크기는 약 480 MB입니다.
- 클라우드 (OpenAI, BYOK) — 분당 요금 — 최고 정확도와 실시간 웹 접근 기능을 제공하며, 여러분의 OpenAI 키를 사용해 OpenAI가 직접 청구합니다. 기본 트랜스크립션은 gpt-4o-mini-transcribe를 사용합니다. 비용이 드는 부분이며, 저희가 아닌 OpenAI가 분당 요금을 청구합니다. 인터넷 연결이 필요합니다. Whisper Pro 안에 있는 것은 이 클라우드 기능뿐입니다.
솔직히 말하면, 대부분의 일상적인 받아쓰기에는 로컬 Whisper 또는 Parakeet으로 충분하며, 이것이 전 구간 무료 경로입니다. 둘 다 여러분의 컴퓨터에서 완전히 실행되며 서버로 전송되는 내용이 없습니다. 클라우드가 분당 비용을 정당화하는 것은 어려운 녹음에서 최고 수준의 정확도가 필요하거나, 모델이 문장 중간에 웹에서 정보를 가져와야 할 때뿐입니다. 'Whisper가 무료냐'는 질문이었다면, 중요한 답은 이것입니다. 로컬 경로는 무료입니다. 거기서 시작하세요.
모델, 정확도, 그리고 원문 텍스트 정리
무료 모델은 하나가 아닙니다. 하나의 계열이고, 어떤 것을 선택하느냐가 정확도를 결정하는 진짜 레버입니다. 작은 모델은 빠르고 가볍습니다. large 다국어 모델은 가장 정확하지만 가장 무겁습니다. 오픈소스 커맨드 라인 버전에서는 모델 크기를 직접 선택하고 속도를 감수해야 합니다. 앱에서는 목록에서 선택하면 모델이 한 번 다운로드됩니다. 더 중요한 사실은, 정확도는 지불하는 금액보다 모델과 마이크에 달려 있다는 것입니다. $20짜리 USB 마이크가 어떤 업그레이드보다 트랜스크립트 품질을 더 높여줍니다.
어떤 모델을 쓰든 원시 받아쓰기는 이어지는 문장들로 나옵니다. '그러니까 모델은 MIT 라이선스로 무료인데 직접 실행하려면 python이랑 ffmpeg가 필요하고'라고 말하면, 구두점 없는 벽처럼 출력됩니다. 이를 다듬는 것은 별도의 단계입니다. Whisper by Remskill은 트랜스크립트에 AI 처리를 한 번 적용할 수 있습니다. 'Hey whisper'라는 활성화 문구를 말하면 텍스트가 정제된 후 입력됩니다. 군더더기가 제거되고 구두점이 교정됩니다. 로컬 모델에서는 Ollama를 통해 무료로, 클라우드 모드에서는 기본적으로 gpt-5-mini를 통해 처리됩니다.
그러니까 모델은 mit 라이선스로 무료인데 직접 실행하려면 python이랑 ffmpeg 그리고 음 좋은 컴퓨터가 필요하고 아니면 느려요
그러니까 모델은 MIT 라이선스로 무료인데, 직접 실행하려면 Python과 ffmpeg, 그리고 좋은 컴퓨터가 필요합니다 — 그렇지 않으면 느립니다.
정확도 문제에는 무료 레버 두 개와 유료 레버 하나가 있습니다. 무료 레버는 하드웨어에 맞는 모델을 선택하는 것, 그리고 괜찮은 마이크로 깨끗한 오디오를 입력하는 것입니다. 유료 레버는 로컬 품질이 아쉬울 때 최신 호스팅 모델을 제공하는 클라우드 트랜스크립션입니다. 대부분의 받아쓰기에서는 무료 레버가 중요한 것입니다. '완벽한 트랜스크립트, 노력 제로'를 약속하는 사람은 솔직하지 않은 겁니다. 모델은 무료지만, 좋은 입력이 여전히 대부분의 역할을 합니다.
말하고 정제하는 이 흐름은 여기서만 유용한 게 아닙니다. 단축키 하나로 어떤 앱에서든 깔끔한 텍스트를 받아쓰기로 입력할 수 있습니다. 긴 메시지도 몇 마디 말하면 끝입니다.
Whisper에 돈을 내는 게 실제로 합리적인 경우

이 글 전체가 '무료입니다'였으니, 솔직한 반대편도 드려야 합니다. 유료가 맞는 상황이 있으며, 그것을 모른 척하면 답이 아니라 영업이 됩니다. 무료 로컬 경로로 충분하다면 그냥 쓰시고 탭을 닫으세요. 대부분이 여기서 끝납니다. 하지만 유료 플랜이 진짜 가치를 내는 상황도 있습니다.
어려운 녹음에서 정확도가 돈보다 중요할 때 클라우드 경로에 비용을 내십시오. 두꺼운 억양의 인터뷰, 소음이 심한 현장 녹음, 틀린 단어 하나가 문제가 되는 법률 트랜스크립트 같은 경우입니다. 호스팅된 OpenAI 모델이 어려운 음성에서 로컬보다 앞서며, 그 우위를 위해 분당 요금을 내는 것입니다. 또 문장 중간에 웹에서 실시간 정보를 가져오고 싶을 때도 마찬가지입니다. 오프라인 로컬 모델은 그것을 할 수 없습니다. 그리고 Python을 설치하거나 모델을 다운로드할 수 없는 회사 보안 노트북처럼, 본인이 제어할 수 없는 기기에서 설치 없이 쓰고 싶다면 호스팅 서비스가 유일한 선택일 수 있습니다. 그 외의 경우, 무료 로컬 경로는 열등한 버전이 아닙니다. 동일한 오픈소스 모델이, 동일한 일을, 무료로 하는 것입니다.
내장된 무료 경로가 힘들어지기 시작할 때 유료를 선택하세요. 어려운 오디오에서 최고 수준의 정확도, 실시간 웹 조회, 또는 로컬에서 아무것도 실행할 수 없는 기기일 때입니다. 그 기준 이하라면 본인 하드웨어의 무료 모델이 맞는 답입니다. OpenAI가 이미 공개한 것에 비용을 내라고 말하지 않겠습니다. 무료 버전은 존재하고, 작동하며, 내부 엔진은 동일합니다.
무료 로컬 Whisper를 원하는 이유가 프라이버시 때문이라면 — 음성을 누군가의 서버에 보내지 않기 위해서라면 — 완전 오프라인 음성-텍스트 변환에 관한 글을 다음으로 읽어보세요. 모델을 본인 컴퓨터에서 실행하는 것이 정확히 그것을 보장합니다.
정리하자면, Whisper는 무료입니까? 모델은 진짜로, MIT 라이선스로, 여러분이 실행할 수 있게 공개되어 있습니다. 무료로 사용하려면 커맨드 라인에서 오후를 보내거나, 그 오후를 대신해준 앱을 쓰면 됩니다. 유료인 부분은 오직 클라우드뿐이며, 일상적인 받아쓰기에 반드시 필요하지는 않습니다. 저는 이 글의 대부분을 텍스트 박스에 말하는 방식으로 작성했습니다. 무료 로컬 모델이 받아써주었고, 단 한 번도 한 문장 변환을 위해 카드를 요구하지 않은 노트북으로요. 이게 전부입니다. 이런 답을 드릴 수 있어 흔치 않게 기쁩니다.
설치 없이 무료 Whisper 실행하기
단축키를 누르고, 말하고, 놓으세요. 오픈소스 모델이 여러분의 컴퓨터에서 무료로 변환하고, 커서 위치에 텍스트를 붙여넣습니다.
로그인한 모든 계정에 로컬 무료 모드 제공. 시작하는 데 카드가 필요 없습니다.



