Rehber
OpenAI Whisper Windows için
OpenAI Whisper, MIT Lisansı altında sunulan ücretsiz ve açık kaynaklı bir konuşmadan metne modelidir. Windows'ta ses dosyalarını yazıya dökmek için genellikle Python ve komut satırı üzerinden çalışır. Whisper by Remskill ise bu modelleri bir masaüstü uygulamasında bir araya getirir; böylece dosya yazıya dökmek yerine doğrudan herhangi bir uygulamanın içine canlı dikte edebilirsiniz.
Son güncelleme: Haziran 2026

OpenAI Whisper, MIT Lisansı altında yayımlanan ücretsiz ve açık kaynaklı bir konuşmadan metne modelidir. Windows'ta genellikle Python ve komut satırı üzerinden çalışır ve kendisine verdiğiniz ses dosyalarını yazıya döker. Whisper by Remskill ise bu modelleri bir masaüstü uygulamasında toplar; böylece bunun yerine doğrudan herhangi bir uygulamaya canlı dikte edebilirsiniz.
OpenAI Whisper ücretsiz ve açık kaynaklı bir modeldir. Sıfır bir Windows makinesinde resmî sürüm, dosyaları yazıya dökmek için Python, ffmpeg ve komut satırı ister. Elinizde bir dosya varsa, Buzz veya Whisper Desktop gibi ücretsiz GUI araçları işi görür. Konuşup sözlerinizin herhangi bir uygulamada imlecin olduğu yere düşmesini istiyorsanız, Whisper by Remskill aynı modelleri hiçbir şey derlemenize gerek kalmadan ve ücretsiz bir yerel katmanla bir araya getirir.
İnsanlar "Windows için OpenAI Whisper" derken neyi kastediyor
İşin sıkıcı gerçeği şu: "OpenAI Whisper" aynı adı taşıyan iki ayrı şey ve arama sonuçları bunları her gün birbirine karıştırıyor.
İlki, modelin kendisi. Whisper, OpenAI'nin MIT Lisansı altında açık kaynaklı hâle getirdiği bir konuşma tanıma modeli; yani hem kodu hem de eğitilmiş ağırlıkları ücretsiz olarak indirilip kullanılabiliyor. Altı boyutta geliyor (tiny, base, small, medium, large ve turbo) ve bunların dördünün yalnızca İngilizce çalışan bir varyantı var; hız ile doğruluk arasında bir denge kuruyorsunuz. Çok dilli çalışıyor ve tek bir bayrakla konuşmayı İngilizceye çevirebiliyor. Bu gerçekten etkileyici ve gerçekten ücretsiz.
İkincisi ise onu nasıl çalıştırdığınız. Resmî Whisper bir Python paketi. Onu pip ile kuruyorsunuz, yanına ffmpeg komut satırı aracını kuruyorsunuz ve sonra bir terminalden ona bir ses dosyası veriyorsunuz. Eğer "terminal", "pip" ve "ffmpeg" sizin için zaten planlamadığınız bir Cumartesi gibi geliyorsa, bu yazının asıl konusu olan boşluğu bulmuşsunuz demektir. Komut satırı, tıklamak yerine bilgisayara komut yazmak için kullandığınız araçtır. Windows kullananların çoğu onu bilerek hiç açmamıştır.
Yani birisi Google'a "Windows için OpenAI Whisper" yazdığında, genellikle iki yanıttan birini istiyordur. Ya: Bu ücretsiz modeli, bilgisayar mühendisliği diplomasına ihtiyaç duymadan nasıl dosyalarımı yazıya döker hâle getiririm? Ya da: Ben sadece konuşup sözlerimin ekranda belirmesini istiyorum, bu şey bunu yapabiliyor mu? Bunlar farklı ihtiyaçlar ve farklı araçlar istiyorlar. İkisine de yanıt vereceğim ve her birini hangi aracın kazandığı konusunda dürüst olacağım.
Ücretsiz model harika. İşin püf noktası kurulumda.
Ürün sayfalarının atladığı kısım burada. Whisper modeli olarak hiçbir şeye mal olmuyor. Whisper bir deneyim olarak ise, sıfır bir Windows makinesinde size bir öğleden sonranıza mal oluyor.
Resmî OpenAI Whisper'ı çalıştırmak için Python kurarsınız, sonra Whisper paketini kurarsınız, sonra ffmpeg kurar ve Windows'un onu bulabildiğinden emin olursunuz, sonra bir terminal açıp her dosya için bir komut çalıştırırsınız. Burada bir geliştirici için zor olan hiçbir şey yok. Ama bunların tamamı geri kalan herkes için bir duvar: yazar, avukat, öğrenci, satış elemanı ve üçüncü demoda dikteyi denemeyi kabul eden kendi annem gibi; ki kendisi "ffmpeg'i PATH'inize ekleyin" cümlesinin geçtiği tam olarak sıfır demoyu kabul ederdi.
Daha dostça başlangıç noktaları da var ve bunları bilmekte fayda var. Whisper.cpp, aynı modelin sade bir C/C++ uyarlamasıdır: MIT lisanslı, hızlı, yalnızca CPU ile çalışan ve hiç Python içermeyen bir sürüm. Ama yine de onu kaynaktan derliyor veya komut satırından çalıştırıyorsunuz. Tam da derleyicilerden keyif alan insanlar için tasarlanmış, gerçekten güzel bir mühendislik ürünü. Bu yazının geri kalanı ise almayan insanlar için.
Bunun yerine komut satırı Whisper'ını istediğinizde (ya da bir dosya yazıya dökücü)
Şimdi sizi başka bir yere yönlendireceğim, çünkü asıl dürüst kısım bu.
Elinizde aslında bir ses dosyası varsa (kaydedilmiş bir röportaj, bir podcast bölümü, sakladığınız bir Teams görüşmesi, bir sesli not) o zaman bizim uygulamamız yanlış araçtır ve size uyumsuz bir şey satmaktansa bunu söylemeyi tercih ederim. Biz canlı dikte yapıyoruz: siz konuşuyorsunuz, sözler imlecinizin olduğu yere düşüyor. Var olan bir dosyayı alıp yazıya dökmüyoruz. Farklı bir iş.
Bu iş için üç ücretsiz araç gerçekten iyi ve tam olarak bunun için yapılmışlar:
- Buzz ses dosyalarını çevrimdışı olarak yazıya döküp çeviriyor; OpenAI'nin Whisper'ından güç alıyor, MIT lisanslı ve Windows'ta çalışıyor. Terminal yerine düğmeleri olan gerçek bir pencere istiyorsanız, buradan başlayın.
- Whisper Desktop (Const-me) bir Windows GUI uygulamasıdır. Zip'ten çıkarıyorsunuz, WhisperDesktop.exe'yi çalıştırıyorsunuz, bir dosyaya yönlendiriyorsunuz ve DirectCompute aracılığıyla GPU'nuzu kullanarak yazıya döküyor. MPL-2.0 lisanslı ve düzgün bir ekran kartında hızlı.
- whisper.cpp komut satırında rahatsanız ve Python olmadan ham hız istiyorsanız sade seçenektir.
Bunu lafı gediğine koymak için söylemiyorum. Bizim aracımız olmadığında sizi doğru araca yönlendirmek, geri kalan her şeye inanmanız için tam da en geçerli neden. Elinizde bir dosya varsa, gidip Buzz'ı kullanın. Elinizde bir mikrofon ve aklınızda bir cümle varsa, okumaya devam edin.
Whisper by Remskill Windows'ta aslında ne yapıyor
Aynı açık kaynaklı Whisper modellerini, üstüne bir de ikinci bir motoru aldık ve bunları bir Windows uygulamasında topladık; böylece derlenecek hiçbir şey ve terminale yazılacak hiçbir şey yok.
Yaklaşık 25 MB'lık tek bir uygulama kuruyorsunuz. Giriş yapıyorsunuz. Varsayılan olarak Ctrl + Space olan ve tamamen yeniden atanabilen kısayol tuşuna basıyorsunuz. Konuşuyorsunuz. Tuşu bırakıyorsunuz. Metin, zaten içinde olduğunuz hangi uygulamaysa orada imlecinizin yanında beliriyor: Word, Outlook, tarayıcı, Slack, bir kod düzenleyici, arama kutusu. Dosya yok, terminal yok, GPU gerekmiyor; tüm yerel transkripsiyon CPU'nuzda çalışıyor.
Kaputun altında üç yoldan birini seçiyorsunuz, çünkü modeli sizin yerinize biz seçmiyoruz:
- Yerel Whisper (8 model) buraya gelmenize neden olan açık kaynaklı Whisper'dır; paketlenmiş ve kullanıma hazır. İngilizce için optimize edilmiş Base'ten (~140 MB) Medium'a (~1,5 GB) kadar, ayrıca Large v3'e (~3 GB) kadar çok dilli sürümler. Çok dilli sürümler 99 dili kapsıyor ve İngilizceye çevirebiliyor.
- Parakeet (NVIDIA TDT, ~600 MB) ayrı bir motordur; CPU'da Whisper'dan 5 ila 10 kat daha hızlıdır ve İngilizceyle birlikte 24 Avrupa dilini daha kapsar. İngilizceye çevirme yok. Hız istiyorsanız ve çoğunlukla İngilizce çalışıyorsanız bunu seçin.
- Bulut (OpenAI, BYOK) en üst düzey doğruluk ve web araması için kendi OpenAI anahtarınızı getirmenize olanak tanır; biz hiçbir pay almıyoruz. Tek Pro özelliği budur.
Yerel hat (her Whisper modeli, Parakeet, Ollama üzerinden yapay zekâ düzenlemesi, geçmiş, hazır ayarlar, özel kısayol tuşu, model indirmeleri) giriş yapmış her kullanıcı için ücretsizdir ve kayıt sırasında kart istenmez. Bulut yolu ise ücretli Pro katmanıdır; rakamları fiyatlandırma sayfasında görebilirsiniz.
Gerçek bir Windows dikte uygulaması neden pip install'dan daha zor
"Whisper'ı bir arayüze sar geçsin" diyenlerin sizi uyarmadığı şey burada.
Model işin kolay kısmı. Windows'ta bir kısayol tuşunu uslu davranmaya ikna etmek değil. Kısayol tuşu işleyicimizin ilk sürümü, tek bir gerçek tuş basışı için kayıt durdurma geri çağrısını altı kez tetikliyordu. Mac'te kusursuz çalışıyordu. Temiz bir Windows kurulumunda kusursuz çalışıyordu. Gerçek müşteri makinelerinde dağılıyordu; yani bir dil giriş yöntemi etkin olanlarda. Bu yöntem Windows'ta öngörülemeyen anlarda hayalet Ctrl + Space bırakma olayları üretiyor. Günler süren telemetri, sonra yetmeyen bir 50 ms gecikme, ardından nihayet yeten bir 300 ms gecikme aldı. Windows giriş yöntemi çerçevesi hakkında hiç kimsenin öğrenmemesi gerektiği kadar çok şey öğrendim ve benim yüksek lisansım var. Bunu anlattığımda büyük kızımın hükmü şuydu: "İşte bu yüzden babamın e-postaları bir türlü bitmiyor."
Bir model ile bir ürün arasındaki fark işte budur. Ücretsiz Whisper size bir dosyanın transkripsiyonunu verir. Bir dikte uygulamasının ise siz başka bir şeyle uğraşırken, gerçek uygulamaların içinde, gerçek Windows masaüstünde ayakta kalması gerekir. Model bu kavgayı hiç görmez. Biz görürüz ve önce yaklaşık bir hafta boyunca kaybettik.
İçinde gelen Windows aracının yeterli olduğu durumlar
İnsanlara ürününüzü ne zaman almamaları gerektiğini söyleyin, belki o zaman gerisi için de size inanırlar. O hâlde: yalnızca arada bir kısa not dikte ediyorsanız, bunların hiçbirine ihtiyacınız olmayabilir. Windows 11'de Win + H ile açtığınız, içinde gelen bir sesli yazma aracı var. Ücretsiz ve birkaç satır için gayet iyi; ama sesinizi makinenizde çalıştırmak yerine Microsoft'un çevrimiçi konuşma tanımasına yönlendiriyor. Hızlı bir Teams yanıtı için fazlasıyla yeterli.
Biz, gerçek metinler yazmaya başladığınız noktada (uzun e-postalar, dilekçeler, ders özetleri, kod yorumları, pazarlama varyantları) ve bunun 99 dilde, her yerde aynı kısayol tuşuyla makinenizde kalmasını istediğinizde kurulmaya değer hâle geliyoruz. Gününüz iki satırlık sohbetlerden ibaretse, işiniz bitti. Gününüz yazmaksa, uygulamayı kullanmaya devam edin.
İleri okuma
OpenAI Whisper ücretsiz ve açık kaynaklı bir modeldir ve Windows'ta dosyaları yazıya dökmek için genellikle Python, ffmpeg ve bir terminal ister. Elinizde bir dosya varsa, Buzz veya Whisper Desktop bunu gerçek bir pencereyle ücretsiz halleder. Asıl istediğiniz şey konuşup sözlerinizin herhangi bir uygulamada imlecin olduğu yere düşmesini izlemekse, hiç derleme yapmadan, komut satırı olmadan ve yerel olarak CPU'nuzda çalışacak şekilde, işte tam da bunu yaptık.
Ücretsiz-ücretli dünyasının daha uzun bir ele alınışı için Windows'ta sesten metne yazısına bakın. İki yerel motorumuz arasında seçim yapmak için Whisper ve Parakeet karşılaştırması yazısına göz atın.
İlk cümlenizi yaklaşık bir dakikada dikte edin
Whisper by Remskill'i Windows için indirin, kart gerekmeden giriş yapın, Ctrl + Space'e basın ve konuşun. Yerel hat, kullandığınız sürece ücretsizdir.
Sonsuza dek ücretsiz yerel transkripsiyon. Kayıtta ödeme yöntemi yok. Bulut katmanı tek ücretli özelliktir.



