Açıklayıcı
Hangi Whisper modelini kullanmalıyım
Tek bir doğru Whisper modeli yok — doğru olanı, en çok neye önem verdiğinize bağlı: hız mı, doğruluk mu, dil mi, yoksa disk alanı mı? Bu rehber, paketle gelen her modeli bir kullanım senaryosuyla eşleştiriyor; böylece yaklaşık bir dakikada seçim yapabilir ve Whisper yerine ne zaman Parakeet'e geçmeniz gerektiğini öğrenebilirsiniz.
Son güncelleme: Haziran 2026

En iyi Whisper modeli işe göre değişir: günlük İngilizce dikte için küçük bir İngilizce model, başka diller için çok dilli bir model, en yüksek doğruluk için büyük model ya da büyük modele yakın kalitede hız için Turbo seçin. Ağırlıklı İngilizce ve hız söz konusuysa Parakeet, Whisper'ı geride bırakır. Uygulama hepsini sunar ve seçimi kullanıcıya bırakır.
Bu soruyu diğer her şeyden daha çok alıyorum, genellikle şöyle soruluyor: "Uygulamayı indirdim, şimdi hangi modeli seçeyim?" Haklı bir soru ve dürüst ilk yanıt şu: kazanan tek bir model yok. Sizin makineniz, sizin diliniz ve fazladan yarım saniye beklemeyi ne kadar dert ettiğiniz için kazanan bir model var. Bu yüzden uygulama sizin yerinize seçim yapmaz. Seçenekleri gösterir ve yoldan çekilir.
Aradaki farkı görene kadar bu bir kaçamak yanıt gibi gelir. En küçük İngilizce model yaklaşık 140 MB ve 2016'dan kalma bir dizüstüde çalışıyor. En iyi çok dilli model yaklaşık 3 GB ve 16 GB RAM istiyor. Bu ikisinin arasında altı seçenek daha, bir de Parakeet adında ayrı bir motor var. Yanlış seçersiniz, ya çok beklersiniz ya da yanlış dilde yazıya dökersiniz. Doğru seçersiniz, modelin varlığını unutursunuz — ki hedef de budur.
İşte tüm listeyi yerine oturtan çerçeve. Her model dört şey arasında bir denge kurar: hız, doğruluk, kaç dil bildiği ve ne kadar disk ile RAM tükettiği. Dördünü birden en üst düzeye çıkaramazsınız. 3 GB'lık bir model daha doğrudur ve daha çok dil bilir, ama daha yavaştır ve 8 GB'lık bir makineye sığmaz. 140 MB'lık bir model anlıktır ama yalnızca İngilizce yapar, o da bir yere kadar.
Yani asıl soru "hangi model en iyisi" değil. "Hangi dengeyi istiyorum" sorusu. Mütevazı bir dizüstüde yalnızca İngilizce dikte eden biri mi, dokuz dil arasında çalışan bir çevirmen mi, yoksa var olan en hızlı yerel seçeneği isteyen biri mi olduğunuzu bir kez bildiğinizde, seçim kendiliğinden ortaya çıkar. İngilizce modelleri, çok dilli modelleri, Parakeet'in hepsini nerede geride bıraktığını ve geri kalanını okumak istemezseniz tek satırlık öneriyi tek tek ele alacağım.
Tek bir soruyla başlayın: en çok neye önem veriyorsunuz?

Herhangi bir model adından önce tek bir soruyu yanıtlayın: şu an sizin için en çok hangisi önemli — hız mı, doğruluk mu, dil kapsamı mı, yoksa disk alanı mı? Öncelik olarak yalnızca birini seçebilirsiniz, çünkü modeller birbirinin aleyhine denge kurar. Bu konuda kafa yoranların çoğu neyi optimize ettiğine henüz karar vermemiştir; liste de bu yüzden felç edici görünür. Oysa değil. Sekiz isim takmış dört kısa yanıttan ibaret.
Hız istiyorsanız ve İngilizce konuşuyorsanız, küçük bir İngilizce modelde ya da büyük olasılıkla Parakeet'te karar kılarsınız. İngilizce dışında bir dile ihtiyacınız varsa, isteseniz de istemeseniz de çok dilli ailedesiniz. Yerel olarak elde edebileceğiniz en doğru yazıya dökümü istiyorsanız ve buna yetecek RAM'iniz varsa, o da büyük modeldir. Disk alanı kısıtlıysa en küçük model dostunuzdur ve 3 GB'lık olan masadan kalkar. Karar ağacının tamamı bu; rehberin geri kalanı yalnızca isimleri yerine koyuyor.
Uygulamanın bilerek yaptığı bir şey var: size asla bir varsayılan dayatmaz. Bizi bir kıyaslamada iyi göstermesi işine gelen modele doğru iten bir "önerilen" rozeti yoktur. Cloud'u görürsünüz, Parakeet'i görürsünüz, sekiz Whisper modelini İngilizce ve çok dilli olarak ayrılmış görürsünüz ve seçersiniz. Daha önce Windows'ta sesi metne dönüştürmeyi ya da Mac'te kurduysanız, bu da aynı ekranın farklı bir soruya çevrilmiş hali.
İngilizce modeller, küçük dizüstüden en yüksek doğruluğa
Yalnızca İngilizce dikte ediyorsanız, İngilizce modeller verimli tercihtir — çok dilli mekanizmayı bırakıp o bütçeyi İngilizceye harcarlar. Dört tane var ve "eski dizüstü"den "yerel olarak çalıştırabileceğiniz en iyi İngilizce"ye kadar düzgünce sıralanırlar. Kısayola basar, konuşur, bırakırsınız; hangisini seçtiğinizden bağımsız olarak yazıya dökülen metin imlecinizin olduğu yere yapışır; tek fark hız ve zor bir kelimeyi ne sıklıkta tam tutturduğudur. Siz konuşurken küçük bir kapsül belirir, böylece dinlendiğini anlarsınız:
En küçüğü, yaklaşık 140 MB olan Base. 2016 model bir dizüstüde ya da RAM'i düşünmeden çalışan bir dikte istediğiniz 8 GB'lık bir makinede seçilecek olan bu. Onun üstünde, yaklaşık 480 MB ile dengeli İngilizce seçeneği Small yer alır — Parakeet'ten yavaş, ama Parakeet'in yapmadığı şeyleri, İngilizceye çeviriyi ve sıcak kelime önyargısını destekler. Sonra yaklaşık 1,5 GB ile 16 GB RAM isteyen ve ailedeki en yüksek düz İngilizce doğruluğunu veren Medium gelir. (Genel bir kıyaslamada, medium İngilizce model temiz seste yaklaşık %3 kelime hata oranına oturuyor; Small ise %5'e daha yakın. Gerçek dünyadaki rakamlar, bunlardan hangisini seçtiğinizden çok daha fazla mikrofonunuza bağlı.)
Dördüncüsü insanların kafasını karıştırıyor, o yüzden açık konuşayım. distil-large-v3 modeli olan Turbo da yaklaşık 1,5 GB ve büyük modelden 6 kat daha hızlı, doğruluğunun ise %99'una sahip olarak tanımlanıyor. Bu, bedava bir öğle yemeği gibi geliyor ve İngilizce için neredeyse öyle de — tam büyük modelin hız cezası olmadan en iyiye yakın İngilizce doğruluğu istediğinizde seçilecek olan bu. İşin püf noktası "yalnızca İngilizce" etiketinde: bu dört model İngilizce bilir, sadece İngilizce. İkinci bir dile ihtiyaç duyduğunuz an bu aileden tamamen çıkmış olursunuz; ki bu da bir sonraki bölüm.
Çok dilli modeller, diğer 98 dil için
Sesiniz İngilizce olmadığı an çok dilli bir model istersiniz. Whisper'ın çok dilli sürümleri otomatik algılamayla 99 dili kapsar ve yazıya dökerken konuşmayı İngilizceye çevirebilen tek yerel yoldur. İngilizce modeller bunu yapamaz, Parakeet de yapamaz. Yani Ukraynaca dikte ediyor, Japonca bir not karalıyor ya da İspanyolca bir kaydın İngilizce metin olarak çıkmasını istiyorsanız, yanıt kesinlikle bu ailedir.
Burada da dört tane var ve İngilizce boyutları yansıtıyorlar. Yaklaşık 480 MB olan Small, hızlı çok dilli temel seçenek — uygulamanın paketle birlikte sunduğu genel varsayılan model, çünkü kimse dilinizi henüz bilmediğinde en güvenli ilk tahmin bu. Yaklaşık 1,5 GB olan Medium, hızı belirgin biçimde daha iyi kalite için takas eder. Yaklaşık 3 GB ile Large v3, yerel olarak elde edebileceğiniz en iyi doğruluktur ve 16 GB RAM'iniz olması koşuluyla profesyonel çok dilli iş için doğru tercihtir. Yaklaşık 1,62 GB olan Large v3 Turbo ise hızlı çok dilli kademedir — büyük modelin kalitesinin çoğu, beklemenin küçük bir kısmıyla.
Dil sayısı üzerine bir not, çünkü pazarlamaya uygun rakam ile gerçek olan, ne kastettiğinize göre farklılaşır. Çok dilli modeller gerçekten 99 dili kapsar; İngilizce modeller tam olarak bir dili. Çoğunlukla İngilizce konuşuyor ve arada bir ikinci bir Avrupa diline geçiyorsanız, bunların herhangi birinden daha hızlı bir seçeneğiniz var, o da Parakeet — ki anlaşılması gereken bir sonraki konu bu, çünkü insanların en sık ya yanlışlıkla seçtiği ya da yanlışlıkla atladığı model bu.
Parakeet, Whisper'ı ne zaman geride bırakır, ne zaman bırakmaz

Parakeet aslında bir Whisper modeli değil — NVIDIA'nın yaklaşık 600 MB'lık TDT motoru ve uygulamanın paketle sunduğu en hızlı yerel seçenek; CPU'da Whisper'dan 5 ila 10 kat daha hızlı olarak tanımlanıyor. Boştaki bir GPU'su olmayan, eski ya da dizüstü sınıfı bir CPU'nuz varsa, bu hız farkı, anlık hissettiren dikte ile sizi bekleten dikte arasındaki fark demek. Günlük İngilizce iş için ilk uzandığım model Parakeet.
İngilizceye ek olarak 24 Avrupa dilini daha kapsar — toplam 25 — yani birçok Avrupalı kullanıcı için fazlasıyla yeterli. Bilerek yapmadığı şeyler ise Whisper'a özgü olanlar: İngilizceye çeviri yok, sıcak kelime önyargısı yok, özel sözlük istemi yok. İşiniz tek dilli İngilizceyse (ya da o 24 Avrupa dilinden biriyse) ve sadece hızlı olmasını istiyorsanız, Parakeet kazanır ve soru kapanır. Tüm resmi görmek isterseniz Parakeet model dökümünde daha fazlası var.
O kutunun dışına çıktığınız an Whisper kazanır. Çince, Japonca ya da Korece mi lazım? Çok dilli Whisper, çünkü Parakeet bunları konuşmaz. Bir kaydı İngilizceye çevirmek mi gerekiyor? Çok dilli Whisper, bunu yapan tek yerel yol. Modeli bir ürün adları ya da jargon listesine doğru yönlendirip onları yanlış yazmasını engellemek mi istiyorsunuz? Sıcak kelimeler aracılığıyla Whisper. Kabaca kural: İngilizce hızı için Parakeet; diller, çeviri ve denetim için Whisper. Uygulama ikisini de sunuyor, çünkü ikisi de herkes için doğru yanıt değil.
Boyut, hız ve doğruluk: denge gerçekte nasıl işler
Üç gücü yan yana görmek işe yarar, çünkü her model aynı üçgen üzerinde farklı bir noktadan ibaret. Büyük dosyalar daha doğru ve daha yavaştır; küçük dosyalar daha hızlı ve RAM açısından daha hafiftir; özel motorlar ise eğriyi büker. İşte her gücün dürüst hali, çünkü uygulama sizi seçim yapmaya zorluyor ve ben de bedelini bilerek seçmenizi tercih ederim.
Sizi sıkan şeye göre listeyi okumanın üç yolu:
- Sorun hızsa — önce Parakeet'e uzanın — yaklaşık 600 MB ve CPU'da Whisper'dan 5 ila 10 kat daha hızlı. GPU'su olmayan bir makinede günlük İngilizce için yerel hiçbir şey ona yetişemez. Bedeli ise İngilizceye çeviri ve sıcak kelimelerin olmaması.
- Sorun doğruluk ya da dilse — Whisper ailesinde daha büyüğe gidin. Yaklaşık 3 GB ile Large v3 en iyi yerel doğruluktur ve 99 dili kapsar, ama 16 GB RAM ister. Turbo sürümleri o kalitenin çoğunu çok daha az beklemeyle verir. Small ve Medium ise mantıklı orta yoldur.
- Sorun disk alanı ya da RAM ise — küçük kalın (yaklaşık 140 MB ile Base) ya da yereli tamamen atlayıp Cloud modunu kullanın; bu mod her donanımda çalışır, çünkü kendi anahtarınızla OpenAI'a yapılan bir ağ çağrısından ibarettir. Cloud, Whisper Pro'nun bir parçasıdır ve internet gerektirir.
Sıkıcı gerçek şu: çoğu insan için, yeni bir makinede, orta boy modeller arasındaki fark, mikrofonunuzun yarattığı farktan daha küçüktür. 20 dolarlık bir USB mikrofon, doğruluk için Small'dan Large'a geçmekten daha fazlasını yapar — kamuya açık Whisper kıyaslamaları bunu doğruluyor ve ben de kendi masamda bunun bir kereden fazla yaşandığını gördüm. O yüzden ilk günden Medium ile Large arasında kafa yormayın. RAM'inize sığan bir şey seçin, dikteye başlayın ve bir kelime sürekli yanlış çıkıyorsa modeli sonra yükseltin. Gerçekten elinizde kalacak model, orada olduğunu unutacağınız kadar hızlı olandır.
Birini deneyin, yanlışsa iki tıkla geçin
İşte tüm kararın yükünü hafifleten kısım: ilk seçtiğiniz modelle evlenmiyorsunuz. Geçiş yapmak Ayarlar'da iki tık ve tek gerçek maliyet, geçtiğiniz modelin indirilmesi. Yani doğru strateji bir saat araştırma yapmak değil — makul bir ilk tahmin yapmak, bir gün onunla dikte etmek ve canınızı sıkıyorsa değiştirmek. Tüm yerel hat, oturum açmış her hesap için ücretsizdir, kayıtta ödeme yöntemi istenmez, dolayısıyla birkaç modeli denemek size disk alanından başka bir şeye mal olmaz.
1. Adım — Ayarlar'ı açın ve Yazıya Dökme panelini bulun.
Model listesi orada yaşar; İngilizce ve çok dilli olarak ayrılmış, yanlarında Parakeet ve Cloud ile. Hiçbiri "en iyisi" olarak önceden seçili değildir.
Her adın yanında boyutuyla birlikte model listesini gördüğünüzde doğru yerde olduğunuzu anlarsınız.
2. Adım — Yukarıdaki bölümden ilk tahmininizi yapın.
İngilizce ve hız istiyorsanız: Parakeet. İngilizce ve doğruluk istiyorsanız: Small ya da Medium İngilizce. Başka diller: çok dilli bir model. RAM'iniz kısıtlıysa: Base.
Model indirmeyi bitirip hazır olarak göründüğünde işe yaradığını anlarsınız.
3. Adım — Bir gün onunla dikte edin.
Test cümlesi değil, gerçek iş üzerinde kullanın. Gerçek notlarla geçen bir öğleden sonra, herhangi bir kıyaslama tablosundan daha çok şey öğretir.
Onu fark etmeyi bırakıp sadece konuştuğunuzda doğru model olduğunu anlarsınız.
4. Adım — Yanlışsa değiştirin.
Çok yavaşsa daha küçük bir şey ya da Parakeet seçin. Bir dili kaçırıyor ya da kelimeleri bozuyorsa çok dilliye ya da daha büyüğe geçin. İki tık, bir indirme, tamamdır.
Yeni model yüklenip bir sonraki kaydınız onu kullandığında işe yaradığını anlarsınız.
İnsanlar bunu tek yönlü bir kapı gibi görüyor, oysa değil. Çalıştırdığım ilk model, elimde kalan model olmadı; alışkanlıktan çok dilli bir modelle başladım, gün boyu İngilizce dikte ettiğimi fark ettim ve hız için Parakeet'e geçtim. İki tık ve bir kahvelik indirme sürdü. İlk seçiminizi bir taslak olarak görün.
Sona atladıysanız, hızlı öneri
Başka hiçbir şey okumayacaksanız işte burada. İngilizce, hızlı olsun, mütevazı makine: Parakeet. İngilizce, en iyi yerel doğruluk: Medium İngilizce model ya da o doğruluğu beklemeden isterseniz Turbo. Başka bir dil ya da çeviri lazım: çok dilli bir model — başlangıç için Small, doğruluk önemliyse ve 16 GB RAM'iniz varsa Large v3. Disk ya da RAM kısıtlı: Base. Web erişimiyle en üst düzey doğruluk istiyorsanız ve kendi OpenAI anahtarınızı kullanmaya razıysanız: Cloud. Haritanın tamamı bu.
Hangisini seçerseniz seçin, ham metin tek bir bütün halinde, noktalama olmadan çıkar; bu yalnızca bizde değil her konuşma motorunda böyle. "tamam toplantı modelini medium yap ve bana büyük olanı sonra test etmemi hatırlat" dersiniz ve geri aldığınız şey, noktalamasız bu duvardır. Whisper, metin yerine ulaşmadan önce noktalamayı düzeltip dolgu sözcükleri ayıklamak için bir AI temizlik geçişi çalıştırabilir — etkinleştirme ifadesini söyleyin, "Hey whisper", o önce ortalığı toparlasın. Yerel bir modelde bu Ollama üzerinden çalışır; bulut modunda ise varsayılan olarak gpt-5-mini'dir.
tamam toplantı modelini medium yap ve bana büyük olanı sonra test etmemi hatırlat hmm belki hızlı işler için parakeet
Tamam, toplantı modelini Medium yap ve bana büyük olanı sonra test etmemi hatırlat — hızlı işler için belki Parakeet.
Her "hangi model" rehberinin sonuna yakışan dürüst bir uyarı: tek yaptığınız bir metin alanına 30 kelimelik bir not bırakmaksa, belki de bir model seçmenize hiç gerek yok. Windows'ta yerleşik Sesli Yazma çubuğu, imleciniz neredeyse oraya Windows key + H ile açılır — noktalamayı kendi yapar ve ücretsizdir, ancak Microsoft'un sunucularından geçer ve internet gerektirir. Mac'te Sistem Ayarları'ndaki Dikte aynısını yapar ve Apple Silicon'da genel metin cihaz üzerinde işlenebilir. Doğruluğun ve uzunluğun canınızı yakmaya başladığı eşiğin altında, zaten makinenizde olanı kullanın. Bizim indirilmeye değmemiz, gerçek bir hacimde çalıştığınızda, çevrimdışı gizlilik istediğinizde ya da yerleşik araçların sunmadığı bir dile ve denetime ihtiyaç duyduğunuzda başlar. Size bir market listesi dikte etmek için uygulama yüklemenizi söyleyecek değilim.
"En iyi" Whisper modeli, üzerinde düşünmeyi bıraktığınız modeldir. Önem verdiğiniz dengeyi seçin, bir ilk tahmin yapın ve canınızı sıkıyorsa iki tıkla değiştirin. Mimari diyagramı daha ikinci commit'te yanlış çıkan sistemler yayınladım, o yüzden "sadece dene ve ayarla" yaklaşımına sağlam bir saygım var. Model seçiminizin riski bundan daha düşük ve geri almak da çok daha kolay. Bir yerden başlayın. Yavaş kısım indirmedir; karar vermek yavaş olmamalı.
Bir model seçin ve konuşmaya başlayın
Bir ilk tahmin yapın, bir gün dikte edin, yanlışsa iki tıkla değiştirin. Uygulama size her seçeneği gösterir ve seçimi size bırakır.
Oturum açmış her hesap için ücretsiz yerel mod. Başlamak için kart gerekmez.



