Yazan: Denys Medvediev

Rehber

Mac için Whisper

"Mac için Whisper" iki şeyden birini ifade eder. Ya Python ve komut satırı üzerinden bir Mac'te çalışan açık kaynaklı OpenAI Whisper modelidir ya da arka planda Whisper kullanan bir Mac uygulamasıdır. Çoğu insan aslında ikincisini ister. Henüz bunun farkında değiller.

Son güncelleme: Haziran 2026

Bir masada duran MacBook ve mikrofon, Mac'te Whisper sesle dikteyi çağrıştırıyor

Mac için Whisper, tek bir ada sahip iki farklı şeydir. Model açık kaynaklı ve ücretsizdir, ama onu çalıştırmanın resmi yolu Python ve komut satırı gerektirir ve canlı konuşmanızı değil, dosyaları yazıya döker. Bir kısayola basıp sözlerinizin herhangi bir Mac uygulamasında belirmesini istiyorsanız, Whisper by Remskill gibi bir dikte uygulaması istiyorsunuz demektir; onun tüm yerel işlem hattı, oturum açan her kullanıcı için ücretsizdir.

Whisper bir modeldir, bir Mac uygulaması değil

İsimlendirme konusunu açıklığa kavuşturayım, çünkü arama sonuçları her ikisini birbirine karıştırıyor.

Whisper, OpenAI'nin MIT Lisansı altında yayınladığı açık kaynaklı bir konuşmadan metne modelidir. Model ücretsizdir. Kod ücretsizdir. Ağırlıkları indirip kendi makinenizde çalıştırabilirsiniz, herhangi bir hesap gerekmez. Bu kısım gerçekten de tam anlamıyla "Mac için Whisper"dır.

İşin püf noktası, onu nasıl çalıştırdığınızdır. Resmi OpenAI Whisper, bir Python ve komut satırı aracıdır. Onu pip ile kurarsınız, ayrıca ffmpeg komut satırı aracına ihtiyaç duyarsınız ve sonra onu bir ses dosyasına yönlendirirsiniz. Kayıtları yazıya döker: audio.mp3, audio.wav, bu tür şeyler. Canlı konuşmanızı Mail veya Slack'e yazmaz. Elinizde zaten bulunan bir dosyayı metne dönüştürür.

Altı model boyutu vardır (tiny, base, small, medium, large ve turbo) ve bunların dördünün, hızdan ödün vererek doğruluk kazandıran yalnızca İngilizce sürümleri bulunur. Whisper çok dillidir ve tek bir parametreyle konuşmayı İngilizceye çevirebilir. İyi bir model. Asıl sıkıcı gerçek şu ki, zorlu kısım hiçbir zaman modelin kendisi olmadı. Onu bir Mac'te gerçekten çalışma şeklinize entegre etmek, asıl zor olan kısımdır.

Whisper'ı saran Mac araçları ve her birinin ne işe yaradığı

"Mac için Whisper" arayan çoğu insan pip'e dokunmak istemez. Bir uygulama ister. Birkaç tane iyi seçenek var ve bunlar birbirinin yerine geçmez. İki gruba ayrılıyorlar.

Birinci grup: dosyaları yazıya dökmek

whisper.cpp, Whisper'ın MIT lisanslı, sade bir C/C++ uyarlamasıdır ve Apple Silicon üzerinde birinci sınıf bir vatandaştır; ARM NEON, Accelerate çerçevesi, Metal ve Core ML ile optimize edilmiştir. Yalnızca CPU üzerinde çalışır, onu kaynaktan derlersiniz ve komut satırından yönetirsiniz. Terminalde rahatsanız ve ham, hızlı, yerel dosya yazıya dökümü istiyorsanız mükemmeldir. MacWhisper, bu fikrin grafik arayüzlü bir sürümünü sunar. Ses ve video dosyalarını OpenAI Whisper ve NVIDIA Parakeet kullanarak cihaz üzerinde yazıya döker, hiçbir veri makinenizden çıkmaz; ayrıca sistem geneli bir dikte özelliği de vardır. İşiniz kayıtları yazıya dökmekse, doğru grup budur.

İkinci grup: canlı konuşmanızı yazmak

Bu dikte etmektir. Bir kısayola basarsınız, konuşursunuz ve metin, o anda odaktaki uygulamada imlecinizin olduğu yerde belirir. VoiceInk burada yer alır. GPL-3.0 altında açık kaynaklıdır, Parakeet v3 dahil yerel modelleri Apple Neural Engine üzerinde çalıştırır ve bas-konuş kısayoluyla metni imlece yapıştırır. Apple Silicon ve macOS 14.4 veya üzerini gerektirir. superwhisper de buradadır; canlı dikteye ek olarak dosya yazıya dökümü sunar, yerel ya da bulut, Mac, Windows ve iOS üzerinde.

Geliştirdiğim uygulama olan Whisper by Remskill, ikinci gruptadır. Önceliği dikte. Herhangi bir şey indirmeden önce hangi grupta olduğunuzu bilmekte fayda var.

Whisper by Remskill bir Mac'te ne yapar

Önce geliştirdiğim şeyi anlatayım, sonra onu diğerleriyle kıyaslayabilirsiniz.

Whisper
Canlı Whisper by Remskill uygulaması — kenar çubuğu, yazıya döküm paneli ve yapay zekâ talimat kartları. Bu gerçek arayüzdür, ekran görüntüsü değil.

Bu bir dikte uygulamasıdır. Bir kısayola basarsınız, konuşursunuz ve metin herhangi bir uygulamada imlecinizin olduğu yerde belirir: Mail, Notes, Slack, kod düzenleyiciniz, bu yılki okul izin belgesini yazdığınız kutucuk. Mac'te varsayılan kısayol, birlikte basılı tutulan Command ve Option'dır ve tamamen yeniden atanabilir. Tüm yazıya döküm Mac'inizde gerçekleşir. Yüklenecek dosya yok, yönetilecek kayıt yok.

Ayrıca Python da çalıştırmazsınız. Pip yok, ffmpeg yok, terminal yok, GPU yok. Her şey saf Rust'tır. Whisper ve Parakeet motorları, transcribe-rs adlı bir kütüphane üzerinden çalışır ve içine herhangi bir Python yan bileşeni gömülmemiştir. Yerel yazıya döküm CPU'nuzda çalışır, özel bir GPU gerekmez ve uygulama diskte yaklaşık 25 MB yer kaplar.

Modelin kendisine gelince, seçim sizin. Yerel Whisper size 8 model, 99 dil, İngilizceye çeviri, özel sözcük dağarcığı, beam-size denetimi ve hotword yönlendirmesi sunar. Daha yavaştır ama en fazla denetimi verir. Parakeet ise NVIDIA TDT motorudur, yaklaşık 600 MB'tır ve bir CPU'da Whisper'dan 5 ila 10 kat daha hızlı çalışır; İngilizceye çeviri olmadan İngilizceyi ve 24 başka Avrupa dilini kapsar. Bulut modu üçüncü yoldur: kendi OpenAI anahtarınızı getirirsiniz ve biz hiçbir pay almayız. Sizin yerinize bilinçli olarak seçim yapmıyorum. Farkları Whisper ile Parakeet karşılaştırması yazımızda ayrıntılarıyla açıklıyoruz, uzun versiyonunu isterseniz.

Yerel doğruluk tipik olarak %95 ile %99 arasında olur. Tüm yerel işlem hattı, oturum açan her kullanıcı için ücretsizdir: Whisper, Parakeet, Ollama üzerinden çevrimdışı yapay zekâ temizleme, yazıya döküm geçmişi, hazır ayarlar, hotword'ler, donanım hızlandırma, model indirmeleri ve özel kısayol. Kayıt sırasında ödeme yöntemi gerekmez. En fazla 3 cihazda kullanabilirsiniz. Ücretli katman olan Whisper Pro, yalnızca bulut yüzeyini ekler: OpenAI bulut yazıya dökümü, bulut yapay zekâ temizleme ve web araması. Fiyatları fiyatlandırma sayfasında bulabilirsiniz. Burada rakam vermiyorum, çünkü fiyatlandırma sayfaları değişir ve bunu doğrudan kaynağından okumanız gerekir.

Dürüst bir kısıtlama: Mac sürümümüz yalnızca Apple Silicon içindir, M1'den M4'e kadar. Intel tabanlı bir Mac kullanıyorsanız bu uygulama size göre değil ve birazdan size neyin uygun olduğunu söyleyeceğim.

İlk dikteniz aslında şöyle görünür. Kısayola basarsınız, küçük bir kayıt göstergesi belirir, konuşursunuz, bırakırsınız ve temizlenmiş metin imlecinizin bulunduğu yere düşer. Aşağıdaki katman, uygulamanın gerçekten gösterdiği şeydir, bir taslak değil.

Pasted
Yayınlanan dikte sonrası "tamamlandı" katmanı — tamamen yerel bir diktenin bittiği andaki gerçek uygulama arayüzü.

Kurulum kısa. Uygulamayı indirin, oturum açın ve bir model indirmesine izin verin. Parakeet, yaklaşık 600 MB ile en küçüğüdür; dil veya çeviri istiyorsanız bir Whisper modeli de seçebilirsiniz. Kısayolunuzu seçin ya da Command ve Option olarak bırakın. Sonra Mail'i açın, kısayolu basılı tutun ve bir cümle söyleyin. Tüm başlangıç süreci bu kadar. Küçük kızım bunu bana tek bir takip sorusu sormadan yaptı ki bu, tam anlamıyla güvendiğim tek kullanılabilirlik testidir. Üç model yolunu da içeren, ekran ekran daha uzun bir anlatım isterseniz, buna özel bir rehber yazdım: Mac'te sesi metne dönüştürme.

Bir Mac'te neden yerel tutuyorum

Bu yazı için kesin bir görüşüm var: yalnızca bulut tabanlı dikte bir gizlilik felaketidir.

Yöneticinizin maaş tablosu, çocuğunuzun okuluna yazdığınız e-posta, trende hazırladığınız hukuki dilekçe. Yalnızca sesinizle yazmak istediğiniz için bunların hiçbiri bir sağlayıcının sunucularından geçmemeli. Mac'inizde zaten bir mikrofon ve bir CPU var. Bir paragraf dikte için araya bir sunucuya ihtiyacı yok. Yerel motorlarla ses asla makinenizden çıkmaz. Benim tercih edeceğim varsayılan budur ve ücretsizdir.

Bulut modu, gerçekten en yeni OpenAI modellerini veya web yanıtlarını kendi anahtarınızla istediğinizde var. Bu bir acil çıkış kapısı, ana giriş kapısı değil.

MacWhisper, VoiceInk veya CLI'nin daha iyi seçim olduğu durumlar

Tek bir uygulamanın her durumu kazandığını iddia etseydim kötü bir rehber olurdum. Öyle değil. İşte sizi başka yerlere yönlendireceğim durumlar.

Çoğunlukla kayıtları yazıya döküyorsunuz

Gününüz; podcast bölümlerini, röportaj kayıtlarını veya toplantı kayıtlarını bir metne dönüştürmekle geçiyorsa, bir dikte uygulaması değil, bir dosya yazıya döküm aracı istiyorsunuz demektir. MacWhisper tam olarak bunun için yapılmış: bir dosyayı sürükleyip bırakın, cihaz üzerinde metni alın. Onu kullanın. Biz dosya yükleme yapmıyoruz. Biz canlı konuşmanızı yazıyoruz.

Ham, betiklenebilir, ücretsiz bir şey istiyorsunuz ve terminalde yaşıyorsunuz

O hâlde cevap whisper.cpp. MIT lisanslı, Apple Silicon için optimize, yalnızca CPU ve onu herhangi bir şeye yönlendirebilirsiniz. Kaynaktan derlemekten keyif alan türden bir insansanız, orada herhangi bir grafik arayüzde olduğunuzdan daha mutlu olursunuz.

Tamamen açık kaynaklı dikte istiyorsunuz ve Apple Silicon'dasınız

VoiceInk GPL-3.0'dır, her satırını okuyabilir veya inceleyebilirsiniz ve bizim gibi metni imlece yapıştırır. Sağlam ve ücretsiz bir seçenektir. Biz; hesaplar, geçmiş, kendi anahtarınızı getirme (BYOK) ve Windows desteğiyle yönetilen bir uygulamayız ve açık kaynaklı değiliz. Yani açık kaynaklılık katı bir gereksinimse, bu sizin kararınız ve VoiceInk iyi bir seçim.

Intel tabanlı bir Mac'tesiniz

Uygulamamız çalışmaz. Açık kaynaklı whisper.cpp, Intel üzerinde derlenip çalışabilir ve Apple'ın kendi yerleşik Dictation özelliği kısa notlar için ücretsizdir. İkisi de henüz satın almadığınız bir Apple Silicon makineyi beklemekten iyidir.

Tek bir şey hatırlayacaksanız

Model ücretsiz ve açıktır. Asıl önemli olan karar, onun etrafına ne sardığınızdır: bir terminal, bir dosya yazıya döküm arayüzü ya da canlı konuşmanızı baktığınız her yere yazan bir kısayol. Sarmalayanı işe göre eşleştirin ve bir Mac'te, gerçekten keyif almıyorsanız Python'u görmezden gelin. Bir Mac'te Whisper aramaya çıkan üç tür insan var: bir kayıt klasörü olanlar, bir daha asla yazmak istemeyenler ve sadece adı beğenenler. Buraya kadar okuyana dek, bunlardan ikisi yanlış gruptaydı.

Bu yazının çoğunu yazmak yerine dikte ettim ki bu da yerinde bir seçim oldu. Elimle yazdığım o tek paragrafta daha fazla yazım hatası vardı.

İleri okuma

Mac'inizde deneyin

Whisper by Remskill'i indirin, oturum açın ve Mac'inizde ilk cümlenizi dikte edin. Yerel katman ücretsizdir ve buluta hiç ihtiyacınız olup olmayacağına daha sonra karar verebilirsiniz.

Sonsuza dek ücretsiz yerel yazıya döküm. Kayıt sırasında ödeme yöntemi gerekmez. Yalnızca Apple Silicon.

Denys Medvediev'in fotoğrafı

Denys Medvediev

Destek e-postalarımızı okuyan kişi benim, büyük ihtimalle yanıtları dikte ederek.