Açıklayıcı
Özel ses yazıya, cihazınızda
Özel ses-yazı dönüşümü, sesinizin kendi cihazınızda metne aktarıldığı ve hiçbir şeyin sunucuya yüklenmediği anlamına gelir. Yerel Whisper ve Parakeet tamamen çevrimdışı çalışır. Bulut dikte ise sesinizi transkripsiyona göndermek için dışarı iletir.
Son güncelleme: Haziran 2026

Özel ses-yazı dönüşümü, transkripsiyonun kullanıcının kendi cihazında gerçekleştiği ve kaydedilen sesin hiçbir zaman makineden çıkmadığı anlamına gelir. Whisper ve Parakeet gibi yerel motorlar, sunucuya hiçbir şey göndermeden tamamen çevrimdışı çalışır. Bulut dikte hizmetleri ise sesi uzaktan transkripsiyona yükler. Maksimum gizlilik için yerel, çevrimdışı bir araç seçin.
Her dikte aracı kendini gizli ilan eder. Çoğu değildir. Bu sözcük, "yüklemeyi şifreliyoruz" veya "30 gün sonra siliyoruz" anlamına gelecek şekilde esnetilir; ama yine de sesiniz makinenizi terk etmiş, başkasının sunucusunda oturmuş ve size ait olmayan bir bilgisayar tarafından metne çevrilmiş demektir. Bu bir gizlilik politikasıdır, gizlilik değil. Sözcüğün gerçek, dar anlamı vardır ve avukatınıza mail dikte etmeden önce bunu netleştirmeye değer.
Dürüst tanım basittir: özel ses-yazı dönüşümü, sesin kendi cihazınızda kelimelere dönüştürüldüğü ve hiçbir şeyin hiçbir yere gönderilmediği anlamına gelir. Yükleme yok, sunucu yok, internet bağlantısı gerekmez. Bu seçenek mevcuttur, yerel boru hattı için ücretsizdir ve zaten sahip olduğunuz dizüstü bilgisayarda çalışır. Ama bir uyarı var — açıkça söyleyeyim: daha iyi doğruluk için bulut modunu tercih ettiğiniz anda bu söz değişir. Bu sınırı net biçimde çizeceğim.
İşte pazarlamanın altına gömülen şey bu. "Gizli", bir his değil tek cevabı olan bir sorudur: ses cihazı terk ediyor mu, etmiyor mu? Terk ediyorsa, teorik olarak sizden başka biri duyabilir. Etmiyorsa, duyamaz. Geri kalan her şey — şifreleme, saklama süreleri, uyumluluk rozetleri — zaten dışarıya çıkması durumunda devreye giren hasar kontrolüdür.
Yani asıl soru "bu araç gizli mi" değil. Asıl soru şu: "sesim benim makinemde mi yoksa onlarınkinde mi metne çevriliyor?" Yerel Whisper ve Parakeet bunu sizinkinde yapıyor; çevrimdışı, model kendi RAM'inize yüklenmiş hâlde. Bulut dikte bunu onlarınkinde yapıyor. Bu kılavuz, bu ayrımın size gerçekte ne kazandırdığını, yerel sürümü iki dakikada nasıl kuracağınızı ve sesi buluta göndermenin makul bir değiş tokuş olduğu tek dürüst istisnayı açıklıyor.
Ses-yazı dönüşümünde "gizli" gerçekten ne anlama gelir?

Özel ses-yazı dönüşümü tek bir şey demektir: kaydedilen sesiniz kendi cihazınızda metne dönüştürülür ve ses hiçbir zaman cihazı terk etmez. Sunucuya yükleme yok, internet üzerinden gidiş-geliş yok, döngüde üçüncü taraf yok. Transkripsiyon, yazım denetiminin gerçekleştiği gibi kendi belleğinizde ve işlemcinizde gerçekleşir ve ardından ses kaybolur. Tanımın tamamı bu; "gizli" sözcüğünü kullanan araçların çoğu bu ölçütü karşılamaz.
Genellikle "gizli" olarak satılan şey, kapıda daha iyi bir kilit bulunan bulut sürümüdür. Ses hâlâ metne çevrilmek için satıcının sunucularına gider; satıcı yalnızca aktarım sırasında şifreleyeceğini ve belirli bir takvimde sileceğini vaat eder. Bu kesinlikle hiç yoktan iyidir ve pek çok kişi için yeterlidir. Ancak sesin hiç ayrılmamasıyla aynı şey değildir. Silme vaadi bir vaat olarak kalır. Cihaz içi işlem ise bir gerçektir — gönderilen hiçbir şey yoktu ki silinecek bir şey olsun. Gizlilik gerçekten önem taşıdığında — bir maaş rakamı, tıbbi bir not, hiç dizine alınmasını istemeyeceğiniz bir taslak — vaat ile gerçek arasındaki fark her şeydir.
Cihaz içi transkripsiyonun artık mümkün olmasının nedeni, modellerin küçülmesi ve dizüstü bilgisayarların hızlanmasıdır. Birkaç yıl önce iyi bir konuşma tanıma çalıştırmak için veri merkezine ihtiyacınız vardı; bu yüzden her şey buluta gitti. Bugün açık kaynaklı bir Whisper modeli orta seviye bir dizüstü bilgisayarda yerel olarak çalışıyor ve Parakeet bundan da hızlı. Bulut, artık sizi engellemeyecek donanım için geçici bir çözümdü. Özel ses-yazı dönüşümü fazladan ödediğiniz bir premium özellik değil — pratik hâle gelen varsayılan seçenektir; bu kılavuzun geri kalanı da onu nasıl kullanacağınızla ilgilidir.
Neden çoğu bulut dikte gizli değildir?
Bir bulut dikte aracında bir tuşa bastığınızda arka planda şunlar olur: mikrofonunuz birkaç saniyelik ses kaydeder, bu ses dosyası internet üzerinden bir sunucuya gönderilir, o sunucudaki bir model sesi metne çevirir ve metin ekranınıza geri döner. Her şey bir saniyeden kısa sürebilir; bu yüzden görünmez gibi hissettiriyor. Ama sesiniz — sadece kelimeler değil, asıl kayıt — kontrol etmediğiniz bir makineye gidip geri geldi.
Windows Sesli Yazma en net örnektir çünkü çoğu kişi zaten kullanıyor. Windows tuşu + H tuşuna basın; küçük bir çubuk açılır ve odaktaki alana sözlerinizi yazmaya başlar. İyi çalışır. Aynı zamanda bir bulut hizmetidir — Microsoft'un çevrimiçi konuşma tanıması — bu yüzden internet bağlantısı gerektirir ve uçakta çalışmayı keser. Sesiniz metne dönüşmek için Microsoft'un sunucularına gider. Bugün piyasaya çıkan çoğu "yapay zeka dikte" uygulaması için de aynısı geçerlidir: zekice kısım başkasının donanımında çalışır ve onu kiralamak için sessizce aylık fatura kesilir. Yerel bir araç dinlerken küçük bir kapsül gösterir; kaydettiği ses hiçbir zaman dizüstü bilgisayarı terk etmez:
Bulut transkripsiyonunun kötü olduğunu söylemiyorum — faydasını kanıtladığı durumlar için ileride savunacağım. Pazarlama sözcüğü "gizli"nin genellikle yüklemenin yokluğunu değil yüklemenin kilidini tanımladığını söylüyorum. Yalnızca buluta dayanan dikte, bir gizlilik felaketi olma yolunda ilerler; bunu ilk hissedenlerin faturaya bakma şansı yoktur. Bir keresinde bir ekibin tek çeyrekte beş haneli bulut-yapay zeka faturası biriktirdiğini izledim; çoğunlukla aynı standup kayıtlarını dört kez yeniden gönderen bir "akıllı yeniden deneme" hatasından kaynaklanıyordu. CFO çeyrek değerlendirmesinde panoyu açtığında oda aniden çok sessizleşti. Kimse tüm o sesi bir sunucuya göndermeye karar vermemişti. Araç her seferinde öyle yaptı, çünkü bu onun çalışma şekliydi.
Yerel ses-yazı dönüşümü gizliliği nasıl sağlar?
Gizli sürüm tamamen kendi makinenizde çalışır. Bir kısayol tuşuna basarsınız, konuşursunuz, bırakırsınız; kendi RAM'inize yüklenmiş bir model sesi metne çevirir ve imlecinizdeki konuma yapıştırır — internet yok, sunucu yok, gönderilen hiçbir şey yok. Apple Silicon'lu bir Mac veya Windows 10 ya da daha yeni bir bilgisayar, çalışan bir mikrofon ve birkaç dakikanız yeterli. Yerel boru hattının tamamı, kayıt sırasında ödeme yöntemi istenmeksizin oturum açmış her hesap için ücretsizdir. İşte adımlar.
Adım 1 — Whisper'ı yükle ve giriş yap.
İndirme sayfasından indirin, yükleyin ve ücretsiz bir hesap oluşturun. Kart gerekmez. Yerel transkripsiyon boru hattının tamamı hemen, çevrimdışı açılır.
Uygulamanın tepsi simgesi belirdiğinde ve kurulum sihirbazı model seçimi sunduğunda işe yaradığını anlarsınız.
Adım 2 — Yerel transkripsiyon yolunu seç.
Uygulama sizin yerinize seçim yapmaz. Gizli, çevrimdışı dikte için Yerel Parakeet veya Yerel Whisper'ı seçin — ikisi de kendi makinenizde çalışır. Üçüncü seçenek olan Cloud ses yükler; gizlilik önceliğinizse onu kapalı bırakın.
Yerel bir model indirmeyi bitirip hazır göründüğünde işe yaradığını anlarsınız.
Adım 3 — Kısayol tuşunu doğrula.
Windows'ta varsayılan Ctrl+Space, Mac'te ise push-to-talk olarak tutulan Command+Option'dır. Mac'te istendiğinde Erişilebilirlik iznini verin; vermezseniz imlece yapıştırma diğer uygulamalara erişemez.
Bir test kaydı herhangi bir metin alanına yapıştığında işe yaradığını anlarsınız.
Adım 4 — Ağ kablosunu çek, yine de konuş.
Bu, gizlilik testidir. Wi-Fi'yi kapatın, imlecini herhangi bir metin kutusuna getirin, kısayol tuşunu basılı tutun, bir cümle söyleyin, bırakın. Transkript yine görünür çünkü model yerel olarak çalıştı.
İnternet tamamen kapalıyken dikte çalışmaya devam ettiğinde işe yaradığını anlarsınız.
Yavaş olan kısım, açıkçası internet gerektiren tek seferlik model indirmesidir. Sonrasında yerel modda ses bir daha çevrimiçi gitmez. Dördüncü adımdaki kabloyu çekme testi bir numara değil — tek geçerli kanıt o. Ağ kapalıyken dikte çalışmaya devam ediyorsa ses cihazınızda metne çevriliyor demektir, nokta. Duruyorsa bir yerlere gidiyordu. Bu tek test, her pazarlama sayfasındaki her "gizli" iddiasını kesip atar.
YZ temizliği bile makinenizde kalabilir
İşte çoğu kişinin sormayı düşünmediği kısım bu. Ham dikte bir yığın olarak çıkar — noktalama yok, arada bir "ee", dağılıp giden cümleler. Çözüm, metni gerçekten saklayabileceğiniz bir şekle düzelten bir YZ geçişidir. Ve "gizli" yerel araçların pek çoğunun sessizce işlemi buluta aktardığı tam da bu noktadır: cihazda transkrip ederler, ardından dağınık transkripi temizlik için bir bulut modeline gönderirler. Ses gizli kaldı; kelimeler kalmadı.
Whisper temizliği yerel olarak da halleder; bunun için Ollama kullanır — makinenizde localhost'ta oturan ve internete hiç dokunmayan ücretsiz bir yerel model çalıştırıcısı. "Hey whisper" etkinleştirme ifadesini söyleyin; metin imlecinizdeki konuma düşmeden önce iyileştirilir; tüm gidiş-dönüş dizüstü bilgisayarınızın içinde gerçekleşir. Zincir bütün kalır: sesiniz cihazınızda metne dönüşür ve bu metin cihazınızda temizlenir. Cümle hakkındaki hiçbir şey — ses, taslak, düzeltilmiş sürüm — hiçbir zaman dışarı çıkmaz.
Bu, kendini gizli olarak nitelendiren herhangi bir araçta kontrol edeceğim ayrıntıdır. Transkripsiyonu yerel tutmak ve iyileştirmeyi buluta kaçırmak kolaydır çünkü iyileştirme büyük bir model gerektiren kısımdır ve büyük modelleri kiralamak cazip gelir. Sıkıcı gerçek şu: günlük dikte için Ollama üzerinden yerel bir model noktalamayı düzeltmek ve doldurucu kelimeleri temizlemek için fazlasıyla yeterlidir. Gerçekten daha zorlu bir şey istediğinizde bulut modeline ihtiyaç duyarsınız; bu sizin bilinçli yapmanız gereken bir seçimdir — arka planda araç sizin yerinize yaptığı değil.
Yerel mi yoksa bulut mu: gizli bir iş akışı için hangi mod?
Gizli saydığınız her şey için yerel ile başlayın. Mac'iniz Apple Silicon'luysa veya bilgisayarınız son birkaç yıldan biriyse, yerel motorlar günlük diktede şikâyetsiz üstesinden gelir; bulut ise varsayılan değil kaçış kapısı hâline gelir. Uygulama sizi kasıtlı olarak bir yol seçmeye zorlar — varsayılanı dayatmaz — işte üçünün gizlilik açısından nasıl farklılaştığı:
Seçim, sesin nerede işlendiğine ve transkripten ne beklediğinize bağlıdır.
- Yerel Parakeet — NVIDIA'nın TDT motoru, yaklaşık 600 MB ve en hızlı yerel seçenek — CPU'da Whisper'dan 5 ila 10 kat hızlı. İngilizce artı 24 başka Avrupa dili olmak üzere toplamda 25 dil. İngilizceye çeviri yok. Tamamen cihazda, hiçbir şey yüklenmiyor. İngilizce ya da başka bir Avrupa dili konuşuyorsanız hızlı gizli seçim.
- Yerel Whisper — Aynı makinede Parakeet'ten yavaş, ancak çok dilli derlemeler 99 dili kapsar ve İngilizceye çevirebilir. Yalnızca İngilizce derlemeler İngilizce içindir, 99 dil için değil. Aynı şekilde tamamen cihazda. Parakeet'in yapamadığı Çince, Japonca, Korece veya herhangi bir çeviri işi için bunu seçin. Varsayılan İngilizce model yaklaşık 480 MB.
- Bulut (OpenAI, BYOK) — En iyi doğruluk ve web erişimi; OpenAI tarafından doğrudan faturalandırılan kendi OpenAI anahtarınızla. Transkripsiyon varsayılan olarak gpt-4o-mini-transcribe kullanır. Bu, sesinizi yükleyen tek yoldur — OpenAI'ye ulaşmak için makinenizi terk eder. Katılım gerektirir, Whisper Pro'nun bir parçasıdır ve siz açmadıkça kapalı kalır.
Sınır nettir: iki yerel yol yapısal olarak gizlidir — ses cihazınızda metne çevrilir ve sızdıracak hiçbir şey yoktur. Bulut yolu değildir ve bunu gizlemeye çalışmıyoruz. Sesinizi OpenAI'ye kendi anahtarınızla gönderir çünkü OpenAI'nin doğruluğunu ve canlı web erişimini almanın tek yolu budur. Mac'iniz M serisi ya da bilgisayarınız yeniyse, yerel modla başlayın ve yalnızca yerel gerçekten yetersiz kaldığında buluta uzanın. Bulut, miras aldığınız varsayılan değil, kendinizin seçtiği istisnadır.
Her modda makinenizden gerçekte ne çıkıyor?
Veri konusunda somut olalım çünkü "gizli" sözcüğü neyin iletildiğini adlandırmadan anlamsız kalır. Yerel modda yanıt hiçbir şeydir — ses değil, transkript değil, temizlenmiş sürüm de değil. Kayıt RAM'inizde işlenir, temizlik Ollama aracılığıyla makinenizde çalışır; gerçekten hareket eden tek şey modelinizden metin kutunuza geçen kelimelerdir. Ağ bağlantısını keserek bunu doğrulayabilirsiniz.
YZ temizliği çalıştığında, yerel model akışkan olmayan metni okunabilir hâle getirirken katman bir iyileştirme durumu gösterir. İşte yaptığı dönüşüm türü — üstte ham dikte, altta temizlenmiş metin — yerel moddayken bunların tümü cihazınızda gerçekleşir:
okay so send the q3 numbers to marcus before the board call and flag the margin dip um but dont cc the whole finance list
Okay, so send the Q3 numbers to Marcus before the board call and flag the margin dip — but don't cc the whole finance list.
Bulut modunda dürüst hesap farklıdır ve anahtarı çevirmeden önce bunu bilmeniz gerekir. Sesiniz, kendi API anahtarınızla orada metne çevrilmek için OpenAI'nin transkripsiyon uç noktasına yüklenir. Bulut YZ iyileştirmesini de kullanıyorsanız transkript bir GPT modeline gider; web araması kullanıyorsanız bir sorgu da dışarı çıkar. Hiçbiri Remskill üzerinden geçmez — kendi anahtarınızla makinenizden OpenAI'ye doğrudan bir hat — ama makinenizi terk eder ve bir şeyin gizli olup olmadığını tanımlayan tek şey budur. Q3 rakamları ve Marcus hakkındaki o cümle tam da yerel tutacağım türden bir şeydir. Eğlence olsun diye dikte ettiğim bir tarif için gerçekten umursamam.
Aynı konuş-sonra-temizle akışı her uygulamada çalışır; kurulumu tamamladıktan sonra sesinizle daha hızlı yazabilirsiniz düzenleyicinizde, e-postanızda ve terminalinizde — yerel modda hiçbir şey dizüstü bilgisayarı terk etmeden, gizlice.
Sesi buluta göndermek ne zaman adil bir değiş tokuştur?

Yerel her zaman cevaptır desem yalan söylemiş olurum. Bazen bulut doğru tercihtir; bunu gizlilik açısından sunmak için görmezden gelmek, son altı bölümde şikâyet ettiğim pazarlama sahtekârlığının ta kendisi olur. Değiş tokuş gerçektir: makinenizi asla terk etmeme garantisinden vazgeçersiniz ve aynı kısayol tuşuyla mevcut en iyi transkripsiyon doğruluğunu ve canlı web erişimini elde edersiniz.
İçerik hassas değilken doğruluk önemliyse bulut moduna uzanın. Bir podcast transkripi, herkese açık bir blog taslağı, bir alışveriş listesi, yerel modelin tökezlediği ağır aksanlı veya gürültülü bir ortamdaki zorlu bir kayıt — bunların hiçbirinin makinenizde kalması gerekmez ve OpenAI'nin modelleri daha temiz sonuç verecektir. Kendi API anahtarınızı kullandığınız için ses doğrudan OpenAI'ye gider ve dakika başı maliyet aracı kâr marjı olmadan size düşer. Kalite için ödeme yaptığınız hassas olmayan işler için bu mantıklı bir değiş tokuştur. Hata bulut kullanmakta değil — sunucuda olmasını asla istemeyeceğiniz şeyler dahil her şey için bulut modunu varsayılan hâle getirmektedir.
Gerçekten kısa içerikler için ise özel bir araç kurmayı tamamen atlayın. 30 kelimelik bir metin dikte ediyorsanız Windows tuşu + H veya macOS Dikte ücretsiz ve zaten kurulu — ancak Windows Sesli Yazma'nın bir bulut hizmeti olduğunu, dolayısıyla gizli seçenek değil pratik seçenek olduğunu unutmayın. Apple Silicon'da macOS Dikte kısa metinleri cihazda işleyebilir; bu da onu kısa pasajlar için gerçekten gizli olan tek yerleşik uygulama yapar. 200 kelime sınırının altında herhangi bir şey kurmanızı tavsiye etmeyeceğim. Özel araç; notlar uzadığında, Windows'ta çevrimdışı gizlilik istediğinizde veya her yerde aynı davranan tek bir kısayol tuşu istediğinizde değerini kanıtlar.
Ağırlıklı olarak gizlilik garantisi için bir araç seçiyorsanız, bu argümanın daha derin versiyonu çevrimdışı ses-yazı dönüşümü kılavuzunda yer alıyor ve ağ bağlantısı kesiliyken her şeyi nasıl çalıştıracağınızı anlatıyor.
"Gizli", bu kategorideki en fazla kullanılan ve test edilmesi en kolay sözcüktür: ağı çıkarın ve hâlâ çalışıp çalışmadığına bakın. Yerel Whisper ve Parakeet bu testi geçer çünkü ses makinenizi hiçbir zaman terk etmez; YZ temizliği de geçer çünkü Ollama tam orada yanı başlarında çalışır. Bulut modu kasıtlı olarak başarısız olur çünkü OpenAI'nin doğruluğunu kiralıyor; bu da doğru iş için adil bir değiş tokuş. Bu kılavuzun büyük bölümünü Wi-Fi kapalıyken dikte ettim; bu ya güçlü bir ürün demosu ya da daha fazla dışarı çıkmam gerektiğinin işareti. İkisi de doğru olabilir.
Hemen gizlice dikte etmeye başlayın
Yerel bir model seçin, ağı çıkarın ve konuşun. Transkript imlecinizdeki konuma düşer — sesiniz dizüstü bilgisayarı hiç terk etmedi.
Oturum açmış her hesap için ücretsiz yerel mod. Başlamak için kart gerekmez.



