Rehber
Sesle yazma yazılımı: ücretsiz yerleşik seçenekler vs. ücretli araçlar
En iyi sesle yazma yazılımlarından bazıları zaten bilgisayarınızda yüklü. Hangisini ne zaman kullanmanız gerektiğini ve özel bir uygulamaya para ödemenin gerçekten ne zaman mantıklı olduğunu anlatıyoruz.
Son güncelleme: Haziran 2026

Sesle yazma yazılımı mikrofondan sizi dinler ve söylediklerinizi yazıya döker; konuşmayı dakikada yaklaşık 145 kelime hızında düzenlenebilir metne çevirir, oysa klavyeyle yazmak dakikada yaklaşık 40 kelimedir. İyi araçlar sistem genelinde çalışır, böylece kelimeler doğrudan imlecin olduğu yere düşer. Bazıları ücretsizdir ve Windows ile Mac'e gömülüdür; ücretli uygulamalar ise çevrimdışı mod ve yapay zekâ ile metin düzeltme ekler.
Konuşun, kelimeler imlecinizin olduğu yere düşsün
İlk kez çalıştığında küçük bir sihir numarası gibi geliyor. Bir tuşa basıyorsunuz, bir cümle söylüyorsunuz, tuşu bırakıyorsunuz ve cümle çoktan e-postanızda. Klavye yok. Genç bir akrabam, ben daha dikteyi anlatmayı bitirememişken büyükannesine 90 kelimelik bir not dikte etmişti. Zor olan asla konuşmak değildi. Yirmi yıl boyunca zor olan, yazılımın güvenecek kadar iyi olmasıydı ve bu kısım nihayet çözüldü.
Bu yazı, zaten sahip olduğunuz ücretsiz seçenekler de dahil olmak üzere, hangi sesle yazma yazılımının vaktinize değdiğiyle ilgili.
Klavyeye mahkûm çoğu insan bunu ihtiyaçtan değil, alışkanlıktan yapıyor. Yazmak öğrenilmiş bir uzlaşma; düşünceleri kafanızdan çıkarıp kulağı olmayan bir makineye aktarmanın bir yolu. Sesle yazma yazılımı bu uzlaşmayı ortadan kaldırıyor. Soru, yaklaşık 2022'de artık çalışıp çalışmadığı olmaktan çıktı ve hangisi olduğuna, paraya ihtiyacım olup olmadığına dönüştü.
Dürüst cevap üç şeye bağlı: ne kadar uzun dikte ediyorsunuz, her uygulamada çalışmasını istiyor musunuz ve kelimelerinizin dizüstü bilgisayarınızdan asla ayrılmamasını önemsiyor musunuz. Bu yazının sonunda size hangi yolun uyduğunu bileceksiniz ve ücretsiz yerleşik seçeneğin tek ihtiyacınız olduğu durumu da söyleyeceğim. Bu uygulamanın destek e-postalarının çoğunu ben okuyorum ve bunların düzenli bir kısmı, makinelerinde zaten bulunan araç işi görecekken bir araca para ödeyen insanlardan geliyor. Yani sizi bir satın almadan vazgeçirmekte küçük bir çıkarım var.
Sesle yazma yazılımı nedir

Sesle yazma yazılımı, mikrofonunuzdan sesi yakalayan ve bir konuşma tanıma modeli kullanarak bunu yazılı metne çeviren bir programdır. Eski adı dikte yazılımıdır. Daha yeni pazarlama adı ise yapay zekâ diktesi; bu da çoğunlukla aynı şeyin üstüne, noktalama ve tonu düzeltmek için bir dil modeli iliştirilmiş hâli demek.
Üç biçimde karşınıza çıkar. Yerleşik dikte işletim sisteminizle gelir: Windows Sesle yazma, Apple Dictation. Tarayıcı tabanlı sesle yazma, Google Dokümanlar Sesle yazma gibi tek bir uygulamanın içinde yaşar. Özel masaüstü uygulamaları ise ayrıca kurulur ve yazdığınız her yerde çalışır. Biçim, markadan daha önemlidir. Yalnızca Google Dokümanlar içinde yazan bir tarayıcı aracı, doğruluğu ne kadar iyi olursa olsun Slack mesajlarınız için işe yaramaz. Herhangi bir araç hakkında sorulacak ilk soru, ne kadar doğru olduğu değil, nerede yazmanıza izin verdiğidir. Doğruluk artık çoğu araç için çözülmüş bir mesele; erişim ise değil.
Ciddi bir aracı oyuncaktan ayıran şey, nereye yapıştırdığıdır. Yerleşik ve özel masaüstü araçları sistem genelidir: kısayol tuşuna herhangi bir metin alanında basın, metin orada belirir. Bütün oyun bundan ibaret. Geri kalan her şey — doğruluk, diller, yapay zekâ düzeltmesi — baktığınız yere yazıp yazmadığının üzerine eklenen birer rötuştur.
Kategorileri ayıran ikinci bir şey daha var: modelin ne duyabildiği. Bazı araçlar yalnızca İngilizce'yi işler. Diğerleri onlarca dili işler ve cümlenin ortasında dil değiştirebilir. Whisper'ın yalnızca İngilizce modelleri tam olarak tek bir dili desteklerken, çok dilli sürümleri 99 dili kapsar. NVIDIA'nın Parakeet'i 25 dille — İngilizce artı 24 Avrupa dili — ortada bir yerde durur. Hayatınızda yalnızca İngilizce yazıyorsanız bunların hiçbiri önemli değil ve seçiminizi hız üzerinden yapmalısınız. Öğleden önce iki dilde taslak hazırlıyorsanız çok önemli. Çoğu insan kaç dile ihtiyaç duyduğunu abartır ve gecikmeyi ne kadar önemsediğini hafife alır. Tuşu bıraktıktan sonra metnin görünmesine kadar geçen gecikme, her seferinde hissettiğiniz şeydir.
Kategori hakkında okumaktansa sistem genelindeki sürümün çalışırken görmeyi tercih ederseniz, Whisper sesle yazma sayfası ücretsiz yerel motorlar dahil, Windows ve Mac'te kısayol-tuşu-tut döngüsünü gösterir.
Nasıl çalışır (ve doğruluk neden nihayet iyileşti)
Kaputun altında bu süreç üç adımdan oluşur. Mikrofonunuz kısa bir ses klibi kaydeder. Bir konuşma tanıma modeli o sesi metne çevirir. Ardından metin yapıştırılır, bazen bir dil modeli onu düzenledikten sonra.
Herkesin fark ettiği doğruluk sıçraması, ortadaki modelden geldi. OpenAI'nin açık kaynaklı Whisper modeli, iyinin anlamını değiştirdi. Aksanları, arka plan gürültüsünü ve çok dilli sürümlerinde 99 dili, herhangi bir eğitim adımı olmadan işliyor. İşte o son kısım, sessiz devrim. Modern sesle yazma yazılımına sesinizi öğretmiyorsunuz. Kuruyorsunuz ve konuşuyorsunuz.
Bunun bilim kurgu olduğu zamanları hatırlayacak kadar yaşlıyım. 1990'ların sonlarında bir akrabam, 64 MB RAM'li bir Windows 98 masaüstünde Dragon NaturallySpeaking çalıştırıyordu. Kurulum, yazılımın sesinize göre ayar yapabilmesi için 45 dakika boyunca bir kelime listesini sesli okumak demekti. Sonra çalışıyordu, ucu ucuna, belki %70 doğrulukla, cümle başına dört saniyelik bir gecikmeyle. Bir bayram mektubunun tek paragrafını dikte etmek on beş dakika sürüyordu. Kulaklık odanın öbür ucuna fırlatıldı. Kulaklık hayatta kaldı; deney kalmadı. Yirmi beş yıl sonra aynı iş doksan saniye ve sıfır eğitim sürüyor. Donanım, fikre yetişti.
Bugün ortadaki adımın iki çeşidi var. Yerel işleme, modeli kendi bilgisayarınızda çevrimdışı çalıştırır, böylece sesiniz makineden asla ayrılmaz; tıpkı çevrimdışı konuşmadan metne özelliğinin çalıştığı gibi. Bulut işleme ise sesi bir sunucuya gönderir; bu, zayıf donanımda daha hızlı olabilir ama kelimelerinizin yolculuk ettiği anlamına gelir. Hangisini istediğiniz, neyi dikte ettiğinize bağlı. Alışveriş listesi mi, kimin umurunda. Müşterinizin sözleşmesi mi, belki biraz umurunuzda.
Üçüncü adım, yani düzeltme, yapay zekâ diktesindeki yapay zekânın yaşadığı yer. Ham transkripsiyon size paragraf boşlukları olmayan bir kelime duvarı ve arada bir 'ıı' verir. Bir dil modeli noktalamayı düzeltebilir, dolgu sözcükleri atabilir ve hatta istediğiniz tonu yakalayabilir. Whisper by Remskill'de bu adım isteğe bağlıdır ve yerel olarak Ollama üzerinden ya da Pro'yu açarsanız kendi OpenAI anahtarınızla bulutta çalışır. Bunu sesle de tetikleyebilirsiniz: etkinleştirme ifadesini, şu an 'Hey whisper', söylersiniz ve metin ham olarak yapıştırılmak yerine modele teslim edilir. Bunların hiçbiri ana numarayı değiştirmez. Yalnızca kelimelerin geldiğinde ne kadar cilalı olacağına karar verir.
Zaten sahip olduğunuz ücretsiz seçenekler: Windows Sesle yazma, Apple Dictation, Google Dokümanlar
Herhangi bir şeye para ödemeden önce, makinenizde zaten neyin olduğuna bir bakın. Üç ücretsiz yerleşik seçenek epey geniş bir alanı kapsıyor.
Windows · Win + H
macOS · Dictation
Docs · Voice typing
Windows Sesle yazma
Windows 11'de herhangi bir metin kutusunda Windows logo tuşu ile H'ye basın; bir sesle yazma çubuğu belirir. Hızlı mesajlar için iyidir. Sorun şu: tanıma bulutta gerçekleştiği için çalışmak üzere bir internet bağlantısına ve çalışan bir mikrofona ihtiyaç duyar. Microsoft'un listesine göre 43 dili destekler. Trende çevrimdışıysanız çalışmayı durdurur. Windows'ta sesten metne rehberimizde tam bir adım adım anlatım var.
Apple Dictation
Mac'te bunu Sistem Ayarları, Klavye, Dikte'den açın, ardından mikrofon tuşuyla ya da seçtiğiniz kısayolla başlatın. Güncel sürüm her uzunlukta metni yazıya döker ve sabit bir süre sınırından sonra değil, yalnızca 30 saniye sessizlikten sonra durur. Apple Silicon'da konuşmanızı cihaz üzerinde işleyebilir. Kısa notlar için ücretsiz ve gayet iyidir; daha uzun kurulum ise Mac'te sesten metne yazısında.
Google Dokümanlar Sesle yazma
Chrome, Edge veya Safari'de bir Google Dokümanı açın, Araçlar'a, ardından Sesle yazma'ya tıklayın; bir mikrofon kutusu belirir. 100'den fazla dili ve bölgesel varyantı destekler. Sert sınır tam adında saklı: yalnızca Google Dokümanlar ve Slaytlar içinde yazar. E-postanızı, Slack'inizi ya da kodunuzu yazmaz.
Bu üçünü dürüstçe okumanın yolu şu: bunlar gerçek araçlar, demo değil ve insanların büyük bir kısmı için aramanın sonu. Nerede durdukları ise öngörülebilir. Windows Sesle yazma, sinyali kaybettiğiniz an ölür. Google Dokümanlar Sesle yazma belgeden asla çıkmaz. Apple Dictation Mac'te mükemmel, başka her yerde yok. İşiniz bu sınırların içine sığıyorsa işiniz bitti. Bu sekmeyi kapatın ve tuşa basın. Ücretli kategori, sığmayan işler için var: gün boyu dikte, uçakta çevrimdışı, tek değil her uygulama ve kendi diskinizde kalması gereken ses.
Bilinmeye değer ücretli araçlar (Dragon, Wispr Flow, Superwhisper, Voicy, Whisper by Remskill)
Ücretsiz araçlar yetersiz kaldığında, gün boyu dikte ettiğinizde ya da çevrimdışı moda veya yapay zekâ düzeltmesine ihtiyaç duyduğunuzda, ücretli kategori devreye girer. İşte bilinmeye değer isimler, her biri için tek dürüst satırla.
Tüm alanı sırayla dizilmiş görmeyi tercih ederseniz, işte en iyi sesle yazma yazılımları, sıralanmış hâliyle.
Bunları kronometreyle karşı karşıya çalıştırmadım, o yüzden öyleymiş gibi yapmayacağım. Aşağıdaki isimleri üç şeye göre seçtim: belgelenmiş platform erişimi (gerçekte yazdığınız yerde çalışıyor mu), belgelenmiş çevrimdışı desteği (sesiniz makineden ayrılıyor mu) ve belgelenmiş dil kapsamı. Tabloda yalnızca her sağlayıcının yayımladığı gerçekler var; hızı ve doğruluğu dışarıda bıraktım çünkü hepsini kapsayan tarafsız bir kıyaslama yok ve böyle bir tane uydurmak, tam da sizi vazgeçirmeye geldiğim şey olurdu.
| Araç | Platform | Yerel / Bulut | Çevrimdışı çalışır | Fiyatlandırma modeli | Diller | En uygun olduğu durum |
|---|---|---|---|---|---|---|
| Windows Sesle yazma | Windows 11 | Bulut | Hayır | Ücretsiz, yerleşik | 43 | Bağlı bir bilgisayarda hızlı mesajlar |
| Apple Dictation | macOS | Apple Silicon'da yerel | Evet (Apple Silicon) | Ücretsiz, yerleşik | Onlarca | Mac'te kısa notlar |
| Google Dokümanlar Sesle yazma | Tarayıcı | Bulut | Hayır | Ücretsiz, tarayıcı özelliği | 100+ | Yalnızca Google Dokümanlar içinde yazmak |
| Dragon by Nuance | Windows | Yerel | Evet | Ücretli, tek seferlik lisans | İngilizce odaklı | Windows'ta gün boyu dikte |
| Whisper by Remskill | Windows, macOS (Apple Silicon) | Yerel veya Bulut (kendi anahtarınız) | Evet (yerel motorlar) | Yerel ücretsiz, bulut için ücretli Pro | Whisper çok dilli ile 99 | Sistem geneli dikte, çevrimdışı, her uygulama |
Dragon by Nuance eski muhafız. Dragon Professional v16, ilk kullanımdan itibaren %99'a varan tanıma doğruluğuyla, yazmaktan üç kat daha hızlı dikteyi reklamını yapıyor ve Windows 11 için optimize edilmiş durumda. Bu %99, tarafsız bir kıyaslama değil, Nuance'ın kendi rakamı. Sorun şu: Dragon Professional yalnızca Windows için ve güncel bir Mac masaüstü sürümü yok.
Wispr Flow, Superwhisper ve Voicy yapay zekâ dikte uygulamalarının daha yeni dalgası. Bir konuşma modelini temiz bir arayüze sarıyor ve ton ya da biçimlendirme düzeltmesi ekliyorlar. Yetkinler. Bu kategorinin çoğunda örüntü aynı mimari — bir konuşma modeli, bir arayüz ve aylık bir fatura — ve en çok farklılaştıkları yer fatura. Faturanın canınızı acıtan kısım olduğu yer burasıysa, tüm yerel süreci sonsuza dek ücretsiz tutan dürüst bir superwhisper alternatifi yazdık.
Whisper by Remskill, bizim uygulamamız, Windows ve Apple Silicon'lı macOS için bir masaüstü aracı. Bir kısayol tuşuna basıyor, konuşuyorsunuz ve metin herhangi bir uygulamada imlecinizin olduğu yere yapışıyor. Varsayılan kısayol Windows'ta Ctrl+Space, Mac'te ise bas-konuş için bir Command+Option akoru — ikisini birden tutun, durdurmak için herhangi birini bırakın. Seçtiğiniz şey motor. Üç yoldan birini seçiyorsunuz: yerel NVIDIA Parakeet (~600 MB, CPU'da Whisper'dan 5–10× daha hızlı, İngilizce artı 24 Avrupa dili); yerel Whisper (sekiz model, çok dilli olanlarda 99 dil, İngilizce'ye çeviri); ya da bizden hiçbir pay alınmadan gpt-4o-mini-transcribe veya gpt-4o-transcribe için kendi OpenAI anahtarınızı kullanan Bulut modu. Tüm yerel transkripsiyon saf Rust'tır, Python yok. Daha geniş alanın tam karşılaştırması ise transkripsiyon yazılımı derlememizde.
Bu aynı zamanda tek görüşümün geldiği yer: önce yerel modu deneyin. Mac'iniz Apple Silicon'sa ya da bilgisayarınız son dört yıldan biriyse, günlük dikte için buluta ihtiyacınız yok. Yerel Parakeet modern donanımda iki saniyenin epey altında transkripsiyona başlıyor, sesiniz dizüstü bilgisayardan asla çıkmıyor ve bulut, varsayılan değil, OpenAI kalitesinde doğruluk veya web araması istediğinizde başvuracağınız bir çıkış kapısı. Ağa, bir duvara tosladığınızda uzanın, öncesinde değil. Refleks olarak daha büyük, daha gösterişli çözüme uzanan ve sonra kendini sakinleştiren türden bir mimar benim. Yerel-öncelik, kendimi alenen sakinleştirmem; böylece bir hafta boşa harcadığım kısmı atlayabilirsiniz.
Pratik gerekçe donanım. Modern bir dizüstü bilgisayarda zaten bir mikrofon ve bir konuşma modelini kendi başına çalıştıracak kadar hızlı bir işlemci var. Makinenizin çevrimdışı, iki saniyenin altında yapabileceği bir iş için bir paragraf sesi sunucuya gönderip geri almak, dizüstü bilgisayarların çok yavaş olduğu zamanlardan kalma bir alışkanlık. Artık değiller. Bulut, zor durumlarda hakkını veriyor: gürültülü bir oda, alışılmadık bir aksan, cevabınıza yapıştırılacak canlı bir web yanıtı gerektiren bir istek. E-posta, not ve sohbetin günlük akışı için ise yerel daha hızlı başlıyor, varsayılan olarak özel ve oturum açmış kullanıcılar için ücretsiz. Çıkış kapısı ihtiyacınız olduğunda orada; çoğu gün ona ihtiyacınız olmayacak.
Özel bir uygulamayı ne zaman atlayıp yerleşik olanı kullanmalı
İşte çoğu en-iyi-yazılım yazısının atladığı kısım. Kısa mesajlar gönderiyorsanız — 30 kelimelik bir mesaj, hızlı bir Slack yanıtı — makinenizde zaten bulunan ücretsiz dikte tek ihtiyacınız olan şey. Windows Sesle yazma (Windows tuşu + H) ve Apple Dictation ücretsiz, yerleşik ve çalışıyorlar. Tek bir cümle yazmak için hiçbir şey kurmayın ya da paraya ödemeyin. Özel bir uygulama, sık dikte ettiğinizde, uçakta çevrimdışı çalışmasına ihtiyaç duyduğunuzda, tek değil her uygulamada istediğinizde ya da kelimelerinizin cihazınızda kalmasını önemsediğinizde yerini hak etmeye başlar. Bu eşiğin altında, sıkıcı gerçek şu ki doğru araca zaten sahipsiniz.
Whisper by Remskill'in maliyeti
Whisper by Remskill, tüm yerel süreç için oturum açmış her kullanıcıya ücretsiz: yerel Whisper, Parakeet, Ollama tabanlı yapay zekâ düzeltmesi, geçmiş, özel kısayol tuşu, model indirmeleri ve kaydolmak için herhangi bir ödeme yöntemi gerekmiyor. Whisper Pro, Bulut yüzeyini ekliyor: OpenAI bulut transkripsiyonu, bulut yapay zekâ geliştirmesi ve kendi OpenAI anahtarınız üzerinden sesli web araması. Bulut modu sizi doğrudan OpenAI üzerinden faturalandırır; biz hiçbir pay almıyoruz. Güncel planlar ve Pro denemesi fiyatlandırma sayfasında. Burada size rakamlar sıralamayacağım; bunu sayfa bir paragraftan daha iyi yapıyor.
İleri okuma
Akrabam 1999'da bir kulaklığı odanın öbür ucuna fırlattı çünkü dikte, çöp üreten 45 dakikalık bir angaryaydı. Kulaklık deneyden daha uzun yaşadı. Yirmi beş yıl sonra angarya yok oldu. Bir tuşa basıp konuşuyorsunuz ve kelimeler beliriveriyor. Geriye kalan tek gerçek karar hangi araç ve birçok kişi için doğru cevap, kapalı hâlde, beklerken, çoktan makinelerinde duruyor. Kendi çocuklarım bunun bir zamanlar zor olduğunu asla bilmeyecek; amaç da bu zaten, akşam yemeği masasında daha kötü bir hikâye çıksa bile.
Önce zaten sahip olduğunuzu deneyin
Yetersiz kalırsa, Whisper'ı indirin ve çalışma şeklinize uyan motoru seçin.
Tüm yerel süreçte oturum açmış kullanıcılar için ücretsiz. Kayıtta kart yok.



