Yazan: Denys Medvediev

Rehber

Sesle yazma yazılımı: ücretsiz yerleşik seçenekler vs. ücretli araçlar

En iyi sesle yazma yazılımlarından bazıları zaten bilgisayarınızda yüklü. Hangisini ne zaman kullanmanız gerektiğini ve özel bir uygulamaya para ödemenin gerçekten ne zaman mantıklı olduğunu anlatıyoruz.

Son güncelleme: Haziran 2026

Aydınlık bir ofis masasında, eller serbest sesle yazma için hazırlanmış şık bir dizüstü bilgisayar ve bir bardak su

Sesle yazma yazılımı mikrofondan sizi dinler ve söylediklerinizi yazıya döker; konuşmayı dakikada yaklaşık 145 kelime hızında düzenlenebilir metne çevirir, oysa klavyeyle yazmak dakikada yaklaşık 40 kelimedir. İyi araçlar sistem genelinde çalışır, böylece kelimeler doğrudan imlecin olduğu yere düşer. Bazıları ücretsizdir ve Windows ile Mac'e gömülüdür; ücretli uygulamalar ise çevrimdışı mod ve yapay zekâ ile metin düzeltme ekler.

Konuşun, kelimeler imlecinizin olduğu yere düşsün

İlk kez çalıştığında küçük bir sihir numarası gibi geliyor. Bir tuşa basıyorsunuz, bir cümle söylüyorsunuz, tuşu bırakıyorsunuz ve cümle çoktan e-postanızda. Klavye yok. Genç bir akrabam, ben daha dikteyi anlatmayı bitirememişken büyükannesine 90 kelimelik bir not dikte etmişti. Zor olan asla konuşmak değildi. Yirmi yıl boyunca zor olan, yazılımın güvenecek kadar iyi olmasıydı ve bu kısım nihayet çözüldü.

Bu yazı, zaten sahip olduğunuz ücretsiz seçenekler de dahil olmak üzere, hangi sesle yazma yazılımının vaktinize değdiğiyle ilgili.

Pasted
Whisper'ın katmanı bir dikteyi tamamlıyor — metin imlecinizin olduğu yere yapışıyor.

Klavyeye mahkûm çoğu insan bunu ihtiyaçtan değil, alışkanlıktan yapıyor. Yazmak öğrenilmiş bir uzlaşma; düşünceleri kafanızdan çıkarıp kulağı olmayan bir makineye aktarmanın bir yolu. Sesle yazma yazılımı bu uzlaşmayı ortadan kaldırıyor. Soru, yaklaşık 2022'de artık çalışıp çalışmadığı olmaktan çıktı ve hangisi olduğuna, paraya ihtiyacım olup olmadığına dönüştü.

Dürüst cevap üç şeye bağlı: ne kadar uzun dikte ediyorsunuz, her uygulamada çalışmasını istiyor musunuz ve kelimelerinizin dizüstü bilgisayarınızdan asla ayrılmamasını önemsiyor musunuz. Bu yazının sonunda size hangi yolun uyduğunu bileceksiniz ve ücretsiz yerleşik seçeneğin tek ihtiyacınız olduğu durumu da söyleyeceğim. Bu uygulamanın destek e-postalarının çoğunu ben okuyorum ve bunların düzenli bir kısmı, makinelerinde zaten bulunan araç işi görecekken bir araca para ödeyen insanlardan geliyor. Yani sizi bir satın almadan vazgeçirmekte küçük bir çıkarım var.

Sesle yazma yazılımı nedir

Konuşmanın veri olarak yakalanışını gösteren, canlı bir ses dalgasıyla bir dijital ses arayüzünün yakın çekimi

Sesle yazma yazılımı, mikrofonunuzdan sesi yakalayan ve bir konuşma tanıma modeli kullanarak bunu yazılı metne çeviren bir programdır. Eski adı dikte yazılımıdır. Daha yeni pazarlama adı ise yapay zekâ diktesi; bu da çoğunlukla aynı şeyin üstüne, noktalama ve tonu düzeltmek için bir dil modeli iliştirilmiş hâli demek.

Üç biçimde karşınıza çıkar. Yerleşik dikte işletim sisteminizle gelir: Windows Sesle yazma, Apple Dictation. Tarayıcı tabanlı sesle yazma, Google Dokümanlar Sesle yazma gibi tek bir uygulamanın içinde yaşar. Özel masaüstü uygulamaları ise ayrıca kurulur ve yazdığınız her yerde çalışır. Biçim, markadan daha önemlidir. Yalnızca Google Dokümanlar içinde yazan bir tarayıcı aracı, doğruluğu ne kadar iyi olursa olsun Slack mesajlarınız için işe yaramaz. Herhangi bir araç hakkında sorulacak ilk soru, ne kadar doğru olduğu değil, nerede yazmanıza izin verdiğidir. Doğruluk artık çoğu araç için çözülmüş bir mesele; erişim ise değil.

Ciddi bir aracı oyuncaktan ayıran şey, nereye yapıştırdığıdır. Yerleşik ve özel masaüstü araçları sistem genelidir: kısayol tuşuna herhangi bir metin alanında basın, metin orada belirir. Bütün oyun bundan ibaret. Geri kalan her şey — doğruluk, diller, yapay zekâ düzeltmesi — baktığınız yere yazıp yazmadığının üzerine eklenen birer rötuştur.

Kategorileri ayıran ikinci bir şey daha var: modelin ne duyabildiği. Bazı araçlar yalnızca İngilizce'yi işler. Diğerleri onlarca dili işler ve cümlenin ortasında dil değiştirebilir. Whisper'ın yalnızca İngilizce modelleri tam olarak tek bir dili desteklerken, çok dilli sürümleri 99 dili kapsar. NVIDIA'nın Parakeet'i 25 dille — İngilizce artı 24 Avrupa dili — ortada bir yerde durur. Hayatınızda yalnızca İngilizce yazıyorsanız bunların hiçbiri önemli değil ve seçiminizi hız üzerinden yapmalısınız. Öğleden önce iki dilde taslak hazırlıyorsanız çok önemli. Çoğu insan kaç dile ihtiyaç duyduğunu abartır ve gecikmeyi ne kadar önemsediğini hafife alır. Tuşu bıraktıktan sonra metnin görünmesine kadar geçen gecikme, her seferinde hissettiğiniz şeydir.

Kategori hakkında okumaktansa sistem genelindeki sürümün çalışırken görmeyi tercih ederseniz, Whisper sesle yazma sayfası ücretsiz yerel motorlar dahil, Windows ve Mac'te kısayol-tuşu-tut döngüsünü gösterir.

Nasıl çalışır (ve doğruluk neden nihayet iyileşti)

Kaputun altında bu süreç üç adımdan oluşur. Mikrofonunuz kısa bir ses klibi kaydeder. Bir konuşma tanıma modeli o sesi metne çevirir. Ardından metin yapıştırılır, bazen bir dil modeli onu düzenledikten sonra.

CancelTranscribing
Whisper transkripsiyonun ortasında — konuşma modeli sesi metne çeviriyor.

Herkesin fark ettiği doğruluk sıçraması, ortadaki modelden geldi. OpenAI'nin açık kaynaklı Whisper modeli, iyinin anlamını değiştirdi. Aksanları, arka plan gürültüsünü ve çok dilli sürümlerinde 99 dili, herhangi bir eğitim adımı olmadan işliyor. İşte o son kısım, sessiz devrim. Modern sesle yazma yazılımına sesinizi öğretmiyorsunuz. Kuruyorsunuz ve konuşuyorsunuz.

Bunun bilim kurgu olduğu zamanları hatırlayacak kadar yaşlıyım. 1990'ların sonlarında bir akrabam, 64 MB RAM'li bir Windows 98 masaüstünde Dragon NaturallySpeaking çalıştırıyordu. Kurulum, yazılımın sesinize göre ayar yapabilmesi için 45 dakika boyunca bir kelime listesini sesli okumak demekti. Sonra çalışıyordu, ucu ucuna, belki %70 doğrulukla, cümle başına dört saniyelik bir gecikmeyle. Bir bayram mektubunun tek paragrafını dikte etmek on beş dakika sürüyordu. Kulaklık odanın öbür ucuna fırlatıldı. Kulaklık hayatta kaldı; deney kalmadı. Yirmi beş yıl sonra aynı iş doksan saniye ve sıfır eğitim sürüyor. Donanım, fikre yetişti.

Bugün ortadaki adımın iki çeşidi var. Yerel işleme, modeli kendi bilgisayarınızda çevrimdışı çalıştırır, böylece sesiniz makineden asla ayrılmaz; tıpkı çevrimdışı konuşmadan metne özelliğinin çalıştığı gibi. Bulut işleme ise sesi bir sunucuya gönderir; bu, zayıf donanımda daha hızlı olabilir ama kelimelerinizin yolculuk ettiği anlamına gelir. Hangisini istediğiniz, neyi dikte ettiğinize bağlı. Alışveriş listesi mi, kimin umurunda. Müşterinizin sözleşmesi mi, belki biraz umurunuzda.

Üçüncü adım, yani düzeltme, yapay zekâ diktesindeki yapay zekânın yaşadığı yer. Ham transkripsiyon size paragraf boşlukları olmayan bir kelime duvarı ve arada bir 'ıı' verir. Bir dil modeli noktalamayı düzeltebilir, dolgu sözcükleri atabilir ve hatta istediğiniz tonu yakalayabilir. Whisper by Remskill'de bu adım isteğe bağlıdır ve yerel olarak Ollama üzerinden ya da Pro'yu açarsanız kendi OpenAI anahtarınızla bulutta çalışır. Bunu sesle de tetikleyebilirsiniz: etkinleştirme ifadesini, şu an 'Hey whisper', söylersiniz ve metin ham olarak yapıştırılmak yerine modele teslim edilir. Bunların hiçbiri ana numarayı değiştirmez. Yalnızca kelimelerin geldiğinde ne kadar cilalı olacağına karar verir.

Zaten sahip olduğunuz ücretsiz seçenekler: Windows Sesle yazma, Apple Dictation, Google Dokümanlar

Herhangi bir şeye para ödemeden önce, makinenizde zaten neyin olduğuna bir bakın. Üç ücretsiz yerleşik seçenek epey geniş bir alanı kapsıyor.

Windows · Win + H

Listening…

macOS · Dictation

Docs · Voice typing

Click to speak
Bilgisayarınızda zaten bulunan dikte, iki çeşitte — kurulum gerekmez.

Windows Sesle yazma

Windows 11'de herhangi bir metin kutusunda Windows logo tuşu ile H'ye basın; bir sesle yazma çubuğu belirir. Hızlı mesajlar için iyidir. Sorun şu: tanıma bulutta gerçekleştiği için çalışmak üzere bir internet bağlantısına ve çalışan bir mikrofona ihtiyaç duyar. Microsoft'un listesine göre 43 dili destekler. Trende çevrimdışıysanız çalışmayı durdurur. Windows'ta sesten metne rehberimizde tam bir adım adım anlatım var.

Apple Dictation

Mac'te bunu Sistem Ayarları, Klavye, Dikte'den açın, ardından mikrofon tuşuyla ya da seçtiğiniz kısayolla başlatın. Güncel sürüm her uzunlukta metni yazıya döker ve sabit bir süre sınırından sonra değil, yalnızca 30 saniye sessizlikten sonra durur. Apple Silicon'da konuşmanızı cihaz üzerinde işleyebilir. Kısa notlar için ücretsiz ve gayet iyidir; daha uzun kurulum ise Mac'te sesten metne yazısında.

Google Dokümanlar Sesle yazma

Chrome, Edge veya Safari'de bir Google Dokümanı açın, Araçlar'a, ardından Sesle yazma'ya tıklayın; bir mikrofon kutusu belirir. 100'den fazla dili ve bölgesel varyantı destekler. Sert sınır tam adında saklı: yalnızca Google Dokümanlar ve Slaytlar içinde yazar. E-postanızı, Slack'inizi ya da kodunuzu yazmaz.

Bu üçünü dürüstçe okumanın yolu şu: bunlar gerçek araçlar, demo değil ve insanların büyük bir kısmı için aramanın sonu. Nerede durdukları ise öngörülebilir. Windows Sesle yazma, sinyali kaybettiğiniz an ölür. Google Dokümanlar Sesle yazma belgeden asla çıkmaz. Apple Dictation Mac'te mükemmel, başka her yerde yok. İşiniz bu sınırların içine sığıyorsa işiniz bitti. Bu sekmeyi kapatın ve tuşa basın. Ücretli kategori, sığmayan işler için var: gün boyu dikte, uçakta çevrimdışı, tek değil her uygulama ve kendi diskinizde kalması gereken ses.

Özel bir uygulamayı ne zaman atlayıp yerleşik olanı kullanmalı

İşte çoğu en-iyi-yazılım yazısının atladığı kısım. Kısa mesajlar gönderiyorsanız — 30 kelimelik bir mesaj, hızlı bir Slack yanıtı — makinenizde zaten bulunan ücretsiz dikte tek ihtiyacınız olan şey. Windows Sesle yazma (Windows tuşu + H) ve Apple Dictation ücretsiz, yerleşik ve çalışıyorlar. Tek bir cümle yazmak için hiçbir şey kurmayın ya da paraya ödemeyin. Özel bir uygulama, sık dikte ettiğinizde, uçakta çevrimdışı çalışmasına ihtiyaç duyduğunuzda, tek değil her uygulamada istediğinizde ya da kelimelerinizin cihazınızda kalmasını önemsediğinizde yerini hak etmeye başlar. Bu eşiğin altında, sıkıcı gerçek şu ki doğru araca zaten sahipsiniz.

Whisper by Remskill'in maliyeti

Whisper by Remskill, tüm yerel süreç için oturum açmış her kullanıcıya ücretsiz: yerel Whisper, Parakeet, Ollama tabanlı yapay zekâ düzeltmesi, geçmiş, özel kısayol tuşu, model indirmeleri ve kaydolmak için herhangi bir ödeme yöntemi gerekmiyor. Whisper Pro, Bulut yüzeyini ekliyor: OpenAI bulut transkripsiyonu, bulut yapay zekâ geliştirmesi ve kendi OpenAI anahtarınız üzerinden sesli web araması. Bulut modu sizi doğrudan OpenAI üzerinden faturalandırır; biz hiçbir pay almıyoruz. Güncel planlar ve Pro denemesi fiyatlandırma sayfasında. Burada size rakamlar sıralamayacağım; bunu sayfa bir paragraftan daha iyi yapıyor.

İleri okuma

Akrabam 1999'da bir kulaklığı odanın öbür ucuna fırlattı çünkü dikte, çöp üreten 45 dakikalık bir angaryaydı. Kulaklık deneyden daha uzun yaşadı. Yirmi beş yıl sonra angarya yok oldu. Bir tuşa basıp konuşuyorsunuz ve kelimeler beliriveriyor. Geriye kalan tek gerçek karar hangi araç ve birçok kişi için doğru cevap, kapalı hâlde, beklerken, çoktan makinelerinde duruyor. Kendi çocuklarım bunun bir zamanlar zor olduğunu asla bilmeyecek; amaç da bu zaten, akşam yemeği masasında daha kötü bir hikâye çıksa bile.

Önce zaten sahip olduğunuzu deneyin

Yetersiz kalırsa, Whisper'ı indirin ve çalışma şeklinize uyan motoru seçin.

Tüm yerel süreçte oturum açmış kullanıcılar için ücretsiz. Kayıtta kart yok.

Denys Medvediev'in fotoğrafı

Denys Medvediev

Destek e-postalarımızı okuyan kişi benim, büyük olasılıkla yanıtları dikte ederek.