Rehber
Yazarlar için gerçek zamanlı dikte uygulaması
Yazarlar için gerçek zamanlı bir dikte uygulaması, söylediğiniz cümleyi kısa süre içinde imlecinizdeki yerine yerleştirir. Whisper ile bir kısayol tuşuna basılı tutup konuşuyor, bırakıyorsunuz; transkript, yazdığınız uygulamaya yapıştırılıyor. Yerel modellerde bu yaklaşık bir buçuk saniye sürüyor.
Son güncelleme: Haziran 2026

Yazarlar için gerçek zamanlı dikte uygulaması, konuşmayı metne çevirerek imlecin bulunduğu yere neredeyse anında yapıştırır. Whisper, basılı tut ve konuş yöntemiyle çalışır: kısayol tuşuna basılı tutun, bir cümle söyleyin, bırakın; transkript ekrandaki editöre yapıştırılır. Yerel modellerde tuşu bırakmaktan metne ulaşmaya kadar geçen süre yaklaşık 1,4 saniyedir. Çevrimdışı çalışır, ücretsizdir ve tüm masaüstü uygulamalarında kullanılabilir.
Whisper'ı geliştirmemin nedeni, yazarken en yavaş adımın klavye olmasıydı. Düşünmek değil, düzenlemek de değil — zihnimde çoktan tamamlanmış bir cümleye yetişmeye çalışan parmakların mekanik hareketi. Sesli yazma bunu çözüyor. Konuşurken dakikada yaklaşık 145 kelime söylüyorsunuz; klavyeyle belki 40. Bu fark, her şeyi özetliyor.
Ama "gerçek zamanlı" ifadesi ağır bir yük taşıyor ve yazarlara dikte satan çoğu sayfa yanlış bir şeyi hayal ettiriyor. Bu yüzden herhangi bir şey indirmeden önce, gerçek zamanlının burada gerçekte ne anlama geldiğini, gecikmenin nasıl hissettirdiğini ve bunun uzun yazı taslakları, blog yazıları, kurgu metinler veya ertelenmiş e-postalar gibi gerçek bir yazma sürecine nasıl uyduğunu açıkça anlatmak istiyorum.
Çoğu pazarlama sayfasının es geçtiği dürüst versiyonu şu: Whisper, basılı tut ve konuş yöntemiyle çalışır. Kısayol tuşuna basılı tutup tam bir ya da birkaç cümle söylüyor, sonra bırakıyorsunuz. Transkript, tuşu bıraktığınız anda imlecinizdeki yere yapıştırılır — konuşurken kelime kelime görünmez, tıpkı bir mahkeme steno monitörü gibi değil. Birim, hece değil; söylenen ifadedir.
Bu ayrım önemli çünkü doğru beklentiyi belirliyor. Kelimelerin ağzınızla eş zamanlı olarak sayfaya sürünerek geldiğini hayal ediyorsanız, bu canlı altyazı — farklı bir iş için farklı bir araç. Whisper'ın bir yazara sunduğu şey pratikte daha hızlıdır: bir düşünce söylüyorsunuz, ekranda beliriyor, bir sonrakini söylüyorsunuz. Yerel modelde gidiş-dönüş yaklaşık 1,4 saniye. İnsan bunu fark etmeyi bırakıp sadece yazmaya başladığında, iş tamamdır.
Bir yazar için "gerçek zamanlı" aslında ne demek?

Yazarlar diktaya yönelir çünkü ben de aynı nedenle yöneldim: taslak zihninizdedir ve klavye yolunuzu tıkıyor. İlk taslak hızlı ve ham olmalıdır. Klavye onu yavaş ve düzgün yapar; bu tam tersi. Konuşmak, dağınık versiyonu düşündüğünüz hızda aktarmanıza olanak tanır. Parmak gerektiren düzenleme aşaması ise sonra gelir.
Bu yüzden bir yazar "gerçek zamanlı dikte" araması yaptığında genellikle şunu ister: bir cümle söyle, bir sonrakini kaybetmeden ekrana düşsün. Gerçek ölçüt bu. Harf harf akan canlı bir yayın değil — iki saniyenin altında bir gecikme; düşünce buharlaşmadan kelimeler orada olsun. Whisper bunu sağlıyor. Kısayol tuşunu bıraktığınız andan metnin belgede görünmesine kadar geçen süre, M1 Air üzerindeki yerel bir modelde yaklaşık 1,4 saniye; daha büyük modelde orta seviye bir Windows makinesinde ise iki saniyenin biraz üstü. (Gecikme iki saniyeyi geçtiğinde akışın bozulduğunu gördüm — beyin ekrana yeniden bağlanıyor ve düşünce ipliği kopuyor. Bu yüzden o sayı benim takıntım.)
Yazarların istediği diğer şey ise belgeden hiç ayrılmamak. Uzun bir taslak bir akış halidir ve bu hal, ayrı bir transkripsiyon penceresi açmak, kayıt düğmesine basmak, beklemek, kopyalamak ve yapıştırmakla bozulur. Whisper, zaten içinde olduğunuz uygulamada imlecin bulunduğu yere yapıştırır — Scrivener, Word, tarayıcıda Google Docs, düz metin editörü, içerik yönetim sisteminiz. Pencere değiştirmiyorsunuz. Tuşa basıp yazmaya devam ediyorsunuz. Teknik olarak tuşu bırakınca yapıştırıldığı halde gerçek zamanlı hissettiren işte bu.
Kısayol tuşuna bas, konuş, bırak — metin kendiliğinden yapışır
Mekanizma sıkıcıdır; bir yazılıma verebileceğim en yüksek iltifat bu. Kısayol tuşuna basılı tutuyorsunuz, konuşuyorsunuz, bırakıyorsunuz; transkript o an odakta olan uygulamada imlecin bulunduğu yere yapıştırılıyor. Whisper, son kelimenin kesilmemesi için tuşu bıraktıktan sonra 250 milisaniyelik kısa bir kuyruk bırakır. İşletim sistemi imlecine yapıştırdığı için el yazmanız sadece "bir metin kutusudur." Scrivener, Final Draft, Word, tarayıcıda Substack taslağı — hepsi aynı şekilde çalışır, uygulamaya özel kurulum gerekmez.
Konuşurken küçük bir kapsül belirir; Whisper'ın dinlediğini anlarsınız. Ardından kısa bir transkripsiyon adımı gösterir ve kelimeler yerleşir. Döngünün tamamı bu. Alt+Tab yapacak ayrı bir uygulama penceresi yok, bulmanız gereken bir kayıt düğmesi yok, dışa aktaracak dosya yok. İmlecinizdeki paragrafta, konuşuyorsunuz, cümle paragrafta beliriyor:
Kısayol tuşunu erkenden doğru ayarlamak tek önemli şeydir. Windows'ta Ctrl+Space, Mac'te ise basılı tutarak konuştuğunuz sadece niteleyici tuşlardan oluşan Command+Option kombinasyonudur. Her ikisi de Ayarlar'dan değiştirilebilir; bu önemli çünkü birçok yazma uygulaması kendi kısayolları için tuş kombinasyonlarını kapıyor. (Küçük kızım bir keresinde çizim uygulamasında kısayolun "çalışmadığını" söyledi. Hata yoktu, çakışma vardı — böylece ortalama bir kullanıcının tuş çakışmasının ne olduğu hakkında hiçbir fikri olmadığını öğrendim. Bu yüzden şimdi her kısayol özelleştirilebilir.) Daha önce Windows'ta dikte ya da Mac'te kullandıysanız, aynı kas hafızası artık yazma uygulamanıza yönlendirilmiş demektir.
İki dakikada kurulum (Windows veya Mac)
Apple Silicon'lu bir Mac ya da Windows 10 veya üstü bir PC, çalışan bir mikrofon ve yazdığınız editörün açık olması yeterli. Tüm yerel süreç, giriş yapılmış her hesap için ücretsizdir; kayıt sırasında ödeme yöntemi istenmez. İşte adımlar.
Adım 1 — Whisper'ı yükleyip giriş yapın.
İndirme sayfasından indirin, yükleyin ve ücretsiz hesap oluşturun. Kart gerekmez. Yerel transkripsiyon süreci hemen açılır.
Uygulamanın sistem tepsisi simgesi belirince ve kurulum sihirbazı model seçmenizi isteyince işe yaradığını anlarsınız.
Adım 2 — Transkripsiyon yöntemini seçin.
Uygulama sizin yerinize seçim yapmaz. Üç seçeneğiniz var: Cloud (OpenAI, kendi anahtarınızı getirin), Local Parakeet veya Local Whisper. Metin taslağı oluşturmayı gizli tutmak istiyorsanız yerel ile başlayın — hangisini seçmeniz gerektiği iki bölüm sonra açıklanıyor.
Bir model indirmeyi tamamlayıp hazır göründüğünde işe yaradığını anlarsınız.
Adım 3 — Kısayol tuşunuzu onaylayın.
Windows'ta varsayılan Ctrl+Space, Mac'te ise basılı tutarak konuşulan Command+Option'dır. Mac'te sorulduğunda Erişilebilirlik iznini verin; bu izin olmadan imlece yapıştırma özelliği yazma uygulamanıza ulaşamaz.
Bir test kaydı herhangi bir metin alanına yapıştırıldığında işe yaradığını anlarsınız.
Adım 4 — İmleci taslağınıza koyun ve konuşun.
Belgeyi açın, sonraki cümleyi istediğiniz yere tıklayın, kısayol tuşuna basılı tutun, söyleyin, bırakın. Transkript, paragrafın ortasında dahi olsa imlecin bulunduğu yerde belirir.
Söylediğiniz cümle taslakta metin olarak oturduğunda işe yaradığını anlarsınız.
Yavaş olan kısım kurulum değil, model indirmesidir. Geri kalan her şey yukarıdaki dört adımdan ibarettir. Uygulama bir kez çalışmaya başladığında, sayfaya cümle aktarmak artık bir yazma görevi değil, konuşma görevi haline gelir. Uzun bir taslak için bu, bir öğleden sonra ile bir akşam arasındaki farkı yaratır.
Taslağı dikte etmek gerçekte nasıl hissettiriyor?
Metin dikte etmenin püf noktası, kelimesi kelimesine mükemmel metin dikte etmeyi bırakmaktır. Yeni yazarlar virgüller ve paragraf geçişleriyle konuşmaya çalışır; sonunda klavyeden de yavaş olurlar. Hızlı yol, bütün düşünceler halinde konuşmaktır — cümleyi bir arkadaşınıza söyler gibi söyleyin, bırakın, bir sonrakine geçin. İlk geçişin ham olmasına izin verin. Taslağı yakalıyorsunuz, dizgi yapmıyorsunuz. Yazarken doksan dakikamı alan 1.500 kelimelik bir blog yazısı, konuşarak yaklaşık yarısı kadar sürer; kazancın büyük bölümü cümle ortasında durup düzeltme yapmamaktan gelir.
Basılı tut ve bırak ritmi, yazarların gerçekte düşünme biçimine uyuyor. Bir düşünce için tuşa basılı tutuyorsunuz, bırakıyorsunuz, yerleşeni okuyorsunuz, sonraki cümleye karar veriyorsunuz, yeniden basıyorsunuz. Tuşa basmalar arasındaki duraklar düşünme zamanıdır, ölü zaman değil — sahnenin nereye gideceğine duvarı stare ederek karar verirken araç "ee"lerinizi kayıt etmiyor. Özellikle kurgu için bu, diyaloğun kafanızda nasıl duyulduğuna klavyeden çok daha yakındır; satırı seslendiriyorsunuz, sonra sayfada kesmek için elinizin altında oluyor.
Uzun oturumlar için iki pratik not. Birincisi, bir nefeste tüm paragraflar yerine birer iki cümlelik parçalar halinde dikte edin — kısa patlamalar daha hızlı yapışır ve yanlış çıkan kelimeyi düzeltmek kolaylaşır. İkincisi, mikrofonunuz tahmin ettiğinizden çok daha önemli. 20 dolarlık bir USB mikrofon, herhangi bir model yükseltmesinden daha fazla doğruluk sağlar; çünkü modelin gerçekte çalıştığı şey temiz ses kaydıdır. "Yapay zeka doğruluğu" satan hiç kimsenin öne çıkarmak istemediği sıkıcı gerçek bu. Kelimeler bu kadar hızlı akınca, tüm taslakları sesle yazabilir ve klavyeyi her zaman daha iyi olduğu şeye — düzenleme aracına — dönüştürebilirsiniz.
Yerel mi, bulut mu: çalışan bir yazar için hangi mod?
Taslak oluşturmak için önce yerel modu deneyin. Yarım kalmış bir el yazması, henüz göndermediğiniz bir sunum, günlük kaydı — bunların hiçbirinin metin haline gelmesi için dizüstü bilgisayarınızdan ayrılması gerekmiyor. Mac'iniz Apple Silicon'luysa veya PC'niz son birkaç yıl içinde alınmışsa, yerel günlük dikteyi sorunsuz kaldırır; bulut ise varsayılan değil kaçış kapısı olur. Uygulamanın sizi seçim yapmaya zorladığını söylediğim için, doğru seçimi yapmanızı isterim — üç yolun farkı şöyle:
- Local Parakeet — NVIDIA'nın TDT motoru, yaklaşık 600 MB ve en hızlı yerel seçenek — CPU'da Whisper'dan 5 ila 10 kat daha hızlı. İngilizce dahil 24 Avrupa dili olmak üzere toplam 25 dil destekler. İngilizceye çeviri yoktur. İngilizce veya başka bir Avrupa dilinde yazıyorsanız bu, hızlı, tamamen çevrimdışı tercihtir ve gecikmeyi düşük tutan seçenektir.
- Local Whisper — Aynı makinede Parakeet'ten yavaştır; ancak çok dilli sürümler 99 dili destekler ve İngilizceye çeviri yapabilir. Yalnızca İngilizce sürümler 99 dil değil, sadece İngilizce içindir. Çince, Japonca veya Korece yazıyorsanız (Parakeet bunları yapamaz), çeviriye ihtiyaç duyuyorsanız ya da karakter adları ve uydurma sözcükler için anahtar kelime yönlendirmesi istiyorsanız bunu seçin. Varsayılan İngilizce model yaklaşık 480 MB.
- Cloud (OpenAI, BYOK) — En iyi doğruluk ve web erişimi; kendi OpenAI anahtarınızı kullanırsınız, fatura doğrudan OpenAI'dan kesilir. Transkripsiyon varsayılan olarak gpt-4o-mini-transcribe ile çalışır. İnternet gerektirir, dolayısıyla makinenizden ayrılan tek yoldur ve Whisper Pro'nun parçasıdır.
Sıkıcı gerçek şu: çoğu metin için yerel yeterlidir — her iki yerel motor da tamamen makinenizde çalışır, sunucuya hiçbir şey gönderilmez. Bulut, zorlu bir kayıtta üst düzey doğruluk istediğinizde ya da cümle ortasında internetten bir bilgiye ihtiyaç duyduğunuzda değer kazanır. Bulut aynı zamanda iyi bir bağlantıda yaklaşık 1,1 saniyeyle en düşük gecikme sağlayan yoldur; çünkü ağ gidiş-dönüşü daha yavaş bir dizüstü bilgisayardaki yerel hesaplamayı geride bırakır. Yerel ile başlayın; ancak yerel sizi tatmin etmediğinde buluta başvurun.
Arkasında duracağım bir görüş: yalnızca buluta dayalı dikte, transkripte dönüşmeyi bekleyen bir gizlilik felaketidir. Bir iç ekibin ağırlıklı olarak aynı kayıtları dört kez yeniden işleyen bir "akıllı yeniden deneme" döngüsü yüzünden çeyrek içinde beş haneli bir bulut faturası biriktirdiğini bizzat izledim. CFO, çeyreklik inceleme sırasında gösterge tablosunu açtı ve oda birdenbire sessizleşti. İlk taslağınızın metin haline gelmesi için bir satıcının sunucularında yaşaması gerekmiyor. Dizüstü bilgisayarınızda zaten bir mikrofon ve bir işlemci var.
Konuşulan taslağı temiz metne dönüştürmek
Ham dikte, bağlaçlı uzun bir cümle olarak çıkar. "Tamam yani bölüm tren istasyonunda açılıyor geç kaldı bağlantıyı kaçırdı falan ve bütün mesele oradan başlıyor" diyorsunuz; herhangi bir konuşma motorunun size verdiği, noktalama işaretsiz bu duvar oluyor. Taslak için sorun değil — zaten düzenleyeceksiniz. Ama okunabilirliğe giden daha hızlı bir yol var.
Windows Sesle Yazma, konuşurken noktalama ekler; macOS Dikte ise "virgül" veya "nokta" dediğinizde temel işlemleri yapar. Daha kapsamlı bir temizlik için — "ee"leri kesmek, bağlaçlı cümleleri düzeltmek, konuşulan bir paragrafı tutulabilir bir şeye dönüştürmek — Whisper bir yapay zeka geçişi çalıştırabilir. "Hey whisper" etkinleştirme ifadesini söyleyin; metin yerleşmeden önce iyileştirilir. Yerel modelde bu Ollama üzerinden çalışır; bulut modunda varsayılan olarak gpt-5-mini kullanılır.
tamam yani bölüm tren istasyonunda açılıyor geç kaldı bağlantıyı kaçırdı falan ve bütün mesele oradan başlıyor
Tamam, bölüm tren istasyonunda açılıyor. Geç kaldı — bağlantıyı kaçırdı — ve bütün mesele tam oradan başlıyor.
Özellikle yazarların duyması gereken bir uyarı: yapay zeka temizleme işlemi noktalama ve dolgu sözcüklerini düzelten bir geçiştir, ortak yazar değildir. Mekanikleri düzeltir; yazı sesinizi yeniden yazmaz ve buna izin vermemelisiniz. Kurgu veya belirgin bir üsluba sahip yazılar için ilk taslakta daha hafif yerel iyileştirmeyi tercih ediyorum ya da tamamen atlayıp sonradan elle düzenliyorum; çünkü hızlı dikte etmenin tüm amacı, ham taslağın size ait olmasıdır. Temizleme özelliğini notları okunabilir kılmak için kullanın. Asıl yazmayı siz yapın.
Bu konuş-sonra-temizle akışı, metin tuttuğunuz her yerde işe yarıyor — taslak oturumları arasında not almak ve fikirleri yakalamak için tam olarak bu yöntemi kullanıyorum; böylece bir araştırma düşüncesi veya olay örgüsündeki bir an, adımı bozmadan konuşulan bir asideden düzenli bir satıra dönüşüyor.
Gerçek zamanlı dikte uygulamasının yanlış araç olduğu durumlar

Bazen dürüst yanıt, başka bir şeye ihtiyacınız olduğudur; yanlış şeyi satmak yerine bunu söylemeyi tercih ederim. Whisper, yazdığınız uygulamaya basılı tut ve konuş yöntemiyle dikte uygulamasıdır. Canlı altyazı değildir, röportaj transkripsiyonu değildir ve bir telefon aracı değildir.
Gerçekten konuşurken kelimelerin ekranda akmasına ihtiyaç duyuyorsanız — canlı bir konuşmayı altyazılandırmak, yayın sırasında altyazı yazmak, erişilebilirlik altyazı kaydı oluşturmak — bu gerçek canlı altyazıdır; sürekli akış için geliştirilmiş ayrı bir kategori, basılı tut ve bırak dikte değil. Bir altyazı aracı kullanın. Kaydedilmiş bir röportajı veya iki saatlik bir toplantıyı transkripsiyona dönüştürecekseniz, bu konuşmacı etiketli dosya transkripsiyonudur — Otter veya Rev gibi bir hizmet, dikte kısayolundan daha uygundur; farklı bir kategori, yazma aracına transkripsiyon işi yaptırmayın. Hareket halindeyken yalnızca 30 kelimelik not alıyorsanız, telefonunuzun klavye mikrofonu ücretsiz ve cebinizde hazır; Whisper Windows ve macOS için bir masaüstü aracıdır, bunun için kurulacak bir uygulama yok.
Gerçek zamanlı bir dikte uygulamasına şu durumda başvurun: iş taslak oluşturmak olduğunda — masada, zaten kullandığınız uygulamada yazılan uzun metin, blog yazısı, bölüm veya sürekli ertelenen e-posta; konuşmanın yazmayı geçtiği ve kelimelerin bir saniye sonra imlecinizdeyken olmasını istediğiniz yer. Bunun altındaki durumlarda ücretsiz olanı kullanın. Tek satır mesaj göndermek için bir masaüstü uygulaması başlatmanızı önleyecek değilim.
Duyduğum yazarların çoğu bir platformda ya da diğerinde; platforma özel adım adım açıklamayı istiyorsanız yazarlar için tasarlanmış dikte yazılımındaki kurulum, model seçmekten klavyeye hiç dokunmadan geçirilen tam bir oturuma kadar iş akışının tamamını kapsıyor.
Bir yazar için "gerçek zamanlı", harflerin ağzınızla eş zamanlı sayfaya sürünmesi demek değildir. Bir cümle söylediğinizde, bir sonrakini kaybetmeden önce orada olması demektir — yaklaşık bir buçuk saniye, zaten içinde olduğunuz uygulamada, hiçbir yere bir şey gönderilmeden. İşte püf nokta bu ve sessiz bir püf nokta. Bu rehberin büyük bölümünü bir seferde bir cümle dikte ettim; düşünceler arasında tuşu bıraktım, bir sonraki satırı çözerken kelimelerin belirişini izledim. Klavye tüm süre boyunca orada durdu — yalnızca düzenlemeler için faydalı oldu. Ki tam olması gereken yer de burası.
Bir sonraki taslağınızı sesle sayfaya aktarın
Kısayol tuşuna basılı tutun, bir cümle söyleyin, bırakın. Kelimeler, yazdığınız uygulamada imlecinizdeki yere yaklaşık bir buçuk saniye içinde düşer — hiçbir yere bir şey gönderilmez.
Giriş yapılmış her hesap için ücretsiz yerel mod. Başlamak için kart gerekmez.



