Yazan: Denys Medvediev

Sesle yazma · Rehber

Sesle yazma uygulaması: her cihaza ne kurmalısınız

Android ve iPhone'da klavyenin içine gömülü dikteyi kullanın. Ücretsiz ve gayet iyi. Windows ve Mac'te yerleşik araçlar kısa kullanımlar için işe yarar ama gerçek bir yazı için çabuk tükenir. Whisper gibi bir masaüstü sesle yazma uygulaması; global bir kısayol tuşu, çevrimdışı çalışan yerel modeller ve doğrudan herhangi bir uygulamaya düşen metin ekler.

Son güncelleme: Haziran 2026

Ahşap bir masada yan yana duran bir dizüstü bilgisayar ve akıllı telefon; bir sesle yazma uygulamasının yaşayabileceği iki yer

Bir sesle yazma uygulaması, imleç neredeyse oradaki konuşmayı metne çevirir. Telefonlarda klavyenin kendisi bunu zaten yapıyor: Android'de Gboard, iPhone klavyesinde mikrofon tuşu. Windows ve Mac masaüstlerinde ise yerleşik araçlar daha fazla kısıtlama getiriyor; işte tam burada Whisper by Remskill gibi özel bir masaüstü uygulaması değerini gösteriyor.

Herhangi bir uygulama mağazasında "sesle yazma uygulaması" araması yapın, karşınıza sayfalarca klavye uygulaması çıkar; her biri yeni bir boyaya bürünmüş bir mikrofon düğmesinden ibaret. Oysa altta yatan sayılar hiç değişmedi: çoğu insan dakikada yaklaşık 40 kelime yazıyor, yaklaşık 145 kelime konuşuyor. Bu kategorinin var olma sebebi tam da bu fark.

Bu uygulamalardan birini ben yaptım, yine de geçen hafta kendimi 400 kelimelik bir e-postayı başparmaklarımla yazarken yakaladım. Alışkanlıklar, sebepleri biteli çok sonra bile yaşıyor. İşin püf noktası şu: doğru cevap, elinizde hangi cihazın olduğuna bağlı ve cihazlardan biri için doğru cevap hiçbir şeye mal olmuyor, üstelik önceden yüklü geliyor.

"Sesle yazma uygulaması" tek bir ada bürünmüş iki ayrı durumu anlatıyor ve çoğu derleme bundan hiç söz etmiyor. Telefonda dikte çözülmüş bir mesele; uygulama mağazaları bunu defalarca yeniden satıyor. Uzun yazıların yazıldığı masaüstünde ise yerleşik araçların bir bedeli var. Akıllı seçim, cihaza göre karar vermek.

Bu sayfanın sonunda telefonunuzda neyi tutacağınızı, masaüstündeki yerleşik araçların nerede tükendiğini ve onları aştığınızda neyi kuracağınızı bileceksiniz. Hayatımı bir masaüstü sesle yazma uygulaması üreterek kazanıyorum ve insanlara söylediğim ilk şey: telefonunuza hiçbir şey kurmayın.

Telefonlar zaten bir sesle yazma uygulamasıyla geliyor

Yerleşik klavyesi zaten dikte yapan bir akıllı telefonu tutan eller

Sıkıcı gerçek şu: telefonunuz için en iyi sesle yazma uygulaması, onunla birlikte gelen klavye. Android'de Gboard bu işi görür: bir metin alanına dokunun, klavyenin üstündeki mikrofona dokunun ve "Şimdi konuşun" yazınca konuşun. Noktalama işaretlerini sesli söyleyebilirsiniz; "nokta", "virgül", "yeni paragraf" gibi. Yine de Google, noktalama ve sesle yazmanın her dilde mevcut olmadığını belirtiyor. iPhone'da klavyede aynı işi yapan bir mikrofon tuşu var.

Bu; mesajları, e-postaları, arama kutularını ve notları kapsıyor, ki bir telefonda yazılanların çoğu da budur. Tipik bir telefon diktesi 50–150 kelimelik bir e-posta yanıtı, yaklaşık 30 saniyelik bir konuşmadır; yerleşik mikrofon bunu hiç şikâyet etmeden halleder. Mağaza sonuçlarını dolduran üçüncü taraf klavye uygulamaları, aynı mikrofonu farklı bir markayla, kimi zaman bir aboneliğe iliştirilmiş olarak paketler. Birini kurmadan önce, zaten sahip olduğunuz düğmeyi deneyin. Ücretsiz, önceden yüklü seçeneğin aynı zamanda mantıklı seçenek olduğu nadir ürün kategorilerinden biri bu.

Dürüst bir açıklama, çünkü tam burası bir satıcının kendi mobil uygulamasına geçiş yapacağı yer: bizim öyle bir uygulamamız yok. Whisper by Remskill, Windows ve macOS için bir masaüstü uygulamasıdır, nokta. Dikte hayatınız bir telefonda geçiyorsa tavsiyem yerleşik klavye ve bu sekmeyi gönül rahatlığıyla kapatabilirsiniz.

Masaüstü, yerleşik araçların tükendiği yer

Her iki masaüstü işletim sistemi de sesle yazmayı içeriyor ve bir şey kurmadan önce ikisini de tanımakta fayda var. Windows 11'de Windows tuşu + H'ye basın, küçük bir sesle yazma penceresi belirir. Üç şeye ihtiyacı vardır: bir internet bağlantısı, çalışan bir mikrofon ve bir metin kutusuna park etmiş imleciniz. 40'tan fazla dili destekler ve ilgili ayarı açarsanız sizin için noktalama işaretleri ekleyebilir. Akılda tutulacak sınır, internet zorunluluğu. Win+H, otel Wi-Fi'si çekene kadar harikadır.

Sesle yazma

Dinleniyor…

Win + H
Windows sesle yazma penceresinin basitleştirilmiş bir taslağı — Win + H'nin arkasındaki yerleşik araç.

Mac'te Dikte; fonksiyon sırasındaki mikrofon tuşundan, bir klavye kısayolundan ya da Düzen > Dikteyi Başlat'tan başlar. Süre sınırı yoktur ama 30 saniyelik sessizliğin ardından kendiliğinden durur; bu da pratikte, siz bir kelime ararken tavana bakarken onun çıkması anlamına gelir. Desteklenen dilleri istenmeden noktalar ve Apple, Dikte'nin tüm dillerde veya bölgelerde mevcut olmadığını belirtir.

İki araç da kötü değil ve bir iki cümle için ikisi de gayet iyi. Sınırlar, yazı işi ciddileşince ortaya çıkar. Ürün adlarınız ve müşterileriniz için özel kelime dağarcığı iki özellik listesinde de yok; konuşmanızın taşıdığı "şey, yani" katmanını temizleyen AI desteği de yok. Mac'te dikte cihaz üzerinde mi çalışıyor diye kontrol edebilirsiniz; Windows'ta ise çevrimdışı olduğunuz an araç kararır. Bu sınırlar, masaüstü sesle yazma uygulamalarının bir kategori olarak var olma sebebidir.

Bir masaüstü sesle yazma uygulaması gerçekte ne yapmalı

Ahşap bir masada turuncu vurgulu tuşu olan mekanik bir klavye

Mekanizmayı anlatmak basit. Bir masaüstü sesle yazma uygulaması arka planda durur, tek bir global kısayol tuşunu izler, siz basılı tutarken kaydeder, sesi bir konuşma tanıma modelinden geçirir ve sonucu imlecinizin olduğu yere yapıştırır. Bu cümlenin her parçası, kurmadan önce kontrol etmeniz gereken bir şeydir.

Kısayol tuşu önemlidir, çünkü dikteyi ziyaret ettiğiniz bir özellik olmaktan çıkarıp bir refleks hâline getirir. "İmlecinizin olduğu her yer" kısmı önemlidir, çünkü yazı; e-postada, Slack'te, bir CRM'de, bir kod editöründe ve bir tarayıcı formunda yazılır; yalnızca kendi penceresine yazan bir araç, mikrofonlu bir not defterinden ibarettir. Model iki kez önemlidir: bir kez doğruluk için, bir kez de sesinizin nereye gittiği için. Yerel modeller makinenizde çalışır ve çevrimdışı işler. Bulut modelleri sesi bir sunucuya gönderir ve çoğu zaman daha iyi yazıya döker. İyi bir masaüstü uygulaması, sizin yerinize karar vermek yerine duruma göre seçim yapmanıza izin verir.

Hız da kontrol listesine girer, hem de net sayılarla. Küçük bir yerel İngilizce model çalıştıran bir M1 MacBook Air'de Whisper, tuşu bıraktığınızdan metnin yapıştığı ana kadar yaklaşık 1,4 saniye sürer; iyi bir bağlantıyla bulut modunda ise yaklaşık 1,1 saniye. Bu aralıktaki bir yanıt, dikteyi "refleks" kategorisinde tutar. Bir araç sizi bekletiyor, bir pencere açtırıyor ya da bir panelden metin kopyalatıyorsa, oluşan sürtünme aradığınız hız avantajını yer.

Bu sayfa için tek bir görüşüm var: en iyi verimlilik hilesi, daha hızlı adımlar değil, daha az adımdır. Çoğu araç yazmayı hızlandırmaya çalışır. Sesle yazma onu tamamen siler. Akış "dur, otur, yaz"dan "konuş, bitti"ye döner; dakikada 145 kelimelik konuşmanın, kimse yeni bir beceri öğrenmeden dakikada 40 kelimelik yazmayı geçmesi de tam olarak bu sayede olur. Adımları geri ekleyen bir uygulama, kendi kategorisinin amacını kaçırmış demektir.

Kategorinin kendisini daha derinlemesine gezmek için — motorlar, doğruluk, yerel-bulut dengesi — ayrı bir açıklayıcı yazımız var: sesle yazma yazılımı. Bu sayfa daha dar bir soruya odaklanıyor: cihaz cihaz, neyi kurmalı.

Whisper, Windows ve Mac'te sesle yazmayı nasıl ele alıyor

Whisper by Remskill, sorunun masaüstü yarısına verdiğimiz yanıt. Tek bir kısayol tuşunu basılı tutuyorsunuz (Windows'ta Ctrl+Space, Mac'te Command+Option), konuşuyorsunuz, bırakıyorsunuz ve metin imlecinizin olduğu yere, herhangi bir uygulamada düşüyor. Siz konuşurken ekranda küçük bir katman beliriyor, böylece dinlediğini görebiliyorsunuz.

Cancel
Whisper kayıt katmanı, canlı — bu, kullanıma sunulmuş arayüzün kendisi, animasyonlu; ekran görüntüsü değil.

Kaputun altında üç yol arasından siz seçim yapıyorsunuz; uygulama sizin yerinize seçmiyor.

  • Yerel Whisperİngilizce için optimize edilmiş ve çok dilli model aileleri; ~140 MB'lık Base modelinden ~3 GB'lık Large v3'e kadar. Çok dilli aile, otomatik algılama dahil 90'dan fazla dili kapsar. Yalnızca İngilizce modeller tam olarak öyledir, sadece İngilizce; o yüzden gün içinde dil değiştiriyorsanız çok dilli aileyi seçin.
  • Yerel ParakeetCPU'da Whisper'dan 5–10 kat daha hızlı çalışır ve İngilizceyle birlikte 24 Avrupa dilini kapsar. Çoğunlukla İngilizce dikte için hızlı şerit.
  • Bulut (kendi OpenAI anahtarınız)Kendi API anahtarınızla OpenAI'ye bağlanır; konuşmanın kendisi için gpt-4o-mini-transcribe veya gpt-4o-transcribe, isteğe bağlı AI temizliği için gpt-5-mini kullanır.

Yerel olan her şey ücretsiz: modeller cihazınızda çalışır, çevrimdışı işler, hiçbir yere bir şey göndermez ve kaydolmak için karta gerek yoktur.

Bilmeye değer bir numara daha var: bir AI anahtar kelimesi. Bir kaydı "Hey whisper" diyerek başlatın; uygulama, yazıya dökülen metni olduğu gibi yapıştırmak yerine onun AI işlenmesini tetikler. Günlük cümleler için dikte, metni yeniden işlemek istediğiniz anlar için bir asistan. Her iki durumda da aynı kısayol tuşu.

En çok güvendiğim test bir kıyaslama değildi. Whisper'ı küçük kızıma verdim, bir kez gösterdim (bas, konuş, bırak, yapıştır) ve o, anneannesine düşen bir diş ile diş perisinin kuru hakkında 90 kelimelik bir e-posta dikte etti; tek bir ek soru sormadan. İki gün sonra "kısayol tuşu çizim uygulamamda çalışmıyor" diye bildirdi; sıradan kullanıcıların kısayol tuşu çakışmasının ne olduğunu bilmediğini böyle öğrendim. Onlar sadece çalışmadığını biliyorlar. Özelleştirilebilir kısayol tuşu ayarları o gece çıktı. Bu döngüyü yedi yaşında biri yürütebiliyorsa, döngü yeterince basit demektir.

Whisper
Gerçek Whisper masaüstü uygulaması, canlı olarak gömülü — Ayarlar'da ve model seçicide dolaşıp tıklayın.

Yukarıdaki gömülü uygulama, gerçek masaüstü arayüzünün kendisi, ekran görüntüsü değil; üzerinde dolaşıp tıklayın. Ve açıklamayı tekrarlayayım, çünkü kurulum niyeti dürüst bir yanıt hak eder: Whisper, Windows'ta ve Apple Silicon Mac'lerde çalışır, başka hiçbir yerde.

Bir şey kurmadan önce kısa bir kontrol listesi

Yazılım kurmak bir taahhüttür, yazılım ücretsiz olsa bile. Beş soru bu işi herhangi bir inceleme derlemesinden daha hızlı çözer:

  • Dürüst olun, hangi cihazda yazıyorsunuz? Çoğunlukla telefon: yerleşik klavye diktesinde kalın ve hiçbir şey harcamayın.
  • Her uygulamada yazıyor mu? İmlece yapıştıran global bir kısayol tuşu arayın; kopyaladığınız ayrı bir pencere değil.
  • Çevrimdışı çalışabiliyor mu? Windows sesle yazma çalışamaz. Yerel modeller çalışabilir. Yazdıklarınızın arasında bir sunucuya gitmemesi gereken şeyler varsa, bu soru başa gelir.
  • Hangi diller, motor başına sayılmış olarak? Windows sesle yazma için 40+, Whisper'ın çok dilli modellerinde 90+, Parakeet'te 25, .en modellerinde yalnızca İngilizce.
  • Önce mikrofonu hallettiniz mi? 20 dolarlık bir USB mikrofon, doğruluk için herhangi bir model yükseltmesinden daha fazlasını yapar. Yazılımı ben üretiyorum, yine de kazanan mikrofon. Bu sektörde kimse bunu yüksek sesle söylemekten hoşlanmaz.

Buraya araştırma açısından geldiyseniz — doğruluk sayıları, motorların karşılaştırması — o tarafı konuşmayı metne çeviren uygulama açıklayıcısı kapsıyor. Planlar ve içlerinde ne olduğu ise fiyatlandırma sayfasında; kısa hâli şu: yerel olan her şey hiçbir şeye mal olmuyor.

Whisper'ı ne zaman atlamalısınız

Dikteniz bir telefonda gerçekleşiyorsa bizi atlayın. Mobil uygulamamız yok ve Gboard ya da iPhone klavyesinin diktesi ücretsiz ve fazlasıyla yeterli. Bir Mac'te günde bir iki cümle yazıyorsanız, Apple Dikte zaten yerleşik, mikrofon tuşundan başlıyor ve sizin için noktalama yapıyor.

Birden fazla konuşmacılı toplantı transkripsiyonuna ve özetlere ihtiyacınız varsa, bu, sesle yazmaktan farklı bir ürün kategorisidir; alışverişinizi o kategoride yapmalısınız. Linux'ta ya da Intel bir Mac'teyseniz, Whisper orada çalışmaz; o yüzden yerleşik araçlar ve tarayıcı araçları sizin dürüst seçenekleriniz.

Kaynaklar

Yirmi yıl önce sesle yazmak, bilgisayarınıza kalibrasyon metinleri okumak ve umut etmek demekti. Bugün dürüst özet iki satıra sığıyor: telefonunuz bunu zaten yapıyor ve masaüstünüz, tek bir kurulumla bunu adamakıllı yapabiliyor. Mikrofon, masanızdaki en hızlı giriş aygıtı olalı bir hayli oldu. Çoğumuz henüz o tuşa basmadık, o kadar.

Masaüstünüze bir sesle yazma uygulaması koyun

Whisper'ı indirin, tek bir kısayol tuşunu basılı tutun ve metnin imlecinizin olduğu yere düşmesini izleyin.

Windows ve Apple Silicon Mac'lerde çalışır. Yerel olan her şey ücretsiz. Klavyeniz, ihtiyacınız olduğunda yine yerinde olacak.

Denys Medvediev'in fotoğrafı

Denys Medvediev

Destek e-postalarımızı okuyan kişi benim, büyük ihtimalle yanıtları dikte ederek.