Yazan: Denys Medvediev

Rehber

Windows 11'de konuşmadan metne

Fiziksel klavyenizde Windows tuşu + H'ye basın, imlecinizi herhangi bir metin kutusuna getirin ve konuşmaya başlayın — yerleşik ses yazımı Azure üzerinden çevrimiçi çalışır. Herhangi bir uygulamada çevrimdışı dikte için özel bir araç yükleyin. Bu rehber her ikisini de baştan sona kurar.

Son güncelleme: Haziran 2026

Kapalı mekânda dizüstü bilgisayar klavyesinde yazı yazan eller — diktenin yazmaya göre daha hızlı bir alternatif olduğunu gösteren illüstrasyon

Fiziksel klavyenizde Windows tuşu + H'ye basın, imlecinizi herhangi bir metin kutusuna getirin ve konuşmaya başlayın. Söyledikleriniz imlecinizin bulunduğu yere iner. Yerleşik ses yazımı Azure çevrimiçi konuşma tanıma altyapısıyla çalışır ve internet bağlantısı gerektirir. Herhangi bir uygulamada çevrimdışı dikte için özel bir araç yükleyin. Bu rehber her ikisini de baştan sona kurar.

Büyük kızım bir keresinde neden e-postalarımın gönderilmesinin bu kadar uzun sürdüğünü sordu. Dürüst cevap şu: dakikada yaklaşık 40 kelime yazıyorum ve her doksan saniyede bir dikkatim dağılıyor. Ses yazımı bu sorunun yarısını çözdü. Windows 11'deki numara, çoğu insanın hiç bulamadığı tek bir kısayol: Windows tuşu + H'yi basılı tutun, ne yazıyorsanız onun üzerinde küçük bir mikrofon araç çubuğu belirir.

Oradan konuşursunuz ve sözcükler imlecinize iner. Aşağıda savunacağım görüş şu: kısa bir not dışındaki her şey için yerleşik aracı tercih etmezdim.

Windows 11'de çalışan bir konuşmadan metne sistemi kurmanın iki yolu var; aralarındaki fark işin nerede yapıldığıdır. 1. Yol, sesinizi Microsoft'un Azure sunucularına gönderen, orada metne çeviren ve geri gönderen yerleşik ses yazımıdır. Teams mesajı için sorun değil, ama Wi-Fi'siz bir uçuşta maaş tablosu için ciddi bir sorun.

2. Yol, transkripsiyon işini kendi makinenizde, çevrimdışı, herhangi bir pencerede yapan bir masaüstü uygulamasıdır. Bu rehberin sonunda her ikisini de çalışır halde göreceksiniz ve hangisini tutacağınıza karar vereceksiniz. Aldığım destek e-postalarının büyük çoğunluğu, ilk günden yanlış yolu seçen birinden geliyor. Onları okuyan benim.

1. Yol: Win+H'ye basın ve konuşmaya başlayın

Windows 11 · Win + H

Listening…
Windows 11'in yerleşik ses yazımı araç çubuğu: bir mikrofon düğmesi, bir ayarlar dişlisi ve Dinleniyor etiketi.

Ön koşullar: Windows 11, internet bağlantısı, çalışan bir mikrofon ve bir metin kutusunda imlecin olması. İndirme veya hesap gerekmez. Süre: bir dakikadan az.

1

Herhangi bir metin kutusunu açın. Bir Word belgesi, e-posta, tarayıcı arama çubuğu — yazı yazabildiğiniz her yer olabilir.

2

Fiziksel klavyenizde Windows tuşu + H'ye basın. Mikrofon düğmesiyle birlikte küçük bir kayan araç çubuğu belirir.

3

Dinleniyor etiketini bekleyin, ardından konuşun. Söyledikleriniz imlecinizin bulunduğu yerde görünür.

4

"Dinlemeyi durdur" deyin ya da durdurmak için mikrofona dokunun. Araç çubuğu kapanır ve diktanız imlecinizin olduğu yerde kalır.

Beklenen sonuç: araç çubuğunda Dinleniyor yazar ve konuştukça sözcükler imleçte belirir. Araç çubuğundaki dişli ikonundan otomatik noktalama açılırsa, söylediklerinize göre virgül ve nokta ekler.

Hiçbir şey olmuyorsa: ses yazımı Azure tarafından desteklenen çevrimiçi konuşma tanımayı kullanır; dolayısıyla internet bağlantısı, çalışan bir mikrofon ve bir metin kutusunun içinde imlecin olması gerekir. Bağlantı yoksa transkripsiyon da yok. Tam sorun giderme listesi iki bölüm aşağıda.

Windows Konuşma Tanıma'dan bahseden eski bir öğretici mi geldiniz? Bu özellik, Eylül 2024'te Windows 11 22H2 ve sonrası için Voice Access ile değiştirildi. Eski WSR denetim masası artık yalnızca daha eski Windows sürümlerinde yaşıyor. Dolayısıyla bir rehber size Konuşma Tanıma sihirbazını açmanızı söylüyor ama bulamıyorsanız sorun bilgisayarınızda değil, rehberin kendisinde.

Yerleşik ses yazımının yeterli olduğu durumlar

Ahşap bir masada dizüstü bilgisayar ve not defteri — yerleşik diktenin yeterli olduğu düşük riskli bir çalışma ortamı

İhtiyaç duymadığınız bir yazılım yüklemenizi söylemeye gerek yok. Pek çok görev için Win+H doğru cevaptır ve hiçbir şeye mal olmaz.

Diktanız kısa, bağlantınız var ve riskler düşükse yerleşik aracı kullanın. Teams'de bir iş arkadaşına cevap, OneNote'ta hızlı bir not, parmakla yazmak yerine söylemek istediğiniz bir arama sorgusu. Otomatik noktalamayı destekler ve Windows 11'deki tüm standart metin kutularında çalışır. Zaten çevrimiçiyken 30 kelimelik bir not için ikinci bir uygulama açmak, yalnızca konuşmaktan daha yavaş olur.

İnsanları karıştıran ikinci bir yerleşik özellik var; bunu açıklayayım. Voice Access, ses yazımıyla aynı şey değildir. Voice Access, tüm bilgisayarı sesle kontrol etmenizi ve metin yazmanızı sağlar; Win+H'nin aksine, tek seferlik dil indirmesinin ardından cihaz üzerinde çevrimdışı çalışır. Windows 11 sürüm 22H2 veya üstü gerektirir. Tam elleri serbest bilgisayar kontrolüne ihtiyacınız varsa (sesle tıklama, kaydırma, uygulama açma) yerleşik araç Voice Access'tir, ses yazımı değil. Farklı işler bunlar.

Win+H'nin yetersiz kaldığı yerler (çevrimdışı, doğruluk, diller)

Yerleşik aracın üç gerçek tavanı var. Hızlı bir not için hiçbiri sorun çıkarmaz. Ama daha uzun veya ciddi işlere girdiğiniz anda üçü de yakınmaya başlar.

Çevrimdışı

Ses yazımı internete muhtaçtır; transkripsiyon Azure sunucularında gerçekleşir, dizüstü bilgisayarınızda değil. Uçakta, tünel geçen bir trende ya da Wi-Fi yutup yok eden bir binada çalışmayı keser.

Doğruluk

Microsoft ses yazımı için herhangi bir doğruluk rakamı yayınlamıyor; güvenilir bir bağımsız kıyaslama da yok. Şunu söyleyebilirim: kararsız bir bağlantıdaki bulut modeli, dizüstü bilgisayarın yerleşik mikrofonu ve belirgin bir aksan — bunlar, elle düzeltmeniz gereken bir transkript almanın üç ayrı yolu.

Diller

Ses yazımı, Microsoft'un yönettiği yaklaşık kırk dilli sabit bir listeyi destekler ve her dili kullanmadan önce yüklemeniz gerekir. Çoğu kişi için yeterli, ama Microsoft'un eklemediği bir dille çalışan biri için bir duvar.

Yerleşik ses yazımının üç gerçek tavanı: çevrimdışı, doğruluk ve dil desteği.

En çok düşündüğüm şey gizlilik boyutu. Diktanız — çocuğunuzun okul müdürüne yazdığınız e-posta, bir sözleşmenin taslağı, toplantıda asla yüksek sesle söylemeyeceğiniz yarım kalmış fikir — makinenizden çıkıp bir sunucuya gidiyor. Beş dakika geç kalan bir Teams toplantısı için bu hiçbir şey. Önem verdiğiniz şeyler için, sesin nereye gittiğini bilmekte fayda var.

Win+H çalışmıyor mu? Üç olağan suçlu

Win+H hiçbir şey yapmıyorsa neredeyse her zaman üç şeyden biridir. Şu sırayla kontrol edin; çünkü her biri o sıklıkla neden oluyor.

1. İnternet yok ya da çalışan bir mikrofon yok.

Ses yazımı hem bağlantıya hem de Windows'un duyabildiği bir mikrofona ihtiyaç duyar. Ayarlar, Sistem, Ses'i açın ve konuşurken giriş cihazınızın hareket gösterdiğini doğrulayın.

Düzeltmeyi test edin: araç çubuğunun askıda kalmak yerine Dinleniyor'a ulaşması gerekir.

2. İmleç bir metin kutusunda değil.

Win+H yalnızca imleciniz yazı yazabileceğiniz bir alanın içindeyken çalışır. Önce bir Word belgesine veya e-posta gövdesine tıklayın, ardından kısayola basın.

Düzeltmeyi test edin: tuşlara bastığınız anda mikrofon araç çubuğu belirir.

3. Bir dizüstü bilgisayar fonksiyon tuşu katmanı H'yi çalıyor.

Bazı dizüstü bilgisayarlarda üst sıra ya da medya tuşları yeniden eşleme yapar ve bir klavye yardımcı programı kısayolu yakalayabilir.

Düzeltmeyi test edin: bunun yerine dokunmatik klavyenin mikrofon düğmesini açın. Dikte orada çalışıyorsa sorun donanım kısayolundadır; üreticinizin klavye yardımcı programından tuşu yeniden atayın.

Üç olağan suçluyu sırayla kontrol edin — her biri o sıklıkta neden olur.

Bunların hiçbiri işe yaramazsa altta yatan sorun genellikle kurulumu tamamlanmamış bir dil paketi ya da yarıda kalan bir Windows güncellemesidir. Bu noktada ben de yerleşik araçla uğraşmayı bırakır ve baştan sona kontrol edebildiğim bir şey kurarım — aşağıdaki 2. Yol. Bundan sonra da başarısız olmaya devam ediyorsa, Windows'ta ses yazımı çalışmıyor rehberini daha uzun kontrol listesiyle birlikte yazdık.

2. Yol: özel bir dikte uygulaması kurun

Whisper, geliştirdiğim masaüstü uygulamasıdır ve Win+H'nin yapamadığı üç şeyi yapar: kendi CPU'nuzda çevrimdışı transkripsiyon, herhangi bir uygulamada çalışan sistem genelinde tek kısayol tuşu ve sabit bir bulut modeli yerine donanımınıza ve dillerinize göre motor seçimi. Baştan sona tam kurulum burada.

Whisper
Gerçek Whisper masaüstü uygulaması — Ayarlar, Transkripsiyon ve Yapay Zeka panellerinde gezinin.

Ön koşullar: Windows 11, orta boy model için yaklaşık 1 GB boş disk alanı, mikrofon ve ücretsiz hesap (başlamak için ödeme yöntemi gerekmez). Bağlantıya yalnızca tek seferlik indirme için ihtiyacınız var; sonrasındaki transkripsiyon çevrimdışı. Süre: 5 ila 10 dakika, büyük çoğunluğu model indirmesi.

1

Whisper'ı indirin ve kurun. Yükleyiciyi indirme sayfasından alın ve çalıştırın. Beklenen: uygulama ana penceresinde açılır.

2

Giriş yapın. İstendiğinde ücretsiz hesap oluşturun; başlamak için kart gerekmez. Beklenen: Ayarlar'ın kullanılabilir olduğu ana ekrana ulaşırsınız.

3

Yerel bir motor seçin ve modeli indirin. PC'nize uygun boyutta bir Whisper modeli seçin ya da en hızlı yerel seçenek için Parakeet'i tercih edin. Beklenen: ilerleme çubuğu tamamlanır ve model hazır olarak görünür.

4

Kısayol tuşunu onaylayın. Windows için varsayılan kısayol tuşu Ctrl+Space: basılı tutun, konuşun, bırakın. Başka bir şeyle çakışıyorsa Ayarlar'dan değiştirin.

5

Herhangi bir uygulamada test edin. Herhangi bir metin alanına tıklayın (tarayıcı, kod editörü, sohbet kutusu), Ctrl+Space'i basılı tutun, bir cümle söyleyin, bırakın. Metin imlecinize iner.

Beklenen sonuç: model indirildikten sonra herhangi bir uygulamada Ctrl+Space'i basılı tutun, konuşun, bırakın — sözcükleriniz indirmeden sonra internet döngüsü olmaksızın imlecinize yapışır. Hey whisper demek, açık durumdaysa metin ininceye önce yapay zeka düzenleme geçişini tetikler.

Kısayol tuşu yanlış tetikleniyorsa: Ayarlar'dan yeniden atayın. Bunu zor yoldan öğrendim. Kısayol işleyicisinin ilk sürümü, Windows giriş çerçevesi öngörülemeyen aralıklarla hayalet Ctrl+Space bırakma olayları ürettiği için Windows'ta gerçek her tuş vuruşunda kayıt durdurma geri çağrısını altı kez tetikliyordu. Temiz bir makinede çalıştı, ikinci bir dil girişi etkin olan her dizüstü bilgisayarda bozuldu. Telemetri gerekti, yetmeyen 50ms koruma gerekti ve sonunda işe yarayan 300ms debounce gerekti. Kızımın kararı geçerliliğini koruyor: babamın e-postaları bu yüzden sonsuza uzuyor.

Dil kapsamı açısından yerel Whisper motoru çok dilli modellerinde 99 dili desteklerken .en derlemeleri yalnızca İngilizceye özgü ve o iş için biraz daha hızlıdır. Parakeet motoru CPU'da Whisper'dan 5 ila 10 kat daha hızlı çalışır ve İngilizce ile 24 Avrupa dilini (toplamda 25) kapsar, ancak Asya dillerini ve İngilizceye çeviriyi atlar. Önceliğiniz çevrimdışı çalışmaksa, çevrimdışı konuşmadan metne rehberimiz motorları daha ayrıntılı ele alıyor.

Win+H vs Voice Access vs özel uygulama

Windows 11'de konuşmayı metne dönüştürmenin üç yolu, yan yana. Tablo yalnızca her aracın belgelediği bilgileri kapsar. Uydurma doğruluk veya hız puanı yok.

AraçTürÇevrimdışı çalışırFiyatlandırma modeliDillerEn uygun kullanım
Win+H ses yazımıWindows 11'e yerleşikHayır (Azure çevrimiçi)Windows ile ücretsiz~40, sabit listeHerhangi bir metin kutusunda kısa çevrimiçi notlar
Voice AccessWindows 11'e yerleşik (22H2+)Evet (cihaz üzerinde)Windows ile ücretsizSınırlı setElleri serbest tam PC kontrolü
Whisper (özel uygulama)Windows + macOS kurulumuEvet (yerel CPU)Ücretsiz yerel katman; ücretli Cloud eklentisiÇok dilli Whisper modellerinde 99Herhangi bir uygulamada çevrimdışı dikte

Tek ihtiyacınız çevrimiçiyken hızlı bir Teams cevabıysa, 1. Yol sadelikte kazanır. Zaten bilgisayarınızda. Çevrimdışılık, her uygulamada çalışma ya da eksik bir dil devreye girdiği anda 2. Yol kurulumu hak eder.

Yerel vs bulut: PC'niz için hangi Whisper modu

Whisper iki modda çalışır ve seçim donanımınıza ve web erişimi isteyip istemediğinize bağlıdır.

Yerel mod her şeyi makinenizde yapar. PC'nize uygun boyutta bir Whisper modeli seçin: Base yaklaşık 140 MB ve neredeyse her şeyde çalışır, Small yaklaşık 480 MB, Medium yaklaşık 1,5 GB; RAM'iniz yeterliyse en iyi doğruluk için çok dilli Large v3 yaklaşık 3 GB. Ya da İngilizce veya Avrupa dillerinde çalışıyorsanız en hızlı yerel seçenek olarak yaklaşık 600 MB'lık Parakeet'i seçin. Bunların hiçbiri indirmeden sonra internete dokunmaz.

Thinking...
Hem yerel hem de bulut modunun paylaştığı, metin inmeden önce çalışan yapay zeka düzenleme geçişi.

Bulut modu kaçış kapısıdır. Kendi OpenAI anahtarınızı kullanır: gpt-4o-mini-transcribe ya da gpt-4o-transcribe üzerinden transkripsiyon ve imlecinize yapıştırılmış canlı bir cevap istediğinizde web araması. Anahtarı siz getirirsiniz; bizim hiçbir katkı payımız yok.

Arkasında duracağım görüş şu: önce yerel modu deneyin. Windows PC'niz son dört yıldan biriyse, günlük dikte için buluta ihtiyacınız yok ve yerel mod sesinizi olması gereken yerde — makinenizde — tutar. Bulut, duvara çarptığınızdaki yedektir, varsayılan değil. Whisper, giriş yaptıktan sonra tüm yerel pipeline için ücretsizdir; başlamak için ödeme yöntemi gerekmez. Bulut yüzeyi ücretli Pro katmanıdır. Ayrıntılar fiyatlandırma sayfasında. Tam yerel adım adım kılavuz için Windows'ta sesten metne rehberi adım adım gidiyor.

Özel uygulamayı atlamanız gereken durumlar

Kullanmayacağınız bir şey yüklemektense Win+H'yi tutmanızı tercih ederim. Tüm bunlar doğruysa özel bir uygulamayı atlayın ve yerleşik ses yazımında kalın:

  • Uzun belgeler değil, kısa dikteler yapıyorsunuz.
  • Dikte ettiğinizde her zaman çevrimiçisiniz.
  • Yalnızca Microsoft'un ses yazımının zaten desteklediği bir dilde çalışıyorsunuz.
  • Sesiniz düşük riskli ve makineden çıkıp çıkmadığını önemsemiyorsunuz.

Win+H ücretsizdir, zaten kurulu ve tam olarak bu işte iyi. Özel uygulama, bu çizgilerden birini geçtiğiniz anda değerini kazanır — bir uçak, sözleşme taslağı, Microsoft'un atladığı bir dil ya da standart metin kutusu olmayan herhangi bir uygulama.

Dürüst fiyatlandırma

Whisper'ın yerel modu giriş yapan herkes için ücretsizdir: Whisper ve Parakeet transkripsiyonu, yapay zeka geliştirme, geçmiş, hazır ayarlar, özel anahtar kelimeler, donanım hızlandırma, model indirmeleri ve global kısayol tuşu — tümü, başlamak için kart gerekmeden. Whisper Pro üstüne Bulut özelliklerini ekler: OpenAI bulut transkripsiyonu, bulut yapay zeka geliştirmesi ve sesli web araması. Windows'un yerleşik ses yazımı da ücretsizdir çünkü Windows'un bir parçasıdır. Tam plan dökümü fiyatlandırma sayfasında. Güncelliğini yitirebilecek bir blog yazısındaki rakama güvenmek yerine kesin sayıları orada okumanızı tercih ederim.

İki yol, tek karar. Çevrimiçiyseniz, not kısaysa ve riskler düşükse Windows tuşu + H'ye basın ve konuşun — ücretsiz ve zaten bilgisayarınızda. Uçakta, herhangi bir uygulamada, Microsoft'un atladığı bir dilde ya da sesinizin kendi makinenizde kalmasını istediğinizde özel uygulamayı kurmanız gerekir. Ben bu çizgiyi öğle kutularını hazırlarken tek elimle üçüncü toplantı notunu dikte ederken geçtim ve o günden beri uzun bir e-posta yazmadım.

Kendi PC'nizde çevrimdışı deneyin

Whisper'ı indirin, Ctrl+Space'i basılı tutun, konuşun, bırakın — sözcükleriniz herhangi bir uygulamada imlecinize yapışır, internet döngüsü olmadan.

Giriş yapmış her hesap için ücretsiz yerel mod. Başlamak için kart gerekmez. Win+H zaten ihtiyacınız olan her şeyi yapıyorsa kısayolu saklayın — iyidir.

Denys Medvediev'in fotoğrafı

Denys Medvediev

Destek e-postalarımızı okuyan benim — büyük ihtimalle cevapları da dikte ederek yazıyorum.

Daha fazla okuma