Yazan: Denys Medvediev

Sorun Giderme

Dikte yanlış kelimeler mi yazıyor? 5 çözüm

Dikte, model bir sesi yanlış duyup tahmin ettiğinde yanlış kelimeler yazıyor. Beş neden var, dördünü on dakikada çözebilirsiniz.

Son güncelleme: Haziran 2026

Koyu bir yüzeyde sığ odaklı siyah klavye; dikte çıktısının sayfaya aktarılmasını çağrıştırıyor

Dikte, konuşma modeli bir sesi yanlış duyup cümleyi o tahmin etrafında yeniden şekillendirdiğinde yanlış kelimeler yazıyor. Olağan nedenler şunlar: zayıf mikrofon, arka plan gürültüsü, modelin ayırt edemediği bir eş sesli, yanlış dil ayarı ya da daha önce hiç karşılaşmadığı bir isim. Önce sesi düzeltin, sonra araca kelime dağarcığınızı öğretin.

"Staging ortamına dağıt" diyorsunuz. Ekranda "stadyumu yık" çıkıyor. Düzeltiyorsunuz. Bir sonraki cümle, aynı şey. Üçüncü düzeltmede konuştuğunuzdan daha hızlı yazmaya başlıyorsunuz; bu da tüm amacı ortadan kaldırıyor. Bu döngünün bir yazarı, bir satışçıyı ve annesini nasıl çıldırttığını bizzat izledim — o da bir keresinde dikteyi deneyip inat olsun diye iki parmakla yazmaya geri döndü. İyi haber şu: neredeyse her yanlış kelime beş nedenden birine dayanıyor ve dördünü önümüzdeki on dakikada çözebilirsiniz.

İşte kimsenin söylemediği kısım. Çoğu dikte aracı bunu yaparken bozuk değil. Kötü koşullar altında, gerçek zamanlı olarak tahmin yürütüyor; meslektaşınızın adını ya da "Kubernetes" diye bir kelimenin var olduğunu bilmiyor. Whisper'ın yerel modunda bunu kökten çözen bir ayar var — duymasını beklediğiniz isimleri ve jargonu listelediğiniz bir Özel kelimeler alanı; böylece uydurma benzerler yerine doğru yazıyor. Ücretsiz ve çevrimdışı çalışıyor. Oraya geleceğiz. Ama sıkıcı gerçek şu ki mikrofon yazılımdan çok daha önemli; bu yüzden oradan başlıyoruz.

Dikteniz bozuk değil. Tahmin ediyor.

Ortam ışığı altında dizüstü bilgisayar klavyesi; yanlış yazılan diktenin nereye düştüğünü gösteriyor

Konuşmadan metne dönüştürme harfleri duymaz. Sesi duyar ve o sesin oluşturduğu en olası kelimelere bahse girer — daha fazla ses geldikçe bu tahmini günceller. Diktenin zaman zaman daha önce söylediğiniz metni yeniden yazmasının nedeni budur. Cümlenin sonunda bir kelimeyi yanlış duyar, gramerin tutması için daha önceki bir kelimenin de farklı olması gerektiğine karar verir ve sessizce değiştirir.

"Kale" ve "tale." "Bar" ve "var." "Yap" ve "ya." Bunlar eş sesliler — aynı şekilde telaffuz edilen kelimeler — ve ne kadar net konuşursanız konuşun bu yardımcı olmaz; çünkü sorun hiçbir zaman netlik değildi. Model bağlamdan tahmin yapmak zorunda; bazen de yanlış tahmin ediyor.

Bir de modelin gerçekten hiç karşılaşmadığı kelimeler var: Yöneticinizin soyadı, bir ürün kodu, "Remskill." Model bilmediği şeyi yazamaz; onun yerine bildiği en yakın gerçek kelimeyi koyar. Bu bir hata değil. Kelime dağarcığı açığıdır ve aşağıda anlatacağımız belirli bir çözümü var.

Mikrofonunuz her zaman ilk şüpheli

Masada kondenser mikrofon, dizüstü bilgisayar ve kulaklıklar; diktenin giriş kaynağı

Yazılımı suçlamadan önce ona ne beslediğinize bakın. Dizüstü bilgisayarın dahili mikrofonu fanın yanında oturuyor, tavana bakıyor ve sesinizden çok odayı kaydediyor. Çöp girdi, yanlış çıktı.

Bu, makaleyi üzerine kuracağım tek görüş: "Yapay zeka" kötü sesi düzeltmez. 20 dolarlık bir USB mikrofon, yapabileceğiniz her model yükseltmesinden daha fazla doğruluk sağlar. Kendi yanlış kelimelerimi düzeltmek için bir hafta daha büyük ve yavaş modeller yükledim; ta ki dizüstü bilgisayarımın fanına baktığını fark edene kadar. Sorun başından beri mikrofonmuş. Bu yazılımı mesleğim olarak geliştiriyorum. Parayı önce donanıma harcayın. Model ucuz olan kısım.

Doğrulama testi: Aynı üç cümleyi önce dahili mikrofonla, sonra bir kulaklık veya USB mikrofonla dikte edin. Yanlış kelime sayısı düşüyorsa sorun mikrofondu ve işiniz bitti. Çoğu kişi okumayı burada bırakıyor; gayet makul.

Arka plan gürültüsü ve oda akustiği

Dizüstü bilgisayar, defter ve çiçeklerle sakin, gürültüsüz bir çalışma masası

İki oda ötedeki bulaşık makinesi. Bir iş arkadaşının telefon görüşmesi. Dokuz metre öteden birinin cips yiyişini duyabildiğiniz açık ofis ortamı. Model sesinizi gürültüden ayırt edemez — en yüksek sesi deşifre eder; bazen de cipsin sesi kazanır.

Google'ın bu konudaki AI Özeti, arka plan gürültüsünü aksan ve eş seslilerin hemen yanında birincil neden olarak sıralıyor. Çözüm gösterişsiz: kapıyı kapatın, fanı susturun, açık pencereden uzaklaşın. Sessiz bir oda, zekice bir algoritmadan daha fazlasını yapar.

Doğrulama: Aynı dikteyi sessiz bir ortamda ve alışılmış ortamınızda deneyin. Sessizlikte hatalar azalıyorsa sorun gürültüydü. Sessiz bir oda bulamıyorsanız, yalnızca tam önündeki sesi duyan yönlü ya da gürültü önleyici bir mikrofon en iyi alternatiftir — ve yine donanıma dönüyoruz; paranın zaten gitmesi gereken yer orası.

Yanlış dil veya aksan uyumsuzluğu

Aydınlık bir masaya saçılmış tahta harf parçaları; kelimeler ve dil seçeneklerini çağrıştırıyor

Dikteniz otomatik algılamaya ayarlıysa ve diller arasında geçiş yapıyorsanız, model kelimeleri tanımadan önce dili tanımaya çalışır — dil hakkında yanlış bir tahmin, sonrasındaki her şeyi mahveder. Mümkün olduğunda dili açıkça belirleyin.

Whisper'da bu, Ayarlar, Transkripsiyon, Dil yolundadır. Konuştuğunuz dili doğrudan seçmek algılama adımını atlar ve modelin kelimelerinizi daha doğru yakalamasına yardımcı olur. Otomatik algılamayı yalnızca oturum ortasında gerçekten dil değiştiriyorsanız bırakın. Whisper'ın çok dilli modelleri otomatik algılamayla 99 dili destekler; yalnızca İngilizce derlemeler İngilizce'ye kilitlenir ki sadece İngilizce konuşuyorsanız tam istediğiniz budur.

Aksan uyumsuzluğu bu sorunun yakın kuzenidir. Ağırlıklı olarak Amerikalı konuşmacılarla eğitilmiş bir Amerikan İngilizcesi modeli, güçlü bir bölgesel aksanla tökezler. Aracınızın sunduğu en yakın bölgesel varyantı seçmek ve temiz bir sinyal vermek bu farkı daraltır.

Windows, Mac ve iPhone'da düzeltin

Her platformun dahili dikte özelliğinin kendine özgü tuhaflıkları ve sınırları vardır. Windows'ta Ses Yazma, Windows tuşu artı H ile açılır; ancak imlecinizin bir metin kutusunda olması ve internet bağlantısına ihtiyacınız var — dahili araç sesinizi transkripsiyon için buluta gönderiyor. Saçma sapan yazıyorsa önce bağlantıyı kontrol edin; aynı yanlış-kelime sorununa ilişkin Apple destek forumları da "internet bağlantısını doğrula" adımını listenin en üstüne koyuyor. (Daha ayrıntılı bir kılavuz için Windows'ta ses-metin dönüşümü çalışmıyor rehberimize bakın.)

Mac'te Dikte'yi fonksiyon tuşu sırasındaki Mikrofon tuşuyla, Dikte kısayoluyla ya da Düzenle ardından Dikteyi Başlat yoluyla açabilirsiniz. Bir şeyin üzerini kapatmak gerekiyor: Günümüz macOS Dikteyi, herhangi bir uzunluktaki metni zaman sınırı olmaksızın dikte etmenizi sağlıyor — yalnızca yaklaşık 30 saniyelik sessizliğin ardından duruyor; bu durum insanlar tarafından katı bir sınır olarak yanlış yorumlanıyor. Yanlış kelimeler devam ederse, Mac ses-metin sorun giderme rehberimiz adım adım anlatıyor. iPhone'da Apple forumları ayrıca tahmine dayalı metni devre dışı bırakmayı öneriyor; bu özellik bazen diktenin doğru yaptığını ikinci kez tahmin ediyor.

Daha sert sınır: Windows Ses Yazma (Win+H), özel kelime eklemenize ya da sözlüğünü eğitmenize izin vermiyor. Word'ün ayrı dikte yüzeyi küçük bir dikte sözlüğü oluşturmanıza olanak tanısa da çoğu kişinin başvurduğu araç — Win+H — kelime dağarcığınızı hiç öğrenemiyor. Bu da bizi yanlış-isim, yanlış-jargon sorununda gerçekten fark yaratan tek düzeltmeye götürüyor.

Kendi kelimelerinizi öğretin: özel kelime dağarcığı

Whisper
Gerçek Whisper uygulaması — Ayarlar, Transkripsiyon'u açın ve isimlerinizle jargonunuzu Özel kelimeler alanına yazın. Tıklayıp deneyin; anlık çalışıyor.

Bu, dahili araçların veremediği düzeltme. Whisper modelini Whisper'ın yerel modunda çalıştırdığınızda Özel kelimeler alanına sahip olursunuz — duymasını beklediğiniz isimler, ürün terimleri ve jargonu virgülle ayırarak yazabileceğiniz bir liste. "Kubernetes, PostgreSQL, Remskill, Ahmet Yılmaz" yazıyorsunuz; transkripsiyon, konuşmanızda bu kelimeler geçtiğinde onları doğru yazmaya yöneliyor. Ücretsiz yerel katmanda, kart ve bulut gerekmeden Ayarlar, Transkripsiyon altında yer alıyor.

Bilmeye değer bir uyarı: Özel kelimeler bir Whisper modeli özelliği. Parakeet, daha hızlı yerel seçenek, özel kelimeler veya istem ipuçlarını desteklemiyor — kendi açıklaması bunu açıkça belirtiyor. Dolayısıyla araca kelime dağarcığınızı öğretmek sizin için önemliyse Whisper modelini seçin, Parakeet'i değil.

Bunun ne kadar önemli olduğunu küçük kızımdan öğrendim. Bir keresinde ona dikteyi gösterdim — bas, konuş, bırak. Hiç soru sormadan büyükannesine düşürdüğü diş ve diş perisinin döviz kuru hakkında 90 kelimelik bir e-posta yazdı hemen. Sonra en iyi arkadaşının adını sürekli mahvettiği için sinirli geri döndü. Kelime dağarcığı açığının ne olduğunu bilmiyordu. Sadece adın yanlış çıktığını biliyordu. Adı Özel kelimeler'e ekledim ve şikayetler durdu. Sıradan bir insan diktenin neden bir adı yanlış yazdığını anlamak istemez. Adı yazabileceği bir kutu ister. O kutu bu bölümün tüm amacı.

İsterseniz ikinci bir kol daha var: Whisper, modelin ne kadar dikkatli dinlediğini kontrol eden Hızlı, Dengeli veya Doğru seçenekli bir Profil ayarı sunuyor. Doğru daha yavaş ama daha çok şeyi yakalıyor. Whisper'ın sunduğu sekiz modelden daha büyüğünü seçmek — yaklaşık 140 MB'lık Base'den yaklaşık 3 GB'lık Large v3'e kadar — hız ile doğruluğu takas ediyor. Bunların hiçbiri herkes için "doğru seçim" değil; bunlar birer düğme ve hangi düğmeyi çevireceğinizi yanlış-kelimeler sorunu belirliyor. Hangisini yükleyeceğinizden emin değilseniz, Whisper modeli seçme rehberimiz artıları ve eksileri açıklıyor.

Geri kalanını düzelten temizleme geçişi

Thinking...
Whisper'ın isteğe bağlı yapay zeka temizleme geçişi ham transkript üzerinde çalışıyor — metin imlecinize gelmeden önce dilbilgisini, noktalamayı ve büyük/küçük harfleri düzeltiyor.

Ses temizlense ve kelime dağarcığı yüklense bile birkaç kalıntı hata sızıyor. Whisper, ham transkript imlecinize gelmeden önce isteğe bağlı bir yapay zeka temizleme geçişi çalıştırabiliyor — dilbilgisi, noktalama ve büyük/küçük harfleri düzeltiyor; "ee" ve "yani" gibi dolgu sözcüklerini temizliyor. Cihazınızda ücretsiz çalışıyor ya da kendi anahtarınızı girdiyseniz OpenAI ile Bulut modunda.

Bu bir güvenlik ağı, ilk hamle değil. Mikrofonu düzeltin, odayı susturun, dili ayarlayın, kelimelerinizi öğretin — sonra temizleme geçişinin kalanını derlesin. Fana bakan dahili bir mikrofonu yapay zeka metin düzeltmesiyle telafi etmeye çalışmak, yanlış sorunu pahalı araçla çözmeye çalışmaktır. Biliyorum, çünkü temizleme geçişini önce, dil seçiciyi sonra yanlış sırayla yayımladım; bir ay kendi uygulamamı kullanarak nedenini merak ettim. İnce ayar yapmak isteyenler için, Whisper istem rehberimiz çıktıyı şekillendirme konusunu daha derine iniyor.

Kayıt için kısayol Windows'ta Ctrl+Space, Mac'te Command+Option; halihazırda kullandığınız bir şeyle çakışıyorsa ikisi de Ayarlar'dan özelleştirilebilir.

Dahili araç düzeltilemediğinde

Bazen yanıt bir düzeltme değil — farklı bir araç ya da hiç araç kullanmamak. Sadece zaman zaman 30 kelimelik kısa mesajlar gönderiyorsanız, Apple Dictation ve Windows Ses Yazma ücretsiz ve yerleşik; mükemmel doğruluğu kovalamak abartılı olur. Zaten orada olanı kullanın.

Ama gerçek bir sınır var. Windows Ses Yazma internete ihtiyaç duyuyor ve kelime dağarcığınızı öğrenemiyor. Yanlış-kelimeler sorununuz özellikle aracın isimleri, ürün terimlerini veya teknik jargonu sürekli mahvetmesinden kaynaklanıyorsa — ve bu kelimeleri hiçbir yere ekleyemiyorsanız — dahili araç kullanım durumunuz için gerçekten düzeltilemez. İşte bu noktada öğrenilebilen, çevrimdışı çalışan bir araç değerini kanıtlıyor. Kendi yazınızı dikte etmek yerine çoğunlukla birden fazla konuşmacıyla toplantı deşifre ediyorsanız, bu tamamen farklı bir araç kategorisi — toplantı transkripsiyonu, dikte değil. Dikte uygulamasını yapılmadığı bir işe zorlamayın.

Dikteden ne kadar doğruluk beklemelisiniz?

Beklentileri dürüstçe belirleyin. Temiz ses, bilinen bir dil ve yüklü kelime dağarcığı sizi düzeltmelerin kural değil istisna olduğu noktaya taşıyacak. Whisper'ın kamuya açık kıyaslamaları, orta İngilizce modeliyle temiz okunan konuşmada yaklaşık yüzde 3 kelime hata oranına işaret ediyor. Gerçek hayat — aksan, oda, jargon — bunun üzerinde seyrediyor. Bu normal.

Hedef sıfır hata değil. Hedef, aynı sürede yazmaktan daha az hata yapmak; bu çıta insanların düşündüğünden çok daha alçak. Dakikada 145 kelimelik dikte, bir ya da iki kelime düzeltmek için durduğunuzda bile dakikada 40 kelimelik yazmayı geride bırakıyor. Her iki kelimede bir düzeltiyorsanız yukarıdaki listede hâlâ düzeltilmemiş bir şey var. Her onuncu kelimede bir düzeltiyorsanız zaten kazandınız.

Dikteniz yanlış kelimeler yazmaya devam ediyorsa sesi düzeltin, dili ayarlayın ve isimlerinizi öğretin — sonra bırakın yazsın, siz başka şeylerle ilgilenin. Küçük kızım hâlâ "konuşan bilgisayar" diyor. Bir kelime dağarcığı alanının, dil seçicinin ya da arkasında sekiz modelin olduğunu bilmiyor. İşte bu, gerçekten çalışan hâli — yanlış kelimeler durduğunda ve aracı fark etmez olduğunuzda.

İsimlerinizin doğru çıkmasını ister misiniz?

Whisper'ı indirin, ilk özel kelimenizi ekleyin ve yanlış kelimelerin ilk cümlede nasıl durduğunu görün.

Denys Medvediev'in fotoğrafı

Denys Medvediev

Destek e-postalarımızı okuyan benim — büyük ihtimalle yanıtları dikte ederek yazıyorum.

Daha fazla okuma