Rehber
Akademisyenler için dikte yazılımı
Araştırmacılar, akademisyenler ve doktora adayları makale ve hibe tekliflerini sesle çok daha hızlı yazıyor. Kısayola basın, konuşun; metin doğrudan Word'de, Overleaf'te, Google Docs'ta ya da Scrivener'da imlecin bulunduğu yere gelir. Çevrimdışı çalıştığı için yayımlanmamış çalışmalarınız bilgisayarınızı asla terk etmez.
Son güncelleme: Haziran 2026

Akademisyenler için dikte yazılımı, söylenen cümleleri Word, LaTeX editörleri, Google Docs veya Scrivener gibi her yazma uygulamasında yazılı metne dönüştürür; bunun için sistem genelinde bir kısayol tuşu kullanır. Whisper gibi bir araç tamamen çevrimdışı çalıştığından yayımlanmamış araştırmalar bilgisayarda kalır; alan jargonunu ve yazar adlarını öğrenerek teknik terimleri doğru biçimde yazar.
Literatür taraması yazmak tuhaf bir deneyimdir. Söylemek istediklerinizi zaten biliyorsunuz — kırk makaleyi okudunuz, argüman kafanızda hazır — ama sonra bir saatinizi o argümanı tek tek tuş vuruşlarına dönüştürerek geçiriyorsunuz. Düşünce tamamdır; yazma sadece bir yük. Cümleyi bilmek ile onu fiziksel olarak oluşturmak arasındaki bu boşluk, diktenin akademik iş akışında hak ettiği yeri bulduğu noktadır.
İnsanlar "akademisyenler için dikte yazılımı" ararken atıf yönetimi, referans programları ve bunun gibi şeyler içeren, akademik kullanım için özel yapılmış bir araç bekliyorlar. Böyle bir şey yok; bunu vaat eden her araç abartıyor. Gerçekte elde ettiğiniz şey daha sade ve daha kullanışlı: halihazırda kullandığınız editörde, yayımlanmamış çalışmalarınızın sesi hiçbir sunucuya ulaşmadan bir paragrafı konuşarak yazmak. Kurulum iki dakika, Word'de de LaTeX dosyasında da aynı şekilde çalışıyor.
Çoğu sayfanın bu anahtar kelimeyi kovalarken görmezden geldiği kısım şu: bir makale taslağı sadece bir metin kutusudur. Yöntemler bölümü de öyle, editöre gönderilen ön yazı da, sürekli yeniden yazdığınız özet de. İmlece yapıştıran bir dikte aracı, o imleç Microsoft Word'de mi, Overleaf editöründe mi, Google Docs'ta mı yoksa bir Scrivener kartında mı olduğuyla ilgilenmez. Nereyi gösterirseniz oraya yazar.
Yani gerçek soru "akademi için özel bir dikte yazılımı var mı" değil. Büyük ölçüde yok ve ihtiyacınız da yok. Soru şu: editörünüzün üzerinde hangi dikte aracını çalıştıracaksınız, sızma riskini göze alamadığınız çalışmalar için çevrimdışı kalıyor mu ve alanınızın dolu olduğu ad ve terimleri doğru yazabiliyor mu? Bunların hepsini ele alacağım, birini kuracağım ve tamamen farklı bir araç gereken tek durumu da söyleyeceğim.
Araştırmacılar neden dikteye yöneliyor?

Dürüst bir bakışla temel ihtiyaç: hacim. Akademik yazı doğası gereği uzun formatlıdır — bir makale sekiz bin kelime, bir tez bölümü çok daha fazla, hibe teklifi ise kendi kelime sayısı ve değişmez bir son tarihe sahip. Bunların hepsini yazmak yavaş; zaten içeriği biliyorsanız bu yavaşlık daha da katlanır. Konuşma hızı çoğu insan için yazmadan üç ila dört kat hızlıdır; bu yüzden ilk taslağı dikte edip sonra düzenlemek, zaten düzenleyeceğiniz temiz bir taslağı yazmaktan çok daha verimlidir.
İkinci neden elleriniz. Uzun yazma seansları tekrarlayan zorlanmaların başladığı yerdir; tanıştığım pek çok araştırmacı dikteyı bir hız hilesi olarak değil, bilekleri şikayet ettiği günlerde yazmaya devam etmenin bir yolu olarak benimsedi. Açıkça söylemek gerekirse bu bir verimlilik ve erişilebilirlik aracıdır, tıbbi cihaz ya da tavsiye değil — sadece tuş vuruşlarını ortadan kaldırır. Ama tez savunmanız altı hafta sonra olduğunda ve elleriniz darboğaz haline geldiğinde, tam da istediğiniz şey budur.
Üçüncü neden yakalamak. Tartışma bölümü için o harika fikir kahve makinesine yürürken geliyor, klavyenin başında otururken değil. Basıp konuşabildiğiniz bir kısayol, fikrin buharlaşmadan önce taslağınızda bir paragrafa dönüşmesini sağlar. Yazmak değil, taslak oluşturmak — işte asıl dönüşüm bu. Metni karakter karakter üretmeyi bırakıp cümle cümle üretmeye başlıyorsunuz; bu da argümanın kafanızdaki gerçek yaşayış biçimine çok daha yakın.
Kısayola bas, konuş, metin taslağına gelir
Bütün mekanizma bu kadar basit — en iyi anlamda sıkıcı. Kısayola basıyorsunuz, konuşuyorsunuz, bırakıyorsunuz; transkript odak noktasındaki metin alanında imlecin bulunduğu yere yapışıyor. Whisper tuşu bıraktığınızda kısa bir süre daha dinlemeye devam ediyor, böylece son kelimeniz kesilmiyor. İşletim sisteminin imlecine yapıştırdığı için editörünüz sadece "herhangi bir metin kutusu" oluyor — bir Word belgesi, bir Overleaf kaynak bölmesi, bir Google Docs paragrafı, bir Scrivener kartı, bir derginin gönderim portalındaki yorum kutusu.
Bu, pazarlama sayfalarının gereksiz yere karmaşıklaştırdığı kısım. Word'e sıkıştıracak bir eklenti yok, ekleyecek bir LaTeX paketi yok, Google Docs içinde yetkilendirecek bir eklenti yok. İmleciniz makalede, konuşuyorsunuz, kelimeler makalede beliriyor. Konuşurken küçük bir kapsül belirir, böylece dinlendiğini anlarsınız:
Kısayol, en baştan doğru ayarlanmaya değer tek şeydir. Windows'ta Ctrl+Space; Mac'te konuşurken basılı tutacağınız Command+Option kombinasyonu. Her ikisi de Ayarlar'dan değiştirilebilir; editörünüzde kullandığınız bir kısayolla çakışıyorsa sorun yaşarsınız — akademik araçlar çakışan kısayollarla dolup taşar, bu yüzden burada bu konu her zamankinden daha önemli. Daha önce Windows'ta dikte veya Mac'te dikte kullandıysanız, aynı kas belleğini taslağınıza yönlendiriyorsunuz.
İki dakikada kurulum (Windows veya Mac)
Apple Silicon bir Mac ya da Windows 10 veya üzeri bir bilgisayar, çalışan bir mikrofon ve açık editörünüz gerekli — Word, Overleaf ya da Google Docs içeren bir tarayıcı sekmesi, Scrivener, her ne kullanıyorsanız. Yerel pipeline, oturum açmış herhangi bir hesap için ücretsizdir; kayıt sırasında ödeme bilgisi istenmez. İşte adımlar.
Adım 1 — Whisper'ı yükleyin ve giriş yapın.
İndirme sayfasından indirin, yükleyin ve ücretsiz bir hesap oluşturun. Kart gerekmez. Yerel transkripsiyon pipeline'ı hemen açılır.
Uygulamanın sistem tepsisi simgesi belirdiğinde ve kurulum sihirbazı bir model seçmenizi önerdiğinde kurulum başarılıdır.
Adım 2 — Transkripsiyon yolunu seçin.
Uygulama sizin yerinize seçim yapmaz. Üç seçenek var: Bulut (OpenAI, kendi anahtarınızla), Yerel Parakeet veya Yerel Whisper. Yayımlanmamış çalışmalar için yerel ile başlayın — iki bölüm sonra hangisini seçeceğinize dair daha fazla bilgi var.
Model indirmeyi tamamlayıp hazır olarak göründüğünde işlem başarılıdır.
Adım 3 — Kısayolunuzu onaylayın.
Windows varsayılanı Ctrl+Space, Mac'te basılı tutarak konuşulan push-to-talk için Command+Option. Mac'te istendiğinde Erişilebilirlik iznini verin; bu izin olmadan imleç yapıştırma diğer uygulamalara ulaşamaz.
Test kaydı herhangi bir metin alanına yapışıyorsa kurulum başarılıdır.
Adım 4 — İmleci taslağınıza koyun ve konuşun.
Makalenizi açın, sonraki cümlenin geleceği yere tıklayın, kısayola basılı tutun, cümleyi söyleyin, bırakın. Transkript belgede imlecin bulunduğu noktada belirir.
Söylediğiniz cümle taslakta metin olarak duruyorsa kurulum başarılıdır.
Yavaş olan kısım model indirmedir, kurulum değil. Geri kalanı yukarıdaki dört adımdan ibarettir. Bir kez çalışmaya başladığında paragraf yazmak bir yazma görevi olmaktan çıkıp konuşma görevine dönüşür; editörünüz ise hiçbir şeyin değiştiğini fark etmez.
Alan jargonu, yazar adları ve çevrimdışı kalmak
Akademik yazıya özgü iki sorun var ve her ikisinin de gerçek bir cevabı var. Birincisi söz dağarcığı. Alanınız genel bir konuşma modelinin hiç görmediği terimlerle dolu — bir gen adı, bir kimyasal bileşik, onu icat eden üç kişinin adını taşıyan bir yöntem, kırk kez atıf yaptığınız yazarın soyadı. Herhangi bir dikte motoru bunların bir kısmını çarpıtır; çünkü benzer seslerin olası kelimelerini tahmin etmeye çalışır. Yerel Whisper bunu hotword ve özel söz dağarcığı ile çözer: kullandığınız terim ve yazar adlarını verirsiniz, sistem bunları sıradan kelimelere değil doğru biçimiyle yazmaya yönelir. Daha hızlı yerel motor olan Parakeet hotword desteklemiyor — yani makaleniz jargon doluysa, Whisper'ı Parakeet'e tercih etmenizin nedeni tam da bu fark.
İkinci sorun gizlilik; yayımlanmamış araştırmalar için bu paranoya değil, işin gereği. Yayın öncesi sonuçlar, gönderim öncesi hibe teklifi, ambargo altındaki bir makale, üzerinde NDA veya bekleyen patent olan her şey. Bulut diktenin sesinizi transkripsiyon için bir satıcının sunucusuna gönderir. Yerel dikte göndermez. Hem Whisper hem de Parakeet tamamen kendi makinenizde çalışır; dışarıya hiçbir şey çıkmaz; yani yayımlanmamış bulgularınızı okurken sesiniz başkasının günlük dosyasına girmez. Bu ayrım çalışmanızda önemliyse — pek çok araştırmada bu tartışmasız bir zorunluluktur — çevrimdışı öncelikli durum tam olarak şurada ele alınıyor: özel, çevrimdışı konuşmadan metne.
Aramızda kalsın, makaleyi yazan ben olsaydım bu konuda asla taviz vermezdim. Taslak, çalışmanızın en hassas halidir — hataların hâlâ içinde olduğu, bir rakibin bayıla bayıla okuyacağı, henüz öncelik hakkı talep etmediğiniz versiyon. Bir model indirmekten kurtulmak için bunu kontrol edemediğiniz bir sunucudan geçirmek kötü bir takas. Dizüstü bilgisayarınızın zaten mikrofonu ve işlemcisi var. Bir paragraf metin için sunucuya gerek yok.
Yerel mi, bulut mu: akademik çalışmalar için hangi mod?
Akademik taslakların büyük bölümü için yerelden başlayın. Gizlilik konusunun gündeme gelmesinin tek nedeni, çalışmanın yayımlanmamış olmasıdır; yerel mod sesi makinenizde tutan tek seçenektir. Mac'iniz Apple Silicon'lı ya da bilgisayarınız son birkaç yıldan biriyse, yerel mod günlük dikteyi sorunsuz karşılar; bulut ise varsayılan yerine kaçış kapısına dönüşür. Uygulamanın sunduğu üç yolun gerçekte nasıl farklılaştığına bakalım.
Hızlı seçmek yerine doğru seçmenizi istiyorum; işte her birinin sade açıklaması:
- Yerel Parakeet — NVIDIA'nın TDT motoru, yaklaşık 600 MB; CPU üzerinde Whisper'dan 5 ila 10 kat daha hızlı, en hızlı yerel seçenek. İngilizce artı 24 Avrupa dili, toplamda 25 dil. İngilizceye çeviri ve hotword desteği yok; bu yüzden alanınızın jargonuna göre ayarlanamaz. Söz dağarcığının sıradan olduğu, düz yazıdaki hızlı ve tamamen çevrimdışı taslaklar için tercih edin.
- Yerel Whisper — Aynı makinede Parakeet'ten yavaş, ancak hotword ve özel söz dağarcığını destekliyor — yazar adları ve teknik terimler için tam istediğiniz şey — ve çok dilli sürümler 99 dili kapsıyor, İngilizceye çevirebiliyor. Sadece İngilizce sürümler yalnızca İngilizce, 99 değil. Varsayılan İngilizce model yaklaşık 480 MB. Jargon yoğun bir makale için yerel seçim bu.
- Bulut (OpenAI, BYOK) — En iyi doğruluk ve web erişimi; kendi OpenAI anahtarınızı kullanırsınız, ücret doğrudan OpenAI tarafından kesilir. Transkripsiyon varsayılan olarak gpt-4o-mini-transcribe üzerinde çalışır. İnternet gerektirir; bu yüzden makinenizi terk eden tek yoldur — hassas olmayan yazılar için sorun yok, ambargolu sonuçlar için yanlış tercih. Bulut arayüzü Whisper Pro'nun bir parçasıdır.
Çoğu makalenin yazıldığı türden düz metin için yerel Whisper yeterlidir; hotword desteği de onu araştırma için doğru yerel motor yapan şeydir. Bulut, zor bir kayıtta üst düzey doğruluk istediğinizde ya da cümle ortasında web'den bir bilgiye ihtiyaç duyduğunuzda ve çalışma gizli değilken devreye girer. Sızdırma riskini göze alamadığınız bir taslak için seçim kendiliğinden yapılır.
Sözlü taslağı temiz bir metne dönüştürmek
Ham dikte, kesintisiz bir metin olarak çıkar. "Sonuçlar iki değişken arasında bir korelasyon olduğunu gösteriyor ancak belirtmek gerekir ki örneklem büyüklüğü küçüktü" dersiniz ve herhangi bir konuşma motorunun size teslim ettiği noktalama işaretsiz metin bloğu tam olarak budur. Temizlemek, modların ayrıştığı yerdir.
Windows Ses Yazma, konuşurken noktalama ekler; macOS Dikte ise "virgül" veya "nokta" dediğinizde temel noktalamayı halleder. Daha ağır temizlik için — yanlış başlangıçları ayıklamak, kesintisiz cümleleri düzeltmek, sözlü bir paragrafı makaleye koyabileceğiniz hale getirmek — Whisper bir yapay zeka geçişi çalıştırabilir. "Hey whisper" etkinleştirme ifadesini söyleyin; metin iyileştirilmiş halde gelir. Yerel modda bu Ollama üzerinden çalışır, temizleme de çevrimdışı kalır; bulut modunda varsayılan olarak gpt-5-mini kullanılır.
sonuçlar iki değişken arasında bir korelasyon olduğunu gösteriyor ancak belirtmek gerekir ki yani örneklem büyüklüğü burada oldukça küçüktü
Sonuçlar iki değişken arasında bir korelasyon olduğunu göstermekle birlikte örneklem büyüklüğü oldukça küçüktü.
Adil bir uyarı, çünkü abartmak kimseye yarar sağlamaz: yapay zeka geçişi dil bilgisini ve dolgu ifadelerini düzeltir, iddialarınızı doğrulamaz ya da istatistiklerinizi düzeltmez; üstelik tam bir teknik terimi sessizce sıradan bir kelimeyle "düzeltebilir". Ürettiğini okuyun — zaten okuyacaksınız, bu sizin makaleniz. Temizlemeyi daha hızlı bir ilk taslak olarak değerlendirin, asla son taslak olarak değil. Dürüst cevap şu: ses kelimeleri hızla aktarır, bilimsel yargı hâlâ size aittir.
Aynı konuş-ve-temizle akışı makalenin çok ötesinde işe yarıyor — aynı şekilde Google Docs'a temiz metin dikte edebilirsiniz; böylece ortak yazılan bir belge ya da hakeme yanıt, yazdığınız bir paragraf yerine birkaç sözlü cümle oluverir.
Dikteyi atlayıp transkripsiyon aracına ne zaman geçmeli?

Dikte ve transkripsiyon sürekli karıştırılır; akademik çalışmalar için bu fark her şeydir. Dikte, siz tarafından, kasıtlı olarak, gerçek zamanlı olarak, kendi metninizi üretmek için konuşmaktır. Transkripsiyon ise mevcut bir kaydı — bir röportajı, odak grubunu, dersi, saatler süren saha sesi kaydını — sonradan metne dönüştürmektir. Bunlar farklı işlerdir ve dikte kısayolu ikincisi için yanlış araçtır.
Göreviniz nitel araştırma sesi ise — oturarak yapılan röportajlar, kayıtlı oturumlar, konuşmacı etiketleri ve zaman damgaları istediğiniz saha kayıtları külliyatı — özel bir transkripsiyon hizmetine veya toplu ses dosyaları için yapılmış bir araca başvurun. Bu, çoğunlukla birden fazla konuşmacıyla kayıtları işlemekle ilgili bir iş olduğu için tam da buna uygun tasarlanmış yazılım istersiniz. Bu da dahil olmak üzere dikte yazılımları, konuşanın siz olduğunuz ve kelimelerin konuşurken taslağınıza düşmesinin amaçlandığı kısım içindir.
Gerçekten küçük işler için ise ücretsiz yerleşik araçlar yeterlidir. Windows'ta Windows tuşu + H, imlecin bulunduğu yerde Sesli Yazma çubuğunu açar; kendi kendine noktalama yapar ancak Microsoft sunucuları üzerinden geçer, yani çevrimdışı değildir. Mac'te Dikte, Klavye altında Sistem Ayarları'nda bulunur; Apple Silicon'da genel metin cihazda işlenebilir. Tek satırlık bir not veya ortak yazara hızlı bir e-posta için bu yeter. Çalışma uzadığında, söz dağarcığı teknikleştiğinde veya sonuçlar makinenizi terk edemediğinde özel, çevrimdışı, sistem genelinde bir araca geçin.
Taslağınız masaüstü uygulamasından çok tarayıcıda yaşıyorsa aynı mantık Google Docs'ta sesli yazma konusunda da geçerli; burada da gerçek entegrasyon bir eklenti değil, imleçtir.
Akademi için özel yapılmış bir dikte yazılımı yok ve bunu yazdıktan sonra gerek de olmadığına ikna oldum. Makale sadece bir metin kutusudur, imleç entegrasyondur; akademiye özgü tek kısımlar — yayımlanmamış çalışmaları çevrimdışı tutmak ve araca alanınızın jargonunu öğretmek — ayrı ürünler değil, ayarlardır. Bunun büyük bölümünü atıf kavramından hiç haberdar olmayan düz bir metin editörüne dikte ettim; her kelime kendi dizüstü bilgisayarımda kaldı, sonra da ilk taslak gibi düzenledim. İşin püf noktası bu.
Bir sonraki makalenizi sesle yazın
Kısayola basılı tutun, konuşun, bırakın. Transkript imlecin bulunduğu her yere gelir — Word, LaTeX, Google Docs, Scrivener — ve çevrimdışı olduğu için yayımlanmamış çalışmalar makinenizde kalır.
Oturum açmış herhangi bir hesap için ücretsiz yerel mod. Başlamak için kart gerekmez.



