Rehber
Röportajları otomatik olarak transkribe etme
Bir röportajı otomatik olarak transkribe etmek için kaydı bir konuşma-metin aracından geçirin: gizlilik için kendi bilgisayarınızda Buzz veya OpenAI Whisper gibi ücretsiz ve açık kaynaklı bir seçenek ya da konuşmacı etiketleri ve düzgün bir editöre ihtiyaç duyduğunuzda bulut tabanlı bir transkripsiyon hizmeti. Ücretsiz ve özel için yerel, diarizasyon için bulut.
Son güncelleme: Haziran 2026

Bir röportajı otomatik olarak transkribe etmek için kaydı bir konuşma-metin aracından geçirin: gizlilik için kendi bilgisayarınızda Buzz veya OpenAI Whisper gibi ücretsiz ve açık kaynaklı bir seçenek ya da konuşmacı etiketleri ve düzgün bir editöre ihtiyaç duyduğunuzda bulut tabanlı bir transkripsiyon hizmeti. Ücretsiz ve özel için yerel, diarizasyon için bulut.
Garip kısmı baştan söyleyeyim, çünkü bu size on dakika kazandırır. Bu blogun ait olduğu uygulama olan Whisper by Remskill, röportaj kayıtlarını transkribe etmez. Canlı dikte bir araçtır: bir kısayol tuşuna basarsınız, konuşursunuz ve kelimeler herhangi bir uygulamada imlecinizin olduğu yere gelir. Bu, iki kişilik bir saatlik kaydı verip etiketlenmiş bir transkript almaktan bambaşka bir iştir. Bu rehber, röportaj işini gerçekten yapan araçlar hakkındadır; sizi doğru araca yönlendirmeyi, bizmiş gibi yapmaya tercih eden biri tarafından yazılmıştır.
Bir röportaj transkripti tek bir nedenden dolayı göründüğünden zordur: konuşmacılar. Sıradan bir transkripsiyon aracı size uzun bir metin duvarı verir. Genellikle istediğiniz şey ise her konuşma sırasının başında "Röportajcı:" ve "Konuk:" ibarelerinin olmasıdır. Buna diarizasyon denir ve her araç bunu yapmaz. Önemli olan ayrım yerel ile bulut arasındadır. Yerel araçlar dizüstü bilgisayarınızda çalışır, hiçbir şeye mal olmaz ve sesinizi hiçbir zaman yüklemez. Bulut hizmetleri dosyayı yükler ama genellikle konuşmacı etiketlerini halleder ve bir editör sunar. Aşağıda dürüst bir harita var; ardından tam olarak nerede işe yaradığımızı ve nerede yaramadığımızı anlatacağım.
Ücretsiz ve özel yol kendi bilgisayarınızda çalışır
Röportaj hassas nitelikteyse (korunması gereken bir kaynak, bir hasta, şirketten üst düzey bir yönetici) kaydın makinenizi terk etmemesi gerekir. Ücretsiz açık kaynaklı araçlar tamamen cihaz üzerinde transkripsiyon yapar.
OpenAI'ın Whisper modeli, bu araçların çoğunun üzerine inşa edildiği temeldir. MIT lisansıyla yayınlanmıştır, tek bir pip komutuyla kurulur ve komut satırından ses dosyalarını transkribe eder. Altı boyutu vardır; dördünün yalnızca İngilizce varyantları mevcuttur. Böylece donanımınıza bağlı olarak hız ile doğruluk arasında tercih yaparsınız. Çok dilli destek sunar ve transkripsiyon yaparken konuşmayı doğrudan İngilizceye çevirebilir. Röportajlar için can sıkıcı nokta şudur: temel Whisper kelimeleri yazar ama kimin söylediğini etiketlemez. Konuşmacı diarizasyonu için ek araçlara ya da bunu içinde barındıran bir bulut hizmetine ihtiyaç vardır.
Komut satırı sizi ürkütüyorsa, Buzz kolay yoldur. Whisper tarafından desteklenen, kişisel bilgisayarınızda çevrimdışı ses transkripsiyon ve çevirisi yapan grafik arayüzlü bir uygulamadır; MIT lisanslıdır ve macOS, Windows ile Linux'ta kullanılabilir. Kaydı sürükleyin, bir model seçin, bekleyin, transkribi okuyun. Ücretsiz röportaj transkripsiyonu yapan çoğu kişi için bu en kısa yoldur.
Bilmeye değer iki araç daha var. whisper.cpp, yalnızca CPU kullanan ve Apple Silicon için yoğun biçimde optimize edilmiş sade bir C/C++ Whisper portunun adıdır: daha hızlı, Python gerektirmez; ancak kendiniz derlemeniz ve komut satırından çalıştırmanız gerekir. MacWhisper ise dosya transkripsiyonunu ön plana alan, cihaz üzerinde Whisper ve NVIDIA'nın Parakeet modelini kullanan bir Mac uygulamasıdır; bu da tam olarak röportaj kullanım senaryosudur. Bunların hepsi sesi makinenizde tutar. Hiçbiri tek başına size temiz konuşmacı etiketleri sunmaz.
Bulut hizmetleri konuşmacı etiketleri ve editör ekler
Bu, gizliliğinizin sizin için ne kadar değerli olduğuna karar verdiğiniz ayrım noktasıdır. Özelleşmiş transkripsiyon hizmetleri kaydınızı sunucularına yükler, işler ve genellikle konuşmacıları adlandıran ve adları düzeltip dışa aktarmanıza olanak tanıyan bir editöre aktarılan bir transkript sunar. Bu kolaylık gerçektir; paylaşmaktan çekinmediğiniz halka açık bir podcast veya panel için daha iyi araçtır.
İhtiyacınız buysa (çok konuşmacılı etiketler, zaman damgaları, temiz bir düzenleme yüzeyi) dikte uygulaması yerine köklü toplantı ve kayıt transkripsiyon kategorisine bakın. Bu alanı Otter.ai alternatifleri yazısında ve Rev alternatifleri yazısında ele aldım; her ikisi de diarizasyon ve düzenlemeyi düzgün yapan bulut araçlarını kapsar.
İşte bir görüş, ve beraberinde fatura gelir. Bir zamanlar birlikte çalıştığım bir ekip, bir yükleniciye her konuşma için bulut yapay zekasını çağıran dahili bir dikte prototipi yaptırdı. Yönetici çeyreğin sonunda maliyet panosunu açtığında beş haneli bir rakamla karşılaştı; bunun büyük kısmı, yeniden deneme mantığının fazla hevesli olması nedeniyle standup kayıtlarının dört kez yeniden transkribe edilmesinden kaynaklanıyordu. CFO'nun yanıtı kısaydı: ya da zaten notları olan toplantıları yüklemek için ödemeyi bırakabiliriz. Para küçük sorundu. Büyük sorun, dahili görüşmelerin dörtte birinin artık bir satıcının sunucularında yaşıyor olmasıydı. Bulut transkripsiyonu, konuşmacı etiketleri ve düzenleme için gerçekten doğru seçimdir. Binadan asla çıkmasını istemediğiniz bir kayıt için ise yanlış seçimdir. Tercihinizi pazarlama vaatlerine göre değil, bu eksene göre yapın.
Tek cümlede nasıl seçersiniz
Bu sayfaya gelen üç tür kişi vardır: gizlilik bilincine sahip olanlar, son teslim tarihi baskısı altındakiler ve konuşmacı adlarını hiç düşünmeden isteyen kişiler. İki grup yerel seçeneğe gitmelidir.
- Ücretsiz ve özel isteyen — Buzz (en kolay) veya kendi makinenizde Whisper. Ses hiçbir zaman yüklenmez.
- Konuşmacı etiketleri ve düzgün editör isteyen — bir bulut transkripsiyon hizmeti. Ses yüklenir; bu değiş tokuş budur.
- Mac'te, dosya öncelikli uygulama isteyen — MacWhisper, cihaz üzerinde.
Dürüst belirleyici: kayıt hassas nitelikteyse cevap yerelde, nokta. Kamuya açık bir konuşmaysa ve diarizasyonun hazır gelmesini istiyorsanız, bulut hak ettiğini karşılar. Röportaj transkripsiyonlarının çoğu ilk türdendir; bu yüzden ücretsiz yerel araçlarla başlıyorum. Ham dönüşüm süreniz bir endişeyse, sesi hızlıca transkribe etme rehberi hız ayarlarını adım adım anlatır.
Whisper by Remskill'in gerçekten nerede işe yaradığı
Şimdi sınırı net çizeceğim kısım, çünkü bu yazının en kötü sonucu bir kayıt işleyeceğini umarak uygulamamızı indirmeniz olurdu. Olmaz. Whisper by Remskill dikte önceliklidir: bir kısayol tuşu canlı konuşmanızı tetikler, transkribe edilir ve hangi uygulamada olursanız olun imlecinizin olduğu yere yapıştırılır. "Röportaj dosyası yükle" düğmesi yoktur ve konuşmacı diarizasyonu da yoktur; çünkü tek bir ses için tasarlanmıştır: anlık olarak sizin sesiniz.
Peki bir röportajcı bunu nerede kullanır? Röportajın etrafında, üzerinde değil. İçeri girmeden önce hazırlık sorularınızı bir belgeye dikte etmek. Konuşma biter bitmez, izlenimler henüz tazeyken ve elleriniz hâlâ kahveyi tutarken takip notlarınızı sesle aktarmak. Transkript hazır olduğunda taslağı sesle oluşturmak. Windows'taki varsayılan kısayol Ctrl+Space'tir, tamamen yeniden atanabilir; yerel pipeline'ın tamamı, kayıt sırasında kart bilgisi gerektirmeksizin oturum açmış her kullanıcı için ücretsizdir. Canlı dikte için OpenAI destekli transkripsiyon ve web araması ekleyen ücretli bir bulut katmanı da mevcuttur; ancak bu hâlâ sesinizle yazmak içindir, iki kişilik bir kaydı transkribe etmek için değil.
Röportajın etrafındaki yazı işleri için bunu kullanın. Röportajın kendisi için Buzz veya bir bulut hizmetini kullanın. Farklı araçlar, farklı işler. Herhangi bir şey yüklemeden önce bunu bilmenizi tercih ederim.
Son bir söz
Transkribe etmeye değer röportaj kayıtlarının çoğu, en az yüklemek isteyeceğiniz olanlardır: resmi kayıt dışı bir kenara çekiliş, size güvenen bir kaynak, bir hasta. Ücretsiz yerel araçların yerini kazanmasının tüm nedeni budur; çünkü dosya dizüstü bilgisayarınızda kalır. Bir keresinde gerçek sorunun dizüstü bilgisayarın fanının altı inç yanında duran mikrofon olduğunu fark etmeden önce kendi bulanık sesimi temizlemek için model ayarlarını düzenleyerek bir hafta sonu harcadım. Yüksek lisans derecesi var bende. Önce mikrofonu alın.
Ve transkript hazır olup gerçekten yazmaya başlama zamanı geldiğinde, işte o zaman uygulamamız seyirci olmaktan çıkar.
Transkript hazır olunca taslağı dikte edin
Röportajı Buzz veya bir bulut hizmetiyle transkribe edin. Ardından Whisper by Remskill'i indirin ve yazıyı dikte edin — röportaj sürecinde tam olarak bunun için tasarlandık. Kayıt sırasında kart bilgisi gerekmeksizin yerel pipeline ücretsizdir.
Sonsuza kadar ücretsiz yerel dikte. Kayıt sırasında ödeme yöntemi gerekmez. Biz kayıtları transkribe etmiyoruz — bunun için yerel bir araç veya bulut hizmeti kullanın.



