Yazan: Denys Medvediev

Rehber

Toplantı transkripsiyon yazılımı

Tek bir arama terimi, iki çok farklı iş. Bazı araçlar görüşmenize katılmak için bir bot gönderir ve ortak notlar tutar. Bazıları ise elinizde zaten olan bir kaydı, çevrimdışı olarak kendi bilgisayarınızda işler. Hangisine gerçekten ihtiyaç duyduğunuzu anlatıyoruz.

Son güncelleme: Haziran 2026

Mikrofon ve monitörlerle donatılmış, yazılımın transkribe edeceği bir toplantıya hazır boş konferans masası

Toplantı transkripsiyon yazılımı, bir görüşmedeki konuşmaları aranabilir yazılı metne dönüştürür. İki şekilde çalışır: gerçek zamanlı transkripsiyon, insanlar konuşurken metnin canlı olarak görünmesi; toplantı sonrası transkripsiyon ise kayıt bittikten sonra işlenerek daha temiz, konuşmacı etiketli ve zaman damgalı notlar üretir. Çoğu araç, takvim senkronizasyonu ve bir toplantı botu aracılığıyla görüşmeye otomatik katılır; bazıları ise elinizde bulunan bir kayıt üzerinde botsuz çalışır.

Bir ekibin toplantı transkripsiyon için gerçekten yüksek bir fatura biriktirdiğini ilk gördüğümde, rakam beş haneliydi ve toplantıların zaten notları vardı. Bir yüklenici, her ses ifadesi için bulut API'sini çağıran dahili bir yapay zeka dikte prototipi kurmuştu; üstelik yeniden deneme mantığı o kadar agresifti ki aynı stand-up kaydını dört kez transkribe etti. Yönetici çeyrek sonunda maliyet panosunu açtı. Odada sessizlik çöktü.

Bu kategorinin sıkıcı gerçeği şu: yanlış aracı seçmek para, gizlilik ya da zaman açısından pahalıya patlar; üstelik genellikle kimse fark etmeden önce.

Bu makalenin tüm amacı da bu. Ekipler on yıldır elleri değmeden toplantı notları istedi ve araçlar artık bu işi gerçekten iyi yapıyor. Tek sorun, tek bir arama terimi altında birbirinden çok farklı işler yapıyorlar. Bazıları video görüşmenize bot olarak katılıp herkes için ortak notlar tutar. Bazıları ise toplantıdan sonra, kendi bilgisayarınızda, botsuz ve çevrimdışı olarak kaydı işler.

Aşağıda her iki yolu da anlatıyor, bilmeye değer araçları isimlendiriyor ve kendi uygulamamızın yapmadığı tek iş konusunda dürüst kalıyorum: Whisper bir toplantı botu değil. Destek e-postalarımızı okuyan biri olarak şunu söyleyebilirim: bu kategorideki karışıklıkların büyük çoğunluğu, insanların ilk günden yanlış türde araç seçmesinden kaynaklanıyor. O e-postayı yalnızca konu satırından tanıyacak kadar çok kez yanıtladım.

Toplantı transkripsiyon yazılımı ne yapar (ve nasıl çalışır)

Pazarlama söylemleri bir yana, buradaki her araç tek bir iş yapar: sesi alır ve metin üretir. Ses, bir toplantıdaki insan konuşmasıdır. Metin ise transkripttir. Geri kalan her şey — özetler, eylem maddeleri, konuşmacı etiketleri, arama — bu tek dönüşümün üzerine inşa edilmiştir.

Kategori, dönüşümün ne zaman gerçekleştiğine göre ikiye ayrılır.

  • Gerçek zamanlı transkripsiyon insanlar konuşurken çalışır. Sözcükler, konuşmacının bir iki saniye gerisinde ekranda belirir. Bunu Zoom veya Microsoft Teams'deki canlı altyazı özelliğinden ve görüşme sırasında akan transkript gösteren not botu uygulamalarından tanıyorsunuz. O anda işe yarar: erişilebilirlik, konuşmayı takip etme ve kaçırdığınız bir ismi yakalamak için.
  • Toplantı sonrası transkripsiyon görüşme bittikten sonra bir kayıt üzerinde çalışır. Araç tüm dosyaya sahip olduğundan zamanını verimli kullanabilir. Yanlış başlangıçları temizler, kimin ne söylediğini etiketler, zaman damgaları ekler ve okunabilir bir belge oluşturur. Toplantı sonrası işleme, canlı versiyona kıyasla daha temiz, konuşmacı etiketli ve zaman damgalı metin üretir. Bedeli ise bekleme süresidir.

Tanıdık araçların çoğu (Otter, Fireflies, Fathom, tl;dv) her ikisini de yapar ve sesi aynı yoldan alırlar: bir bot görüşmeye katılır. Google veya Outlook takviminizi bağlarsınız, araç video bağlantısı olan bir toplantı görür ve odayı dinleyip kaydetmek için oraya bir katılımcı gönderir. Zoom ızgarasında gördüğünüz o küçük kayıt kutucuğu, tüm modeli tek bir karede özetler.

Arama teriminin gölgesinde kalan üçüncü bir yol daha var: zaten sahip olduğunuz bir kaydı, kendi bilgisayarınızda, bot olmadan ve görüşmeye bağlanmadan transkribe etmek. Bu, toplantı not alıcısından ziyade dikte ve transkripsiyon yazılımıdır; kendi uygulamamızın bulunduğu alan da tam olarak burasıdır. Aşağıda buna daha ayrıntılı değineceğiz — ne zaman yanlış tercih olduğunu da dahil.

Bir toplantı botunun doğru tercih olduğu durumlar (ve Whisper'ın olmadığı durumlar)

Not Alıcı · Haftalık SyncKayıt
Görüşmede
Maria (ev sahibi)
Tom
Priya
Not alıcı bot
Canlı transkript

Maria 10:02 Lansman tarihiyle başlayalım.

Tom 10:02 Sanırım bir hafta erteliyoruz.

Otomatik katılım: takvim senkronize · Görüşme sonrası özet + eylem maddeleri
Bir bot not alıcısı: takviminizden otomatik olarak görüşmeye katılır, katılımcı listesinde görünür ve herkes için canlı bir transkript oluşturur. Whisper bunu yapmaz.

Sorununuz "bir şey Zoom, Teams veya Google Meet görüşmeme katılmalı, herkesi kaydetmeli ve sonrasında tüm ekibe ortak notlar sunmalı" şeklindeyse, bir toplantı botuna ihtiyacınız var. Whisper bunu yapmaz. Görüşmelere otomatik katılmaz, diğer katılımcıları kaydetmez ve bir video toplantısında çok konuşmacılı diarizasyon yapmaz. Aksi yönde bir iddiada bulunmak öğleden sonranızı boşa harcatır.

Bu iş için doğru seçimler bot tabanlı not alıcılardır. Otter.ai, otomatik olarak notlar yazmak ve paylaşmak için Zoom, Microsoft Teams ve Google Meet'e katılır; modeli denemeden önce ödeme yapmak istemeyenler için ücretsiz Basic planı vardır. Fireflies.ai, davet yoluyla veya takvim toplantılarına otomatik katılarak görüşmelere dahil olur; ücretsiz planı sınırlı yapay zeka özetleriyle birlikte sınırsız transkripsiyon sunar. tl;dv, Google Meet, Zoom ve Teams'i kaydeder, bot gerektirmeyen bir yakalama modu sunar ve zaman sınırı olmayan ücretsiz bir plan içerir. Fathom, sınırsız kayıt ve bot gerektirmeyen (beta) ya da bot tabanlı yakalama seçeneğiyle ücretsiz kalıcı bir plan sunar.

Makalenin bu bölümünde sizi kasıtlı olarak başka yere yönlendiriyorum. Otter toplantılar içindir. Whisper yazmak içindir. Bunlar farklı kategorilerdir ve yanlış olanı satın almak bu alandaki en yaygın hatadır. Kaydedilmiş bir görüşmede çok konuşmacılı diarizasyona, takvim otomatik katılımına ve toplantı biter bitmez ekip kanalında bir özete ihtiyaç duyuyorsanız, bot not alıcı uygulamamızın hiçbir zaman yapılmak üzere tasarlanmadığı bir işi yapar. Biz sesle yazma eylemini hızlandırırız; onlar ise bir odayı otomatik olarak yakalar. Önce kategoriyi, sonra aracı seçin.

Yapay zeka toplantı transkripsiyonu gerçekten ne kadar doğru?

Dürüst yanıt: temiz seste beklediğinizden iyidir, gerçek bir toplantıda umduğunuzdan kötüdür. Kategori, net tek dilli seste yüzde 85 ila 95 doğruluk civarında seyreder; arka plan gürültüsü, aksanlar, jargon ve üst üste konuşmalarla bu oran düşer. İnsan doğrulamalı hizmetler yüzde 99'a yaklaşır çünkü modelin kaçırdığını biri düzeltir.

Kendi yerel modumuz, genellikle yüzde 95 ile 99 arasında bir doğruluk rapor eder; daha büyük modeller daha yüksek skorlar alır. Burada dikkatli olmak istiyorum. Bu ölçüm kendi yazılımımıza ait; Otter veya Fireflies ile bağımsız bir karşılaştırma değil ve böyle bir test uydurmayacağım. Size ses koşullarını söylemeden tek bir doğruluk yüzdesi veren herkes ölçüyor değil, satıyor demektir.

İşte kimsenin pazarlamadığı kısım, çünkü burada ek satış yok. Mikrofon, modelden daha önemlidir. Yirmi dolarlık bir USB mikrofon, küçük modelden büyüğüne geçmekten transkriptinize daha fazla katkı sağlar. Gördüğüm kötü transkriptlerin büyük çoğunluğu model hatası değildi. Bir klima sesi yakalayan dizüstü mikrofon, tek bir speakerphone'u paylaşan dört kişi ya da her cümlenin ilk kelimesini kesen bir Bluetooth kulaklıktı. Önce sesi düzeltin. Yapay zeka bir su ısıtıcısının sesini geri alamaz.

Arka planda doğruluğu etkileyen iki şey daha var. Birincisi, aracın bir kişinin nerede bitip diğerinin nerede başladığına nasıl karar verdiği; özellikle insanlar aynı anda konuştuğunda bu zorlaşır. İkincisi ise özel sözcük dağarcığı desteği: genel modelin hiç görmediği ürün adlarını, soyadlarını ve kısaltmaları besleyebilme imkânı. Whisper, yerel Whisper motorunda özel sözcük dağarcığı ayarlamanıza ve belirli anahtar kelimelere öncelik vermenize olanak tanır; pek çok toplantı botu da bunu yapar. Görüşmeleriniz jargonla doluysa, bu tek ayar model yükseltmesinden daha değerlidir.

Botsuz ve çevrimdışı: zaten elinizde olan bir kaydı transkribe etmek

Arama teriminin sessiz geçtiği ve uygulamamızın var olduğu yol işte burası. Yazılımın bir toplantıya katılmasına her zaman ihtiyaç duymazsınız. Bazen zaten bir kaydınız vardır — bire bir görüşmeden bir ses notu, bir röportaj, bir web semineri dışa aktarımı, bir meslektaşın gönderdiği klip — ve yalnızca bundan temiz bir metin istiyorsunuzdur; kendi bilgisayarınızda, kimsenin görüşmesinde bot olmadan.

Whisper gibi dikte ve transkripsiyon yazılımı burada devreye girer ve gizlilik konusunda gerçek değerini kanıtlar. Yerel moddaki her şey bilgisayarınızda çalışır. Ses cihazı terk etmez: arada sunucu yok, satıcı günlüğü yok, bulut maliyet sayacı yok. Patronunuzun maaş görüşmesi, hukuki kayıt, İK konuşması — bunların hiçbiri bir transkripte ihtiyaç duyduğunuz için üçüncü tarafın depolama alanına düşmemelidir. Yerel-önce burada bir özellik değil. Tüm meseledir.

Whisper
Gerçek Whisper uygulaması, yerel olarak çalışıyor — tıklayıp keşfedebilirsiniz. Botsuz yol bu: zaten sahip olduğunuz bir kaydı işaret edin ve kendi bilgisayarınızda temiz metin alın.

Whisper, her ikisi de tamamen Rust ile yazılmış transcribe-rs üzerinden çalışan iki yerel motor kullanır; başlatmayı yavaşlatan bir Python sidecar yoktur. İlki OpenAI'nin açık kaynaklı Whisper modeli olup çok dilli sürümlerinde 99 dili destekler ve İngilizceye çeviri yapabilir; model boyutları yaklaşık 140 MB'lık Base'den yaklaşık 3 GB'lık Large v3'e kadar uzanır. Yalnızca İngilizce sürümler adından da anlaşılacağı üzere yalnızca İngilizce destekler ve biraz daha hafif çalışma eğilimindedir. İkinci motor NVIDIA'nın Parakeet TDT motorudur; yaklaşık 600 MB boyutunda olup uygulama içinde CPU'da Whisper'dan 5 ila 10 kat daha hızlı olarak tanımlanır. İngilizce ve 24 Avrupa dili dahil toplam 25 dili destekler; İngilizceye çeviri özelliği yoktur. Çoğunlukla İngilizce çalışıyorsanız hız için Parakeet'i seçin. Çeviri ya da Parakeet'in kapsamadığı bir dile ihtiyaç duyuyorsanız Whisper'ı tercih edin.

CancelTranscribing
Whisper, bir kaydı işlerken görünen küçük yüzen widget — kimsenin görüşmesinde bot yok.

Etkileşim, gün boyunca benim de kullandığım etkileşimle aynı. Kısayol tuşunu basılı tutun — Windows'ta Ctrl+Space veya Mac'te her iki tuşu basılı tutup birini bırakarak durduran Command+Option bas-konuş akordu — konuşun ve metin, o an odaklanılan uygulamada imlecinizin bulunduğu yere düşer. Küçük bir bindirme, çalışırken durumu gösterir. Canlı konuşma yerine bir kayıt için uygulamayı dosyaya yönlendirin ve transkripti alın. Özellikle dikte tarafıyla ilgileniyorsanız çevrimdışı konuşmadan metne kılavuzumuz her şeyi cihaz üzerinde çalıştırma konusunu daha ayrıntılı ele alır.

En yeni OpenAI modellerini ve aynı araçta sesle web araması yapmak isteyenler için bir Bulut seçeneği de vardır. Kendi OpenAI anahtarınızı getirin, metni yapay zekaya yönlendirmek için "Hey whisper" deyin. Ancak elinizde bulunan bir kaydı transkribe etmek için yerel mod yanıtınızdır ve oturum açmış her kullanıcı için ücretsizdir.

Bilmeye değer diğer araçlar

Bu kategori kalabalık ve arama sonuçları her birinde altı ila on araç sıralayan listelerle dolu. Aşağıda, on inceleme okumak zorunda kalmadan her birinin ne için olduğunu anlayabileceğiniz açık bir harita sunuyorum. Aşağıdaki her özellik ilgili aracın kendi sayfalarından alınmıştır.

  • Otter.aivarsayılan toplantı not alıcısı. Bot Zoom, Teams ve Meet'e katılır; aylık 300 dakikalık ücretsiz Basic planı, üzerinde ücretli Pro ve Business seviyeleri var. Altı dilde transkripsiyon: İngilizce, İspanyolca, Fransızca, Almanca, Japonca, Çince.
  • Fireflies.aibot davet yoluyla ya da takvim otomatik katılımıyla katılır. Sınırsız transkripsiyon ve sınırlı yapay zeka özetleri sunan ücretsiz plan; 100'den fazla dil.
  • tl;dvMeet, Zoom ve Teams'i kaydeder, bot gerektirmeyen bir mod sunar, 30'dan fazla dilde transkript çıkarır; zaman sınırı ve kart gerektirmeyen ücretsiz kalıcı plan.
  • Fathomsınırsız kayıt sunan ücretsiz kalıcı plan; bot gerektirmeyen (beta) ya da bot tabanlı yakalama seçeneği; üzerinde ücretli Premium, Team ve Business seviyeleri.
  • NottaZoom, Teams ve Meet için toplantı botu ve ücretsiz katman içerir; kendi yardım merkezi yaklaşık 58 dil olduğunu belirtir.
  • Zoom ve Teams, dahilibir şey satın almadan önce zaten ne için ödeme yaptığınızı kontrol edin. Zoom, bulut kayıtlarını transkribe eder ve uygun ücretli planlarda 46 dilde AI Companion gerçek zamanlı transkripsiyon sunar. Microsoft Teams, yaklaşık 50'den fazla konuşma dilinde dahili canlı transkripsiyona sahiptir; canlı çeviri transkripsiyonu Teams Premium gerektirir.

Aynı harita aşağıda tablo halinde, yalnızca her aracın kendi sayfalarında doğrulayabileceğiniz kısımlarla. Hiç kimse aynı ses üzerinde kafa kafaya bir test yapmadığından doğruluk veya hız rakamı eklemedim; böyle bir testi uydurmayacağım.

Toplantı transkripsiyon araçları karşılaştırması: yakalama yöntemi, çalıştığı ortam, çevrimdışı destek, fiyatlandırma modeli, dil sayısı ve her birinin en iyi olduğu kullanım alanı.
AraçYakalamaYerel/BulutÇevrimdışı çalışırFiyatlandırma modeliDillerEn iyi olduğu alan
Otter.aiBot görüşmeye katılırBulutHayırÜcretsiz katman + kullanıcı başına ücretli6Varsayılan ekip not alıcısı
Fireflies.aiDavet ya da otomatik katılımla botBulutHayırÜcretsiz katman + kullanıcı başına ücretli100+Cömert ücretsiz transkripsiyon
tl;dvGörüşmeyi kaydeder, bot gerektirmeyen modBulutHayırSonsuza kadar ücretsiz + ücretli30+Toplantı ızgarasında bot istemeyenler
FathomBot gerektirmeyen (beta) veya botBulutHayırSonsuza kadar ücretsiz + ücretliFiyatlandırma sayfasında belirtilmemişSınırsız ücretsiz kayıt
NottaBot görüşmeye katılırBulutHayırÜcretsiz katman + ücretli~58 (kendi yardım merkezi)Bot ve ücretsiz katman birlikte
Zoom / Teams (dahili)Görüşmeye özgüBulutHayırUygun ücretli planlara dahilZoom 46, Teams 50+Zaten ödediğiniz şey
Whisper by RemskillGörüşmeye katılmaz; dosya veya dikte transkribe ederYerel (Bulut opsiyonel)EvetÜcretsiz yerel katman + Pro99 multilingual, 25 ParakeetÖzel, botsuz, cihaz üzerinde

Toplantılarınız zaten ücretli bir Zoom veya Teams planında çalışıyorsa, dahili transkripsiyon ihtiyacınızı karşılıyor olabilir; böylece başka bir abonelik ya da görüşmeye başka bir bot eklemek zorunda kalmazsınız.

Her durum için ne seçerdim

Destek e-postalarını okuduğumdan, yanlış araç pişmanlığını sık sık görüyorum. İşte nasıl seçeceğimi anlatan görüşlerim.

  • Bir ekip video görüşmesinden otomatik olarak, herkesle paylaşılan notlar istiyorsunuz. Bot not alıcı kullanın. Gösterişli varsayılanı istiyorsanız Otter, cömert ücretsiz katman istiyorsanız Fireflies ya da Fathom, ızgarada bot istemiyorsanız tl;dv.
  • Zaten ücretli bir Zoom veya Teams planındasınız. Üçüncü bir araç için ödeme yapmadan önce dahili transkripsiyonu deneyin.
  • Bir kaydınız var ve özel olarak, kendi bilgisayarınızda temiz metin istiyorsunuz. Bu botsuz, çevrimdışı yoldur: Whisper ya da başka bir yerel transkripsiyon aracı. Ses cihazda kalır.
  • Görüşme sırasında veya sonrasında imlecin bulunduğu yere, herhangi bir uygulamada sesle yazmak istiyorsunuz (e-postalar, belgeler, notlar). Bu dikte işidir ve Whisper tam bu iş için yapıldı. Transkripsiyon yazılımı karşılaştırmamız dikte ile toplantı notu arasındaki farkı daha ayrıntılı ele alır.
  • Hukuki veya uyum kaydı için garantili yaklaşık mükemmel bir transkripte ihtiyaç duyuyorsunuz. İnsan doğrulamalı bir hizmet kullanın. Yapay zeka tek başına gerçek sesde yüzde 99'un altında kalır.

Kaçınılması gereken hata, dikte için bir toplantı botuna para ödemek ya da bir dikte aracının görüşmelerinize katılmasını beklemektir. Farklı kategoriler. İşe uyan kategoriyi seçin. On beş yıldır yazılım geliştiriyorum ve geçen yıl hâlâ bir iş için yanlış aracı satın aldım; dolayısıyla bu, her şeyi ilk seferde doğru yapan birinin dersi değil.

Fiyatlar, düz rakamlarla

Buradaki araçların çoğunun, herhangi bir kart bilgisi vermeden önce denemeye değer ücretsiz bir katmanı var. Otter, Fireflies, tl;dv ve Fathom'un hepsinde ücretsiz plan bulunur; daha fazla dakika, daha fazla koltuk veya sınırsız depolama istediğinizde ücretli seviyelere geçilebilir. Bot not alıcılar genellikle kullanıcı başına aylık ücret alır ve bu ücret bir ekipte hızla artar.

Whisper, tüm yerel boru hattı boyunca oturum açmış her kullanıcı için ücretsizdir — her iki motor, Ollama aracılığıyla yapay zeka geliştirme, geçmiş, hazır ayarlar, özel sözcük dağarcığı, kısayol tuşu ve tüm bunlar — kayıt sırasında herhangi bir ödeme yöntemi talep edilmez. Ücretli seviye, OpenAI'nin modellerini ve sesle web aramasını isteyenler için Bulut yüzeyini ekler. Aylık, yıllık, ömür boyu ve ekip koltukları için kesin rakamlar fiyatlandırma sayfasında yer alır. Bir fiyatı bağlam dışında vermek yerine ücretsiz başlayıp kendiniz karar vermenizi tercih ederim.

Markayı seçmeden önce araç türünü belirleyin. Görüşmenize bir bot katılmalıysa not alıcı kullanın. Bilgisayarınızdaki bir kayıt özel metne dönüşmeliyse çevrimdışı bir şey kullanın. Bir ekibin biriktirdiği beş haneli faturayı izlediğimde, neyin bedelini ödediklerini hiç sormamışlardı ve kimsenin transkriptine ihtiyaç duymadığı bir toplantıydı bu.

Elinizde olan bir kayıtta botsuz yolu deneyin

Whisper'ı indirin, bir kayda yöneltin ve temiz metnin kendi bilgisayarınızda, kimsenin görüşmesinde bot olmadan nasıl geldiğini görün.

Tüm yerel boru hattı boyunca oturum açmış her kullanıcı için ücretsiz. Kayıtta ödeme yöntemi gerekmez.

Denys Medvediev fotoğrafı

Denys Medvediev

Destek e-postalarımızı okuyan kişi benim; büyük ihtimalle yanıtları dikte ederek yazıyorum.

Daha fazla okuma