Yazan: Denys Medvediev

Rehber

Sesten metne Roam Research'te

Roam Research'te yerleşik dikte yok. Çözüm, sistem genelinde çalışan bir araç: bir kısayol tuşuna basın, konuşun, transkript imlecinizin bulunduğu herhangi bir Roam bloğuna yapışsın. İşletim sisteminizin dikte özelliği de kısa notlar için iş görür.

Son güncelleme: Haziran 2026

Karanlık bir masada dizüstü bilgisayarın yanında açık bir defter ve kalem; bağlantılı not alma ve dikteyi çağrıştırıyor

Roam Research'te sesten metne, Roam'ın kendisiyle değil, sistem genelinde çalışan bir araçla olur. Roam Research'te yerleşik dikte yoktur. Çözüm, Whisper gibi bir araç: bir kısayol tuşuna basın, konuşun, transkript imlecinizin bulunduğu herhangi bir Roam bloğuna yapışsın. İşletim sisteminin kendi dikte özelliği de kısa notlar için iş görür.

Roam'da bir günlük-notlar sayfası tutuyorum, çünkü bağlantılı düşünme olayı fikirleri kafamda tutma şeklimi gerçekten değiştirdi — her blok bir düğüm, her [[sayfa]] sonradan çekebileceğim bir iplik. Hep istediğim tek şey, bir düşünceyi yazmak yerine bir bloğa konuşarak söylemekti. Ayarı aramaya koyuldum. Öyle bir ayar yok. Roam'da mikrofon düğmesi yok ve epeyce karıştırdıktan sonra, benden bir tane gizlemediğine eminim.

İnsanlar "Roam Research'te sesten metne" diye arıyor, uygulamada hiçbir şey bulamıyor ve bir düğmeyi atladıklarını sanıyorlar. Atlamadılar. O düğme hiç yapılmadı. İyi haber şu: çözüm yaklaşık iki dakika sürüyor, isterseniz tamamen çevrimdışı çalışıyor ve bonus olarak açtığınız diğer her uygulamada da işe yarıyor.

Bu anahtar kelimenin etrafında dönüp duran çoğu sayfanın açıkça söylemeyeceği şey şu. Bir Roam bloğu sadece bir metin kutusu, tıpkı Gmail veya bir arama çubuğu gibi. İmlecinizin olduğu yere yapışan dikte, imlecin hangi uygulamada olduğunu umursamaz.

Yani asıl soru "Roam'da sesli yazmayı nasıl açarım" değil. Açma düğmesi yok. Soru şu: "Roam'ın üstünde hangi dikte aracını çalıştırırım," ve cevap, ücretsiz-ve-yerleşik mi istediğinize, yoksa her yerde aynı davranan tek bir çevrimdışı kısayol tuşu mu istediğinize bağlı. Hepsini anlatacağım, birini iki dakikada kuracağım ve ne zaman özel araç yolundan vazgeçmeniz gerektiğini söyleyeceğim.

Roam Research'te yerleşik dikte var mı?

Bir klavyenin yanında kâğıt deftere yazı yazan eller; yazmayı dikteyle karşılaştırıyor

Hayır. Roam Research'te bir bloğa sesle yazmak için yerleşik bir sesten metne, dikte veya sesli yazma özelliği yok. Blokta mikrofon düğmesi yok, sesli komut yok, gizli bir tercih yok. Roam, yazılan girdiyi alır. Menülerde dikte düğmesi aradıysanız, durabilirsiniz. Orada değil.

Var olan şey, açıklamasında "konuşma" geçen bir avuç Roam Depot eklentisi ve bir Live AI Assistant; insanların kafasının karıştığı yer de tam burası. Bunlar, önceden kaydettiğiniz bir ses dosyasını — bir toplantı, bir röportaj, /upload ile yüklediğiniz bir klip — sonradan metne çevirir, genellikle kendi anahtarınızla OpenAI Whisper API'sini çağırarak. Faydalılar, ama canlı dikte değiller. İmlecinizi bugünün günlük notuna koyup konuşamaz ve kelimelerin belirmesini izleyemezsiniz. Bir kaydı işlerler; siz düşünürken sizin yerinize yazmazlar. İkisini birbirine karıştırmak bir öğleden sonranıza mal olur ve o öğleden sonrayı atlamanızı tercih ederim.

Mobil tarafı kendi başına bir mesele ve yanlış cihazda peşine düşmemeniz için bir cümleyi hak ediyor: telefondan grafiğinize bir sesten-metne not gönderen yardımcı yakalama uygulamaları var, ama bu bir telefon özelliği ve telefonda zaten klavyenin mikrofonunu kullanırsınız. Çoğu insanın asıl yaşadığı masaüstü grafiğinde, Roam'ın üstünde oturan bir araca ihtiyacınız var. Birkaç dürüst kategori var ve bu rehberin geri kalanı onları kapsıyor.

Bir kısayola basın, konuşun, metin bloğa düşsün

Mekanizmanın tamamı bu ve en güzel anlamda sıkıcı. Bir kısayola basarsınız, konuşursunuz, bırakırsınız ve transkript, odakta hangi metin alanı varsa imlecinizin olduğu yere yapışır. Whisper, tuşu bıraktıktan sonra kısa bir kuyruğu tutar, böylece son kelimeniz kesilmez. İşletim sistemi imlecine yapıştığı için, bir Roam bloğu sadece "herhangi bir metin kutusu"dur. Tarayıcı uygulaması ya da bir masaüstü sarmalayıcı, aynı davranış — Roam'ın fark edebileceği bir ayrım bile yok.

İniş sayfalarının fazla karmaşıklaştırdığı kısım bu. Roam'a kuracağınız bir eklenti yok, yapıştıracağınız bir API jetonu yok, başında bekleyeceğiniz bir senkronizasyon işi yok. İmleciniz bir blokta, konuşursunuz, kelimeler blokta belirir. Konuşurken küçük bir kapsül belirir, böylece dinlediğini bilirsiniz:

Cancel
Kayıt katmanı: siz konuşurken beliren küçük bir kapsül, böylece Whisper'ın dinlediğini bilirsiniz.

Baştan doğru ayarlamaya değer tek şey kısayol tuşu. Windows'ta Ctrl+Space; Mac'te ise Command+Option, yalnızca değiştirici tuşlardan oluşan, konuşurken basılı tuttuğunuz bir bas-konuş kısayolu. Zaten kullandığınız bir şeyle çakışırsa, ikisi de Ayarlar'dan değiştirilebilir. (Küçük kızım bir keresinde çizim uygulamasında bir kısayolun "çalışmadığını" söylemişti. Bir çakışmaydı, hata değil; ortalama bir insanın kısayol çakışmasının ne olduğu hakkında en ufak fikri olmadığını böyle öğrendim. O yüzden artık her kısayol özelleştirilebilir.) Daha önce hiç Mac'te dikte ayarladıysanız, bu aynı kas hafızasının farklı bir uygulamaya yöneltilmiş hali.

İki dakikada kurun (Windows veya Mac)

Apple Silicon'lı bir Mac veya Windows 10 ya da daha yenisini çalıştıran bir PC'ye, çalışan bir mikrofona ve tarayıcınızda açık bir Roam'a ihtiyacınız var. Yerel akışın tamamı, oturum açmış her hesap için ücretsiz ve kayıt sırasında ödeme yöntemi istenmiyor. Sıralama şöyle.

Adım 1 — Whisper'ı kurun ve oturum açın.

İndirme sayfasından indirin, kurun ve ücretsiz bir hesap oluşturun. Kart yok. Tüm yerel transkripsiyon akışı hemen açılır.

Uygulamanın tepsi simgesi belirdiğinde ve kurulum sihirbazı bir model seçmeyi önerdiğinde işe yaradığını anlarsınız.

Adım 2 — Bir transkripsiyon yolu seçin.

Uygulama sizin yerinize seçmez. Üç seçeneğiniz olur: Bulut (OpenAI, kendi anahtarınızı getirin), Yerel Parakeet veya Yerel Whisper. Özel günlük notları için yerelle başlayın — iki bölüm aşağıda daha fazlası var.

Bir model indirmeyi bitirip hazır olarak göründüğünde işe yaradığını anlarsınız.

Adım 3 — Kısayol tuşunuzu onaylayın.

Windows varsayılan olarak Ctrl+Space, Mac ise bas-konuş olarak basılı tutulan Command+Option kullanır. Mac'te istendiğinde Erişilebilirlik iznini verin; o izin olmadan imlece-yapıştırma tarayıcınıza ulaşamaz.

Bir test kaydı herhangi bir metin alanına yapıştığında işe yaradığını anlarsınız.

Adım 4 — İmlecinizi bir Roam bloğuna koyun ve konuşun.

Grafiğinizi açın, bir bloğa tıklayın, kısayolu basılı tutun, bir cümle söyleyin, bırakın. Transkript, imlecin olduğu yerde, blokta belirir.

Konuştuğunuz cümle metin olarak Roam bloğunda durduğunda işe yaradığını anlarsınız.

Whisper
Gerçek Whisper masaüstü uygulaması, Transkripsiyon ve AI panelleri açık halde ayarlar ekranında.

Yavaş kısım model indirme, kurulum değil. Geri kalan her şey yukarıdaki dört adım. Bir kez çalıştığında, bir düşünceyi grafiğinize yakalama eylemi bir yazma işi olmaktan çıkıp bir konuşma işi olmaya başlar.

Windows'ta sesten metne · Mac'te

Bir Roam eklentisi mi, sistem genelinde bir kısayol mu

Bu anahtar kelimede üst sıralarda yer alan çoğu sayfa sizi bir Roam Depot eklentisine yönlendirir — Live AI Assistant, Otter içe aktarıcı, adında "konuşma" geçen bir şey. Bunlar iyi araçlar, ama ortak yapısal bir takıntıları var. Önceden kaydettiğiniz sesi — bir toplantı dosyası, bir Otter oturumu, bir bloğa yüklenmiş bir klip — metne çevirirler, şu an düzenlediğiniz bloğa canlı konuşmayı değil. Kaydedersiniz, sonra metne çevirirsiniz, sonra sonucu temizlersiniz. Bu bir transkripsiyon akışı, dikte değil. "Bir saatlik sesim var" sorununu çözüyorlar, "bu cümleyi günlük notuma konuşarak söylemek istiyorum" sorununu değil.

Sistem genelinde bir kısayol bunu tamamen aşar. Hangi pencere sahip olursa olsun işletim sistemi imlecine yapışır, böylece bir Roam bloğunu dolduran tuş, Gmail yazma kutunuzu, bir Slack mesajını ve bir commit mesajını da doldurur. Tek araç, her metin alanı, hem Windows'ta hem Mac'te. Uygulama değiştirdiğinizde hiçbir şeyi yeniden öğrenmezsiniz ve hiçbir şeyin bunun Roam olduğunu bilmesine gerek yoktur — entegrasyonu imleç yapar.

Çoğunlukla metne çevirecek kayıtlarınız varsa — aramalar, dersler, zaten yakaladığınız sesli notlar — dosya üzerinde Whisper'ı çağıran bir Depot eklentisi doğru biçim ve bakmaya değer. Asıl istediğiniz şey, taze bir bloğa canlı olarak yüksek sesle düşünmek olduğu anda, sistem genelindeki yol kazanır. Ben tek kısayolu tercih ederdim, çünkü saatte kabaca kırk kez uygulama değiştiriyorum ve hatırlamam gereken kırk farklı dikte düğmesi istemiyorum.

Yerel mi bulut mu: özel bir grafik için hangi mod

Roam için önce yerel modu deneyin. Bir grafik, filtrelenmemiş şeylerle dolar — yarım kalmış bir fikir, bir toplantı özeti, başkasının sunucusunda asla istemeyeceğiniz bir günlük girdisi. Bir bloğu herkese açık paylaşmadan önce iki kez düşünüyorsanız, onu yazmak için sesinizi bir buluttan geçirmeden önce de muhtemelen iki kez düşünürsünüz. Mac'iniz Apple Silicon ise veya PC'niz son birkaç yıldan biriyse, yerel mod gündelik dikteyi sızlanmadan halleder ve bulut, varsayılan yerine acil çıkış kapısı olur.

Üç yolun nasıl farklılaştığı şöyle, çünkü uygulama sizi seçmeye zorluyor ve iyi seçmenizi tercih ederim:

  • Yerel ParakeetNVIDIA'nın TDT motoru, yaklaşık 600 MB ve en hızlı yerel seçenek — CPU'da Whisper'dan 5 ila 10 kat hızlı. İngilizce artı 24 Avrupa dilini, toplam 25 dili kapsar. İngilizceye çeviri yok. İngilizce ya da başka bir Avrupa dilinde günlük tutuyorsanız, hızlı ve tamamen çevrimdışı seçim bu.
  • Yerel Whisperaynı makinede Parakeet'ten yavaş, ama çok dilli sürümler 99 dili kapsar ve İngilizceye çevirebilir. Yalnızca-İngilizce sürümler yalnızca İngilizce, 99 değil. Çince, Japonca, Korece veya Parakeet'in yapamadığı herhangi bir çeviri işi için bunu seçin. Varsayılan İngilizce modeli yaklaşık 480 MB.
  • Bulut (OpenAI, BYOK)en iyi doğruluk ve web erişimi; doğrudan OpenAI tarafından faturalandırılan kendi OpenAI anahtarınızı kullanır. Transkripsiyon varsayılan olarak gpt-4o-mini-transcribe üzerinde çalışır. İnternet gerektirir, dolayısıyla makinenizden ayrılan tek yol budur. Bulut yüzeyi Whisper Pro'nun parçasıdır.

Sıkıcı gerçek şu: çoğu insanın Roam'a koyduğu türde metin için yerel fazlasıyla yeterli. Her iki yerel motor da makinenizde tamamen çalışır, sunucuya hiçbir şey gönderilmez. Bulut, zor bir kayıtta üst düzey doğruluk istediğinizde veya cümlenin ortasında modelin web'den bir bilgi çekmesine ihtiyaç duyduğunuzda yerini hak eder. Günlük not alışkanlığı için yerelle başlayın ve yalnızca yerel sizi yetersiz bıraktığında buluta uzanın.

Sesle noktalama, bloklar ve Roam sözdizimi

Ham dikte, birbirine yapışık tek bir cümle olarak çıkar. "tamam mimari dokümanı incele onu project alpha olarak etiketle ve perşembe bana hatırlat" dersiniz ve herhangi bir konuşma motorunun size verdiği o noktalamasız duvar budur. Bunu temizlemek, yolların ayrıldığı yer.

Windows Sesli Yazma siz konuştukça noktalama ekler ve macOS Dikte, "virgül" veya "nokta" dediğinizde temel noktalamayı halleder. Daha ağır temizlik için — "şey"leri ayıklamak, birbirine yapışık cümleleri düzeltmek, konuşulan bir paragrafı grafiğinizde gerçekten saklayacağınız bir şeye dönüştürmek — Whisper bir AI geçişi çalıştırabilir. Etkinleştirme ifadesi "Hey whisper"ı söyleyin, metin yapışmadan önce iyileştirilir. Yerel bir modelde bu Ollama üzerinden çalışır; bulut modunda varsayılan olarak gpt-5-mini'dir.

Thinking...
Ham

tamam mimari dokümanı incele onu project alpha olarak etiketle ve perşembe bana hatırlat şey standuptan önce

Temizlenmiş

Tamam, mimari dokümanı incele, onu Project Alpha olarak etiketle ve perşembe standuptan önce bana hatırlat.

Roam'ın kendi yapısı için — iç içe bloklar, #etiket ve [[sayfa]] bağlantıları, TODO işaretleri — dürüst cevap şu: sesle metni alırsınız, Roam'ın kendi sözdizimiyle de yapıyı kurarsınız. Cümleyi dikte edin, sonra bloğu girintilemek için Tab'a, bir etiket için #'e veya bir sayfa bağlantısı için [['e her zaman yaptığınız gibi basın. Hiçbir dikte aracı, komutla Roam'ın taslak sözdizimini var edemez; "çift köşeli parantez project alpha de ve bağlanmasını izle" diye söz veren herkes size bir demo satıyor, bir salı gününü değil. Kelimeleri sesle hızlıca aşağı dökün, blokları zaten bildiğiniz tuşlarla şekillendirin.

Aynı konuş-sonra-temizle akışı grafiğinizin çok ötesinde de işe yarar — ayrıca herhangi bir uygulamaya temiz metni dikte edebilirsiniz tek kısayolla, böylece uzun bir blok, yazdığınız bir paragraf yerine birkaç konuşulan cümleye dönüşür.

Roam Research için ne zaman dikte aracı kullanmamalı

Kaldırıma tebeşirle çizilmiş, farklı yönleri gösteren iki ok; bir araç seçimini anlatıyor

Bazen doğru araç, makinenizde zaten bulunan ücretsiz olandır ve aksini iddia etmek dürüstlük olmazdı. Roam'a yalnızca kısa şeyler bırakıyorsanız — hızlı bir günlük-not satırı, iki kelimelik bir hatırlatma — işletim sisteminiz bunu bedava karşılar.

Windows'ta Windows tuşu + H'ye basın; yerleşik Sesli Yazma çubuğu, imlecinizin olduğu her yerde, bir Roam bloğu dahil açılır. Kendi başına noktalama yapar ve kısa parçalar için iyidir. Püf noktası: Microsoft'un sunucularından geçer ve internet bağlantısı gerektirir, dolayısıyla çevrimdışı bir seçenek değildir; grafiğiniz yarı-özel düşüncelerle dolu olduğunda bu, her zamankinden daha çok önem taşır. Mac'te Dikte, yazabildiğiniz her yerde metin girmek için konuşmanızı sağlar; Sistem Ayarları'nda Klavye altından kurulur ve Apple Silicon'da genel metin cihaz üzerinde işlenebilir. Ve asıl elinizdeki şey kaydedilmiş sesse — bir arama, bir ders — dosyayı metne çeviren bir Roam Depot eklentisi, herhangi bir canlı-dikte aracından daha iyi oturur.

Yerleşik araçlar canınızı yakmaya başladığında özel, sistem genelinde bir araca uzanın: uzun notlar, çok dilli işler, Windows'ta çevrimdışı gizlilik veya Roam'da, e-postanızda ve düzenleyicinizde aynı davranan tek bir kısayol istemek. O çubuğun altında, ücretsiz olanı kullanın. Tek satırlık bir hatırlatma için bir uygulama kurmanızı söyleyecek değilim.

Notlarınızı başka bir yerde de tutuyorsanız aynı denge ortaya çıkar — Obsidian'a dikte etme mantığı aynıdır, çünkü orada da gerçek entegrasyonu bir eklenti değil, imleç sağlar.

Daha fazla okuma

Roam hiçbir zaman bir mikrofon düğmesi göndermedi ve bunu yazdıktan sonra hiç göndermeyeceğinden epey eminim. Buna gerek yok, çünkü entegrasyon imleçtir. Bloğa konuşun, metni alın, onu zaten bildiğiniz [[ ve # ile şekillendirin. Bu rehberin çoğunu Roam olmayan bir metin kutusuna, hangi kutu olduğunu umursamayan bir araçla dikte ettim, sonra hepsini kendi grafiğime yapıştırdım. Bütün hüner bu.

Bir sonraki Roam bloğunuzda deneyin

Kısayolu basılı tutun, konuşun, bırakın. Transkript, imlecinizin olduğu hangi blok varsa oraya düşer — ve diğer her uygulamaya da.

Oturum açmış her hesap için ücretsiz yerel mod. Başlamak için kart gerekmez.

Denys Medvediev'in fotoğrafı

Denys Medvediev

Destek e-postamızı okuyan kişi benim, büyük olasılıkla yanıtları dikte ederek.