ガイド
音声テキスト入力 Logseq で
Logseq のデスクトップ版には音声入力機能が組み込まれていません。解決策はシステム全体で動くツールです。ホットキーを押して話すだけで、文字起こしされたテキストがカーソル位置に貼り付けられ、Logseq のどのブロックでもそのまま使えます。短いメモなら OS の音声入力でも十分です。
最終更新: 2026年6月

Logseq での音声テキスト入力は、Logseq そのものではなく、システム全体で動くツールを通して実現します。Logseq のデスクトップ版に音声入力機能は組み込まれていません。解決策は Whisper のようなツールです。ホットキーを押して話すと、文字起こしされたテキストが Logseq のどのブロックでもカーソル位置に貼り付けられます。短いメモなら OS の音声入力でも十分です。
私は毎日のジャーナルを Logseq に書いています。どんなクラウドよりも、プレーンな markdown が入ったフォルダのほうを信頼しているからです。ずっと欲しかったのは、入力する代わりにブロックに向かって話せること。その設定を探しました。そんな設定はありません。Logseq にはマイクのボタンがなく、かなり掘り下げて調べた末に、隠されているわけでもないと確信しました。
「Logseq 音声入力」と検索し、アプリの中に何も見つからず、トグルを見落としたのだと思い込む人がいます。違います。トグルは最初から作られていないのです。良い知らせは、解決策は2分ほどで済み、望めば完全にオフラインで動き、おまけに開く他のすべてのアプリでも使えることです。
このキーワードの周りを遠回しに語るほとんどのページが、はっきりとは言わないことがあります。Logseq のブロックは、Gmail や検索バーと同じ、ただのテキストボックスです。カーソル位置に貼り付ける音声入力は、そのカーソルがどのアプリにあるかを気にしません。
つまり本当の問いは「Logseq で音声入力をどうオンにするか」ではありません。スイッチなどないのです。問いは「Logseq の上でどの音声入力ツールを動かすか」であり、その答えは、無料で組み込みのものが欲しいのか、Mac 専用でいいのか、それともどこでも同じように動く一つのオフラインのホットキーが欲しいのかによって変わります。これからそのすべてを案内し、2分でセットアップし、専用ツールの道を選ばなくていい場面もお伝えします。
Logseq に音声入力は組み込まれている?

いいえ。Logseq のデスクトップ版には、ブロックに音声で書き込むための音声テキスト入力、ディクテーション、音声入力の機能が一切ありません。ブロックにマイクボタンはなく、音声コマンドもなく、隠された設定もありません。設定をくまなく探していたなら、もうやめて大丈夫です。そこにはありません。
実際に存在するのは、名前に「whisper」が付いたコミュニティのプラグイン群で、ここで人は道に迷います。これらのプラグインは、音声ファイルや YouTube のリンクをあとからテキストに文字起こしするものです。便利ではありますが、ライブの音声入力ではありません。今日のジャーナルにカーソルを置いて話し、言葉が現れるのを見ることはできません。プラグインは録音を処理するだけで、考えている間にあなたの代わりに入力してくれるわけではないのです。この二つを混同すると半日を失います。その半日を、あなたには飛ばしてほしいのです。
モバイルの話はまた別物で、間違ったデバイスで追いかけないよう一文だけ触れておく価値があります。新しい Logseq のモバイルアプリには音声文字起こしがいくらか追加されましたが、それはスマホの機能で、スマホならどのみちキーボードのマイクを使うでしょう。ほとんどの人が実際に過ごすデスクトップのグラフでは、Logseq の上に乗るツールが必要です。誠実なカテゴリーが三つあり、このガイドの残りでそれらを扱います。
ホットキーを押して話せば、テキストがブロックに着地する
これが仕組みのすべてで、いちばん良い意味で退屈です。ホットキーを押して話し、離すと、文字起こしされたテキストがカーソル位置、つまりフォーカスのあるテキスト欄に貼り付けられます。Whisper はキーを離したあと少しだけ余韻を残すので、最後の言葉が切れることはありません。OS のカーソル位置に貼り付けるので、Logseq のブロックも「ただのテキストボックス」になります。デスクトップアプリでもブラウザ版でも、動きは同じです。
ここがランディングページの大げさにしすぎる部分です。Logseq にインストールするプラグインも、貼り付ける API トークンも、世話をする同期ジョブもありません。カーソルがブロックにあり、話せば、言葉がブロックに現れます。話している間は小さなカプセルが表示され、聞き取り中だとわかります。
ホットキーは最初にきちんと決めておく価値のある唯一のものです。Windows では Ctrl+Space、Mac では Command+Option で、話している間に押し続ける修飾キーだけのプッシュ・トゥ・トークです。どちらも、すでに使っているものとぶつかる場合は設定で変更できます。(うちの下の娘が以前、お絵描きアプリでホットキーが「効かない」と言ってきたことがあります。それはバグではなく競合でした。これで私は、普通の人はホットキーの競合とは何かすら知らないのだと学びました。だから今はすべてのホットキーがカスタマイズ可能です。)もし以前にもWindows での音声入力やMac での音声入力を設定したことがあるなら、これは同じ体の記憶を別のアプリに向けるだけです。
2分でセットアップ(Windows または Mac)
必要なのは、Apple Silicon の Mac か Windows 10 以降の PC、動作するマイク、そしてデスクトップアプリかブラウザのどちらかで開いた Logseq です。ローカルのパイプライン全体は、サインインしたアカウントなら誰でも無料で、サインアップ時に支払い方法を求められることもありません。手順は次のとおりです。
ステップ1 — Whisper をインストールしてサインイン。
ダウンロードページから入手し、インストールして、無料アカウントを作成します。カードは不要です。ローカルの文字起こしパイプライン全体がすぐに開きます。
アプリのトレイアイコンが現れ、セットアップウィザードがモデルの選択を促してきたら、うまくいった証拠です。
ステップ2 — 文字起こしの方式を選ぶ。
アプリは代わりに選んでくれません。三つから選びます。Cloud(OpenAI、自分のキーを使う)、Local Parakeet、Local Whisper です。プライベートなジャーナルのメモには、まずローカルから始めてください。詳しくは二つ先のセクションで。
モデルのダウンロードが完了し、準備完了と表示されたら、うまくいった証拠です。
ステップ3 — ホットキーを確認する。
Windows の既定は Ctrl+Space、Mac は押し続けるプッシュ・トゥ・トークの Command+Option です。Mac では、求められたときにアクセシビリティの権限を付与してください。これがないと、カーソル位置への貼り付けが他のアプリに届きません。
テスト録音が任意のテキスト欄に貼り付けられたら、うまくいった証拠です。
ステップ4 — Logseq のブロックにカーソルを置いて話す。
グラフを開き、ブロックをクリックして、ホットキーを押し続け、一文話して、離します。文字起こしされたテキストが、カーソルのある場所、つまりブロックに現れます。
話した一文がテキストとして Logseq のブロックに収まっていたら、うまくいった証拠です。
時間がかかるのはモデルのダウンロードであって、セットアップではありません。それ以外は上の4ステップがすべてです。一度動き出せば、グラフに思いつきを書き留める作業は、入力するタスクではなく話すタスクになります。
Logseq プラグイン vs. システム全体のホットキー
このキーワードで上位に来るほとんどのページは、Logseq のプラグインか、アウトラインに直接話しかける Mac 専用のメニューバーツール Blurt を勧めてきます。どちらもまずまずの答えですが、それぞれ構造的な引っかかりが一つあります。whisper 系のプラグインは音声ファイルを文字起こしするもので、編集中のブロックにライブで話し込むものではありません。そして Blurt は、本人の説明どおり macOS 専用です。Windows なら、そもそも選択肢になりません。
システム全体のホットキーは、その両方の制約をかわします。どのウィンドウが所有していようと OS のカーソル位置に貼り付けるので、Logseq のブロックを埋めるのと同じキーが、Gmail の作成欄も、Slack のメッセージも、コミットメッセージも埋めます。一つのツールで、すべてのテキスト欄を、Windows でも Mac でも。アプリを切り替えても何も覚え直す必要はなく、ノートパソコンによって別の解決策を用意する必要もありません。
Mac を使っていて、書き込むのは Logseq の中だけというなら、Blurt はすっきりした的を絞った選択で、一見の価値があります。Windows になった瞬間、あるいは開くすべてのプログラムで同じ流れが欲しくなった瞬間、システム全体の道に軍配が上がります。私は1時間に40回くらいアプリを切り替えるので、一つのホットキーに手を伸ばします。覚えておくべき40個の別々の音声入力ボタンなど欲しくありません。
ローカルかクラウドか:プライベートなグラフにはどちらのモード
Logseq には、まずローカルモードを試してください。多くの人が Logseq を選んだそもそもの理由は、ローカルファーストのプレーンテキストだからです。会議の要約、まだ形になっていないアイデア、誰かのサーバーには絶対に置きたくないジャーナルの記録。メモを自分のディスクに置いておきながら、そこへ届けるために声をクラウド経由で通すのは、おかしな選択でしょう。Mac が Apple Silicon か、PC がここ数年のものなら、ローカルは日常の音声入力を文句なくこなし、クラウドは既定ではなく非常口になります。
三つの道がどう違うのか、ここで説明します。アプリが選択を迫ってくる以上、上手に選んでほしいからです。
- Local Parakeet — NVIDIA の TDT エンジンで、約600 MB、ローカルでは最速の選択肢です。CPU 上で Whisper の5〜10倍速く動きます。英語に加えて他の24のヨーロッパ言語、合計25言語をカバーします。英語への翻訳機能はありません。英語か他のヨーロッパ言語でジャーナルを書くなら、これが手早く、完全オフラインの選択です。
- Local Whisper — 同じマシンでは Parakeet より遅いものの、多言語版は99言語をカバーし、英語への翻訳もできます。英語専用版は英語専用で、99言語ではありません。中国語、日本語、韓国語、または Parakeet にはできない翻訳作業には、こちらを選んでください。既定の英語モデルは約480 MB です。
- Cloud(OpenAI、BYOK) — 最高の精度とウェブアクセスを、自分の OpenAI キーで使えます。料金は OpenAI から直接請求されます。文字起こしは既定で gpt-4o-mini-transcribe で動きます。インターネットが必要なので、マシンの外に出る唯一の道です。Cloud の機能は Whisper Pro の一部です。
退屈な真実ですが、ほとんどの人が Logseq に入れるたぐいのテキストには、ローカルで十分です。どちらのローカルエンジンも完全にあなたのマシン上で動き、サーバーには何も送りません。それこそがローカルファーストのグラフの核心です。クラウドが活きるのは、難しい録音でトップクラスの精度が欲しいときや、文の途中でモデルにウェブから事実を引いてきてほしいときです。毎日のジャーナルの習慣なら、ローカルから始めて、物足りないときだけクラウドに手を伸ばしてください。
句読点、ブロック、そして音声で書く Logseq の markdown
生の音声入力は、ひとつながりの文として出てきます。「えーとアーキテクチャのドキュメントを見直してプロジェクトアルファのタグを付けて木曜にリマインドして」と言えば、どの音声エンジンも句読点のないこの一塊を渡してきます。これをきれいにするところで、道が分かれます。
Windows の音声入力は話すそばから句読点を付け、macOS のディクテーションは「カンマ」や「ピリオド」と言えば基本的な句読点を扱います。もっと重い手直し、つまり「えー」を取り除き、ひとつながりを直し、話した段落を実際にグラフに残せるものに変える作業には、Whisper が AI のパスを走らせられます。起動フレーズ「Hey whisper」と言えば、テキストが着地する前に整えられます。ローカルモデルでは Ollama を通して動き、クラウドモードでは既定で gpt-5-mini です。
えーとアーキテクチャのドキュメントを見直してプロジェクトアルファのタグを付けて木曜にリマインドしてあースタンドアップの前に
では、アーキテクチャのドキュメントを見直し、Project Alpha のタグを付けて、スタンドアップの前の木曜にリマインドして。
Logseq 独自の構造、つまり入れ子のブロック、#tag や [[page]] のリンク、TODO のマーカーについては、正直な答えはこうです。音声はテキストを手に入れさせてくれ、構造は Logseq 自身の構文が手に入れさせてくれます。文を音声で書いたら、いつものように Tab でインデントを付け、# でタグを、[[ でページリンクを入力してください。どんな音声入力ツールも、命令ひとつで Logseq のアウトライン構文を呼び出してはくれません。「プロジェクトアルファのタグと言えばリンクされるのを見て」と約束する人は、デモを売っているのであって、日常を売っているのではありません。言葉は音声で素早く落とし込み、ブロックはすでに知っているキーで形づくりましょう。
この「話してから整える」流れは、グラフの外でも大いに役立ちます。一つのホットキーで、どのアプリにもきれいな文章を音声入力できるので、長いブロックも、打ち込む段落の代わりに、話す数文で済みます。
Logseq で音声入力ツールを使わなくていいとき

ときには、正しいツールはすでにマシンにある無料のもので、そうでないふりをするのは不誠実でしょう。Logseq に短い書き込みしか落とさないなら、たとえば手早いジャーナルの一行や二語のリマインダーなら、OS が無料でまかなってくれます。
Windows では、Windows キー + H を押すと、Logseq のブロックも含めてカーソルのある場所に組み込みの音声入力バーが開きます。自分で句読点を付け、短いひと吹きには十分です。落とし穴は、Microsoft のサーバーを経由しインターネット接続を必要とすることで、オフラインの選択肢ではありません。グラフの目的そのものがローカルにとどまることなら、これはいつにも増して重要です。Mac では、ディクテーションを使えば入力できる場所ならどこでも話して文字を入れられ、システム設定のキーボードでセットアップでき、Apple Silicon なら一般的なテキストはデバイス上で処理できます。そして、Logseq の中だけで完結する Mac ユーザーなら、Blurt はまさにそのために作られた、的を絞ったネイティブの選択です。
組み込みのものが痛みになり始めたら、専用のシステム全体のツールに手を伸ばしてください。長いメモ、多言語の作業、Windows でのオフラインのプライバシー、あるいは Logseq でもメールでもエディタでも同じように動く一つのホットキーが欲しいとき。その線より下なら、無料のものを使ってください。一行のリマインダーのためにアプリを入れろとは言いません。
同じトレードオフは、ほかの場所にもメモを取っている場合に現れます。Obsidian への音声入力の理屈もまったく同じです。どちらもローカルファーストの markdown アプリで、本当の統合はプラグインではなくカーソルだからです。
さらに読む
Logseq はマイクのボタンを一度も出荷しませんでしたし、これを書いたあと、たぶんこの先も出さないだろうと私はかなり確信しています。出す必要がないのです。統合はカーソルだからです。ブロックに話しかけ、テキストを得て、すでに知っている構文で形づくる。私はこのガイドのほとんどを、Logseq ではないテキストボックスに、どのボックスかを気にしないツールで音声入力し、それを丸ごと自分のグラフに貼り付けました。それがこの仕掛けのすべてです。
次の Logseq のブロックで試してみてください
ホットキーを押し続け、話して、離す。文字起こしは、カーソルのあるどのブロックにも、そして他のすべてのアプリにも着地します。
サインインしたアカウントなら誰でも無料のローカルモード。始めるのにカードは不要です。



