ガイド
ブロガーのための 音声入力ソフト
ブログの下書きが遅い原因は、タイピングの遅さにあります。音声入力ソフトが解決するのはエディターではなく、下書きそのものです。ホットキーを押して話すだけで、WordPress、Ghost、Substack、Medium、Notion のカーソル位置にきれいなテキストが貼り付きます。プラグイン不要、オフラインで動作します。
最終更新:2026年6月

ブロガー向けの音声入力ソフトは、話した下書きをあらゆるエディター内の入力テキストに変換します。Whisper のようなシステム全体に対応したツールはホットキーで動きます。話して、離す。すると WordPress、Ghost、Substack、Medium、Notion のカーソル位置に文章が貼り付きます。CMS プラグイン不要、オフライン動作、ローカルモードはログイン済みアカウントなら無料です。
ブログ記事を書くことは、一つの締め切りに二つの仕事を抱えるようなものです。「何を言いたいか考える」という作業と、「タイピングする」という作業です。後者こそ、アイデアが渋滞を起こす遅い部分です。副業でかなり文章を書いてきましたが、「この段落に何を書くか分かっている」から「段落が画面に現れる」までのギャップは、いつもタイピングでした。だから、最初の下書きを話して作るようにしました。
「ブロガー向け音声入力ソフト」で検索すると、どれも特定のエディター内に住み着こうとするアプリのリストに行き着きます。WordPress のプラグインや Chrome の拡張機能といった具合です。正直な答えはもっとシンプルで、少し地味です。CMS の中に音声入力は必要ありません。必要なのは、マシン全体で使えるツールです。Gutenberg のブロックにも、Substack の投稿にも、読者からのメールへの返信にも、同じホットキーで入力できること。ツールは一つ、エディターはどこでも。
リスト記事が飛ばしているポイントがここにあります。あなたのエディター、Gutenberg でも Ghost のコンポーザーでも Substack のボックスでも Medium でも Notion のページでも、要はテキストフィールドです。カーソル位置に貼り付ける音声入力は、どのエディターかを気にしません。統合すべきは CMS ではなく、カーソルです。
だから本当の問いは「どのブログプラットフォームが一番優れた音声入力を持っているか」ではありません。どれも優れた内蔵音声入力など持っていないし、持つ必要もありません。問うべきは「すべてのエディターの上で動かす音声入力ツールはどれか」で、答えは無料・オフライン・どのエディターでも同じ動作かどうかにかかっています。なぜそうなのかを説明し、2分でセットアップし、話した文章を下書きに変えるクリーンアップの手順を示し、音声入力をスキップして別のツールを使うべき場面もお伝えします。
ブロガーが音声入力に手を伸ばす理由

ボトルネックは下書きであり、編集ではありません。知り合いのブロガーの多くは、2分で記事のアウトラインを作れても、そのアウトラインを文章に変えるのに1時間かけます。話す方がタイピングより速い。私の場合はおおよそ3〜4倍速く、研究もその大まかな傾向を裏付けています(正確な数字はあなたの手とテーマ次第ですが)。音声入力の目的はライティングを省くことではありません。考えの流れを失う前に、ごちゃごちゃした最初のバージョンを頭の外に出してページに乗せることです。
もう一つ、長くやっていれば気になってくる理由があります。手です。ブロガーはよく打ちます。週刊ニュースレター、数本の投稿、コメントへの返信、メール。積み重なると、毎日静かにキーストロークが蓄積されます。音声入力なら手を休めながらも書き続けられます。これは生産性の選択であり、医療上の話ではありません。何かが治ると言うつもりはありません。ただ、話して下書きを作ることで1時間のタイピングが減り、書き物の多い週には公開できるかできないかの差になります。
それに、アイデアは行儀よく順番を待ってくれません。イントロに使えるいいフレーズは、キーボードの前に座っているときではなく、コーヒーを淹れているときに浮かびます。ホットキーがあれば、それを記録するコストはほぼゼロです。10秒話すだけで、フレーズは下書きの中に収まります。正直に言えば、音声入力は言葉を素早く出すためのものです。構成、見出し、引用、段落の順序、これらはまだあなたの仕事です。音声入力が取り除くのは、遅いキーボードのせいで文章を失ってしまう部分だけです。
ホットキーを押して話す。テキストはエディターに届く
仕組みはこれだけです。これ以上でも以下でもなく、ちょうどよく地味です。ホットキーを押して、話して、離す。そうすると、フォーカスが当たっているテキストフィールドのカーソル位置にトランスクリプトが貼り付きます。Whisper はキーを離した後も少しの間バッファを持つので、最後の一語が切れることはありません。OS のカーソルに貼り付けるため、Gutenberg のブロックも、Ghost の段落も、Substack のコンポーザーも、Medium のストーリーも、すべて「テキストボックス」として扱われます。どのタブにいても、ホットキーは同じ、動作も同じです。
これがランディングページが複雑に見せているポイントです。WordPress にインストールするプラグインも、ブラウザに追加する拡張機能も、Ghost に貼り付ける API トークンも必要ありません。カーソルをエディターに置いて話せば、言葉がエディターに現れます。話している間、小さなカプセルが表示され、聴いていることを教えてくれます。
最初にきちんと設定する価値があるのはホットキーだけです。Windows では Ctrl+Space、Mac では Command+Option を話している間押し続けて離すプッシュ・トゥ・トーク方式です。どちらも既存のショートカットと競合する場合は設定で変更できます。(娘がドローアプリでホットキーが「動かない」と言ってきたことがあります。バグではなく競合でした。これで、ホットキーの競合を知らない人がほとんどだと学びました。だからすべてのホットキーはカスタマイズ可能にしています。)すでに Windowsで音声入力やMacで音声入力を設定済みなら、同じ操作感がそのまま CMS でも使えます。
2分でセットアップ(Windows または Mac)
必要なのは Apple Silicon 搭載の Mac か Windows 10 以降の PC、動作するマイク、ブラウザタブかデスクトップアプリで開いたブログエディターです。ローカルパイプライン全体はログイン済みアカウントなら無料で、サインアップ時にお支払い情報は不要です。手順はこちらです。
ステップ 1 — Whisper をインストールしてサインインする
ダウンロードページからダウンロードし、インストールして、無料アカウントを作成します。カード不要。ローカル文字起こしパイプライン全体がすぐに使えます。
アプリのトレイアイコンが表示され、セットアップウィザードがモデル選択を求めたら成功です。
ステップ 2 — 文字起こし方式を選ぶ
アプリは自動で選んでくれません。3つから選択します:Cloud(OpenAI、自分のキーを使用)、Local Parakeet、Local Whisper です。自分のマシンで下書きするなら、まずローカルから始めましょう。詳しくは2つ後のセクションで説明します。
モデルのダウンロードが完了し「準備完了」と表示されたら成功です。
ステップ 3 — ホットキーを確認する
Windows のデフォルトは Ctrl+Space、Mac は Command+Option をプッシュ・トゥ・トークで押し続けます。Mac ではプロンプトが表示されたらアクセシビリティの権限を許可してください。許可しないと、カーソル位置への貼り付けがブラウザやエディターに届きません。
テスト録音がいずれかのテキストフィールドに貼り付いたら成功です。
ステップ 4 — エディターにカーソルを置いて話す
WordPress、Ghost、Substack、Medium、Notion で投稿を開き、本文内をクリックし、ホットキーを押しながら一文話して離します。カーソルのある場所にトランスクリプトが表示されます。
話した文章がテキストとしてエディターに表示されたら成功です。
時間がかかるのはモデルのダウンロードだけで、セットアップ自体は上の4ステップです。動き始めれば、下書きはタイピングの作業から話す作業に変わり、エディターはその違いに気づきません。
WordPress、Ghost、Substack、Medium、Notion に音声入力する
ブロガーからよく聞かれるので、エディターごとの使い方をまとめます。WordPress Gutenberg では、段落ブロック内をクリックして話します。言葉がブロックに入り、次のブロックへはいつも通り Enter を押します。Ghost のコンポーザーも同じで、本文にカーソルを置いて話せばテキストが届きます。Substack の投稿エディターと Medium のストーリーエディターはシンプルなリッチテキストボックスなので、音声入力がそのまま入ります。Notion は各ブロックをテキストフィールドとして扱うので、カーソルのあるブロックにホットキーで入力できます。どれもプラグインも拡張機能も CMS 内の設定変更も必要ありませんでした。ツールを一つインストールすれば、すべてのエディターがその恩恵を受けます。
これがどこでも動く理由は、シンプルすぎて拍子抜けするほどです。ツールが貼り付けるのは特定のアプリの API ではなく、OS のカーソル位置だからです。Gutenberg のブロックに入力するのと同じキーが、読者へのメール返信や、編集者への Slack メッセージ、そしてサイトのリポジトリの コミットメッセージ にも使えます。ツール一つで、Windows と Mac を問わず、あらゆるテキストフィールドに対応します。下書きからコメント返信に切り替えても、操作を覚え直す必要はありません。
音声入力がしてくれないのは書式設定です。最悪のタイミングで気づくより、はっきり言っておく方がいい。言葉は出てきます。H2、太字、引用、ブロックの順序はまだあなたの仕事です。普段使っているキーとボタンで行います。「見出し2と言えば自動でフォーマットされる」と謳う製品はデモを売っているのであって、日常のワークフローを売っているのではありません。音声で文章を書いて、あとは他の下書きと同じように記事を整える。主にひとつのエディターを使っているなら、Ghost エディターやSubstack エディターのプラットフォーム別ガイドに、各アプリ固有の詳細が記載されています。
ローカルかクラウドか:下書きに向いているのはどちら
ブログ目的なら、まずローカルモードを試してください。下書きはあなただけのもの。未公開の投稿、半信半疑のニュースレター、公開前に削るかもしれない尖った意見。ラップトップにすでにマイクと CPU があるのに、クラウドサーバーを通してエディターに届ける習慣は少し奇妙です。Mac が Apple Silicon か、PC が数年以内のものなら、ローカルは日常的な下書きを問題なくこなします。クラウドはデフォルトではなく、逃げ道として使えば十分です。
3つの方式の違いをまとめます。アプリが選択を求めるので、うまく選んでほしいと思います。
- Local Parakeet — NVIDIA の TDT エンジン、約 600 MB、最速のローカル選択肢で CPU 上の Whisper より 5〜10 倍速い。英語と他 24 の欧州言語、合計 25 言語に対応。英語への翻訳機能はなし。英語または欧州言語でブログを書くなら、素早く完全オフラインで使えるおすすめの選択肢です。
- Local Whisper — 同じマシン上では Parakeet より遅いですが、多言語ビルドは 99 言語をカバーし、英語への翻訳もできます。英語専用ビルドは英語のみで 99 言語対応ではありません。中国語、日本語、韓国語でブログを書く場合や、Parakeet が対応していない翻訳が必要な場合はこちらを選んでください。デフォルトの英語モデルは約 480 MB です。
- Cloud(OpenAI、BYOK) — 最高精度とウェブアクセスを提供し、OpenAI が直接請求する自分の OpenAI キーを使用します。デフォルトでは gpt-4o-mini-transcribe で文字起こしを実行します。インターネットが必要なため、マシンの外に出る唯一の方式です。Cloud 機能は Whisper Pro の一部です。
面白みのない真実を言えば、多くのブロガーが書くような文章には、ローカルで十分です。どちらのローカルエンジンも、サーバーに何も送信せずにマシン上で完全に動作します。未公開の作業にはこれが正しいデフォルトです。クラウドが真価を発揮するのは、難しい録音で最高精度が欲しいとき、または話の途中でモデルにウェブから情報を引っ張ってほしいときです。週次で書く習慣なら、ローカルから始めて、物足りなくなったときだけクラウドに手を伸ばしましょう。
話した下書きをきれいな文章に変える
生の音声入力は続き文になって出てきます。「えーっとイントロでほとんどのブログの下書きが遅い理由を説明してそれからホットキーの話に入って」と言うと、フィラーワードも含めて句読点のない塊として返ってくる。これがどの音声エンジンでも起きます。クリーンアップ方法は選択した方式によって変わります。
Windows の音声入力は話しながら句読点を追加し、macOS のディクテーションは「コンマ」「ピリオド」と言うと基本的な句読点を処理します。もっと本格的なクリーンアップ、「えー」の除去、続き文の修正、話した段落を実際に投稿に使えるものに変換するには、Whisper が AI パスを実行できます。アクティベーションフレーズ「Hey whisper」と言うと、テキストが届く前に強化されます。ローカルモードでは Ollama を通じて実行され、クラウドモードではデフォルトで gpt-5-mini が使われます。
えーっとイントロでほとんどのブログの下書きが遅い理由を説明してそれでまあホットキーの話に入ってどのエディターでも動く仕組みを説明するといい感じかな
イントロではほとんどのブログの下書きが遅い理由を説明し、ホットキーとあらゆるエディターでの動作について述べる。
これが音声入力をメモだけでなく実際の公開にも使えるようにする部分です。クリーンアップされた話し言葉の段落は完成した記事ではありません。一番時間がかかっていた部分、つまり完成した最初の下書きです。読み返し、脱線した一文を削り、動詞を締め、どの記事にも必要な編集作業は変わりません。音声入力は下書きを素早くきれいに作ります。編集の判断はあなたのもので、タイピングで書いたときと同じです。正直に言えば、仕事の遅い半分を短縮するのであって、記事を代わりに書いてくれるわけではありません。
この「話してクリーンアップ」の流れは、下書きを離れてブログ周りのあらゆる作業をするときにも役立ちます。すでに設定したホットキーひとつで、音声でより速く入力することが、メールでも SNS 投稿でもキャプションでもできます。
音声入力をスキップして別のツールを使うべきとき

音声入力が向いていない作業もあります。そこを正直に言わないと、午後を無駄にしてしまいます。最も明確なケースは、下書きではなく文字起こしをしたいとき。ポッドキャストのエピソード、インタビュー、長い音声メモを録音済みで、その録音のテキストが欲しいなら、それは別の仕事です。音声入力はリアルタイムで話した内容をタイピングします。既存の音声ファイルを取り込む機能はありません。そのためには、ファイルを受け取ってトランスクリプトを出力する専用の文字起こしサービスを使いましょう。それが正しい形のツールであり、音声入力ではありません。
もう一つのケースは、デスクから離れている素早いメモです。明日の投稿のフレーズが電車の中で浮かんだら、スマートフォンのキーボードにすでにマイクがついています。タップして話すだけで完了。Whisper は Windows と macOS 向けのデスクトップツールなので、スマートフォンではキーボードのマイクが実用的な方法です。デスクでの短いメモには無料の内蔵機能もあります。Windows では Windows キー + H でカーソルのある場所に音声入力が開きますが、Microsoft のサーバーを経由するためインターネットが必要でオフラインでは使えません。Mac では、システム設定のキーボードからディクテーションを有効にするとあらゆるテキストフィールドで使えます。Apple Silicon では一般的なテキストをデバイス上で処理できます。
内蔵機能では不満が出てきたときに専用のシステム全体ツールを使いましょう。長い下書き、多言語の投稿、Windows でのオフラインプライバシー、CMS もメールもエディターでも同じ動作をするホットキーが欲しいときです。それ未満なら無料のものを使うか、用途に合ったツールを使ってください。電車の中で一行のメモのために音声入力アプリを起動するよう勧めるつもりはありませんし、ポッドキャストを文字起こしするとも言いません。実際にできませんし、木曜日には使えないとわかって戻ってくることになります。
ほとんどの下書きが特定のエディターで行われているなら、Substack エディターでの音声入力のプラットフォーム別解説で、このガイドが省略したアプリ固有の詳細を確認できます。
優れた音声入力を内蔵したブログプラットフォームはありませんでしたし、このガイドを書いてみて、必要もないと感じています。統合すべきはカーソルです。エディターに向かって話し、きれいな下書きを作り、既知のキーとボタンで整える。このガイドのほとんどは、CMS ではないテキストボックスに、どのボックスかを気にしないツールで音声入力し、それを読んでいるこの投稿に貼り付けました。代わりにタイピングしていたなら、それが取り戻した1時間です。
話して次の投稿を下書きしよう
ホットキーを押して、話して、離す。カーソルがあるエディター、WordPress、Ghost、Substack、Medium、Notion、その他すべてのアプリに、きれいな下書きが届きます。
ログイン済みアカウントなら無料のローカルモード。開始にカード不要。



