Denys Medvediev

チュートリアル

WordPressで音声入力: 3つの方法

WordPressには音声入力機能が標準で備わっていません。だから音声からテキストへの変換は、必ず自分で追加するツールから始まります。ブラウザ拡張機能、プラグイン、OSの音声入力、あるいはWhisperのようなデスクトップアプリ。Whisperは、システム全体で使えるホットキーを備え、オフラインで動作し、どんなアプリでも使えます。

最終更新: 2026年6月

木製デスクのノートパソコンの横に開いたノートとペン。WordPress記事を音声で下書きするための執筆環境

WordPressには音声入力が標準搭載されていないため、音声からテキストへの変換は必ずサードパーティ製ツールで行います。現実的な選択肢は3つ。クラウドのWeb Speech APIを使うブラウザ拡張機能、WordPress用の音声入力プラグイン、フォーカス中のブロックに入力するOSの音声入力です。Whisperのようなデスクトップアプリは、4つ目の道を加えます。システム全体で使えるホットキーで、オフライン対応・アプリ横断、プラグインも不要です。

マーケティングページには誰も書かないことから始めましょう。WordPressを新規インストールして、Gutenbergのブロックをクリックし、マイクのボタンを探してみてください。ありません。WordPressは長年にわたって全ウェブの約40%を支えてきたのに、今でも一語一語を手で打ち込むことを求めてきます。音声認識は2022年から実用に足る精度に達しています。でも、エディターにその知らせは届かなかったようです。だから、これから紹介する選択肢はすべて、自分で取り付けるものです。

まず一つ、はっきり分けておきましょう。「WordPress 音声入力」で検索すると、ほとんどの結果はもう一方の「音声」、つまり公開した記事を訪問者に読み上げるテキスト読み上げプラグインです。あれは音声の出力です。この記事はその逆。あなたが話すと、その言葉がエディターに入る音声入力(ディクテーション)の話です。読み上げをお探しなら、タブを間違えています。声で記事を書きたいなら、ほかのプラットフォームでブロガー向けの音声入力ソフトを選ぶときと同じように、このまま読み進めてください。

WordPressには音声入力が標準で備わっていない。それが意味すること。

ノートパソコンのキーボードを打つ手のクローズアップ。ブロックエディターが今も前提としている手入力

メニューの三階層下に埋もれた設定を見落としていないか確かめるため、公式プラグインディレクトリを調べに行きました。(見落としていませんでした。めったに見落としませんが、いつも確認します。確認しなかった一度が、まさに設定があるときだからです。)WordPress.orgのプラグインディレクトリで「dictation」を検索すると、サードパーティ製プラグインがずらりと並びます。「Dictation (Speech Recognition)」「Dictate Button」といった顔ぶれです。どれもコアには同梱されていません。WordPress本体に音声入力は一切ありません。これが正直な調査結果で、これから紹介するすべてのツールの捉え方が変わってきます。

ネイティブのエンジンがないので、それぞれの選択肢が独自のエンジンを持ち込みます。ほとんどのWordPress音声入力プラグインと、人気のブラウザ拡張機能は、ブラウザのWeb Speech API、つまりGoogleのクラウド音声認識をラップしています。つまり、あなたが下書きした段落は、文字起こしのためにサーバーへ送られるのです。動きはします。ただしオンライン専用で、たいていはChromeかEdge専用です。退屈な真実ですが、「WordPressの音声入力」とは、その多くが他社のクラウドマイクに貼られた薄いラベルにすぎません。

クラウドというルールの唯一の例外が、自分のマシン上で動く音声入力です。OSの標準機能か、デスクトップアプリがそれにあたります。どちらもこの後で扱います。

WordPressに音声入力する3つの方法と、それぞれが抱えるトレードオフ

カテゴリーはちょうど3つ、それにデスクトップアプリという道が加わります。どれも何かを与えてくれる代わりに、何か別のものを差し出します。

方法その1: ブラウザ拡張機能。 Dictanote社のVoice Inが定番の選択肢です。Chromeウェブストアからインストールし、入力欄をクリックして話すだけ。ブラウザのWeb Speech APIで動くので、クラウドベースで、ブラウザのタブの中だけで動きます。無料で始められ、インストールも手早く済みます。落とし穴は、そのタブの中でしか使えないこと。Slackやメールに切り替えると、マイクは消えてしまいます。そして、いずれにせよ音声はGoogleのクラウドを経由します。

方法その2: WordPressプラグイン。 「Dictation (Speech Recognition)」やListenerのようなプラグインは、エディターのすぐ中にマイクボタンを追加します。多くはやはりWeb Speechをラップしているので、オンライン専用・Chrome向けという同じ制約を受け継ぎます。良い点は、WordPressの中で完結すること。だから、ほかに管理するものがありません。エディター内のボタンがどうしても欲しくて、クラウドでも構わないなら、これを選んでください。

方法その3: OSの音声入力。 Windowsには音声入力(Win + Hキー)があります。macOSには「システム設定」の中に音声入力があります。どちらもフォーカス中の入力欄、ブラウザ内のGutenbergブロックも含めて、そこに文字を打ち込みます。無料で、インストール不要、すでにあなたのコンピューターに入っています。精度はまちまちで、片方のOS専用ですが、ちょっとした段落ならこれで十分通用します。PCをお使いなら、Windowsでの音声入力の完全ガイドがWin + Hの使い方をより詳しく解説しています。

そしてデスクトップアプリという道があり、Whisperはここに位置します。OSの音声入力と同じ発想、つまりフォーカス中の入力欄に貼り付けるホットキーですが、プラットフォームを横断し、オフラインでも動き、ブラウザのタブにも縛られません。ここで最も近い直接の競合はBlurt、Macのメニューバーアプリで、どんなWordPressの入力欄にも音声で入力できます。きれいに作られたツールです。ただしmacOS専用、クラウド専用で、無料なのは最初の1,000語まで。その後は月$10または年$99です。Macをお使いで、クラウドが気にならないなら知っておく価値があります。

ホットキーでブロックエディターに記事を音声入力する

デスクトップのホットキーツールを使った、実際の流れを一歩ずつ。ウェブ版エディターでも自己ホスト型サイトでも、5つの動作は同じです。

Cancel
録音オーバーレイ。話している間に現れる小さなカプセルで、Whisperが聞いていることが分かります。
  1. ブロックエディターで記事を開く。 どのブラウザのウェブ版WordPressでも、自己ホスト型でも構いません。ホットキーはプラグインの中ではなく、OSのレベルで動くからです。
  2. 埋めたいブロックをクリックする。 段落ブロック、記事タイトル、抜粋、YoastやRank Mathのメタ欄。カーソルが点滅する場所ならどこでも。
  3. ホットキーを押しながら話す。 WindowsならCtrl+Space、macOSならCommand+Optionを、押している間だけ録音する形で使います。声に出すように、段落を話してください。
  4. 離す。 クリックしたブロックのカーソル位置に、テキストが現れます。それだけです。
  5. 次のブロックをクリックして繰り返す。 ブロック間の移動はキーボードかマウスで、それぞれを埋めるのはホットキーで。

正直な注意点を一つ。過剰な約束は誰のためにもならないからです。このツールはフォーカス中のブロックに音声入力します。Gutenbergのブロック構造までは理解しません。新しい見出しブロックを作ったり、段落を二つに分けたり、「次」と言って次のブロックへ飛んだりはしません。ブロックを操るのはあなた、それを埋めるのがホットキーです。このカテゴリーの音声入力ツールはどれも同じ仕組みで、BlurtもVoice Inも例外ではありません。声は言葉を書きます。家具を並べるのは、やはりあなたです。

アプリ全体を、その場で

Whisper
本物のWhisperデスクトップアプリ。あちこちクリックして、文字起こしの経路を選び、カーソル位置にテキストが届く様子を見てください。

上に埋め込まれているのは本物のデスクトップアプリで、スクリーンショットではありません。クリックして動かしてみてください。これがWordPressで機能する理由は、説明すると退屈になる理由でもあります。文字が打てるどんなアプリでも、システム全体で使えるグローバルなホットキーで、カーソル位置に文字起こしを貼り付ける。それだけです。WordPressのブロックエディター、コメント欄、WooCommerceの商品説明、メール、Slack、コードエディター。同じキー、同じ動き。アプリごとのプラグインは要りません。

それが検索結果との実用上の違いです。ブラウザ拡張機能はタブの端で止まります。これは止まりません。Yoastでメタディスクリプションを音声入力し、続いて読者のコメントへの返信、それから受信トレイに切り替えてそれも音声入力する。ツールを切り替えずに、です。ほかの場所でも記事を公開しているなら、同じホットキーが使えます。Ghostのエディターも、Substackのエディターも、まったく同じやり方で音声入力を受け付けます。

音声入力を自動で整える

Thinking...

そのままの音声入力には癖があります。「えーと」と言ったり、文を二度言い直したり、読点を忘れたり。Whisperには任意のAIクリーンアップ機能があり、テキストがブロックに届く前に、大文字小文字や句読点を整え、つなぎ言葉を取り除きます。無料のローカルモードでは、すべてあなたのマシン上で動きます。Proではクラウドで動きます。任意の機能であって、魔法ではありません。オフにすれば、自分で編集したい人のために、そのままの文字起こしが手に入ります。

ブログ記事なら、これは確かな時間の節約になります。読点が最初から正しい位置にある段落は、公開ボタンを押す前に整え直す必要がありません。同じ流れは、ほかの執筆ツールにも引き継がれます。WordPressに限らず、どんな下書きでも声でもっと速く打つやり方そのものです。

オフラインで、プライベート

日中に門を施錠する青い南京錠。デバイス上で完結するプライベートな音声入力を表す

この記事で唯一、強い意見を述べさせてください。クラウドでしか動かず、オフラインの選択肢がない音声入力は、文字起こしを待つプライバシーの大惨事です。このページのブラウザ拡張機能と、ほとんどのプラグインの経路は、あなたの下書きをテキスト化するためにサーバーへ送ります。公開するブログ記事なら、気にしないかもしれません。でも、勤め先について書きかけの記事や、消す前に毒づくコメント返信なら。あなたのノートパソコンには、すでにマイクとCPUがあります。一段落を打ち込むのに、間にサーバーを挟む必要はありません。

Whisperのローカルモードは、完全にオフラインで動きます。音声がマシンの外に出ることはありません。インターネットが必要なのは、一度きりのモデルのダウンロードだけ。選ぶモデルによって140 MBから3 GBほどです。Blurt、Voice In、Web Speech系のプラグインは、設計上どれもオンライン専用です。これは、それらとローカルのデスクトップアプリとを分ける、本物で確かめられる一線であって、スローガンではありません。

WhisperはWindowsとMacで動き、90を超える言語に対応します(多言語モデルの系統は具体的には99言語に達し、英語専用版は一つの言語をしっかりこなします)。複数の言語でブログを書く人には、これが効いてきます。

Whisperを使わず、WindowsかMacの音声入力で済ませるべきとき

マーケティングページがやらないことをやりましょう。WordPressに音声入力するのがたまにだけなら、ここで一段落、あそこでコメント一つ、というくらいなら、ダウンロードは飛ばして、すでに手元にあるものを使ってください。WindowsではWin + Hで音声入力を開くを押して、フォーカス中のブロックに話しかけてください。Macなら、「システム設定」で音声入力をオンにして同じことをします。無料、インストール不要、もうそこにあります。

一つのブラウザの中で暮らしていて、テキストがクラウドを通っても気にならないなら、ブラウザ拡張機能やエディター内プラグインは、ほぼ無料の妥当な選択肢です。Whisperのようなデスクトップアプリに手を伸ばすのは、オフラインで使いたいとき、一つのタブではなくすべてのアプリで同じホットキーを使いたいとき、WindowsとMacの両方をカバーしたいとき、あるいは任意のAIクリーンアップが欲しいときだけにしてください。どれも当てはまらないなら、無料のOSの経路が正解です。買いすぎるより、それを使ってほしいと思います。

ローカルのパイプラインは無料。Proがクラウドを加える。

白いテーブルにノートパソコン、白紙、鉛筆だけのミニマルな作業環境。よりシンプルな道を吟味する

ローカルのパイプライン一式、音声入力と任意のAIクリーンアップは、サインインしたユーザーには無料で、登録時にカードは要りません。デスクトップアプリをインストールしてサインインすれば、一切支払うことなくWordPressに音声入力できます。Proは、最新のOpenAIモデルを使いたい人のためにクラウドの領域を加えるもので、短いクラウド試用が付いています。カードを求められるのはアップグレードの段階だけで、最初のサインインでは決して求められません。だから、記事の下書きに実際に使うオフラインの経路は、まったくお金がかかりません。詳しい金額は料金ページにあります。段落の途中で引用するのはやめておきます。

参考までに、最も近い有料の競合であるBlurtは、無料で使えるのは1,000語まで。その後は月$10または年$99です。中くらいのブログ記事はだいたい1,000語。つまり、おおよそ一記事で、あとはメーターが回り始めます。

先週の火曜日、お弁当を作りながらWordPressに三つのことを音声入力しました。下書き用の段落、コメントへの返信、それと一週間も避けていたメタディスクリプションです。片手にきゅうり、もう片手でホットキー。子どもたちが半分くらい話に割り込んできましたが、クリーンアップ機能が、下の子が「どうして月は時々ないの?」と尋ねた部分を、そっと落としてくれました。あれは以前なら、片手で打ち込む15分でした。今はサンドイッチを作る時間で済みます。(ちなみにそのサンドイッチは、やっぱり傾いて仕上がりました。クリーンアップ機能はお弁当までは直してくれません。)

たまに一行を音声入力するだけなら、あなたのOSはもうこれを無料でやってくれます。それを使ってください。オフラインで、どこでも、整えた状態で欲しいなら、次の記事で試してみてください。どちらにせよ、口で言えばいい部分を打ち込むのは、もうやめましょう。

次のWordPress記事を音声で書く

ブロックをクリックし、キーを押しながら話して、離す。文字起こしはカーソルのある場所に届きます。WordPressでも、ほかのどのアプリでも。

サインインしたアカウントなら、ローカルモードは無料。始めるのにカードは不要です。

Denys Medvedievの写真

Denys Medvediev

サポートメールを読んでいるのは私です。たぶん、返信も音声入力しています。