Denys Medvediev

ガイド

音声で文字入力 Substack のエディタで

Substack の投稿エディタには音声入力機能がありません。音声機能はあくまで完成した投稿を読み上げるためのもので、書くのを助けてはくれません。解決策はシステム全体で動くツールです。ホットキーを押して、話すだけで、エディタ内のカーソル位置に言葉がそのまま入力されます。

最終更新: 2026年6月

暗いデスクでコーヒーを片手にノートパソコンに向かい、話しながら投稿の下書きをするライター

Substack のエディタでの音声入力は、Substack そのものではなく、システム全体で動くツールを通して実現します。Substack の投稿エディタに音声入力機能はなく、音声オプションは完成したテキストを読み上げるだけです。Whisper のようなツールがそれを解決します。ホットキーを押して話すと、エディタのカーソル位置に文字起こしが貼り付けられ、AI が一度処理してとりとめのない話を整えてくれます。

私は小さなニュースレターを書いていますが、一番よく書けた段落のほとんどは、キーボードに向かっているときではなく、犬の散歩中に浮かんできます。そこで、下書きをそのまま Substack のエディタに話しかけて入れる方法を探しました。見つかったのは Substack の読み上げ機能についてのページばかり。私が本当に欲しかったものは、その真逆だったのに、どれも当てはまりませんでした。

ほぼすべての検索結果がつまずく勘違いがここにあります。Substack は完成した投稿を喜んで音声に変えてくれます。でも、音声を投稿に変えてはくれません。この二つは正反対の方向で、後者、つまり下書きを口述することには、エディタのどこを探してもボタンがありません。解決策は Substack の外にあり、設定には2分ほどしかかからず、あなたが文章を書く他のすべてのアプリでも同じように動きます。

読み上げ機能の記事が埋もれさせている要点はこうです。Substack の投稿エディタはブラウザのリッチテキスト入力欄で、Gmail の作成画面や Google ドキュメントと同じ種類のものです。カーソル位置に貼り付ける音声入力は、それがどの入力欄であろうと気にしません。

だから本当の問いは「Substack で音声入力をどうやってオンにするか」ではありません。スイッチなどなく、あなたが何度も見つけている音声メニューは逆の仕事をします。問うべきは「Substack のエディタの上でどの音声入力ツールを動かすか」であり、その答えは、無料で内蔵されているものが欲しいのか、それとも、どこでも同じように動くオフラインのホットキーが一つ欲しいのかで変わります。すべてを順に説明し、2分で一つ設定し、専用ツールを使わなくていい場面もお伝えします。

Substack のエディタに音声入力はある?

ノートパソコンに向かって考えながら話す人。タイピングではなく音声で下書きする様子を表している

ありません。Substack の投稿エディタには、下書きを音声で書くための音声入力、口述入力、ボイスタイピング機能が一切ありません。代わりに入力してくれるマイクボタンも、音声コマンドも、隠れた設定もありません。エディタのツールバーをずっと探していたなら、もうやめて大丈夫です。そこには存在しません。

そこにあるもの、そしてどの検索結果も代わりに差し出してくるものは、ヘッドホンアイコンの奥にある音声メニューです。これは読み上げとテキスト読み上げです。読み上げは、すでに書いた投稿を自分で朗読して録音したり、音声ファイルをアップロードしたりして、購読者が聴けるようにする機能です。一部のパブリケーションで使えるテキスト読み上げは、完成した投稿を合成音声で読み上げます。どちらもテキストから音声を作ります。音声入力はその正反対で、あなたの声からテキストを作ります。両方ともマイクと「音声」という言葉が絡むので、人々はこの二つを混同します。そしてその混同は、検索に費やす午後の半日を奪います。あなたにはその半日を省いてほしいのです。

この違いが大事なのは、どこを探せばいいかを教えてくれるからです。音声メニューをどれだけ見つめても、Substack の中に音声入力は見つかりません。そもそもそこには作られていないからです。エディタはタイピングを前提とした入力欄です。そこに声を入れるには、ブラウザの上に乗ってカーソルのある場所へテキストを送り込むツールが必要です。誠実な道は二つあり、このガイドの残りは両方を扱います。

ホットキーを押して話すと、言葉がエディタに現れる

これが仕組みのすべてで、いい意味で退屈です。ホットキーを押し、話し、離すと、フォーカスのある入力欄、つまりカーソルのある場所に文字起こしが貼り付けられます。Whisper はキーを離した後も短い余韻を残すので、最後の言葉が切れてしまいません。OS のカーソル位置に貼り付けるので、Substack のエディタは単なる「どこかの入力欄」にすぎません。連携用の API もプラグインの差し込み口もないウェブエディタですが、それは問題ではありません。音声入力は Substack のコードに一切触れないからです。あなたがすでに入力している場所に入力するだけです。

ランディングページが必要以上に複雑にしているのはこの部分です。Substack に何かをインストールする必要も、パブリケーション設定に貼り付けるトークンも、承認すべき連携もありません。カーソルがエディタにあり、あなたが話すと、言葉がエディタに現れます。話している間は小さなカプセルが表示され、聞き取っていることがわかります。

Cancel
録音オーバーレイ: 話している間に表示される小さなカプセル。Whisper が聞き取っていることがわかります。

最初にきちんと押さえておく価値があるのはホットキーです。Windows では Ctrl+Space、Mac では Command+Option で、話している間だけ押し続けるプッシュトゥトークの修飾キーのみの組み合わせです。すでに使っている操作とぶつかる場合は、どちらも設定で変更できます。(下の娘がかつて、お絵かきアプリでホットキーが「効かない」と言ったことがあります。それはバグではなく競合でした。そこで、普通の人はホットキーの競合が何なのかすら知らないのだと学びました。だから今ではすべてのホットキーをカスタマイズできるようにしています。)これまでに Windows での音声入力Mac での音声入力 を設定したことがあるなら、同じ手の動きをニュースレターに向けるだけです。

2分でセットアップ (Windows または Mac)

必要なのは、Apple Silicon の Mac か Windows 10 以降の PC、動作するマイク、そしてブラウザで Substack を開き、下書きの投稿を画面に表示しておくことです。ローカルのパイプラインはすべて、サインインしたアカウントなら誰でも無料で、サインアップ時に支払い方法を求められることもありません。手順は次のとおりです。

ステップ1 — Whisper をインストールしてサインインする。

ダウンロードページから入手してインストールし、無料アカウントを作成します。カードは不要です。ローカルでの文字起こしのパイプラインがすぐに使えるようになります。

アプリのトレイアイコンが表示され、セットアップウィザードがモデルの選択を促してきたら成功です。

ステップ2 — 文字起こしの方法を選ぶ。

アプリが勝手に選ぶことはありません。選べるのは3つ: クラウド (OpenAI、自分のキーを使用)、ローカル Parakeet、ローカル Whisper です。自分のマシンで投稿の下書きをするなら、まずはローカルから。詳しくは2つ先のセクションで。

モデルのダウンロードが完了し、準備完了と表示されたら成功です。

ステップ3 — ホットキーを確認する。

Windows の初期設定は Ctrl+Space、Mac はプッシュトゥトークとして押し続ける Command+Option です。Mac では、求められたときにアクセシビリティの許可を与えてください。これがないと、カーソル位置への貼り付けがブラウザに届きません。

テストの録音がどこかの入力欄に貼り付けられたら成功です。

ステップ4 — Substack のエディタにカーソルを置いて話す。

下書きを開き、本文をクリックし、ホットキーを押し続け、一文を言って、離します。文字起こしがカーソルのある場所、つまりエディタの中に現れます。

話した一文が Substack の下書きにテキストとして収まっていたら成功です。

Whisper
本物の Whisper デスクトップアプリの設定画面。Transcription と AI のパネルが開いています。

時間がかかるのはモデルのダウンロードであって、セットアップではありません。それ以外は上の4ステップがすべてです。一度動き出せば、下書きをページに載せるという行為はタイピングの作業ではなく、話す作業になります。ニュースレターにとっては、それがほぼ仕事のすべてです。

Windows での音声入力 · Mac での音声入力

ブラウザのエディタにシステム全体のツールが必要な理由

Substack のエディタはブラウザの中で動いていて、それが何ができるかを決めています。口述入力したい大半のアプリには、深く連携できるデスクトップ版があります。ところがウェブのリッチテキストエディタには、そうしたものが何もありません。プラグインのマーケットプレイスも、Substack が投稿への書き込みに公開している拡張ポイントもありません。だから連携を Substack の内側から持ってくることはできません。ブラウザより上の層から来る必要があるのです。

システム全体のホットキーが、まさにその層です。どのウィンドウが持っていようと OS のカーソル位置に貼り付けるので、Substack の下書きを埋めるのと同じキーが、あなたの Gmail の作成画面 も、Slack のメッセージも、コミットメッセージ も埋めてくれます。一つのツールで、すべての入力欄を、Windows でも Mac でも。投稿の下書きから読者へのメール返信に移っても、覚え直すことは何もありません。どこでも同じ「押す・話す・離す」です。

Substack だけで動くブラウザ拡張機能が、この問題には合わない形である理由もここにあります。ライターは一つのタブの中だけで生きてはいません。Substack で下書きをし、別のウィンドウで調べ物をし、アプリでコメントに返信し、次のアイデアは浮かんだ場所のどこにでも書き留めます。一つのサイトに限定したツールは一部分を解決するだけ。カーソルに合わせたツールは全体を解決します。私は1時間に40回くらいアプリを切り替えますが、40個もの違う音声入力ボタンを覚えたくはありません。

ローカルかクラウドか: 投稿の下書きにはどちらのモード

ニュースレターの下書きなら、まずはローカルモードを試してください。書きかけの投稿は、あなた自身の生の思考です。まだ固まりきっていない意見、削るかもしれない段落、公開していいか確信が持てないもの。磨かれていない一文を、自分の画面に映すためだけに誰かのクラウドへ毎回送るのは、奇妙な選択でしょう。Mac が Apple Silicon か、PC がここ数年のものなら、ローカルは日常の口述入力を文句なくこなしてくれます。そしてクラウドは初期設定ではなく、いざというときの逃げ道になります。

3つの方法がどう違うかをここに示します。アプリが選ばせる以上、きちんと選んでほしいからです。

  • ローカル ParakeetNVIDIA の TDT エンジンで、約600 MB、ローカルで最速の選択肢です。CPU 上で Whisper の5〜10倍速い。英語に加えて他の24のヨーロッパ言語、合計25言語に対応します。英語への翻訳機能はありません。ニュースレターを英語か他のヨーロッパ言語で書くなら、これが手早く完全にオフラインで使える選択肢です。
  • ローカル Whisper同じマシンでは Parakeet より遅いものの、多言語ビルドは99言語に対応し、英語へ翻訳できます。英語専用ビルドは99言語ではなく英語専用です。中国語、日本語、韓国語、あるいは Parakeet にはできない翻訳作業には、これを選んでください。標準の英語モデルは約480 MB です。
  • クラウド (OpenAI、BYOK)最も高い精度とウェブアクセスを、自分の OpenAI キーで利用します。料金は OpenAI から直接請求されます。文字起こしは初期設定で gpt-4o-mini-transcribe で動きます。インターネットが必要なので、あなたのマシンの外に出る唯一の方法です。クラウド機能は Whisper Pro の一部です。

つまらない真実ですが、大半のニュースレターのライターがページに載せるような文章には、ローカルで十分です。どちらのローカルエンジンも完全にあなたのマシンの中で動き、サーバーには何も送りません。クラウドが活きるのは、雑な録音から最高水準の精度が欲しいときや、下書き中にモデルにウェブから事実を引っぱってきてほしいときです。普段の書く習慣には、まずローカルから始めて、ローカルでは物足りないときだけクラウドに手を伸ばしてください。

話したとりとめのない言葉を、整った段落に変える

生の口述は、ひと続きの長い文として出てきます。人は考えるのと同じように話すので、句読点のない長い一息になります。それがどの音声エンジンも返してくる文字の壁です。書き終えたメールなら煩わしいだけ。でも自分の名前で公開する投稿には、それは問題です。文字起こしのように読める段落を世に出したい人はいません。それをきれいにする部分こそ、音声で下書きをする本当の価値が表れるところです。

Windows のボイスタイピングは話すそばから句読点を打ってくれますし、macOS の音声入力は「カンマ」や「ピリオド」と言えば基本的な句読点を扱えます。もっと本格的に整える作業、つまり「えーと」を取り除き、長すぎる一息を直し、話したとりとめのない言葉を実際に公開できる段落に変えるには、Whisper が AI で一度処理できます。起動フレーズ「Hey whisper」と言うと、テキストが入力される前に整えられます。ローカルモデルでは Ollama を通して動き、クラウドモードでは初期設定で gpt-5-mini です。ビフォーアフターがそのまま売りどころです。

Thinking...
そのまま

ええとつまり今週言いたかったのは生産性のアドバイスってほとんどがタイピングのアドバイスを言い換えただけなんだよねえーとつまりもっといいアプリが必要なんじゃなくてそんなにタイプするのをやめればいいんだ

整えた後

今週言いたかったのは、生産性のアドバイスはほとんどがタイピングのアドバイスの言い換えだということです。もっといいアプリは必要ありません。そんなにタイプするのをやめればいいのです。

正直な限界を伝えておく価値があります。デモは伝えてくれないからです。音声は言葉を届けてくれますが、書式は届けてくれません。Substack の見出し、太字、引用ブロック、リンク、そしてあの細い区切り線は、すべてエディタ自身のツールバーとショートカットから生まれます。一文を口述したら、いつものようにツールバーに手を伸ばして H2 を作ったり、リンクを差し込んだりしてください。Substack の引用を命じれば呼び出してくれる音声入力ツールなどありません。まずは音声で文章を素早く落とし込み、それからすでに知っているエディタで投稿を形にしてください。

同じ「話してから整える」流れは、ニュースレターをはるかに超えて役立ちます。どんなアプリにも整った文章を口述する のも、あの一つのホットキーでできるので、手で書き上げる段落の代わりに、長いひとかたまりが話した数文に変わります。

Substack で音声入力ツールを使わなくていいとき

舗道にチョークで描かれた、別々の方向を指す2本の矢印。ツール選びを表している

ときには、正しいツールはすでにあなたのマシンにある無料のものであり、そうでないふりをするのは不誠実です。エディタに短い一行を入れるだけなら、つまり一文のメモや、コメントへの手早い返信だけなら、OS が無料でそれをまかなってくれます。

Windows では、Windows キー + H を押すと、内蔵のボイスタイピングバーがカーソルのある場所、Substack のエディタを含めて開きます。自動で句読点を打ち、短い入力なら十分です。難点は、Microsoft のサーバーを経由するためインターネット接続が必要で、オフラインの選択肢ではないことです。Mac では、音声入力を使えば文字を入力できるどこででも話して入力でき、システム設定の「キーボード」で設定します。Apple Silicon では一般的なテキストをデバイス上で処理できます。下書きへの手早い一文なら、どちらも本当に十分で、無料を使うなと止める気はありません。

内蔵機能がつらくなってきたら、専用のシステム全体のツールに手を伸ばしてください。たとえば長文の投稿、とりとめのない話を公開できる文章に変える AI の整え処理、多言語での執筆、オフラインでの下書き、あるいは Substack でもメールでもメモアプリでも同じように動くホットキーが一つ欲しいとき。ニュースレターは長文の事例なので、大半のライターはその線をすぐに越えます。でもその線より下なら、無料のものを使ってください。一行のコメント返信のためにアプリを入れろとは言いません。

同じ天秤は、あなたが文章を書くところならどこにでも現れます。Gmail への口述 の理屈もまったく同じです。どちらもブラウザの入力欄であり、本当の連携を担うのはプラグインではなくカーソルだからです。

関連資料

Substack はあなたの完成した投稿を読み上げてくれますし、それは上手にこなします。ただ、そもそも書くこと自体は手伝ってくれません。これを書き終えた今、Substack は最初からそうするつもりがなかったのだろうと私はほぼ確信しています。それでいいのです。連携を担うのはカーソルだから。エディタに話しかけてテキストを得て、AI の一度の処理で整え、すでに知っているツールバーで投稿を形にする。このガイドのほとんどを、私は Substack ではない入力欄に音声で下書きしました。どの入力欄かを気にしないツールを使って。そして全部を下書きに貼り付けたのです。それがこの仕掛けのすべてです。

次の Substack の下書きで試してみてください

ホットキーを押し続け、話して、離す。文字起こしがカーソルのあるエディタに収まり、AI の一度の処理がとりとめのない話を公開できる段落に変えます。

サインインしたアカウントなら無料のローカルモード。始めるのにカードは不要です。

Denys Medvediev の写真

Denys Medvediev

サポートメールを読んでいるのは私です。たぶん、返信を口述しながら。