Denys Medvediev

解説

音声入力のショートカット すべてのOSで

Win+H、Ctrl+Shift+S、Option+F1、Macのディクテーションキー。すべての音声入力ショートカットを一覧表にまとめ、そしてどのアプリでも使えるただ一つのホットキーをご紹介します。

最終更新: 2026年6月

暗い部屋でバックライトが灯るノートパソコンのキーボード。音声入力ショートカットに使うキーをクローズアップした様子

音声入力のショートカットは、どこで入力するかによって変わります。WindowsではWin+Hで音声入力を開きます。Google DocsではWindowsはCtrl+Shift+S、MacはCmd+Shift+Sを使います。Word for MacはOption+F1でDictateを起動します。macOSのディクテーションは、Microphoneキー、またはシステム設定で割り当てたショートカットで開始します。Whisperはこれらすべてを、どのアプリでも使える設定可能なただ一つのホットキーに置き換えます。

Win+H。Ctrl+Shift+S。Option+F1。一部のキーボードにはあり、別のキーボードにはないMicrophoneキー。何の変哲もない火曜日に、私が音声入力をするのに必要なショートカットの数を数えてみました。Outlookでメール、Google Docsで資料、Slackで返信。合計で4つ、それに加えてショートカットがまったく存在しないアプリが1つ。ディクテーションは毎分約145語、対してタイピングは40語です。このスピードを手に入れるために4つのショートカットを覚える――これは誰も口にしない「隠れた税金」なのです。

どのOSも、どの大手ライティングアプリも、それぞれ独自の音声入力ショートカットを選びました。しかもその半分は、特定の場所でしか動きません。2026年、ディクテーションそのものはもう解決済みです。Windows、macOS、Google Docs、Wordはすべて、ちゃんと使えるバージョンを提供しています。けれども、それを起動するキーは場面ごとにバラバラで、それぞれに細かな注意書きがついて回ります。このページでは、すべての音声入力ショートカットを一つの表にまとめ、それぞれが反応する前に何が必要なのかを説明し、なぜ互いに重ならないのかをひも解きます。読み終わるころには、どこで入力していてもディクテーションを始めるのはどのキーなのか、そしてどこでも同じキーを押したいなら何をインストールすればいいのかが分かるはずです。「サポート受信箱でいちばん多い音声入力ショートカットの質問は『どのキーか』ではなく『なぜキーが効かなくなったのか』です。だからこそ、その解決策は別の記事に分けてあります」――2年間その受信箱を読み続けた私の実感です。

すべての音声入力ショートカットを一つの表に

入力する場所ショートカット細かな注意書き
Windows 10 / 11、任意のテキストボックスWin+Hインターネット接続、動作するマイク、テキストフィールドにカーソルがあることが必要
macOS、任意のテキストフィールドMicrophoneキー、または自分で設定したショートカットシステム設定 > キーボード > ディクテーション で設定・変更
Google DocsCtrl+Shift+S (Win) / Cmd+Shift+S (Mac)最新のChrome、Edge、Safariで動作
Word (Microsoft 365)MacではOption+F1、WindowsではDictateボタンMicrosoft 365へのサインインとインターネット接続が必要
WindowsでもMacでも、すべてのアプリWhisperではCtrl+Space / Command+Option任意の組み合わせに再割り当て可能。ローカルモードはオフラインで動作

この表は、仕組みを知るまでは適当に見えます。音声入力ショートカットは3つの層に存在していて、その層によってショートカットがどこで効くかが決まるのです。

OSの層。 Win+HとMacのディクテーションショートカットはオペレーティングシステムに属します。OSはキーボードとテキストカーソルを掌握しているので、これらはテキストフィールドのあるどのアプリでも効きます。メモ帳、ブラウザ、メールクライアント、ファイルの名前変更ボックスなど、どこでも使えます。

アプリの層。 Ctrl+Shift+SはGoogle Docsのもの、Option+F1はWordのものです。アプリは自分のウィンドウ内でキー入力を捕まえるので、そのショートカットはほかの場所では一切効きません。SlackでCtrl+Shift+Sを押しても、Slackは肩をすくめるだけ。それでも私は週に一度くらいやってしまいます。何も起きません。それでもまたやってしまうのです。

ユーティリティの層。 Whisperのようなディクテーションアプリは、OSにただ一つのグローバルホットキーを登録し、押している間だけ録音して、文字起こしをカーソルの位置に貼り付けます。そのカーソルがどのアプリにあっても構いません。アプリより一段上、OSと同じ届く範囲、それでいてキーは自分で選べます。

この仕組みのモデルは、故障のパターンまで予測してくれます。そこがいちばん役立つところです。OSのショートカットは、OSの機能が依存しているものを失ったときに壊れます。インターネットがない、マイクの権限がない、というように。アプリのショートカットは、設計上、そのアプリを離れた瞬間に壊れます。グローバルホットキーが壊れるのは、別のプログラムが同じ組み合わせを先に押さえてしまったときだけ。だからこそ、どのデフォルトキーで出荷されているかよりも、再割り当てできることのほうが大事なのです。

Windows: Win+Hを押して、話し始める

聞き取り中…Win + H
Win+Hで開くWindowsの音声入力バー(再現)。

Windowsキーを押しながらHをタップすると、音声入力バーが下りてきて聞き取りの準備が整います。同じショートカットがWindows 11でもWindows 10でも使えます。Windows 10ではこの機能をディクテーションと呼び、Windows 11では音声入力と名前を変えましたが、キーは一度も変わっていません。Microsoftの音声入力ドキュメントによると、文字起こしを始める前に3つのものが必要です。インターネット接続、動作するマイク、そしてテキストボックスに置かれたカーソル。どれか一つでも欠けると、バーは開いても何も入力されません。

いったん動き出せば、音声コマンドを受け付けます。「それを削除」「それを選択」と言えば、その通りに編集してくれます。対応範囲は分かりやすい言語だけにとどまりません。音声入力には40を超える言語がインストールできます。なお、話しながらフィラーを整理してくれるMicrosoftの新しいフルーエント・ディクテーションモードは、今のところCopilot+ PCと英語ロケール限定です。

Win+Hの調子が悪いときは、その症状がどの依存先で失敗したかを教えてくれます。押しても何も開かない、または数語で聞き取りが止まる場合、解決策の出発点はマイクのプライバシー設定です。音声入力バーのマイクボタンがグレーアウトしている場合は、Windowsがシステムレベルでマイクをブロックしています。そして、虚空に向かって入力し続けた末にWin+Hそのものの代替がほしくなったなら、そのためのツールがまるごと一カテゴリ存在します。この記事は修理の話には立ち入りません。先ほどの3つの記事が深く掘り下げているので、こちらは地図のままでいられるのです。

macOS: ディクテーションキーを押す、または自分で設定する

ディクテーションescで終了
macOSのディクテーション用マイクのポップオーバー(再現)。

Appleは同じ部屋への入り口を3つ用意しています。ファンクションキーの列にMicrophoneキーがあればそれを押す、ディクテーションのキーボードショートカットを押す、あるいはメニューバーの 編集 > 読み上げを開始 を選ぶ。言葉づかいには意味があります。Appleのディクテーションガイドが「ディクテーションのキーボードショートカット」と書いているのは、万人共通の単一のキーが存在しないからです。そのショートカットは、システム設定 > キーボード > ディクテーション のショートカットポップアップメニューに表示されているものが何であれそれであり、カスタマイズから自分で好きなキーを押して設定できます。

終了の手順も、同じパターンを逆になぞります。Esc、Microphoneキー、もう一度ショートカットを押す――どれでもセッションを終わらせられますし、ディクテーションは30秒間の沈黙が続くと自分から切れます。この自動停止が、考えている途中の人を驚かせます。言葉を探そうとひと呼吸おいた頃には、ポップオーバーはもう帰ってしまっているのです。

面白みのない事実ですが、Macの設定は組み込み機能の中でいちばん洗練されています。ちゃんとした設定ページ、キーの選択肢、メニューという逃げ道。その代償として「Macのディクテーションショートカットは何?」という問いに一行で答えられず、サポートの質問が設定の案内ツアーへと変わってしまうのです。もし一気に30秒以上書き続けるなら、最初にぶつかる壁はこの30秒の沈黙による打ち切りでしょう。私たちのMacで音声を文字にするガイドが、それを越えるために何を使えばいいかをまとめています。

Google DocsとWordには独自のショートカットがある

音声入力Ctrl+Shift+S
Google Docsの音声入力マイクパネル(再現)。

Google Docsは音声入力をエディタの機能として扱います。Googleのショートカット一覧では「その他のツールとナビゲーション」に分類されています。WindowsとChromeOSではCtrl+Shift+S、MacではCmd+Shift+S、あるいはメニューから ツール > 音声入力 です。Googleはこの機能が最新のChrome、Edge、Safariで動作するとしており、ページが使えるようマイクがオンで他に占有されていない必要があります。ページ上にマイクのボックスが現れるので、それをクリックするか、もう一度ショートカットを押すと停止します。

詳しい解説は別の記事にGoogle Docsへのディクテーションとしてまとめました。ショートカットが沈黙してしまったときの対処法も載っています。

Wordはもっとややこしいです――そう言うのは、3ページ分のドキュメントをすべて読んだ者ならではの愛情からです。Word for MacはOption+F1でDictateを起動します。Word for Windowsには開始ショートカットがまったく記載されていません。ホームタブのDictateボタンをクリックする方式で、Alt+`(バッククォートキー。左上の、最後に押されたのは2019年だろうあのキー)は、一時停止したセッションの再開用としてだけ記載されています。どのバージョンも、Microsoft 365へのサインイン、マイク、そして生きたインターネット接続が必要です。一つの製品、3つのプラットフォーム、「どのキー?」への3通りの答え。

すべてのアプリで使える一つのショートカット

Whisperはユーティリティの層に位置するので、一つのホットキーがその上のすべてをカバーします。デフォルトはWindowsでCtrl+Space、MacでCommand+Option。2つの修飾キーを一緒に押したまま話し、離せば停止します。文字起こしはカーソルのある場所――Outlook、Docs、Slack、コードエディタ、会計ソフトの検索ボックスなど、どこにでも貼り付けられます。アプリごとのショートカットも、このウィンドウが「祝福された」一つかどうかを確かめる手間も要りません。

Cancel
Whisperの録音オーバーレイ――ホットキーを押したまま、話し、離す。

キーそのものは、自分で変えられます。設定に「録音ホットキー」の欄があります。クリックして、好きな組み合わせを押せば完了。Escでキャプチャをキャンセルでき、リセットボタンでプラットフォームのデフォルトに戻せます。この欄が存在するのは、午前2時14分に届いた一通のメールのおかげです。「Cmd+Shift+Spaceで音楽ソフトがクラッシュする。これじゃ使い物にならない。返金を」。

私は起きていました――どんな親にも心当たりのある理由で――そして初期のビルドではホットキーをハードコードしていました。カスタマイズ可能な欄は午前2時22分に出荷されました。ユーザーは午前2時31分に「ありがとう」のひと言だけで返信し、返金を求めることは二度とありませんでした。苦情から修正まで8分というのは、私が約束できるプロセスではありません。けれどもそれが生んだ設定パネルは、ずっと残ります。

録音は、あなたの話し方に合わせます。逆ではありません。オートモードはキーを押している間に録音し、離したときに文字起こしします。短い一言には自然に感じられるやり方です。マニュアルモードはワンタップで始まり、オーバーレイのボタンで停止します。キーを押し続けるのがしんどくなるくらい長いディクテーションに向いています。ローカルモードはパイプライン全体をあなたのマシン上で動かし、モデルに応じておよそ140 MBから3 GBのモデルファイルを一度ダウンロードすれば、その後はオフラインで動きます。

Whisper
本物のWhisperアプリ、ライブで動作中――録音ホットキーの欄は設定の中にあります。いろいろ触ってみてください。

この記事がずっと周りを回り続けてきた意見はこれです。最高の生産性ハックは、速い手順ではなく、少ない手順だということ。覚えた4つのショートカットは、最初の一言を発する前の4つの決断です。今どのアプリにいるかを思い出す分を数えれば5つ。どこでも効く一つのキーは、タイピングだけでなく、決断そのものを取り除いてくれます――そしてそれが取り除くタイピングこそが、遅い部分でした。毎分40語、対して話せば145語なのですから。

Whisperを使わなくていいとき

週に数回、一文か二文をディクテーションする程度なら、組み込みの機能で十分ですし、お金もかかりません。Win+HはすでにどのWindowsマシンにも入っていて、40を超える言語に対応し、音声での句読点コマンドも受け付けます。MacのディクテーションはMicrophoneキー一つで使え、短いメッセージなら問題なくこなします。書く生活のすべてがGoogle Docsの中で完結するなら、Ctrl+Shift+Sは無料で、しかも仕事をする場所にあります。専用のディクテーションツールを入れるのは、細かな注意書きが時間を奪い始めたとき――インターネット必須、30秒の沈黙打ち切り、一つのアプリを出たら死ぬショートカット。それまでは、お金は取っておきましょう。

どこかのユーザビリティ研究室で、Ctrl+Shift+Sを選ぶのに関わった人と、Win+Hを選ぶのに関わった人が、口をきいていません。残りの私たちが手にするのは一枚の表です。それを印刷するもよし、暗記をやめて、アプリからアプリへとついてくる一つのキーを割り当てるもよし。私は2つ目を選びました。便利だからです――まあ、それを売っている身ですしね。いずれにせよ、上の表はあなたのものです。

すべてのアプリで使える一つのショートカットがほしいですか?

Whisperをダウンロードして、Ctrl+Space(MacならCommand+Option)を押したまま、話し、離す。文字起こしはカーソルのある場所に届きます。

サインイン済みのアカウントなら、ローカルモードは無料です。

Denys Medvedievの写真

Denys Medvediev

私たちのサポートメールを読んでいるのは私です。たぶん返信もディクテーションで書いています。