Denys Medvediev

トラブルシューティング

Windowsの音声入力が 止まる

Windowsの音声入力(Win+H)は、数秒の沈黙のあと、別のウィンドウをクリックしたとき、または接続が切れたときに、勝手に止まります。しかもMicrosoftは、沈黙による自動一時停止が仕様だと認めています。乗り切るには話し続けてインターネットを安定させるか、自動で止まらない押している間だけ録音するツールを使いましょう。

最終更新: 2026年6月

ノートパソコンの横、机の上に置かれたストップウォッチ。作業の途中で時間切れになる機能を連想させる。人物は写っていない

Windowsの音声入力が止まり続けるのは、音声入力(Win+H)が数秒の沈黙のあと、ウィンドウのフォーカスが変わったとき、またはクラウド接続が切れたときに自動で一時停止するからです。しかもMicrosoftは、沈黙による一時停止が仕様だと認めています。対処法は、話し続ける、インターネットを安定させる、マイクを確認する、の3つ。押している間だけ動くオフラインのツールなら、キーを押している限り動き続け、自動で止まることはありません。

Win+Hを押すとバーが現れ、話し始めるとちゃんと動きます。そこで少し考えようと一拍おく。資料にちらっと目をやったり、名前を確認しようと別のウィンドウをクリックしたりするかもしれません。向き直って話を続ける――ところが何も入力されない。あなたが見ていない隙に、音声入力がこっそり自分でオフになっていたのです。これが文の途中で起きるのを、数え切れないほど目にしてきました。最初の十数回は、自分のマイクが壊れたのだと思い込んでいました。

壊れてはいませんでした。長い説明の前に、まず短く言うとこうです。Windowsの音声入力は、自分で止まるように作られています。黙ると止まり、キーボードで入力すると止まり、クラウドサービスに依存しているので、不安定な接続やウィンドウのフォーカス変更でも切れてしまいます。一部は回避できます。ですが沈黙のあとに一時停止する部分は、Microsoft自身の言葉を借りれば「仕様」であり、これは完全にはオフにできません。

最初の検索結果が省きがちなのはこの点です。これらの多くは意図された動作であって、パッチを当てて直せるバグではありません。Win+Hは、一拍の間を「もう終わり」と読むように設計されているので、自分で一時停止します。手で入力を始めた瞬間にも一時停止します。さらに音声入力は、Microsoftのオンライン音声サービスを通じて音声を文字に変換するため、安定したインターネット接続が必要です。そこで少しでも途切れたり、フォーカスのあるウィンドウが切り替わったりすると、途中で止まってしまうのです。

そこで正直に問うべきは、一度の長い録音をどう途切れさせずに続けるか、実際に直せる部分をどう切り分けるか、そしてそもそも止まらない口述の方法はあるのか、ということです。この3つすべてを、Microsoftの正確な手順とともに扱います。そして、組み込みの機能だけで本当に十分なのはどんなときかについても、率直に話します。

Windowsの音声入力が勝手に止まり続ける理由

暗い机の上、キーボードの横に置かれたストップウォッチ。時間切れになる機能を表している

原因は4つあり、そのうちあなたが直せるのは一部だけです。最初は最も多くの人がぶつかるもの。音声入力は、数秒の沈黙のあと自分で一時停止します。Microsoftのサポートチーム自身が、これが意図的なものだと認めています。公式Q&Aで、あるMicrosoftコミュニティのサポート担当者はこう述べています。「現在の音声入力ツールは、確かにこのように設計されています。一定時間操作がないと音声入力ツールが自分で一時停止するのを防ぐ追加の手段はありません」。同じスレッドでは、「キーボードを使って手で入力したときにも自動的に一時停止する」とも書かれています。つまり、考えるための一拍や、ひとつのキー入力でセッションが終わるのです。

2つ目の原因はフォーカスです。Windowsは、スマートフォンのように常時画面上にマイクを表示してくれるわけではありません。同じ公式ガイダンスによれば、「各セッションでは、Win+Hで改めて起動し直す必要があります」。別のウィンドウをクリックすると、直前のフィールドに結びついていた音声入力が切れ、またショートカットを押し直す羽目になります。3つ目の原因はネットワークです。Microsoftの公式ページははっきりと「音声入力は、Azure Speech servicesを利用したオンライン音声認識を使用します」と述べています。つまりクラウドベースなので、弱い接続や切れる接続では文の途中で止まることがあります。4つ目はマイクそのもの。緩んだUSBマイク、スリープと復帰の不具合、または下がりすぎた音量は沈黙として読まれ、原因その1の自動一時停止を引き起こします。

声に出して言っておく価値があります。午後を一日棒に振らずに済むからです。通話ではマイクが問題なく使えるなら、これはまずハードウェアの故障ではありません。止まる原因はもっと上流、音声入力がセッションの終わりをどう判断するかにあります。だからこそ、以下の対処法は2つに分かれます。本当に効くもの(安定した接続、良いマイク、話し続ける)と、どうしても取り除けないただ一つの制限(仕様としての沈黙による一時停止)です。

ほとんどの人に効く手早い対処法

沈黙のタイムアウトそのものは消せませんが、それを引き起こさないようにすることはできます。一度の長い文章では、目標はシンプルです。黙らない、ウィンドウを切り替えない、そして他に何も途切れさせていないことを確かめる。手順は、Microsoftのサポートガイダンスと、スレッドで説明されている動作から導いたものです。

話の流れを途切れさせないようにしましょう。考えるための一拍が必要なら、完全に黙るのではなく、ハミングするかつなぎ言葉を口にしてください。数秒の沈黙が一時停止を引き起こすからです。口述の途中でキーボードに触れないこと。手で入力すると仕様としてセッションが止まります。一度の録音中はひとつのウィンドウにとどまり、別の場所をクリックしたらWin+Hを押し直してください。接続を確認しましょう。オンライン音声認識には安定したインターネットが必要です。Wi-Fiが切れているなら、音声入力も切れます。そして「設定」「システム」「サウンド」「入力」でマイクを確認し、「設定」「プライバシーとセキュリティ」「マイク」でマイクへのアクセスがオンになっていることを確かめてください。途切れるマイクは沈黙として読まれ、セッションを終わらせます。これらがすべて揃えば、たいてい一度の途切れない録音は持ちこたえます。

Cancel
押している間だけ動くオーバーレイは、キーを押している間ずっとオンのままです。沈黙タイマーもなく、次の文を組み立てるあいだに自動で止まることもありません。

これが目の前の作業を乗り切るための応急処置です。上のオーバーレイは別のツール――システム全体で使える口述アプリ――のもので、ひとつの対比を見せるためにここに置いています。押している間だけ録音するレコーダーは、沈黙していようがいまいが、キーを押している分だけきっかりオンになります。考えるために一拍おくたびにカウントダウンが進むことはありません。あなたが終わったと勝手に判断しないからです。毎日この止まっては始まる繰り返しと戦っているなら、次のセクションで紹介する根本的な答えは、そもそも自動で止まらないツールを使うことです。

根本的な対処法: 自動で止まらない口述

長い文章を口述していて、数秒ごとにバーが終わってしまうのにうんざりしているなら、根本的な対処法は、オン・オフの仕組みが違うツールです。押している間だけ動くホットキーは、押している限り録音し続けます――一拍の間も、考える時間も、コーヒーに手を伸ばす間も。そしてローカルエンジンが自分のマシン上で文字に起こすので、切れるクラウド接続も、引っかかる沈黙タイマーもありません。必要なのはWindows 10以降のPCと、使えるマイクだけ。Whisperを使った4ステップのセットアップを紹介します。

ステップ1 — Whisperをインストールしてサインイン。

ダウンロードページから入手してインストールし、無料アカウントを作成します。カードは不要。ローカル文字起こしのパイプライン一式がすぐに使えるようになります。

アプリのトレイアイコンが表示され、セットアップウィザードがモデルの選択を促してくれたら、うまくいった証拠です。

ステップ2 — ローカルの文字起こし方式を選ぶ。

アプリは勝手に選んではくれません。接続の切れを完全に避けるには、Local Parakeet(英語で最速)またはLocal Whisper(多言語、翻訳対応)を選びましょう。どちらも完全に自分のマシン上で動きます。クラウドも用意されていますが、それだけはネットワークを使う方式です。

モデルのダウンロードが終わり、準備完了と表示されたら、うまくいった証拠です。

ステップ3 — 押している間だけ話すホットキーを設定。

Windowsの既定はCtrl+Spaceで、押している間だけ話すプッシュ・トゥ・トークとして機能します。キーを押している間は録音し、離したときに止まります。一拍おいたときではありません。Ctrl+Spaceが他のアプリと衝突する場合は、設定で別のキーを選んでください。

キーを押したまま、文の途中で数秒間止まり、また話し続けても、全体をきちんと取り込めたら、うまくいった証拠です。

ステップ4 — カーソルをどこにでも置いて話す。

どんなテキストボックスでも――メール、ドキュメント、検索バー――クリックして、ホットキーを押したまま、間を挟みながら数文を話し、離します。文字起こしはカーソルのある場所に貼り付けられ、ローカルで処理され、沈黙のタイムアウトに切られることはありません。

間を含む長い文章がひとかたまりのテキストとして入力され、押し直しが要らなければ、うまくいった証拠です。

Whisper
実際のWhisperデスクトップアプリの設定画面。文字起こし(Transcription)とAIのパネルが開いている。

唯一ゆっくりなのは、一度きりのモデルのダウンロードだけです。そのあとは、キーを押している間ずっと録音が続き、文字起こしはあなたのCPU上で行われます。だからWin+Hを止め続けていた2つのもの――沈黙タイマーとクラウドのやり取り――は、そもそもこの仕組みに存在しません。押して、話して、一拍おいて、話し続けて、離す。それがすべての流れです。

それでも組み込みの方を直したいなら

Win+Hにきちんと動いてほしいだけで、別のアプリは入れたくない、という人はたくさんいます。もっともです。ここからは、私なら試す順に、Windows側のより踏み込んだトラブルシューティングを紹介します。すべてMicrosoft自身のサポート文書とスレッドからのものです。どれもレジストリには触れないので、マシンを壊すようなものは何もありません。そして、どうしても直せないただ一つのことも指摘します。

まずは接続です。クラウドへの依存は、最も過小評価されている原因だからです。音声入力はMicrosoftのオンライン音声サービスを通じて音声を送るので、「設定」「プライバシーとセキュリティ」「音声認識」でオンライン音声認識がオンになっていること、そしてインターネットが安定していることを確認してください。不安定な接続では文の途中で止まり、ローカルのバグのように見えます。次にマイク。「設定」「システム」「サウンド」「入力」で正しい入力を選び、音量が低ければ上げ、「設定」「プライバシーとセキュリティ」「マイク」でマイクへのアクセスがオンになっていることを確かめます。Microsoft自身のトラブルシューティングでも、内蔵マイクが途切れる場合はヘッドセットや外付けマイクに切り替えることを勧めています。途切れるマイクは、自動一時停止を引き起こす沈黙として読まれるのです。

3つ目は言語です。「設定」「時刻と言語」「音声認識」で、音声認識の言語が口述している言語と一致していること、その認識パックがインストールされていることを確認してください。一致していないと挙動が不安定になります。Microsoftは、背景の雑音が音声を濁らせるため、より静かな部屋で口述することも勧めています。さて正直な部分です。これらのどれも、沈黙による自動一時停止を取り除けません。あれは意図的なものです。Microsoftのサポートチームは直接それを認め、変更を求めるなら音声入力ツール内の「フィードバックを送信」から投票するようユーザーに案内しています。その投票が実るまで、できるのはせいぜい黙らないようにすることだけ。一時停止そのものはオフにできません。それがあなたにとって致命的なら、唯一の本当の逃げ道は押している間だけ動くキーを持つツールであり、それこそ上のセクションの主旨です。

ローカルかクラウドか: どちらのモードが実際にこれを避けるか

ここに来た理由が、接続がぐらついた瞬間に終わってしまう機能なら、答えはローカル寄りです。どちらのローカルエンジンも、何もどこにも送らずに完全に自分のマシン上で動くので、ネットワークの途切れがWin+Hのように文の途中で止めることはできません。アプリがあなたに選ばせる3つの方式が、この特定の問題に対してどう違うかを見ていきます。

アプリは選択を迫ってくるので、「止まり続ける」という不満に対して私ならどう考えるかを示します。

  • Local ParakeetNVIDIAのTDTエンジンで、約600 MB、最速のローカル選択肢です。CPU上でWhisperの5〜10倍速い。英語に加えて他の24のヨーロッパ言語、合計25言語をカバーします。英語への翻訳機能はありません。完全にオフラインなので、切れる接続もありません。英語かヨーロッパ言語を話すなら、これがクラウドのやり取りという足踏み機から最も手早く抜け出す方法です。
  • Local Whisper同じマシンではParakeetより遅いですが、多言語版は99言語をカバーし、英語へ翻訳できます。英語専用版は英語のみで、99言語ではありません。中国語、日本語、韓国語、またはParakeetにはできない翻訳作業ならこれを選びましょう。既定の英語モデルは約480 MB。これも完全にオフラインです。
  • Cloud(OpenAI、BYOK)最高の精度とウェブアクセスを備え、自分のOpenAIキーを使い、OpenAIから直接課金されます。文字起こしは既定でgpt-4o-mini-transcribeで動きます。インターネットが必要なので、Win+Hと同じくネットワークに依存し、途切れれば中断されることがあります。Cloudの機能はWhisper Proの一部です。

退屈な真実ですが、あなたをここに連れてきた特定のいらだちに対しては、ローカルが本当の治療法です。一度もネットワークに触れない文字起こしを、接続の途切れが止めることはできませんし、押している間だけ動くキーは、あなたがどれだけ長く間をおこうと気にしません。クラウドが真価を発揮するのは、難しい録音で最上級の精度がほしいときや、文の途中でウェブから事実を引き出したいときです。ですが不満が「Wi-Fiが点滅すると止まる」ことなら、また別のネットワーク依存の方式を選ぶのは的外れです。まずはローカルから始めましょう。

音声入力が途切れなくなったあとの、よりきれいなテキスト

音声入力が実際に最初から最後まで動くようになると――組み込みでもそれ以外でも――次の現実にぶつかります。生の音声は、だらだらと続く一文になって出てくるのです。「じゃあデッキを仕上げてマリアに送って明日リハーサルのために一時間確保して」と言えば、それがどんな音声エンジンでも手渡してくる句読点のない一塊です。それをきれいにするところで、ツールの差が出ます。

Windowsの音声入力は、動いている間、話しながら句読点を付けられます。より本格的な整え――「えーと」を取り除き、だらだら続く文を直し、話した段落を実際に送れるものに変える――には、Whisperがテキストが確定する前にAIによる処理を一度通せます。起動フレーズの「Hey whisper」と言えば、テキストがまず整えられます。ローカルモデルではOllamaを通じて、クラウドモードでは既定でgpt-5-miniで動きます。

Thinking...
生のまま

じゃあデッキを仕上げてマリアに送って明日クライアントとの打ち合わせの前にえーとリハーサルのために一時間確保して

整えたあと

じゃあ、デッキを仕上げて、マリアに送って、明日クライアントとの打ち合わせの前にリハーサルのために一時間確保しておいて。

この整えのステップは、専用ツールが単に止まらないこと以上に価値を持つ理由の一部です。あなたが手にするのは、間を挟んでもオンのままの取り込みだけではありません。完成により近いテキストも手に入るのです。これのもっと広い形がほしいなら、この同じ「話してから整える」流れこそが、開くすべてのアプリで声でもっと速く入力することを可能にしてくれます。Win+Hがたまたま入力した、たったひとつのウィンドウだけではありません。

そして、どんなフィールドでもカーソルの位置に貼り付け、フォーカスが移っても自動で止まらないので、同じ流れはブラウザのタブの中でも保たれます。Googleドキュメントへの口述は、デスクトップのエディタへの口述と同じように動きます。両者の間をクリックして行き来しても同じです。まさにそここそ、Win+Hがセッションを落としがちな場面なのです。

組み込みの機能で十分なとき

ノートパソコンが置かれた、落ち着いた整然とした机。問題が解決したことを連想させる

ここは、何かをインストールしないよう私があなたを説得する部分です。短い区切りで口述していて、自動停止が一度も邪魔にならないなら、別のアプリは要りません。沈黙タイマーが働く前に一文か二文――それこそWin+Hが想定している使い方です。無料で、Windowsに組み込まれていて、手早い返信には本当に問題ありません。二行のメッセージを口述するためにソフトをインストールしろ、なんて言うつもりはありません。

組み込みの道が正解なのは、いくつかの条件が当てはまるときです。主に短いテキストを口述する、どのみち常にオンラインである、フィールドの間でWin+Hを押し直すのが気にならない、そして自分の声が認識のためにMicrosoftのクラウドへ送られても構わない。最後の点が本当の分かれ道です。音声入力は仕様として、あなたの音声をMicrosoftのオンライン音声サービスを通じて送ります。買い物リストには問題ありませんが、クライアントへのメールや、自分のマシンに留めておきたいものには、ひと考えする価値があります。

押している間だけ動くオフラインのツールに手を伸ばすべきなのは、止まることが繰り返し痛みになり始めたときです。長い文章を口述していて沈黙の一時停止に何度もぶつかる、ウィンドウを絶えず切り替えてセッションを失い続ける、不安定な接続で作業している、または自分の声をマシンの外に出したくない。その線より下なら、無料のものを使いましょう。このガイドの前半にある回避策は、まさにそうできるようにあります。

問題が止まること以上に大きいなら――Win+Hが何も反応しない、テキストが出ない、または言語が違う――もっと広いチェックリストはWindowsで音声入力が動かないときにあり、厳密には自動停止ではない残りの不具合のパターンをカバーしています。

さらに読む

Microsoftは、あなたが考えようと立ち止まった瞬間に終わったと判断する音声入力機能を作り、それからこれは意図的で、しかもオフにできないと、自分のサポートフォーラムで認めました。そこで私たちは、切るのが怖い電話のように一拍ごとに話し続け、別のウィンドウにちらっと目をやるたびに同じ二つのキーを押し直します。短い区切りなら、たいてい動きます。ですが、息をしたせいで文の途中で機能が終わるのを初めて経験した瞬間、自分を待ってくれるものがほしくなり始めます。私はこのガイドのほとんどを、たった一つのキーを押したまま、好きなときに一拍おきながら口述しました。一度も私を見捨てませんでした。

自動停止なしで口述する

ホットキーを押して、話して、必要なときにいつでも一拍おいて、離す。文字起こしはどんなアプリでもカーソルの位置に届きます。ローカルで処理され、沈黙タイマーも、切れるクラウド接続もありません。

サインインしたアカウントならどれでも無料のローカルモード。始めるのにカードは不要です。

Denys Medvedievの写真

Denys Medvediev

私たちのサポートメールを読んでいるのは私です。おそらく返信を口述しながら。