Denys Medvediev

比較

Windows向け音声入力の決定版を、 ランキングで

Windowsに最適な音声入力アプリは、あなたがどこで入力するかで変わります。Win+Hは無料で標準搭載されていますが、インターネット接続が必要で、テキストボックスの中でしか動きません。Whisperはオフラインで動き、あらゆるアプリで使え、カーソル位置にそのまま貼り付けます。

最終更新:2026年6月

明るい窓辺の整頓されたオフィスデスクに開かれたシルバーのノートパソコン。典型的なWindows音声入力の作業環境

Windowsに最適な音声入力アプリは、あなたがどこで入力するかで変わります。Windows音声入力(Win+H)は無料で標準搭載されていますが、インターネット接続が必要で、テキストボックスの中でしか動きません。Whisper by Remskillはオフラインで動き、あらゆるアプリで使え、カーソル位置にそのまま貼り付けます。本格的に文章を書くなら、こちらのほうが頼りになります。

先週末、下の娘がウクライナのおばあちゃん宛てに90語ほどのメールを、90秒ほどで口述しました。キーボードは使いません。娘は7歳です。25年前、同じ家の同じパソコンでは、休暇の手紙の一段落を口述するのに15分かかり、しかも出来はひどいものでした。Windowsの音声入力は、いつの間にか「実験プロジェクト」であることをやめていたのです。正直に言えば、選択肢は思っているよりたくさんあり、有名どころの一つ二つは飛ばしてもかまいません。

たいていの「Windows向けベスト音声入力」リストは12個のツールに順位をつけ、リンク代を払ったところを推します。これはそういう記事ではありません。2026年のWindowsには、ほとんどの人が見つけられないまま使っていない無料の音声入力機能が標準搭載されています。そして有料市場は、会議を録音するツールと、文章を書くのを助けるツールへと二分されました。このガイドでは、Windows 10以降にインストールする価値のある音声入力アプリを、本当に大事な4つの観点でランクづけします。精度、オフライン対応、どこで使えるか、そして価格です。さらに、無料の標準機能だけで十分なのはどんなときか、わかりやすくお伝えします。読み終えるころには、今日インストールすべき一本と、棚に置いたままでいい有名どころが見えているはずです。私は自分が作っているアプリのサポートメールを自分で読んでいるので、これらのツールがどこで壊れるかについて知っていることの大半は、壊れたと知らせてくれた人たちからの便りで成り立っています。

これから読む内容の読み方について、ひとこと。私はこのリストに載るツールの一つを作っているので、中立な審判のふりはしません。それでも、無料の選択肢や競合のほうが正解になるケースははっきり名指しします。それが、この記事を誠実に書く唯一の方法だからです。順位は単一の勝者ではなく用途別につけています。なぜなら、単一の勝者など存在しないからです。1日にSlackメッセージを3本飛ばす人と、3,000語のレポートを声で書き上げる人とでは、求めるツールが違います。そうではないふりをするリストは、あなたに何かを売りつけようとしているのです。

手っ取り早い結論:Win+Hは無料、でもここで行き止まる

Windows · Win + H

Listening…
Windows音声入力(Win+H)の再現図。画面上部に現れる小さなフローティングバーです。無料で標準搭載ですが、インターネット接続が必要で、テキストボックスの中でしか動きません。

どのテキストボックスでもWindowsロゴキーとHを押すと、画面上部に小さなツールバーが現れます。話し始めてください。それがWindows音声入力で、無料、しかもWindows 11に標準搭載されています。チャット窓へのちょっとしたメッセージなら、無料ですでにインストール済みというのは、なかなか勝てない組み合わせです。

それを止めるものが二つあります。第一に、インターネットが必要です。音声入力はMicrosoftのAzure Speechサービスを使ったオンライン音声認識なので、接続がなければ口述もできません。第二に、そもそも動かすにはカーソルがテキストボックスの中になければなりません。これでは、声で済ませたい場所の多くが対象外になります。ファイル名の変更、思いどおりにいかない表計算のセル、Windowsが「テキストボックス」とみなさないデスクトップアプリなどです。

もう少し小さな三つ目の問題は、数週間使ってからようやく見えてきます。Win+Hは機能であって、ワークフローではありません。口述した内容の履歴を残さず、いつも間違って出てくる単語を直しておく場所もなく、自分の話し方に合わせて句読点を調整する方法もありません。手に入るのはマイクとテキストだけ。それで全部です。一行のぴったりした返信には申し分ありません。けれど、その朝4通目のメールになると、もっと欲しくなってきます。

ですから本当の問いは「無料の選択肢はあるか」ではありません。あります。まず試すべきです。問いは、無料が尽きたとき何に手を伸ばすか、です。電波のない電車の中で、Win+Hが入ろうとしないアプリの中で、あるいは同じ作業が40回目に巡ってきて、それを覚えていてほしいときに。

選び方:精度、オフライン、どこでも動く、価格

ノートパソコン、ノート、チェックリストの並んだデスク。音声入力アプリをランクづけする基準を表したもの

次の4つでランクづけしました。順番もこのとおりです。なぜなら、この順番であなたを噛んでくるからです。

精度。 テキストが間違っていたら、ほかのすべては雑音にすぎません。やっかいなのは、公平な一対一の数字を誰も公表していないことです。NuanceはDragonについて、初回利用から最大99%の認識精度をうたっています。ローカルモードでのWhisperの公表値は95%から99%で、大きいモデルほど高くなります。どちらも自己申告なので、ランキングではなく主張として受け止めてください。Win+H、Googleドキュメントの音声入力、Otterについて、検証可能な一対一の精度を一次情報として公表しているところは一つもありません。ですから、すべてのツールに数字を並べてくるリストは、それをでっち上げているのです。退屈な真実はこうです。20ドルのUSBマイク一本のほうが、どんなモデルの入れ替えよりも精度を動かします。文字起こしの質にお金をかけたいなら、まずマイクに、ソフトはその次にかけてください。

オフライン。 Wi-Fiを切っても動くか。Win+Hは動きません。Googleドキュメントの音声入力も動きません。自分のマシン上で動くツールなら動きます。これは給与の表計算ファイル、法律文書の下書き、業者のログに残っていてはいけない子どもの学校宛てメールにとって大事なことです。そしてもっと素朴で日常的な意味でも大事です。電車、飛行機、地下室、車の後部座席。クラウドの音声入力は、その日ぶつかる一番弱い電波と同じくらいしか信頼できません。

どこでも動く。 あらゆるアプリに入力できるのか、それとも一つだけか。ここが勢力図を分ける線です。システム全体のホットキーは、カーソルがどこにあろうとそこに貼り付けます。ブラウザの機能は、そのブラウザのタブの中でしか動きません。私が使うテストはわざと地味です。ファイル名を変更できるか、デスクトップアプリの検索ボックスを埋められるか、コミットメッセージを書けるか。「無料」の選択肢のほとんどは、ブラウザを出た瞬間にこのテストに落ちます。そしてあなたは、思っているよりずっとブラウザの外に出るものです。

価格。 「〜から」のない、はっきりした数字。無料が本物のところは無料と書きます。網羅しているように見せるために、Windowsのライセンスより高いツールでランキングを水増しはしません。そして、無料の標準機能だけで十分なときは、そう伝えます。多くの人にとっては、実際そうなのです。

時間をかける価値のあるWindows音声入力アプリ

Whisper
実際のWhisperアプリがライブで動いている様子。設定を開いて文字起こしエンジンを選びます。ローカルモードでは、どれもあなたのマシンから出ていきません。

Whisper by Remskill — あらゆるアプリで書くのに最適

正直に言っておくと、これは私が作っているものなので、そこは差し引いて読んでください。標準機能にできなくてこれにできること。それは、入力できるあらゆるアプリで動くシステム全体のグローバルホットキーを使い、文字起こししたテキストをカーソルのある場所にそのまま貼り付けることです。Windowsの初期ホットキーはCtrl+Spaceです。押したまま話し、離すと、テキストが着地します。

オフラインで動きます。ローカルの文字起こしはすべて純Rust製で、あなたのデバイスにとどまります。モデルをダウンロードしてしまえば、何一つマシンから出ていきません。どう動かすかはあなたが選びます。アプリが押しつけてくる単一の「おすすめ」モデルはありません。正しい選択は、あなたのマシンと言語によって変わるからです。

ローカルのWhisperには8つのモデルが付属します。英語専用が4つ、約140 MBのBaseから約1.5 GBのMediumまで。多言語が4つ、約3 GBのLarge v3まで。多言語のものは99言語に対応し、英語専用の.enビルドは英語、しかも英語だけを扱います。小さいモデルは素早く読み込まれ、ほどほどのハードウェアで動きます。大きいものはより多くのRAMを求め、その代わりにきれいな文字起こしで報いてくれます。もう一つのエンジン、約600 MBのNVIDIA製Parakeetは、CPU上でWhisperより5〜10倍速く動き、英語と24のヨーロッパ言語を扱います。アジアの言語と英語への翻訳はありません。おもに英語を話し、速さがほしいなら、Parakeetが追い越し車線です。99言語、翻訳、あるいはより細かな制御が必要なら、読み込むべきはWhisperです。

最新のOpenAIの品質とウェブからの回答を同じツールでほしいなら、Cloudモードはあなた自身のOpenAIキーを使います。だから支払いはOpenAIへ直接で、私たちは取り分を取りません。声で何かを調べさせることもできます。起動フレーズ「Hey whisper」と言えば、ウェブ検索を実行して答えを貼り付けます(起動フレーズを製品名にちなんで付けたのですが、妻に言わせれば、それを気が利いていると思うのはソフトを作る人間くらいだそうです)。全体は軽量です。アプリ本体は約25 MB、専用GPUは不要で、ローカルの文字起こしはCPU上で動きます。Windows 10以降にインストールできます。初回設定の手順は、私たちのWindowsで音声をテキストにガイドで詳しく解説しています。

最適な人: 複数のアプリにまたがって声で書く人、そしてそれを飛行機の中でも動かしたい人。

Windows音声入力(Win+H) — 無料・標準搭載の決定版

すでにあなたのPCにあり、インストールもアカウントも不要。Win+Hを押して、テキストボックスに話しかけるだけ。引き換えはインターネット必須と、テキストボックス限定という制約です。どのみちオンラインでいる短いメッセージなら、何のコストもかからないという理由で、これがまさに正しい最初の選択肢です。MicrosoftはWin+Hに自動句読点を追加しており、それは新規インストールしたWindows 11のどれにも最初から入っています。「音声入力なんて持っていない」という人のほとんどは、実はすでに持っていて、ただキーの組み合わせを押したことがないだけです。ここから始めてください。それで1日が回るなら、もう完成です。お金は1円もかかりません。

最適な人: ブラウザやチャット欄での手早い口述。オンラインで、設定いらず。

Dragon Professional — 専門用語に最適

Windows音声入力の古い王者。Nuanceは今も初回利用から最大99%の精度をうたい、Windows 11に最適化され、Windows 10とも後方互換です。一日じゅう濃い医療用語や法律用語を口述するなら、Dragonのカスタム語彙の奥行きこそが存在理由で、汎用モデルがつまずく専門用語の処理に何十年もの蓄積があります。正直なただし書きをひとつ。執筆時点でNuanceストアは移行の最中で、現行価格も、現行版が買い切りなのかサブスクなのかも、一次情報からは確認できませんでした。歴史的にはDragonは買い切りライセンスでしたが、自分が立てない数字を載せるつもりはないので、買う前に確認してください。もう一つのただし書きは、私に意見のあるもので、後ほど触れます。口述ソフトを訓練する時代は、この狭い専門ケースを除けば、ほぼ誰にとっても終わりました。

最適な人: 重い専門用語を扱い、予算のある専門職。

Wispr Flow — 洗練されたクラウド版の決定版

直接の競合であり、しかも洗練された一本。Wispr Flowは自動検出付きの100以上の言語をうたい、Windows、Mac、iOS、Androidでネイティブに動きます。目玉は自動検出です。あなたがそうするように、文の途中で言語を行き来すると言っています。文字起こしがデバイス上で動くのかクラウドなのかは、ホームページからは確認できませんでした。オフラインが大事なら、決める前に直接尋ねてください。洗練されていてマルチプラットフォーム。クラウドで構わず、スマホとノートで同じツールを使いたいなら一見の価値があります。二者で迷っているなら、私たちのWispr Flowの代替記事に一対一の比較をまとめてあります。

最適な人: 洗練された、デバイス横断の体験を求め、オフラインが不要な人。

Otter.ai — 会議向け、口述向けではない

Otterは得意なことが見事です。ただし、それはこれではありません。Otterは会議の文字起こしツールで、Zoom、Microsoft Teams、Google Meetに参加し、月300分までの無料Basicプランがあります。あなたのアプリに入力するのではなく、会話を録音して文字起こしし、要約します。まったく別のカテゴリです。あなたの問題が「会議を要約する」ことなら、Otterは強い答えです。けれど「もっと速く書く」ことなら、どれほど優秀でも間違ったツールです。システム全体のホットキーではなく、独立したアプリとウェブサービスとして動くので、フォームの入力欄を埋めるために手を伸ばすものでもありません。その線について私たちのOtter.aiの代替記事で掘り下げました。

最適な人: 会議の記録と要約。声で書くことではなく。

ひと目で比較:それぞれのツールが動く場所

この表からは、わざと精度を外しました。数字を公表しているのはDragonとWhisperだけで、どちらも自己申告です。Win+H、Googleドキュメントの音声入力、Otterは、検証できる数字を一つも公表していません。5つすべてにわたる「ツールXは96.3%の精度」といったランキングは、事実の形をした当て推量です。ですから下の列は、あなたが確かめられるものにしてあります。どこで動くか、オフラインで使えるか、あらゆるアプリに届くか、そして何のために作られているか。

ツール料金モデルローカル/クラウドオフライン対応あらゆるアプリで動く言語最適な用途
Whisper by Remskillローカルは無料、クラウドは有料(/pricing参照)ローカルまたはクラウドはい、ローカルモードではい、システム全体のホットキー多言語モデルで99言語あらゆるアプリで声で書く
Win+H 音声入力無料、標準搭載クラウド(Azure)いいえ、インターネットが必要いいえ、テキストボックスのみ複数、設定で指定手早いオンライン口述
Dragon Professional有料、Nuanceストアを確認ベンダーに確認ベンダーに確認対応アプリ内でベンダーに確認専門用語
Wispr Flow有料、ベンダー参照未確認未確認Win/Macでシステム全体100以上をうたう洗練されたクラウド口述
Otter.ai無料プランあり、上位は有料(ベンダー参照)クラウドいいえいいえ、独立アプリベンダーに確認会議の文字起こし

この表を左から右へ読めば、勢力図はおのずと整理されます。「あらゆるアプリで動く」と「オフライン」の両方がはいである必要があるなら、リストは短くなります。オンラインで、一つのアプリの中で満足しているなら、無料の標準機能でこなせるので、ここで読むのをやめてかまいません。決め手は、抽象的にどのツールが「最良」かであることはめったにありません。あなたの働き方に合うのはどの行か、それがすべてです。

知っておく価値のあるそのほかのツール

Windowsの勢力図は5つの名前より広がっています。ほかのリストで見かけるであろういくつかを、合わないものを飛ばせるよう、それぞれ正直な一行で紹介します。

  • Microsoft Word ディクテーション — Microsoft 365のWordに組み込まれ、すでにOffice代を払っているなら無料で、Wordの中では優秀です。Wordの中に閉じ込められています。書き物のほとんどがどのみちそこで起こるなら、追加費用ゼロの良い選択肢です。その癖についてはWordでの音声入力で扱いました。
  • Googleドキュメント 音声入力 — 無料ですが、対応ブラウザでGoogleドキュメントとスライドの中だけ。音声サービスはブラウザが制御します。システム全体ではなく、ドキュメントからタブを切り替えた瞬間に止まります。
  • OpenAIの音声テキスト変換API — whisper-1、gpt-4o-transcribe、gpt-4o-mini-transcribeがあり、ファイル1つあたり25 MBのアップロード上限があります。これはインストールするアプリではなく、開発者向けの構成部品です。WhisperのCloudモードのようなツールが裏で呼び出すもので、それに向かって話しかけて使うものではありません。
  • Speechnotes — 無料のブラウザ用口述パッド。メモを走り書きするには十分で、タブの中で暮らし、タブの外には出ません。
  • Windows 音声アクセス — MicrosoftのハンズフリーOS操作で、速く書くためではなく、アクセシビリティと完全なキーボードレス操作のために作られています。Windowsを声だけで動かす必要があるなら、その存在を知っておく価値があります。
  • OpenAI Whisper — オープンソースのモデル本体で、コマンドラインなしでローカルに動かせます。PCでWhisperモデルそのものをどうしても使いたいなら、ターミナル不要でインストールして使う方法をWindows版OpenAI Whisperの手順解説でご覧ください。

会議ツールやクラウド文字起こしサービスも含め、このカテゴリ全体の長めの一覧がほしいなら、文字起こしソフトの完全ガイドを書いてあります。このページの短い結論はこうです。これらの大半は、ブラウザに縛られているか、あらゆるWindowsアプリに書き込むという仕事にはカテゴリが合っていません。

有料アプリを飛ばすべきとき(そしてただWin+Hを使うべきとき)

Windows · Win + H

Listening…
またWin+Hです。ブラウザやチャット欄での短いオンライン口述なら、無料の標準バーが本当に正しい答えです。Windowsがすでにくれているものに、お金を払わないでください。

ここが、こうしたリストのほとんどが省く部分です。あなたを無料の競合へ送り出しても、誰のブログの足しにもならないからです。オンラインにいて、ブラウザやチャット欄にときどき短いメッセージを口述するだけなら、何にもお金を払わないでください。私たちにもです。Win+Hを押して、先へ進んでください。無料で、Windows 11に標準搭載され、短い一吹きならちゃんとこなします。Googleドキュメントの中で暮らしているなら、その音声入力は無料で、ドキュメントのすぐそこにあります。本当の必要が、書くことよりも会議の録音と要約なら、Otterの無料プランが月300分くれます。有料の口述アプリがその居場所を稼ぎ始めるのは、具体的な一線からです。長めの文章を書くとき、電波のない場所で作業するとき、あるいはWin+Hが入れないアプリに話しかける必要があるとき。その線より下では、標準機能が正しい答えです。私としては、あなたにお金をとっておいてもらい、それを使い切ったときに戻ってきてもらうほうがいいのです。

この記事に植えておく強い意見をひとつ。口述ツールがあなたに訓練を求めるなら、それは1999年です。現代の音声認識は、たいていのアクセントと言語で、箱から出してそのまま動きます。古いWindows時代を象徴したあの45分のキャリブレーション儀式は、乏しい計算資源への間に合わせであって、機能ではありませんでした。1990年代後半、私の親戚が64 MBのRAMを積んだWindows 98のデスクトップでDragon NaturallySpeakingを動かしていました。訓練には45分かかりました。単語の一覧を読み上げてキャリブレーションするのです。それでようやく口述が、かろうじて動きました。精度はせいぜい70%、一文ごとに4秒の遅れつきで。休暇の手紙の一段落に15分。ヘッドセットは部屋の向こうへ投げつけられました。ヘッドセットは生き残り、実験は生き残りませんでした。25年後、同じ家の7歳児が、訓練もキャリブレーションもなしに、90秒でメール一通を口述しました。2026年のツールがいまだに、聞き始める前にあなたに訓練を求めるなら、それは新しいアイコンをまとった1999年の発想です。

回りくどさのない料金

Whisperのローカルのパイプラインは、アカウントがあれば誰でもまるごと無料です。ローカルのWhisper、Parakeet、デバイス上のAI強化、口述履歴、カスタムホットキー、その全部。登録に支払い方法は要りません。ここはじっくり味わう価値があります。この記事まるごとが扱っている、オフラインであらゆるアプリで動く口述が、1円もかからず、しかもカードを差し出さずに手に入るのです。Whisper Proは、OpenAI駆動の文字起こし、クラウドのAI強化、音声ウェブ検索といったCloudの面を加えます。最新のモデルとウェブからの回答を同じツールでほしい人のためです。Win+HとGoogleドキュメントの音声入力も無料です。Otterには月300分の無料プランと、その上の有料プランがあります。Dragonは有料製品で、現行価格をNuanceから直接は確認できなかったので、ストアを確認してください。Whisper Proの正確な数字は料金ページにあります。はっきりと、書面で、「〜から」なしで。更新の前には必ずメールでお知らせするので、日付も金額も不意打ちになることはありません。

今すぐテキストボックスを開いて、Win+Hを押してみてください。あの手早いツールバーで、あなたのすることがすべてまかなえるなら、それで完了です。ダウンロード一つ分を節約できました。電波のない電車の中にいる自分に気づいた瞬間、聞こうとしないアプリに話しかけている瞬間、あるいはメッセージより長い何かを書いている瞬間。そこが、インストールするツールが意味を持ち始める線です。私の7歳児がその線を越えたのは、車の後部座席からおばあちゃんに手紙を書きたくなった日でした。月は隠れたり現れたりして、Wi-Fiはついに一度も姿を見せませんでした。

あなたのWindows PCで見てみたいですか?

Whisperをダウンロードして、Ctrl+Spaceを押したまま、文字起こしがどのアプリにも着地するのを見てください。ローカルのパイプラインは無料、登録にカードは要りません。

ログイン済みのすべてのユーザーにローカル口述が無料。Proは別のトライアルでクラウド機能を追加します。

Denys Medvedievの写真

Denys Medvediev

私はうちのサポートメールを読んでいる本人です。たぶん、返信も口述で書いています。

さらに読む