Denys Medvediev

比較

音声入力ソフトのおすすめ: 厳選7ツールをランキング

音声入力ツール7本を、入力できる場所・無料プランの実力・Wi-Fiが切れても使えるかという3点でランキング。書いているのはベンダー本人なので、偏りはラベルに明記してあります。

最終更新:2026年6月

暗いデスクに置かれた白いキーボード。下書きづくりを音声入力ソフトがそっと肩代わりする、ありがちな机まわり

2026年の音声入力ソフトのおすすめは、結局この7本に絞られます。WindowsとMacで無制限・無料・ローカル完結の音声入力なら Whisper by Remskill が頭ひとつ抜けており、デバイスをまたいだ仕上がりの良さなら Wispr Flow。短時間・たまの利用なら標準機能(Apple Dictation、Windowsの音声入力、Googleドキュメントの音声入力)でカバーでき、Superwhisper と Dragon がそれぞれ特定の用途を埋めます。

90年代後半、私の親戚は64MBのRAMを積んだWindows 98のデスクトップで Dragon NaturallySpeaking を動かしていました。トレーニングには、ヘッドセットに向かって調整用の単語を45分間読み上げる作業が必要でした。年賀状の1段落を口述するのに、さらに15分。最終的にヘッドセットは部屋の向こうへ飛んでいきました。生き残ったのはヘッドセットのほうで、実験のほうではありません。それから25年。下の娘は、トレーニングゼロ・一発で、おばあちゃん宛ての一通のメールを90秒で口述しました。音声入力はついに「使える」ものになったのです。新しい悩みは、どれも一番だと名乗る十数本のツールから1本を選ぶことになりました。

世にある「音声入力ソフトのおすすめ」リストの多くは、ベンダーのどれかが書いていて、自社製品を1位に据え、採点表はそこから逆算して作られています。一方で、あなたのOSにはすでにそこそこ優秀な無料の音声入力機能が標準搭載されていて、同じことをもっと洗練された形で実現すると謳う有料ツールも次々と登場しています。このリストでは、自分で確かめられる2つの軸で7本をランキングします。どこに文字を入力できるか、そしてお金を払わずに何が手に入るか。読み終わるころには、自分のプラットフォーム・文字量・プライバシーの線引きに合う1本がわかるはずです。包み隠さず、私自身の言葉で言うと、「私はこのリストに載っているツールの1本を作っている張本人です。Whisper は1位に置いていますが、その弱点も真下に明記してありますし、この記事の中で2回、他のツールを使えと勧めています」。

まず仕組みから知りたいなら――エンジン、レイテンシ、話した言葉がどうやってカーソル位置に届くのか――については、音声入力ソフトが内部でどう動いているかの解説がカバーしています。このページはランキング一覧です。

この7本をどう選んだか

選定が先、ランキングは後。リストに載るには、書いている場所で音声を文字に変えてくれる、実在して出荷中の本物のプロダクトであることが条件でした。カテゴリ名でも、開発終了したアプリでも、来期には消えている薄っぺらいラッパーでもダメ。多くのベンダーのリストを水増ししているブラウザ上のお遊びツールや放置されたフリーウェアは、選から漏れました。

ランキングのロジックは、わざと退屈に作ってあります。

  1. どこに入力できるか。 どのアプリでも使えるシステム全体型のツールは、特定の文書エディタに縛られたツールより上位です。
  2. 無料プランの実力。 ずっと使い続けられる無料プランは、文字数メーター付きの「お試し」無料より上位です。
  3. オフライン時の挙動。 Wi-Fiが切れても使える音声入力は、使えなくなる音声入力より上位です。
  4. 対応プラットフォーム。 可能ならWindowsとMacの両方。

10点満点の点数も、これが科学であるかのように装った加重マトリクスもありません。4つの基準を順番に当てはめ、同点は私自身の日々の使い込み(サンプル数1。それでも、たいていのベンダーのリストより1つ多い)で割りました。あなたの結果は変わるでしょうし、最後のセクションはまさにそのケースのために書いてあります。

7本のツール、ランキング

1. Whisper by Remskill:無制限・無料・ローカル完結、しかもシステム全体

Whisper
本物のWhisperアプリを、その場で動かしています――スクリーンショットではありません。Settingsをあちこちクリックしてみてください。

WhisperはWindowsとmacOS向けのデスクトップアプリです。ホットキーを押して、話して、離す。すると文字がカーソルのある場所にそのまま届きます――メール、Slack、CRM、コードエディタ、どこでも。デフォルトのホットキーはWindowsで Ctrl+Space。Macでは、トランシーバーのように Command と Option を同時に押し続け、離すと止まります。

1位の理由は無料プランです。これは文字数で制限されたお試しではありません。ローカルのパイプライン一式が、サインイン済みのユーザーにとって無料です。8種類すべてのローカルWhisperモデル、Parakeetエンジン、Ollama経由のAIテキスト整形、履歴、カスタム単語、ホットキー。すべてがあなたのマシン上で動き、何もデバイスの外に出ず、インターネットがオフでも動きます。

多言語版のWhisperモデルは99の言語をカバーします――この数字は多言語バリアントに当てはまるもので、英語最適化ビルドは英語のみです。一日の大半を英語で話していて速さがほしいなら、NVIDIAのParakeetエンジン(約600MB)はCPU上でWhisperより5〜10倍速く、英語に加えて24のヨーロッパ言語をカバーします。2つのエンジンはそれぞれ違うトレードオフを取っており、WhisperとParakeetの比較でより深く掘り下げています。有料のProプランは、自分のAPIキーでOpenAIのクラウド文字起こしとウェブ検索を追加します。詳しくは料金ページに載っています。

ここからは正直な部分です。Whisperはデスクトップ専用で、iPhoneアプリもAndroidアプリもありません。MacではApple Siliconが必須。IntelのMacは対象外で、Linuxビルドも存在しません。ノートPCよりスマホから口述することのほうが多い人や、お使いのノートPCが2017年のMacBookだという人は、Whisperは飛ばして読み進めてください。この一文も私はWhisperで口述しました。だから、二重に身にしみます。

ホットキーの一連の流れ、エンジンの顔ぶれ、何があなたのマシン上に留まるのかは、すべてWhisperの音声入力ページにまとめてあります。

2. Wispr Flow:仕上がりの良いクロスデバイス選択肢

Wispr Flow は、デバイスをまたいで暮らしている人に私が指し示すツールです。Mac、Windows、iPhone、Androidで動き、100以上の言語を会話の途中で自動判別し、散らかった話し言葉を入力の4倍の速さで洗練されたテキストに変えることを売りにしています。本当の差別化要因はスマホアプリです。このリストの他のどれも、デスクトップからロック画面までついてきてはくれません。

落とし穴はメーターです。無料プランはデスクトップで週2,000語が上限で、平均的な音声入力ユーザーなら1〜2日で使い切ります。それを超えると、1ユーザーあたり月$15のProサブスクリプション、年額プランなら$12です。さらにクラウドベースでもあります。Wispr自身のプライバシーページには文字起こしは常にクラウドで行われると書かれているので、あなたの音声はマシンの外に出ます。オフラインや無制限・無料よりスマホでの口述のほうが大事なら、これがあなたの一本です。罪悪感なくWhisperを飛ばしてください。

3. Apple Dictation:Macに最初から入っている答え

どのMacにもすでに入っています。マイクキー、カスタマイズ可能なキーボードショートカット、または「編集 > 読み上げ入力を開始」から起動でき、現行のmacOSではタイムアウトなしで好きなだけの長さのテキストを口述できます。無音が30秒続くと自動で止まります。

Appleの音声入力ガイドには、口述がAppleのサーバーに送られるのではなく端末上で処理されているかどうかを確認できる場所が示されています。

メッセージで40語の返信をするなら、これが正解のツールで、その用途のために誰かにお金を払うのは馬鹿げています。限界は端のほうに現れます。利用できるかどうかは言語と地域で変わり、Appleのガイドには自社製品名向けのカスタム単語についての記載がなく、全体がApple の囲いの中で暮らしています。口述が短く、たまにで、Macでなら――ここで止まって、お金は取っておきましょう。

4. Windowsの音声入力:Win+Hを押して話すだけ

Microsoftの標準の音声入力は、どのテキストボックスでも Win+H で起動し、Windows 10と11の中に何もダウンロードせずに同梱されていて、話すそばから句読点を自動で挿入します。40を超える言語に対応しています。ほとんどのWindowsユーザーが一度も押したことのない無料機能としては、評判より優秀です。

注意点が2つ。Microsoft自身のサポートページにあるとおりインターネット接続が必要で、つまり電車のWi-Fiが切れた瞬間に死にます。そしてMicrosoftはこの機能向けのカスタム単語を文書化していないので、あなたの会社の製品名を聞き間違え続けると思っておきましょう。たまの利用には十分。日常の相棒としてはもどかしい。

5. Googleドキュメントの音声入力:無料、ただしドキュメントの囲いの中だけ

Googleドキュメントを開き、「ツール」をクリックして「音声入力」を選ぶと、マイクのボックスが現れます。現行のChrome、Edge、Safariで動き、公開された長いリストの言語とアクセントを扱い、Googleスライドの発表者ノートと字幕もカバーします。学生や、とにかく何でもドキュメントで下書きする人にとっては、無料で、今日から使えます。

囲いがすべてです。GoogleドキュメントとGoogleスライドには入力できますが、メールクライアントにも、Slackにも、それ以外のどこにも入力できません。音声からテキストへの変換サービスはブラウザが握っているので、品質はあなたではなくブラウザに従います。退屈な真実を言えば、自分の入力作業の90%で使えないツールは、ひとつの機能ではあっても、音声入力の環境とは呼べません。

6. Superwhisper:Appleを軸に使う人向けのインディーなローカル選択肢

Superwhisper は、受けている注目より多くの注目に値します。macOS、Windows、iOSで動き、オフラインで使え、どのアプリでも Option+Space または押している間だけ録音する方式で起動します。無料プランには、どのアプリでも使える音声からテキストへの変換、会議の録音、英語への翻訳付きの100以上の言語と方言、そして小型AIモデルの無制限利用が含まれます。より大きなモデルとカスタムAPIキーは、有料のProプランと買い切りプランの後ろに置かれています。

ここに並ぶどれよりも、1位のWhisperと重なります。どちらもローカル優先で、ホットキー駆動、そして住み着ける無料プランを持っています。違いは端のほうにあります。SuperwhisperはMacを軸に育ち、iOSも身内に抱えています。一方でWhisperの無料プランは、両方のデスクトッププラットフォームでローカルモデルのフルラインナップを含みます。Appleのエコシステムにどっぷり浸かっていて、iPhoneの相棒がほしいなら、Superwhisperは私たちより良い選択になります。

7. Dragon:すべての始まりとなったプロ向けライセンス

Dragon Professional v16 は、私の親戚が1998年に怒鳴りつけていたあのソフトの末裔です。Nuanceの名誉のために言えば、45分のトレーニングセッションを要求するのはとうの昔にやめました。Nuanceは、タイピングより3倍速く文書を口述でき、認識精度は最大99%だと謳っており、製品はWindows 11に最適化され、Windows 10にも後方互換です。製品ページにMac版は見当たらず、価格は公開された値札ではなく、販売チャネル経由で取り決めるプロ向けライセンスです。

この記事における私の強い持論はこれです。もし音声入力ツールが、あなたにトレーニングや修正、声のプロファイル登録を求めるなら、それは1999年の問題を解いています。現代の音声モデルは、たいていのアクセントで箱から出してすぐ動きます――Whisper系のモデルは99言語を、登録ゼロで同梱しています。2026年のDragonは、すでにDragonのワークフローを確立したプロ、長年の独自コマンドを持つ法律・医療チームにとっては居場所を勝ち取りますが、ゼロから始める人向けではありません。

ざっくり比較

ツール入力できる場所無料プランオフライン言語
Whisper by Remskillどのアプリでも(Windows、Mac)ローカルパイプライン一式可。完全ローカル多言語99 / Parakeet 25
Wispr Flowどのアプリでも(Mac、Win、iPhone、Android)週2,000語不可。クラウド文字起こし100以上、自動判別
Apple DictationMacアプリ標準搭載端末上処理に対応地域により異なる
Windowsの音声入力どのテキストボックスでも(Windows)標準搭載不可。インターネット必須40以上
Googleドキュメントの音声入力ドキュメント+スライドのノートのみ標準搭載不可(ブラウザのサービス)公開された長いリスト
Superwhisperどのアプリでも(macOS、Windows、iOS)小型モデル、無制限100以上+方言
Dragon ProfessionalWindowsアプリ公開されている無料プランなし製品ページに記載なし製品ページに記載なし

1行だけ注釈が必要です。「無料プラン」とは、無期限に使い続けられるもののことであって、お試しが2週間だけ貸してくれるもののことではありません。

なぜシステム全体型がアプリ内音声入力に勝るのか

このリストで最大の分かれ目は精度ではありません。テリトリーです。Googleドキュメントの音声入力は2つのGoogleアプリに縛られています。Apple DictationはMacの中に留まります。システム全体型のツール――Whisper、Wispr Flow、Superwhisper、Windowsの音声入力――は、カーソルが点滅しているところならどこでも入力します。

Cancel
録音中のWhisperオーバーレイ――どのアプリでも、ホットキーを押し続けている間に見える、アニメーション付きの状態です。

そのテリトリーの差が、音声入力が習慣になるかどうかを決めます。平均的な音声入力ユーザーは1分あたり約145語を話し、タイピングはおよそ40語ですが、ツールが入力するすべてのボックスで使えると、その速さは積み上がっていきます。メール、チケット、チャットの返信、コミットメッセージ。使うために文書を切り替えなければならないツールは、本来取り除くはずだった摩擦を足してしまいます。ほとんどの生産性ツールは、姿を変えたタイピングの問題です。システム全体のホットキーは、入力を飾るのではなく取り除いてくれる、まれな解決策なのです。

ケースごとに、私ならこう選ぶ

ランキングをはがすと、4つの問いが残ります。たいていスマホから口述する? なら Wispr Flow――ロック画面からノートPCまでをこなすのは、ここではこれだけです。1つのプラットフォームで短い・たまのメモ? なら最初から入っているものを使い、誰にもお金を払わない――MacならApple Dictation、WindowsならWin+H、ドキュメントなら「ツール > 音声入力」。プライバシーやオフラインが重要な、長文の日常的な口述? それはローカル優先の2本組――WindowsとMacで無料モデルのフルラインナップがほしいならWhisper、Appleの世界でiOSの相棒がほしいならSuperwhisper。法律や医療の独自コマンドを備えた、確立したDragonのワークフロー? ならDragonに留まりましょう。長年の手なじみを移行するコストは、ライセンス代より高くつきます。

まだ迷う? なら無料で始めましょう。上のどの道にも無料の入り口があり、無料の音声入力ソフトガイドがそれらを詳しく案内します。アップグレードは、マーケティング上の壁ではなく本物の壁にぶつかったときに。

7本のツール、しかし決めることは3つだけ。標準か専用か、クラウドかローカルか、デスクトップだけかどこでもか。これに答えれば、リストはそれ自体ひとつの名前へと収束します。私の親戚は、1998年には口述がまだ使い物にならないと学ぶのに、45分のトレーニングと飛んでいくヘッドセットが必要でした。それが今は使えると学ぶのに、あなたに必要なのはおよそ10分とゼロドルです――プロダクトの時間軸としては、少なくとも正しい方向に進んでいます。

あなたの声が何を仕上げられるか、確かめてみてください

WindowsまたはMac向けのWhisperをダウンロードして、無料のローカルプランを、メールとメモの本物の一日にかけてみてください。

あるいはWin+Hから始めるのもあり。左の小指から4センチのところに座っています。まず無料の競合を試せと勧めるのは、聞くところによると、マーケティングのやり方ではないそうですが。

Denys Medvedievの写真

Denys Medvediev

サポートメールを読んでいるのは私です。おそらく、返信も口述で書いています。