Denys Medvediev

比較

superwhisper Windows版

superwhisperがWindows版をリリースしたため、「Macのみ、申し訳ありません」という古い答えはもう通用しません。本当の問いは、どの音声入力ツールがあなたのWindowsマシンに合っているかです。superwhisper Windows版と、最も近いローカル代替ツールを正直に比較します。

最終更新:2026年6月

暗いデスクの上にあるWindowsノートパソコンと近くに置かれたマイク。デスクトップ音声入力を想起させる画像

superwhisper Windows版はいよいよ現実のものになりました。2026年現在、superwhisper.comからWindows 10・11向けのアプリをダウンロードでき、どのフィールドでもオンデバイス・オフラインのAI音声入力が使えます。最も近いローカル代替ツールはWhisper by Remskillです。こちらもWindowsネイティブで、ローカルパイプラインは無料。システム全体で使えるプッシュトゥトークのホットキーとAI清書機能も備えています。

長い間、「superwhisper Windows版」と検索しても、がっかりする答えしか返ってきませんでした。superwhisperはもともとMacアプリとして誕生し、その後iOSに対応。Windowsユーザーはフィードボードで「いつ自分たちの番が来るのか」と問い続けていました。去年検索していた方なら、どのページも同じことを言っていたのを覚えているでしょう。「Macのみです、代替ツールをどうぞ、申し訳ありません」。

その答えはもう古くなりました。superwhisper.comにはWindows専用ページとダウンロードリンクが追加されました。Windows 10・11対応、x64とARM64、オンデバイスのオフライン文字起こしが可能です。もはや「入手できるか」という問いではなくなりました。「自分のWindowsマシンに合ったツールか、それとも別のものが合っているか」という問いに変わったのです。私は毎日Windows上で音声入力を使っています。superwhisperの本当の強みは正直に伝えつつ、Whisper by Remskillが合う場面もお話しします。

古い記事が誤解を招いていた点をはっきり言っておきます。不要な回り道に時間を使ってほしくないからです。superwhisperはもうMac専用ではありません。Windows版は正式にリリースされた公式サイトのアプリであり、ベータ版の申し込みではありません。superwhisperを使いたかった方は、今日からインストールできます。

つまり「MacアプリをどうやってWindowsで動かすか」という問題ではなくなり、普通のツール選びの話になりました。Windows上で動くしっかりしたローカル音声入力アプリが2つある状態です。このガイドの残りは正直な比較です。superwhisperとは何か、なぜ人々が他のツールを探し続けるのか、2つをどう比較するか、そしてsuperwhisper——あるいはWindowsの組み込みオプション——の方が賢い選択となるケースを紹介します。

superwhisperとは何か、誰に向いているか

ワークステーションでの音声入力を表す、キーボードの横に置かれたデスクトップマイク

superwhisperはAI音声入力アプリです。話すと文字に起こし、使っているアプリ——メール、チャット、コードエディタ——に整形されたテキストを貼り付けてくれます。公式説明によると、あらゆるアプリにまたがって動作し、句読点や書式は自動で処理。100以上の言語に対応し、言語を自動検出します。ライブの音声だけでなく、音声ファイルや動画ファイルも文字起こしできます。これは本当に優れた機能セットで、そうでないふりはしません。

superwhisperが最も強調しているのはプライバシーです。Windows版のページにはこう書かれています。「オンデバイスのAIモデル。音声はデバイスから一切外に出ず、インターネット接続も不要。」これは音声入力ツールとして正しい姿勢であり、Whisper by Remskillの考え方とも一致しています。クラウドの請求書が膨らむのを見た人なら、ローカル処理がなぜ大切かわかるはずです。(かつてあるチームが、スタンドアップの録音を「スマートリトライ」が積極的すぎるせいで4回も再処理してしまい、1四半期で5桁のクラウドAI料金を積み上げるのを目の当たりにしました。CFOがレビューの途中でダッシュボードを開いた瞬間、会議室が静まり返りました。)オンデバイスの音声入力は、そういった問題をそもそも回避できます。

では誰に向いているか。洗練されたモダンな音声入力アプリを求め、複数のAIモデルから清書モデルを選びたい人——Macを使っている人、または新しいWindows版に乗り換えた人です。superwhisperはmacOSで育ったアプリで、そこでは強力かつ評価の高い選択肢です。Windows版はまだ新参者です。それは批判ではなく、今の立ち位置を示しているだけです。以下の比較を読む上で重要な点です。

「なぜWindows版がなかったのか」——そしてなぜついに変わったのか

長年にわたり「superwhisper Windows版」への正直な答えは「ない、MacとiPhoneのアプリだ」でした。Mac先行はインディー開発ツールによくある道です——サポートするプラットフォームは一つ、OSとの密な統合、バグも少ない。Windowsはより難しい。入力の仕組みだけとっても荒削りです。私自身、言語入力が有効なマシンで自社のホットキーが録音停止コールバックを1キー押下に6回発火させた問題を修正するため、Windowsのインプットメソッドフレームワークについて知りたくもなかった知識を大量に習得しました。300ミリ秒のデバウンスで直りました。Macではそのバグは一度も出ませんでした。

このギャップこそが人々を代替ツール探しに駆り立て、このキーワードが今も検索されている理由です。古い習慣、古い記事、そしてWindows版のリリースがまだ新しすぎて知らない人が多いという現実があります。2つのツールが共通して持つ仕組みはシンプルです。ホットキーを押し、話し、放す。するとカーソルの位置に文字が貼り付けられます。話している間は小さなカプセルが表示され、ツールが聞いていることがわかります。

Cancel
録音オーバーレイ:話している間に表示される小さなカプセル。ツールが待ち受けているサインです。

Whisper by RemskillのWindowsでのプッシュトゥトークホットキーはCtrl+Spaceで、話している間押し続けます。他のショートカットと衝突する場合は設定から変更できます。(うちの下の娘が一度、お絵かきアプリでホットキーが「動かない」と言ってきたことがあります。バグではなく競合でした——一般の人がホットキーの競合というものを知らないと学んだ出来事です。だからすべてのホットキーをカスタマイズ可能にしました。)以前にWindowsで音声入力を設定したことがある方なら、同じ操作感です。

Whisper on Windowsを2分でセットアップする

superwhisperと並べて試したい方のために、全体の手順をまとめます。必要なのはWindows 10以降のPC、動作するマイク、そして数分の時間だけです。ローカルパイプライン全体はログイン済みアカウントなら無料で、サインアップ時に支払い方法の入力は不要です。

ステップ1——Whisperをインストールしてサインイン。

ダウンロードページからダウンロードしてインストール、無料アカウントを作成します。カード不要。ローカル文字起こしパイプライン全体がすぐに使えます。

トレイアイコンが表示され、セットアップウィザードでモデルの選択が促されたら成功です。

ステップ2——文字起こし方式を選ぶ。

アプリは自動で選びません。3つの選択肢があります。Cloud(OpenAI、自分のキーを使用)、Local Parakeet、Local Whisperです。プライベートな作業にはまずローカルから始めましょう——詳しくは2セクション先で説明します。

モデルのダウンロードが完了して「準備完了」と表示されたら成功です。

ステップ3——ホットキーを確認する。

WindowsのデフォルトはプッシュトゥトークでCtrl+Spaceを押し続けます。すでに使っているショートカットと競合する場合は設定から変更してください。

テスト録音がテキストフィールドに貼り付けられたら成功です。

ステップ4——カーソルをどこかに置いて話す。

メール、ドキュメント、チャットなど、任意のテキストボックスをクリックし、ホットキーを押し続けて一文話してから放します。カーソルの位置に文字起こし結果が表示されます。

話した文章がフィールドにテキストとして入力されていたら成功です。

Whisper
実際のWhisperデスクトップアプリの設定画面。「文字起こし」と「AI」パネルが開いた状態。

時間がかかるのはモデルのダウンロードだけで、セットアップ自体は上の4ステップで完了です。一度動き始めると、フィールドへの入力が「タイピング」から「会話」に変わります。superwhisperをインストールした後も同じ体験です。どちらのツールも、ホットキーとマイクがあればどこでも使えます。

superwhisperとWhisperの正直な比較

どちらも今やWindowsで動き、オンデバイスで文字起こしし、あらゆるアプリで動作し、多くの言語に対応しています。共通点は多く、それを認めた方が誠実です。違いは細部にあります。superwhisperは清書モデルを多数揃えており、GPT、Claude、Llama、Grok、Gemini、Mistralといった選択肢がサイトに列挙されています。さらにトーンを調整できる「モード」もあります。設定の細かさが好きな方には本当に魅力的な機能で、superwhisperはそれをしっかり実現しています。

Whisper by Remskillは少し異なる設計です。文字起こしエンジンを自動で選ぶのではなく、3つの選択肢を提示してユーザーに委ねます。高速なローカルエンジン、英語への翻訳もできる多言語ローカルエンジン、そして自分のOpenAIキーを使うクラウドオプションです。WindowsでのプッシュトゥトークホットキーはCtrl+Spaceでカスタマイズ可能。ローカルパイプライン全体——すべてのローカルモデル、ローカルモデルによるAI清書、履歴、プリセット、カスタムホットキー、3台のデバイス——はサインアップ時カード不要でログイン済みアカウントなら無料です。有料プランはクラウド機能を追加するだけです。これは単純な無料プラス有料という構造とは異なります。

superwhisper on Windowsについて正直に言うべき注意点は、機能ではなく成熟度です。Windows版はmacOS版より新しく、Windows上の新しいデスクトップソフトウェアはしばらく粗削りな部分が残りがちです——先ほど話した入力の仕組みの難しさがそのコストです。最も歴史のあるバージョンを求めるなら、superwhisperではmacOS版、Whisperなら最初からWindowsとMacの両方で提供されています。MacでsuperwhisperをすでにJoyfully使っていてWindows版を試したい方は試してみてください。ただし、育ってきたプラットフォームと同じ完成度を初日から期待しないでください。

ローカルかクラウドか:Windows上でのWhisperモードの選び方

Whisperを使うなら、まずローカルモードを試してください。メール、途中まで書いたメモ、ベンダーのログに残したくないメッセージ——こうした音声入力の大半は、一段落のテキストのためにラップトップの外に出す必要はありません。ここ数年のPCなら、ローカルで日常的な音声入力は問題なくこなせます。クラウドはデフォルトではなく逃げ道として活用できます。アプリが選択を求めるので、3つの違いを説明します。

選択は速度、言語の対応範囲、最高精度のどれを優先するかで決まります。

  • Local ParakeetNVIDIAのTDTエンジンで、約600 MB。CPUでのWhisperより5〜10倍速い、最速のローカルオプションです。英語を含む25言語(ヨーロッパ言語が中心)に対応。英語への翻訳はできません。主に英語や他のヨーロッパ言語を話す方には、素早く完全オフラインで使える選択肢です。
  • Local Whisper同じマシンではParakeetより遅いですが、多言語対応ビルドは99言語をカバーし、英語への翻訳も可能です。英語専用ビルドは英語のみ対応で、99言語ではありません。中国語、日本語、韓国語、または翻訳作業にはこちらを選んでください。Parakeetではこれらには対応していません。デフォルトの英語モデルは約480 MBです。
  • Cloud(OpenAI、BYOK)最高精度とウェブアクセスを提供。自分のOpenAIキーを使い、料金はOpenAIに直接支払います。デフォルトの文字起こしはgpt-4o-mini-transcribeで実行されます。インターネットが必要なため、デバイス外に出る唯一の方式です。クラウド機能はWhisper Proに含まれます。

正直なところ、Windowsで人々が音声入力する内容のほとんどは、ローカルで十分です。どちらのローカルエンジンも、サーバーに何も送らずに自分のハードウェアだけで完全に動作します。superwhisperが謳うオンデバイスの約束と同じです。クラウドが真価を発揮するのは、難しい録音で最高精度を求める場合や、会話の途中でモデルにウェブから情報を引き出してほしい場合です。まずローカルから始め、物足りなくなったときだけクラウドに頼りましょう。

話し言葉を整った文章に変えるAI清書パス

生の音声入力はつながった一文になります。「ええとアーキテクチャのドキュメントレビューしてプロジェクトアルファってタグつけて木曜日のスタンドアップ前に教えてね」と話すと、どの音声エンジンも最初はそのまま句読点なしのテキストを返します。そのテキストをどう扱うかで、ツールの真価が問われます。

superwhisperはモデルピッカーとカスタムモードで清書します。Whisper by RemskillにもAIパスがあります。アクティベーションフレーズ「Hey whisper」と言うと、テキストが貼り付けられる前に整えられます。フィラーワードが除かれ、繋がりが修正され、話し言葉がそのまま送れる文章に変わります。ローカルモデルではこのパスがOllamaを通じて完全オフラインで動きます。クラウドモードではデフォルトでgpt-5-miniが使われます。どちらも目的は同じです——ざっくり話して、整ったテキストが届く。

Thinking...
変換前

ええとアーキテクチャのドキュメントレビューしてプロジェクトアルファってタグつけて木曜日のスタンドアップ前に教えてね

清書後

アーキテクチャのドキュメントをレビューして、プロジェクトアルファとタグ付けし、スタンドアップ前の木曜日に教えてください。

清書パスは、修正が必要な音声入力とそのまま送れる音声入力の差を生み出します。また、オンデバイスとクラウドの境界線が最も重要になる場面でもあります。自分のマシン上で動く清書モデルはサーバーを経由しません。これがそもそもローカルで音声入力をする理由です。生の文字起こしだけで十分な方には必要ない機能かもしれません。しかし実際にメールを声で送り始めると、この機能は当たり前のものになって意識しなくなります。それがうまく機能している証拠です。

話してから清書するというこの流れこそが、そもそも音声がキーボードより速い理由です——どのアプリでも声でより速くタイピングできます。長い段落も、5分のタイピングではなく数文を話すだけになります。

Macをお使いの方へ

柔らかな光の中でウッドデスクに開かれたMacBook。macOSでの音声入力を表す画像

自分のハードウェアについて正直に向き合ってください。正解はデバイスによって変わります。Macでこれを読んでいるなら、superwhisperは強い選択肢であると率直に言えます。macOSで生まれ、何年もかけて磨かれ、Apple Siliconではオンデバイスモデルが快適に動きます。成熟したネイティブ音声入力アプリと充実したモデルピッカーを求めるMacユーザーには、superwhisperは本当にお勧めできます。良いツールから引き離すために点を稼ごうとは思いません。

知っておくべきこと:Whisper by RemskillはMacでも動きます。Apple Silicon対応で、同じローカルファーストのパイプラインを持ち、話している間はcommand+optionのプッシュトゥトークホットキーを押し続けます。Mac上の選択肢はsuperwhisperか何もないかではなく、しっかりしたローカルオプションが2つある状態です。どちらが合うかは、superwhisperのモデル&モードアプローチか、Whisperの3つのパスから選ぶアプローチかのどちらを好むかによります。どちらも音声をデバイス上に保ちます。気に入った形のものを試してみてください。どちらを選んでも後悔はないはずです。

30文字程度のテキストを送るだけなら、何もインストールする必要はありません。macOSの音声入力は標準搭載で、「システム設定」の「キーボード」から設定でき、Apple Siliconでは一般的なテキストをオンデバイスで処理できます。Windowsでは、Windows key + Hでカーソルのある場所にVoice Typingバーが開きます——句読点を自動で入力し、短い入力には十分です。ただしMicrosoftのサーバーを経由し、インターネットが必要なため、オフラインオプションではありません。(Win+Hが開かなくなった場合は、Win+Hが動かない場合の修正方法に原因があることが多いです。)長いメモ、オフラインプライバシー、どこでも同じホットキーを使いたいといった場面になって初めて、専用ツールを検討してください。

昔ながらの音声入力ツールから来た方には、同じ比較の考え方が現代版Dragonの代替ツールにも当てはまります——ローカル処理、学習ステップなし、実際の音声入力の使い方に合わせた設計です。

「superwhisper Windows版」はかつて行き止まりの検索でした。もうそうではありません——アプリはWindowsで使え、やるべきことをしっかりやります。求めていたものがsuperwhisperなら、今すぐ入手してください。インストールボタンの先まで読む理由があるとしたら、1番上に出てきたツールではなく、自分のマシンとプライバシーの基準に合ったツールを選んだかどうかを確かめるためだけです。私はこの比較の大部分を、カーソルのある場所なら何でも貼り付けてくれるツールでWindowsノートパソコン上で音声入力し、そのまま送り出しました。キーボードは使わずじまい——それがすべての目的です。

WindowsでローカルAI音声入力を試してみる

ホットキーを押し、話して、放す。文字起こし結果はカーソルがある場所に届きます——あらゆるアプリで、完全にデバイス内で。

ログイン済みアカウントなら無料のローカルモード。開始時にカード不要。

Denys Medvedievの写真

Denys Medvediev

サポートメールを読むのは私の役目です。おそらく返信のほとんどを音声入力で書いています。

参考資料