Denys Medvediev

比較

Whisper と Parakeet

Whisper と Parakeet は、Whisper by Remskill に搭載された 2 つのローカル音声エンジンです。選び方はたった 1 つのトレードオフに尽きます。Parakeet は CPU 上で Whisper の 5〜10 倍速い一方、対応するのは英語と 24 のヨーロッパ言語だけ。Whisper は遅いものの、99 言語に対応し、英語への翻訳ができ、細かな調整もできます。

最終更新: 2026年6月

暗い編集画面に映る色とりどりの音声波形。2 つの音声エンジンを思わせるイメージ

Whisper と Parakeet はどちらも Whisper by Remskill に無料で同梱されていて、ドロップダウンで切り替えられます。Parakeet は CPU 上で 5〜10 倍速く、英語と 24 のヨーロッパ言語に対応。Whisper は遅いものの 99 言語に対応し、英語への翻訳ができ、カスタム語彙やビーム制御まで使えます。良い悪いではなく、速さか柔軟さか、という話です。

Whisper と Parakeet は、Whisper by Remskill に搭載された 2 つのローカル音声エンジンです。選び方はたった 1 つのトレードオフに尽きます。Parakeet は CPU 上で Whisper の 5〜10 倍速い一方、対応するのは英語と 24 のヨーロッパ言語だけ。Whisper は遅いものの、99 言語に対応し、英語への翻訳ができ、細かな調整もできます。

両方とも私たちが提供しています。だからこれは売り込みではありません

「X 対 Y」の記事の多くは、X を売りたい誰かが書いています。この記事は違います。私たちは同じアプリに両方のエンジンを載せています。好きな方をドロップダウンで選び、一度ダウンロードすれば、いつでも切り替えられます。

つまり、あなたに合わない方を勧める理由が私にはありません。Parakeet があなたに合うなら、Parakeet を使ってほしい。Whisper が必要なら、Whisper を使ってほしい。アプリがあなたの代わりに選ぶことはないし、私も選びません。それぞれが本当に得意なことを、ありのままお伝えするだけです。

どちらも完全にオフラインで動きます。どちらもサインイン済みのすべてのユーザーに無料です。カード登録も、分単位のクラウド請求も、2 つ目のエンジンへの追加料金もありません。

Parakeet は速い方

Parakeet は NVIDIA の TDT モデルです。TDT は Token-and-Duration Transducer の略で、FastConformer エンコーダにデコーダを組み合わせ、単語とそれぞれの長さの両方を予測します。この内容を覚える必要はありません。大事なのは次の一文です。

ふつうの CPU 上で、Whisper の 5〜10 倍速いのです。GPU も不要、待ち時間もなし。ホットキーを離した時点で、テキストはほぼもうそこにあります。

同梱モデルは Parakeet v3 で、ディスク上で約 600 MB。英語に加えて他の 24 のヨーロッパ言語、合計 25 言語に対応します。品質は良好です。Whisper-large ほどではありませんが、メール、メモ、メッセージなど、私たちの多くが一日中打ち込む文章のような日常的なディクテーションには十分すぎるほどです。

Parakeet にできないこと。話した内容を英語に翻訳することはできませんし、カスタム語彙やホットワードのヒントも受け付けません。フランス語で話せば、フランス語のテキストになります。これはほとんどのフランス語話者がまさに望むことなので、翻訳こそがあなたの目的のすべてである場合にだけ問題になります。

Whisper は丁寧な方

Whisper は OpenAI のオープンモデルで、私たちのアプリの中では 8 種類の形で提供されます。英語専用が 4 つ、多言語が 4 つ。およそ 140 MB の Base モデルから、およそ 3 GB の Large v3 まで。あなたのマシンと辛抱強さに合うサイズを選べます。

多言語モデルは 25 ではなく 99 言語に対応します。これには Parakeet が完全に対象外としている中国語、日本語、韓国語、アラビア語も含まれます。さらに Whisper は、これらのどれでも一度の操作で英語に翻訳できます。Parakeet にはできないことです。

そして Whisper は、Parakeet にない制御を与えてくれます。カスタム語彙、ビームサイズの設定、同僚の名前や自社製品の名前を取り違えないようにするホットワードバイアス。専門用語を一日中ディクテーションするなら、その制御こそが、きれいなテキストと、置換作業の手間との分かれ目です。

代償は速度です。同じ CPU 上では Whisper は遅く、大きなモデルではかなり遅くなることもあります。身も蓋もない事実を言えば、Whisper を選ぶ人の多くは、Parakeet より精度を取っているというより、速度よりも言語と制御を取っているのです。

Whisper
Whisper by Remskill のライブのモデル選択画面。スクリーンショットではなく、実際のアプリで両方のエンジンを選べます。

正直な比較を、1 つの表で

判断のすべてを 7 行にまとめました。金額は載せていません。どちらのエンジンも同じプランで無料だからです。

Whisper by Remskill 内の Parakeet と Whisper の機能比較
機能ParakeetWhisper
エンジンNVIDIA TDT(FastConformer + Token-and-Duration Transducer)OpenAI Whisper
ダウンロードサイズ約 600 MB(モデル 1 つ)約 140 MB 〜約 3 GB(モデル 8 つ)
対応言語25 言語、英語 + ヨーロッパ 24 言語99 言語(多言語モデル)
英語への翻訳不可可能
CPU での速度5〜10 倍速い遅い
カスタム語彙 / ホットワード / ビーム制御不可可能
向いている用途CPU 上での高速な英語 / EU 言語ディクテーション99 言語、翻訳、細かな制御

どちらもローカルで、どちらもオフラインで、どちらも同じプランで無料です。この表は「良い対悪い」ではありません。「速い対柔軟」です。

結局どちらを選ぶべきか

ほとんどの比較記事が避けて通る部分なので、ここではっきり書きます。

ほとんどの英語ユーザーには、Parakeet を選んでください。日々の速さが勝ちます。一日に何十回もディクテーションするなら、「テキストが即座に出る」と「ひと呼吸おいて出る」の差は、思考の流れにとどまれるか、見失うかの差です。だいたい 2 秒を超えると、脳は元のアプリへ意識を戻し始め、何を言っていたか忘れてしまいます。Parakeet が CPU 上で 5〜10 倍速いのは、スペック表の自慢ではありません。一日に何百回と体で感じることなのです。

Whisper を選ぶのは、Parakeet には用意できない次の 3 つのうちどれかが必要なときです。25 のヨーロッパ言語の外にある言語(中国語、日本語、韓国語、アラビア語)、英語への翻訳、あるいは名前や専門用語のためのカスタム語彙とホットワードの制御。

私はランタイムをインストールする前にアーキテクチャ図を描くようなタイプなので、いつも「より高機能なツールを使え」という本能が働きます。ここではその本能が間違っています。より高機能なのは Whisper ですが、日々の英語ディクテーションの習慣に合う正しいツールは、たいてい速い方です。使わない機能は、ただのダウンロードサイズにすぎません。

CancelTranscribing
ディクテーション中の、実際に出荷されている録音オーバーレイ。どちらのエンジンを選んでも、ホットキーもオーバーレイも同じです。

Whisper が勝つ実際のケース

ローンチから 3 週目の初期に、あるユーザーがメールをくれました。文の途中でウクライナ語から英語への切り替えに対応できるか、という質問でした。彼はキーウのニュースをリアルタイムで読みながら、数語ごとに言語を切り替えていたのです。私は「多言語」とはセッションごとに 1 言語を選ぶことだと思い込んでいました。彼が言っていたのは本物のコードスイッチングで、しかもそのワークフローでは Parakeet の 25 言語では十分にカバーしきれない言語でした。Whisper の多言語モデルはそれをこなしました。99 言語、自動検出、同じ処理での英語への翻訳。彼が確認の返信をくれることはありませんでした。私はそれを良い兆候だと受け取ることにしています。

ルールのすべてが、この 1 つの話に詰まっています。あなたの一日が彼のようなものなら、Parakeet の速さは助けになりません。Parakeet ではそもそも仕事が成り立たないからです。会議の合間に英語のメールをディクテーションするような一日なら、その速さこそが要点です。

両者を切り替える方法

どちらかに固定する必要はありません。モデル選択画面を開いて、Parakeet か任意の Whisper モデルを選べば、一度だけダウンロードされます。仕事が変われば、いつでも切り替えられます。朝のメールはまとめて Parakeet で、午後に日本語のインタビューを書き起こすときは Whisper Large v3 で。

どちらでもホットキーは同じ、オーバーレイも同じ、設定も同じです。Windows ではデフォルトが Ctrl+Space。Mac では Command+Option のプッシュ・トゥ・トークの組み合わせで、何かと衝突する場合は割り当てを変えられます。エンジンはドロップダウンであって、再インストールではありません。

1 つだけ覚えておくなら

速さと英語なら Parakeet。99 言語、翻訳、制御なら Whisper。インストール時に決める必要はありません。両方が同じアプリに同梱されていて、切り替えはドロップダウン、後戻りできないダウンロードの決断ではないからです。

音声をサーバーに送るより自分のマシンで動かす方が良い理由について、もっと長い視点が知りたい方は、こちらに書きました。オフライン音声認識。そして、特定の有料アプリと比べて検討しているなら、superwhisper の代替 の記事がその一騎打ちを取り上げています。

両方のエンジンを入れて、最初の午後に決めさせよう

アプリをダウンロードして、Parakeet と Whisper モデルを入れてください。どちらも無料です。あとは、あなた自身の最初の午後にこの論争の決着をつけさせましょう。

ローカルエンジンは両方とも永久に無料です。サインアップ時に支払い方法は不要。7 日間の Cloud トライアルは、アップグレード時にだけカードを求めます。

Denys Medvediev の写真

Denys Medvediev

サポートメールを読んでいるのは私です。おそらく返信もディクテーションで書いています。

さらに読む