Denys Medvediev

比較

正直に語る Aqua Voice の代替

Aqua Voice は Mac、Windows、iPhone 向けのクラウド型音声入力アプリで、話した言葉をリアルタイムであらゆるアプリに入力し、文法や書式もその場で整えてくれます。最も有力なプライバシー重視の代替が Whisper by Remskill です。そのローカル処理はオフラインで、無料で動き、あなたの音声をどこにも送りません。

最終更新: 2026年6月

暖色の薄暗い光のなか、机の上に置かれたスタジオ用コンデンサーマイク。オフラインの音声入力を思わせる一枚

まず利害関係をはっきりさせておきます。これは比較記事ですが、私はそこで取り上げる2つのうちの片方を作った張本人です。ですから Aqua Voice は称えるべきところでしっかり称えます。競合のブログにしては意外なほど多くの場面でそうするつもりです。そして私たちが本当に勝っている1つの点については、具体的に書きます。

Whisper by Remskill は、プライバシーを守る Aqua Voice の代替です。ローカル処理のすべてがオフラインで動き、ずっと無料で、文字数の上限もなく、登録時に支払い方法も求めません。Aqua Voice はリアルタイムで洗練されており、話している最中にクラウドであなたの言葉を整えます。本当に重要な違いはたった1語、「クラウド」です。

この比較は何で、誰が作ったのか

退屈な事実を言えば、Aqua Voice は自分の得意なことが本当に得意です。リアルタイムで、洗練されていて、話すそばから一語一語を処理し、言い回しや文法をその場で直します。すでに料金を払っていて満足しているなら、このタブはもう閉じても構いません。終わりの方に、留まるべきタイミングをずばり書いた章があります。

それでもまだ読んでくれているみなさんへ。違いはたった1語、「クラウド」です。Aqua はそのリアルタイムの魔法のために、あなたの音声を自社サーバーへ送ります。私たちはそれをあなたのノートパソコン上で、無料でやります。音声はその部屋から外へ出ません。

言い分はこれですべてです。記事の残りでは、主張するのではなく、それを実際に示していきます。でっち上げのレビュー件数も、捏造した利用者数もありません。あるのは2つの機能リストと、両社のホームページと突き合わせて確認できる1つの表だけです。

Aqua Voice が実際にやること

Aqua Voice は Mac と Windows で動き、iPhone アプリもあります。すでに使っているあらゆるアプリにそのまま溶け込む、ライブのリアルタイム音声入力で、面倒な準備の儀式はいりません。押して、話せば、整えられたテキストが現れます。その整える機能こそが売りです。文法を直し、言い回しを磨き、話しながら書式を整えてくれます。

中身は独自のクラウドエンジンです。マーケティングでは有料プランを Avalon、無料プランを Aqua Engine と呼んでいて、中を検証できる公開された重みはありません。49言語を理解します。これは実在のホームページに載った実在の数字なので、ことさら小さく見せるつもりはありません。

データの扱いについては、Aqua はたいていのクラウドツールより慎重です。同社のサイトには、Starter と Pro のプランではサーバーに何も保存しないとあり、Zero Data Retention は Enterprise 向けとされています。これは公正なポリシーです。ですが、やはりポリシーでしかありません。あなたの音声はマシンを離れ、同社のクラウドへ渡り、文字起こしされて戻ってきます。あなたは物理ではなく、約束を信じているのです。

無料の Starter プランは1,000語までで、その先に年額の Pro プラン、Team プラン、Enterprise があります。ここで具体的な数字は引用しません。料金ページは変わるものですし、向こうのページと私たちのページを、それぞれ一次情報から直接読んでほしいからです。大事なのは形です。無料枠はいずれ尽き、その先はすべてサブスクリプションだということです。

Whisper by Remskill ならさらに手に入るもの

ここは私が作った方を説明する番です。その上で、表はあなたに判断してもらいます。Whisper by Remskill は、1つのホットキーに載った2つのプロダクトです。無料プランがローカル処理のすべてです。8種類の Whisper 文字起こしモデル、Parakeet エンジン、Ollama による完全オフラインの AI 整形、文字起こし履歴、プリセット、ホットワード、ハードウェアアクセラレーション、モデルのダウンロード、カスタムホットキーが手に入ります。登録時に支払い方法はいらず、文字数の上限もありません。アカウントを作り、アプリをダウンロードし、ホットキーを押して、話すだけです。

Whisper
稼働中の Whisper by Remskill アプリ — サイドバー、文字起こしパネル、AI 指示カード。これは実際のインターフェースで、はめ込み画像ではありません。

ローカルエンジンは、私たちが推すものではなく、あなたに必要なものを基準に選べます。Whisper は99言語、英語への翻訳、カスタム語彙、ビームサイズの調整、ホットワードによる重み付けを提供しますが、その代償は速度です。Parakeet は NVIDIA TDT エンジンで、約600 MB。CPU 上で Whisper の5〜10倍速く動き、英語に加えて他の24のヨーロッパ言語をカバーします。速度と英語なら Parakeet。言語、翻訳、細かな調整なら Whisper。どちらも初期設定ではありません。決めるのはあなたです。

ローカルの精度はおおむね95%から99%の間に収まり、すべて CPU で動いて GPU は不要です。アプリ自体はディスク上で約25 MB。これらすべてがあなたのマシンで起こります。往復もなく、サーバーもなく、信じるべき約束もありません。

クラウドが欲しいなら、それも用意しています。しかも、自分の鍵を持ち込む方式です。Pro プランで OpenAI のクラウド文字起こしが加わります。自分の OpenAI の鍵を貼り付け、モデルを選びます。1分あたり約$0.003の gpt-4o-mini-transcribe、もしくはより高品質な gpt-4o-transcribe です。AI 整形は既定で gpt-5-mini で動き、OpenAI の Responses API を通じてカーソル位置でのウェブ検索もできます。OpenAI の料金に私たちが上乗せすることはありません。鍵もあなた、請求もあなたへ。Pro の数字は料金ページで確認してください。

プラットフォームの話は、正直に言うべき部分です。Windows と Apple Silicon の macOS は、どちらも今日から使えます。iPhone アプリはなく、iPad アプリもなく、Android もありません。スマートフォンから音声入力するなら、ここははっきり Aqua の方が上です。

Aqua Voice 対 Whisper by Remskill、並べて比較

ほかの誰も実際の中身で埋めようとしない表です。数字は入れていません。それらは両社の料金ページで確認してください。

Aqua Voice と Whisper by Remskill の機能比較
機能Aqua VoiceWhisper by Remskill
対応プラットフォームMac、Windows、iOSMac(Apple Silicon)と Windows。モバイルアプリなし
音声を処理する場所クラウド。音声はマシンを離れるあなたのマシン上、オフライン
無料プラン1,000語まで無料ローカル処理すべてがずっと無料、文字数上限なし
ネット接続なしで動くかいいえ、クラウド前提はい、ローカル処理は完全オフライン
エンジン独自クラウド(Avalon / Aqua Engine)、公開された重みなし8種類の Whisper モデル + Parakeet、公開モデル
自分の OpenAI の鍵を持ち込む提供なしはい — クラウドは BYOK、上乗せなし
対応言語49多言語 Whisper で99、Parakeet で25
英語への翻訳記載なしはい、Whisper モデルで対応
話しながらのリアルタイム整形はい。看板機能整形は発話のあと、Ollama またはクラウド AI で実行
モバイルでの音声入力はい — iPhoneモバイルアプリなし
料金体系無料枠を超えるとサブスクリプションローカルは無料。クラウド用に任意の Pro

この表の正直な読み方をいくつか。Aqua のリアルタイム整形は本当に滑らかで、49言語は人が音声入力するものの大半をカバーし、私たちにはないモバイルアプリも出しています。これらは小さな勝ちではありません。一方、オフライン、プライバシー、無料のローカル処理、対応言語数に関する行はどこも、差が逆向きに開いています。

音声がマシンを離れないこと、それが核心

ここを比べたくて来た人がいちばん多いはずなので、具体的に言います。Aqua のデータポリシーは良いものです。消費者向けプランではサーバーに何も保存しないとあり、私はそれを信じます。ですが「保存しない」は「一度も外へ出ていない」と同じではありません。あなたの音声は、文字起こしのためにやはりクラウドへ渡ります。クラウドエンジンとはそういう仕組みだからです。Whisper by Remskill のローカル処理なら、その輪の中にサーバーは一切いません。モデルがあなたの RAM に読み込まれ、マイクがそれに音声を送り、テキストが現れます。機内モードのフライト中でも、機密区画の中でも、トンネルを抜ける列車の中でも。あなたは約束を信じているのではありません。約束すべきものが、そもそも何もないのです。

Pasted
実装されている音声入力後のオーバーレイ — 無料で完全オフラインのローカル音声入力が1回終わった、まさにその瞬間の見た目です。

この記事で唯一はっきり意見を述べる部分です。クラウド専用の音声入力は、文字起こしされるのを待っているプライバシーの惨事です。上司の給与スプレッドシート、子どもの学校宛のメール、列車の中で書いている法的書面 — 声で入力したかっただけで、そのどれもがノートパソコンを離れていいはずがありません。以前一緒に働いたチームで、ある業者が社内向けのクラウド音声入力の試作を作りました。発話のたびに AI の API を呼ぶものです。それは同じ朝会の録音を4回も文字起こししました。「賢いリトライ」の処理が積極的すぎたのです。四半期末、マネージャーがクラウド費用のダッシュボードを開くと、5桁の請求が待っていました。業者の解決策は「プロンプトを最適化しましょう」。CFO の解決策は「あるいは、すでに議事録がある会議をサーバーに送るのをやめる」でした。ローカル優先は、より安く、そしてより私的な答えでした。同じ一文の中で、両方を満たしていたのです。

あなたのノートパソコンには、もうマイクと CPU が付いています。1段落を入力するのに、輪の中にサーバーは要りません。クラウドは優れた非常口であって、奇妙な初期設定です。

Aqua Voice に留まるべきとき

この章は、記事の残りに値します。留まるべき本当の理由はあって、私はそれをごまかすつもりはありません。

すべて任せられるクラウド体験が欲しく、オフラインは気にしない

これが一番大きい理由です。Aqua はリアルタイムで、ホスティング済みで、設定ゼロです。音声がベンダーのサーバーに一瞬だけ存在することが気にならず、モデルをダウンロードしたりエンジンを考えたりしたくないなら、すべて任せられるクラウド体験は本当に手間が少ないです。うまくいっているものは、そのまま使えばいい。

とりわけそのリアルタイム書式が欲しい

Aqua は話しながら言い回しを磨き、文法を直します。その場で、テキストが着地する前に。私たちの整形は、文の途中ではなく発話のあとに動きます。あの一語ずつ進むライブの整形に惚れ込んだのなら、向こうはそれをやり、私たちは別のやり方をします。

スマートフォンから音声入力する

Aqua には iPhone アプリがあります。私たちは Windows と Apple Silicon の Mac で出していて、モバイルアプリはロードマップにもありません。日々の音声入力がスマートフォンで起きるなら、必要なのは向こうのツールです。

それ以外のすべての人へ — 個人の書き手、マーケター、営業、学生、夕食を作りながら先生のメールに返信する親、そして言葉を部屋の外に出すべきでないすべての人へ。まずは無料のローカルプランから始めて、壁にぶつかることがあるか試してみてください。文字数の上限もなく、インターネットも要りません。

1つだけ覚えておくなら

たいていの音声入力の比較記事は、ワークフローを一変させよう、と告げて終わります。この記事はもっと小さく終わります。音声入力が埋めるのは、言いたいことがある状態と、それを文書に入れた状態との間の隙間です。Aqua はその隙間をリアルタイムで、クラウドで埋め、無料枠を超えると課金します。私たちはそれをあなたのマシン上で、オフラインで埋め、ローカルの部分は無料です。あなたの言葉が他人のサーバー上に存在しても構わないなら、Aqua は良い選択です。そうではない、あるいは単にそうしたくないなら、それこそ私たちが生まれた理由そのものです。

その主張のもっと掘り下げた版が欲しいなら、オフラインの音声テキスト変換についての記事に書きました。それから、superwhisper の代替比較もあります。ローカルの選択肢を検討しているならどうぞ。

まずは無料のローカル処理を試す

Whisper by Remskill をダウンロードし、カード不要でアカウントを作り、ホットキーを押して、音声入力してください。あなたの音声はマシン上に留まり、クラウドプランが一度も必要にならなければ、支払うことも一度もありません。

ローカル文字起こしはずっと無料、完全オフライン。登録時に支払い方法は不要。7日間のクラウド試用は、アップグレードのときだけカードを求めます。

Denys Medvediev の写真

Denys Medvediev

サポート用メールを読んでいるのは私です。たぶん、その返信も音声入力で書いています。

さらに読む