Denys Medvediev

比較

Revの代替ツール、 正直に言います

「Revの代替」とは、実は二つの問いです。ファイルアップロードサービスを乗り換えるのか、それともアップロード自体をやめてライブで音声入力するのか。どちらのニーズにどのツールが答えるか、そしてRevが今でも勝る唯一の用途を整理しました。

最終更新:2026年6月

スタジオの机に置かれたマイクとノートパソコン。あらゆるRevの代替ツールが想定する録音・文字起こしのシーン

Revの代替ツールとは、Rev.comの代わりに使う文字起こしツール全般を指します。主な動機は分単位の課金、サブスクリプション費用、または音声データをベンダーのクラウドにアップロードするプライバシーコストを避けることです。最適な選択は用途次第です。SonixのようなファイルアップロードサービスはRevを直接置き換えられますが、Whisper by Remskillのようなホットキー音声入力アプリは、リアルタイムかつオフラインで音声をテキストに変換します。

先四半期、私が関わったチームで内部の音声入力プロトタイプが五桁のクラウド請求を積み上げていることが発覚しました。同じスタンドアップ録音を四回も文字起こししていたのが主な原因でした。Revの代替を探し始める理由はみんな同じです。課金のメーターが止まらないのです。Revの文字起こしページには人間による文字起こしの分単位料金と、それより低いAI文字起こしの料金が載っています。積み重なるのはあっという間で、これが「Revより安い」という検索キーワードの裏にある地味な真実です。

ほとんどの比較記事が飛ばしているポイントがあります。「Revの代替」という言葉の裏には、まったく異なる二つのニーズが隠れています。間違ったカテゴリを選ぶと、不要なソフトにお金を払う羽目になります。一つ目のニーズはRevのコアサービスを置き換えること。録音ファイルがあって、文字起こしが欲しいというケースです。二つ目はほとんど誰も口に出さないニーズです。ファイルをアップロードしたくない。話したらカーソルのある場所にテキストが現れてほしい、というものです。この記事を読み終えるころには、自分がどちらを求めているか、どのツールがそれに応えるか、そしてRevがこのページのすべての代替ツールを今でも上回る唯一の用途がわかります。私は日常的にサポートメールを読んでいます(たいてい返信を音声入力しながら)。そこに届くコストの不満は決まって同じ始まり方をします。必要のない分単位サービスを選んでしまったというものです。

Revとは何か、なぜ人は離れるのか

Revはファイルアップロード型の文字起こしサービスです。音声ファイルまたは動画ファイルを送ると、文字起こしが返ってきます。二つのサービスラインがあります。精度99%以上を謳うプロの人間による文字起こしと、精度96%以上を謳うAI文字起こしです。英語またはスペイン語のキャプション、17言語への字幕、および法廷速記サービスも提供しています。

コスト体系が人々を比較検討に向かわせます。人間による文字起こしは分単位課金で納品は12時間以内。AI文字起こしは低い分単位料金で5分以内に届き、37言語に対応しています。Revにはサブスクリプションもあります。月45分までの無料枠(英語のみ)があり、その先は月数千円単位の有料プランになります。

Upload audio · transcribe
standup-recording.mp32:00:00
Per-minute rate120 min billed
人々がRevを離れる理由の形——ファイルをアップロードすると、分単位のメーターが動き出す。2時間の録音は同じ料金が120回分かかる。Revの実際の画面ではなく、その仕組みを表したイメージです。

これ自体は悪くありません。Revはやることをうまくやっています。人々が離れる理由は三つあります。長いファイルの分単位料金、無料45分を超えた後のサブスクリプション費用の積み上がり、そして調書、医師のメモ、役員会議の録音を他社のサーバーにアップロードすることへの静かな不安です。最初の二つはお金の話です。三つ目はプライバシーの話で、これがオフライン対応を探し始めるきっかけになります。

一言で答えると:ファイルをアップロードしますか、それともリアルタイムで音声入力しますか?

バックライト付きメカニカルキーボードに手を置く様子。アップロード工程をまるごとスキップするライブ音声入力の選択肢

録音済みファイルを文字起こししたいなら、Revに最も近い代替はほかのファイルアップロードサービスです。Sonixはアップロード音声を時間単位の定額で請求し、Happy Scribeは月額プランを基本に人間によるプルーフリードをオプションで追加できます。MaestraとTrintはそれぞれ125言語以上と40言語以上の文字起こしに対応しています。ファイルが会議録音なら Otter.ai が有力候補で、Zoom、Teams、Google Meetに参加してメモを書いてくれます。

「Revの代替」検索のかなりの割合は、実はファイルとは無関係です。文字起こしを得る唯一の方法が録音だと思い込んで録音している人たちからの検索です。メールや文書を打ち込む代わりに話して下書きしたいなら、アップロードサービスは不要です。必要なのは音声入力です。これは別のカテゴリであり、Revが競合していない領域です。

Whisper by Remskillはその二つ目のカテゴリに属します。ホットキーを押して話すと、使っているアプリのカーソル位置にテキストが入力されます。ファイルも、アップロードも、課金メーターも不要です。録音ファイルの場合も、どこかに送るのではなく自分のマシン上で文字起こしします。

選定方法について

七つのサービスを実験室で並べてテストしたわけではありませんし、そうしたと装うつもりもありません。自社製品をレビューしながら中立なベンチマーク比較を主張するメーカーほど信頼できないものはありません。だから正直に方法を説明します。Revを乗り換えるかどうかを実際に左右する四つの基準で各ツールを評価し、公開ドキュメントや公表スペックから点数をつけ、唯一自分が語れる一つのこと——自社アプリの毎日の使用体験——を加えました。その四つの基準を、決断を左右しやすい順に挙げます。

  • カテゴリ適合性。 そのツールは目的に合っていますか?ファイルアップロードサービスと音声入力アプリは互換ではありません。「Revの代替」として失敗した購入の半分は、ここを無視しています。
  • 料金モデル(表面価格ではなく)。 分単位、時間定額、月額プラン、無料ローカルのそれぞれは、使用量が増えると異なる動きをします。請求額の形は、ページ先頭の数字より大事です。
  • プライバシーの姿勢。 音声データがマシンの外に出ますか?調書や給与スプレッドシートを扱うなら、それがすべての問いです。
  • 言語対応範囲、 各ツールが文書化している内容に限定して評価します。「99言語対応」という謳い文句がきちんと当てはまるカテゴリは一つだけで、残りには当てはまりません。

Whisperの推薦は、実際に使った体験に基づくものであり、再現できないベンチマークではありません。以下の表にある競合他社の数字はすべてベンダーが公表したスペックで、出典を明記しています。価格を公開していないベンダー(Trintがその例)については、数字を作るのではなくその旨を記しています。これが一線です。競合他社の機能に関する主張はその公式ページから、Whisperがライブ音声入力として試す価値があるという主張は私が毎日使っている実感から来ています。

Revの代替ツール一覧

検証できる項目のみ掲載しています。再現できない精度スコアも、計測していないスピード比較も載せません。料金は金額でなく形で表現しています。価格は変動するため、記事本文でも具体的な数字は出していません。「最適用途」列を最初に読むことをお勧めします。

ツールプラットフォームローカル / クラウドオフライン対応料金モデル言語数最適用途
RevWebアプリ + モバイルクラウドなし人間またはAIの分単位課金AI 37言語認定済み・法廷提出可能な逐語記録
Whisper by RemskillWindows + macOS デスクトップローカル(クラウドオプション)あり無料ローカル枠;Proでクラウド追加多言語 Whisper 99言語;Parakeet 25言語ライブ音声入力、プライベートなオフライン文字起こし
Otter.aiWeb + モバイルクラウドなし無料枠 + 月額シート6ライブ会議の文字起こし
SonixWebアプリクラウドなし時間定額 + 月額プラン54言語以上ファイルを入れてトランスクリプトを出す
Happy ScribeWebアプリクラウドなし月額プラン + 人間による分単位AI 150言語以上動画の字幕作成
MaestraWebアプリクラウドなし月額プラン125言語以上文字起こし + 吹き替え

「オフライン対応」の列はほとんどの比較表が省いていますが、機密音声を扱う人にとっては最重要項目です。リストのすべてのクラウドツールは録音をサーバーにアップロードします。Whisperのローカルモードは一切行いません。

Whisper by Remskill:任意のアプリへの音声入力、オフラインでのファイル文字起こし

Whisper by Remskillはファイルアップロードサービスではありません。そう偽っても時間の無駄です。これは音声入力アプリです。ホットキーを押し続け——Windowsでは Ctrl+Space、Macでは Command+Option——話してから離すと、使っているアプリのカーソル位置に文字起こしされたテキストが貼り付けられます。「Hey whisper」と先に言うと、AIによる整形処理を経てから貼り付けられます。最初のバージョンでは、ホットキーのデバウンスを攻めすぎて3回に1回のキー入力を取りこぼしていました。気づくのに一週間かかりました。修士号を持っているにもかかわらず。

Whisper
実際のWhisperアプリがライブ動作中——設定を開いて文字起こしエンジンを選ぶだけです。音声データはどこにもアップロードされません。

多くの人にとってRevの代替として機能する理由は、オフラインのローカルモードです。モデルを一度ダウンロードすれば、文字起こしはネットワーク通信ゼロで自分のマシン上で実行されます。サーバーが処理しないため、分単位の課金もありません。二つのローカルエンジンを搭載しており、どちらもPythonサイドカーなしの純Rust実装です。多言語バリアントで99言語に対応し英語への翻訳機能もある OpenAI Whisper(8モデル)と、25言語対応でCPU上でWhisperの5〜10倍高速に動作する約600MBモデルの NVIDIA Parakeet です。フットプリントを最小限に抑えたい場合向けの英語専用Whisperビルドも用意しています。

ローカルエンジンが対応できないことのために、クラウドモードがあります。自分のOpenAIキーを使い、gpt-4o-mini-transcribeで文字起こし、GPT-5ファミリーで強化、音声ウェブ検索も実行できます。ローカルパイプライン全体はサインイン済みユーザーであれば無料で、サインアップ時にお支払い情報は不要です。クラウド機能は有料のProプランです。料金の詳細は料金ページでご確認ください。ここでは数字を引用しません。

一つだけ持論を述べさせてください。クラウド専用の音声入力はプライバシー面での時限爆弾です。上司の給与スプレッドシート、子どもの学校へのメール、起草中の法的文書——声でタイプしたかっただけなのに、これらがベンダーのログに残るべきではありません。冒頭で触れた五桁のクラウド請求は単なるお金の話ではありませんでした。同じ録音が丸一四半期、第三者のサーバーに保存されていたのです。あなたのノートパソコンにはすでにマイクとCPUが付いています。一段落の文章を入力するだけなら、サーバーは必要ありません。この議論の詳細は、オフライン音声認識について書いた記事をご覧ください。

次点と知っておくべき他のツール

すべての用途で勝るツールは一つもありません。ファイルアップロード路線での次点として私が挙げるのはSonixです。一つのことだけをやります——ファイルを受け取ってトランスクリプトを返す。時間定額料金は使用量が増えても見通しやすいままです。他のツールについては正直な一行評価をまとめます。何かに申し込む前にご自身で判断してください。

  • Sonix: ファイル入力・トランスクリプト出力の次点。時間定額料金でクリーンなファイルアップロード文字起こし、54言語以上に対応。トランスクリプトだけ欲しい場合の最も直接的なRevの代替です。
  • Otter.ai: 会議向けに設計されています。Zoom、Teams、Google Meetに参加してメモを書いてくれます。無料枠は月300分。ライブ音声入力には向いていませんが、「会議を記録したい」という用途には適しています。詳しくはOtter.aiの代替の記事で比較しています。
  • Happy Scribe: ファイルアップロード+字幕作成、AI対応150言語以上、人間によるプルーフリードもオプションで可能。キャプションが必要な動画クリエイターに強い選択肢です。
  • Maestra: 125言語以上の文字起こし、字幕、吹き替えに対応。吹き替えも必要なら幅広い機能セットが揃っています。
  • Trint: コンテンツエディタ付きのAI文字起こし、文字起こし40言語以上・翻訳70言語以上に対応。料金はマーケティングページに掲載されていないため、申し込む前にアプリ内で確認してください。
  • Descript: 文字起こし機能を内蔵したAI動画・ポッドキャスト編集ツール。分単位ではなく「メディア時間」で課金されます。編集ツールがメインで文字起こしはサブ機能です。どう使い分けるかは文字起こしソフトウェアのガイドで解説しています。

Revを選ぶべきとき

いくつかの用途ではRevに戻ることをお勧めします。本心からそう言っています。ローカルツールのプライバシーとコストの優位性は、トランスクリプトをあなた以外の誰かに対して説明責任を持たせる必要が生じた瞬間に崩れます。裁判所速記者の認定書、公証付き陳述書、規制当局のアクセシビリティ監査——これらには言葉に責任を持つ人間が必要であり、ラップトップ上で動いて誰にも答えないモデルでは足りません。

Revの専門家による人間の文字起こしは、そのような用途向けに作られています。精度99%以上と12時間以内の納品を謳い、法廷速記ラインでは法律業務が求める認定済み逐語記録を提供します。Whisperは人間の文字起こし担当者を雇用せず、認定トランスクリプトも発行しません。それはWhisperが戦うカテゴリではなく、比較で勝つために事実を曲げるつもりはありません。

原則はシンプルです。裁判官、規制当局、または聴覚障害者向けアクセシビリティ要件がトランスクリプトの受け手なら、Revの人間によるサービスに料金を払い、人が内容を確認するようにしてください。同じ論理は逐語証言録取書、宣誓供述書、「AIの精度は96%でした」が問題になる文書にも当てはまります。費用を節約しようと証言録取書に無料のローカルモデルを使うのは、法廷で高くつく節約です。自分のスクリーンで完結する用途であれば、そのような手続きは不要なオーバーヘッドです。

もう一つ、Revが選択肢に残るケースがあります。AI文字起こしが数分で済む短い・まれなファイルで、何かをインストールする手間よりコストが低い場合です。Revの無料枠は月45分のAI文字起こし(英語のみ)です。それで十分なら、デスクトップアプリをインストールすることは存在しない問題を解決することになります。

料金:請求額の形を知る

コストの差こそがこのキーワードが存在する理由ですから、金額より料金体系の形を理解することが重要です。Revは分単位で課金します。短いクリップでは予測しやすいですが、長いファイルでは厳しくなります。2時間の録音は同じ分単位料金が120回適用されます——何も契約していない状態でも。他のファイルアップロードサービスは分単位を月額プランに替えており、Sonixは時間定額を採用しています。Otter.aiは有料シートが始まる前に月次の無料分を提供しています。

Whisperのローカルパイプラインには分単位のメーターが一切ありません。文字起こしがあなたのハードウェア上で実行されるからです。有料のProプランはクラウド機能を追加するだけです。ここで金額を引用しないのは意図的な判断です。価格は変わり、ブログ記事の古い数字は数字がないより悪いからです。Whisperの各プランの最新料金は料金ページをご覧ください。

正直にまとめると、「Revの代替」はもともと一つの問いではありませんでした。一つの検索ボックスを共有していた二つの問いです。サービスを乗り換えるのか、アップロード自体をやめるのか。どちらを求めているかを整理すれば、選択はずっとシンプルになります。私の下の娘は七歳ですが、先週おばあちゃんへの90語のメールを音声入力で書き上げ、トランスクリプトとは何かを一度も聞きませんでした。テキストが見ている場所に現れるとき、アップロードの工程がいかに関係ないかを物語っています。

アップロードをまるごとスキップしてみませんか?

Whisperをダウンロードし、ホットキーを押して、そもそもファイルをアップロードする必要があったかどうかを確かめてください。ローカルパイプラインは無料で、サインアップ時にカードは不要です。

サインイン済みユーザー全員に無料のローカル文字起こし・音声入力を提供。Proは別途トライアルでOpenAIクラウド機能を追加します。

Denys Medvedievの写真

Denys Medvediev

サポートメールを読むのが仕事で、たいてい返信を音声入力しています。

参考資料