Denys Medvediev

ガイド

AI議事録ツールの 本当のところ

このカテゴリーには性質のまったく違う2種類の製品が含まれているのに、マーケティングのページはその境界をあいまいにしています。一方はあなたの通話にボットを送り込み、もう一方は通話に一切触れません。自分に必要なのはどちらなのか、その見分け方を解説します。

最終更新: 2026年6月

仕事中の木製デスクの上に置かれた、開いたノートパソコンと真っさらなリングノート、ペン、コーヒー

AI議事録ツールは会話を録音し、それを文字起こし・要約・アクションアイテムに変えるものです。多くは自動参加型のボットで、ZoomやTeams、Meetの通話に入り込み、その場の全員分の議事録を書きます。もう1つの種類はボットなし型で、自分でメモを口述し、通話には何も参加しません。ロボットに会議へ出席させてまとめてほしいならボット型(Otter、Fireflies、Granola、Read AI、tl;dv)を、その場を録音せずに自分のきれいなメモを声で残したいならWhisperのような口述ツールを選びましょう。

1時間の会議でおおまかに見積もると、話される言葉はおよそ9,000語にのぼります。それを手で打ち込む人はいません。だからこそ、招かれてもいないのに通話に参加してメモを書いてくれるツールが、いまや一大産業を形づくっているわけです。退屈な真実はこうです。「AI議事録ツール」という言葉は性質の違う2種類の製品を指しているのに、マーケティングのページはせいいっぱいその境界をぼかしています。一方はボットを部屋に送り込み、もう一方は通話に一切触れません。選び間違えると、欲しくもない機能にお金を払うか、会議まるごとの録音を送るつもりのなかった場所に送ってしまうかのどちらかになります。

これは比較記事なので、結論を先に言います。ロボットにZoomへ出席させて、終わったら全員にまとめを渡してほしいですか? それなら自動参加型のボット(Otter、Fireflies、Granola、Read AI、tl;dv)がまさにそのために作られていて、いくつかは無料プランもあります。では、第三者にその場を録音させずに、通話中や直後に自分のきれいなメモを声で残したいですか? それは別のツールの仕事で、まさにWhisperの出番です。この記事ではカテゴリーをこの2種類に整理し、知っておくべきボットを名指しし、それぞれの場面で私ならどちらを選ぶかをお伝えします。私が読む問い合わせメールのほとんどは、初日に間違った種類を買ってしまった人からのものです。だからこの区別を正しく伝えることに、私自身が責任を感じています。

私はWhisperを作っている当事者なので、先に進む前にその立ち位置をはっきりさせておきます。Whisperは会議ボットではありません。通話には参加しません。これは口述ツールです。ホットキーを押して話すと、テキストがカーソルのある場所にそのまま入力されます。だから「半分しか出ていない4人の朝会を文字起こしする」には向かないツールで、「会議まるごとをアップロードせずに、自分のメモやアクションアイテムを声で書く」には向いたツールなのです。どちらの用途も本物です。たいていの記事は、用途は1つしかないかのように振る舞っています。

AI議事録ツールは、話し言葉を行動につながるメモに変える

後ろにぼやけたホワイトボードがある木製デスクの上の、ノートパソコンとノート、ペンが置かれた作業スペース

マーケティングをはぎ取ると、このカテゴリーのどのツールもやっていることは3つです。音声を取り込む。その音声をテキストに文字起こしする。そして言語モデルがそのテキストを要約・決定事項のリスト・アクションアイテムへと圧縮する。この検索に対してGoogleが表示するAIによる概要も、もっと多くの言葉で同じことを言っています。

ツールを分けるのは取り込みの段階で、そここそ各社のトップページが軽く流してしまう部分です。自動参加型のボットは、参加者をあなたのビデオ通話に送り込んで取り込みます。あなたも見たことがあるでしょう。グリッドの中に「Otter.ai」や「Fireflies Notetaker」という名前の見知らぬ出席者が座っているのを。ボットなしのデスクトップツールは、代わりにパソコンを通して流れている音声を取り込むので、部屋に余計なゲストは現れません。Whisperのような口述ツールは、ホットキーを押している間にあなたがマイクに話したことだけを取り込みます。紙の上では同じカテゴリー。でも部屋の中では3つの違うものなのです。

これが大事なのは、機能のためではなく、同意とプライバシーのためです。ボットが参加すると、第三者が通話中の全員を、たいていは明確な予告なしに録音します。自分でメモを口述するなら、取り込まれる声はあなたのものだけで、ローカルモードなら何もあなたのマシンから出ていきません。その点はまた後で戻ります。まずは、ボットがどう動くかを見ましょう。

自動参加型のノートテイカーの仕組み

自動参加型のツールは、あなたのカレンダーの中で暮らしています。Google CalendarやOutlookを接続しておくと、各会議が始まる数分前にツールがボットを送り出し、参加者として通話への参加を求めます。たとえばFirefliesは「カレンダーの会議に自動参加」できますし、進行中の会議にその場でボットを招くこともできます。Read AIの売り文句は、Zoom、Google Meet、Microsoft Teamsをまたいで「会議に参加し、録音し、まとめを届ける」というものです。

中に入ると、ボットは通話を録音し、すべての話者を文字起こしし、会議のあとにはアクションアイテム付きの要約を書いて、それをメールで回したりワークスペースに置いたりします。こうしたツールの中には、過去のすべての会議を横断して検索したり、話された内容について「質問」できたりするものもあります。

この1年で、もう1つの静かな手法が育ってきました。ボットなしの取り込みです。ボットが通話に参加する代わりに、デスクトップアプリがパソコン自身のスピーカーから出てくる音声を録音します。Granolaは「通話に会議ボットを参加させることなく、パソコンの音声を直接文字起こしする」とうたっています。Fathomはいまや両方に対応していて、ボットありでもなしでも、どちらでも「会議に集中していられる」ようにしています。tl;dvは無料プランで「ボット不要(NO BOT REQUIRED)」のフローを売りにしています。メモが会議全体をカバーするのは変わりません。違うのは、目に見えるゲストがグリッドに現れるかどうかだけです。録音そのものはやはり行われます。それがクラウドではなく、あなたのノートパソコンの中で起きるというだけのことです。

誰も区別を教えてくれない2種類のツール

カテゴリーのページが描こうとしない区別がこれです。部屋に耳を傾けるツールと、あなたに耳を傾けるツールがあるのです。

部屋のツールは、ボットありでもボットなしでも、会話全体を、すべての話者を、自力で取り込みます。あなたは座っているだけでメモが現れます。それが価値を発揮するのは、完全には出席できない会議のときや、チーム全員で共有する記録が必要なときです。同時にそれは他人の録音でもあり、あなたが今後背負うことになる同意と保管の問題を伴います。

「あなた」のツールは、あなたが話すと選んだことだけを取り込みます。ホットキーを押し、重要だった3つの決定を口述すると、整えられたテキストがメモアプリやメールに入ります。他の誰も録音されません。会議のものは、あなたが意図して話した要約以外、何も残りません。考える作業を自分でやらなければならないという意味では遅いのですが、その考えることこそが肝心なのです。あなたが口述した600語の要約は、誰も読まない9,000語の文字起こしより価値があります。

「AI議事録ツール」を検索する人のほとんどは、自分が欲しいのは部屋のツールだと思い込んでいます。でも、いざ考えてみると、そのうち半分くらいは「あなた」のツールが欲しいのです。彼らはそれがカテゴリーとして存在することを知りませんでした。この記事があるのは、まさにそのためです。

この比較でツールをどう選んだか

ここでは正直なやり方こそが大事なので、手法について手短に。私はラボでテストしたわけではありません。これらのボットを7つ並べて同じZoom通話に入れ、計測したことはありませんし、その録画を見せずに「やった」と主張する記事は当て推量です。だから、自分が作っていないツールについて、精度のパーセンテージや速度の数字をでっち上げるつもりはありません。以下は2つのものから組み立てています。各ツール自身が公表する機能(価格や製品ページに書かれた主張を、本文中に出典として示します)と、私が毎日作って使っている唯一のアプリを実際に使った経験です。

私が重視した観点を、このカテゴリーで重要になりがちな順に並べると次のとおりです。

  • 何を取り込むか。 部屋全体(自動参加またはボットなし)か、それともあなた自身の声だけか。これが、他のすべてがぶら下がる分かれ道です。
  • 誰が録音されるか。 通話の中のボットは参加者全員を録音し、口述はあなた1人だけを録音します。これが同意とプライバシーの物語を決めます。
  • 音声がどこへ行くか。 クラウドサービスか、自分のマシンの中か。ほとんどのボットはクラウド専用で、ローカルモードが1つだけ例外です。
  • 対応の広さ。 どの通話アプリ(Zoom、Meet、Teams)に参加し、どのOSで動くか。
  • 言語の対応範囲。 各ベンダーのページを一次情報源としています。ベンダーが数を明記していない場合は、当て推量せずにそう書きます。
  • 料金のかたち。 無料プラン、シートあたりのサブスク、フリーミアムのいずれか。実際の金額は各ツール自身のページと、料金ページに載っています。ここで文中に引用することはしません。

これらは選定の基準であって、判定を装ったものではありません。基準を述べたうえで、カテゴリーを1つの表にまとめます。

ツールを一目で

以下の各セルは、各ツール自身が公表する主張(次のセクションで本文中に出典を示します)か、Whisperについてはアプリが実際に出荷されている形から取っています。精度や速度の数字は載せていません。ここで挙げたどのベンダーも検証済みのベンチマークを公表しておらず、それをでっち上げるつもりはないからです。

最初の6行が部屋。最後の1行があなたです。
ツール参加するプラットフォームローカルかクラウドかオフライン動作料金のかたち言語数(公表値)向いている人
Otter.aiZoom、Teams、Meetクラウド不可無料プラン+シート課金6対応言語を使う、Zoom中心のチーム
Fireflies.aiZoom、Meet、Teams、ほかクラウド不可永久無料+シート課金100以上全通話を検索できるアーカイブ
GranolaZoom、Meet、Webex、Slack、Teamsクラウド(ボットなしのローカル取り込み)不可フリーミアム記載なし目に見えるボットなしの会議全体メモ
Read AIZoom、Meet、Teamsクラウド不可無料プラン+有料20以上カード不要の無料プランで試したい人
tl;dvMeet、Zoom、Teamsクラウド(ボットなしの選択肢あり)不可永久無料+有料30以上もっとも太っ腹な無料プラン
Notion AI Meeting Notes記載なしクラウド不可Notionの有料プランに同梱記載なしすでにNotionで暮らしているチーム
Whisper by Remskill何にも参加しない(あなたが口述する)ローカルかクラウド(あなたが選ぶ)可能(ローカルモード)無料のローカルプラン+クラウド向けPro99(ローカルの多言語版)自分のメモを声で、プライベートに書きたい人

この表は仕分けの道具として読んでください。点数表ではありません。最初の6行が部屋、最後の1行があなたです。自分の行を選べば、この記事の残りが、その行のどの名前に手を伸ばせばいいかを教えてくれます。

知っておく価値のある会議ボット

Weekly sync · 4 participants
YYou
PPriya
MMarcus
recordingNotetaker
自動参加型の会議ボットを再現したもの。「Notetaker」という名前の余計な参加者が、あなたの通話グリッドに座って録音しています。これはWhisperではありません。Whisperがあえて避けているのは、こういうUIです。

部屋のツールこそ必要なものなら、時間をかける価値のある5つを紹介します。以下の主張はすべて、各ツール自身のページから取っています。

Otter.aiはこの分野の定番の名前です。Zoom、Microsoft Teams、Google Meetに参加して、リアルタイムの文字起こしと字幕とともにメモを書き、共有します。無料のBasicプランでは月300分の文字起こしが使えます。知っておくべき落とし穴は、料金ページに6言語、すなわち英語、スペイン語、フランス語、ドイツ語、日本語、中国語が挙げられている点です。それ以外の言語なら、他をあたりましょう。Otterと口述ツールを天秤にかけているなら、Otter.aiの代替の記事で、会議か文章書きかという分かれ目をより深く掘り下げています。

Fireflies.aiはZoom、Meet、Teamsなどでカレンダーの会議に自動参加し、100以上の言語での文字起こしをうたっています。シートあたり800分の保存容量がついた永久無料プランがあります。全通話を検索できるアーカイブが欲しいチームに寄っています。

Granolaはボットなし型です。パソコンの音声を録音し、グリッドにボットは現れず、Zoom、Meet、Webex、Slack、Teamsと並んで動き、iPhoneアプリもあります。目に見えるボットの気まずさが反対理由なら、Granolaは会議全体を取り込みつつ、それを取り除いてくれます。

Read AIは、私が見た検索結果で1位にランクインしていました。Zoom、Meet、Teamsをまたいで参加・録音し、まとめを届け、Windows、macOS、Android、iPhone、Chrome向けのアプリがあり、20以上の言語に対応します。無料プランでは、クレジットカード不要で月5回の会議が使えます。

tl;dvは攻めの無料オプションです。Free Foreverプランでは、AI要約付きで30以上の言語の録画と文字起こしが無制限とうたわれ、Meet、Zoom、Teamsと連携します。「無料」が唯一の絶対条件なら、ここから始めましょう。

もう1つ触れておく価値があるのが、Notion AI Meeting Notesです。別のボットなしでNotionの中で文字起こしと要約を行い、NotionのBusinessおよびEnterpriseプランに同梱されています。すでにNotionで暮らしているなら知っておく価値がありますが、ページには、どの通話プラットフォームに参加するのか、何言語に対応するのかは書かれていません。

Whisperの居場所: あなたが口述し、入力され、通話には何も参加しない

Pasted
口述したメモを書き終えるWhisperのオーバーレイ。完了状態です。通話にボットは参加せず、取り込まれた声はあなたのものだけです。

Whisperは「あなた」のツールです。ホットキーを押し(Windowsなら Ctrl+Space、macOSではプッシュ・トゥ・トークの組み合わせとして Command+Option を押したまま)、それから話すと、あなたの言葉がカーソルのある場所に、どのアプリでもテキストとして貼り付きます。通話にボットは参加しません。Zoomのグリッドに余計なゲストは現れません。取り込まれる音声は、あなたが意図して自分のマイクに話したことだけです。

それがワークフローを変えます。会議全体の9,000語の文字起こしの代わりに、重要な部分(3つの決定、2人の担当者、1つの締め切り)を、通話の記憶が新しいうちにメモのドキュメントへ直接口述するのです。クラウドモードでは、AIアシスタントがそれを整えたり、段落を要約したり、口述した内容からアクションアイテムを抜き出したり、フォローアップのメールを下書きしたりして、カーソルの位置に貼り付けてくれます。指示の前に「Hey whisper」と言えば、AIのステップが起動します。

エンジンはあなたが選びます。ローカルのWhisperはマシン上で8つのモデルを動かし、多言語版では99言語をカバーします。英語専用の .en ビルドは英語だけを扱います。NVIDIA Parakeetは最速のローカルオプションで、CPU上でWhisperより5〜10倍速く、25言語(英語と24のヨーロッパ言語)をすべてデバイス上でカバーします。あるいはクラウドモードでは、あなた自身のOpenAIキーを使います。文字起こしには gpt-4o-mini-transcribe または gpt-4o-transcribe、文章の整えには gpt-5-mini を使います。ローカルモードでは、一度モデルをダウンロードすればすべてがオフラインで動き、文字起こし中に何もどこへも送られません。すべてを自分のマシンで動かすことこそ大事だという人には、オフライン音声テキスト変換ガイドが、ローカルのエンジンをより深く案内しています。WhisperはWindowsとmacOS(Apple Silicon)で動きます。Linuxには対応していません。

正直なトレードオフはこうです。部屋のツールはあなたの注意を節約し、Whisperは必要のなかった録音を残さずに済ませます。もし主に文章を書く人(通話のあとのメールやドキュメント、メモ)なら、口述のワークフローは会議をはるかに超えて、あなたの1日に居場所を得ます。それは、より広い視点の音声テキスト変換アプリの記事で私が主張しているのと同じことであり、Whisperがまず口述を、次に会議を中心に作られている理由でもあります。

ここで私が強く持っている1つの意見を、はっきり言います。クラウド専用の口述は、文字起こしされるのを待っているプライバシーの大惨事です。以前一緒に仕事をしたあるチームは、契約者に社内の「AI口述」プロトタイプを作らせました。それは一語ごとにクラウドモデルを呼び出し、すべてのノートパソコンで動いていました。四半期末にマネージャーがコストのダッシュボードを開くと、5桁の請求があり、その大半は、ある1つのチームが朝会の録音を4回も繰り返し文字起こししていたものでした。「スマートな再試行」のロジックが攻めすぎていたのです。契約者は「プロンプトを最適化すべきです」と言いました。CFOは「いや、すでにメモのある会議をアップロードするためにお金を払うのをやめるべきだ」と言いました。部屋はとても静かになりました。上司の給与の数字、子どもの学校へのメール、口述している法的な草稿。そのどれも、声で入力したかったというだけで、ベンダーのログの中に存在させる必要はありません。Whisperのローカルモードでは、あなたの音声はパソコンの中で処理され、いかなるサーバーにも、決して何も送られません。

会議ボットがWhisperに勝るとき

ここからは正直な部分です。もしあなたの実際の仕事が「ほとんど出席できない4人の通話を取り込んで、全員にまとめをメールする」ことなら、Whisperは間違ったツールで、私ならあなたに売りつけません。あなたに必要なのは部屋のツールです。Zoomで暮らしていて、その6言語のどれかを話すならOtterに、無料プランで30以上の言語の無制限な録画が欲しいならtl;dvに、目に見えるボットなしで会議全体を取り込みたいならGranolaに手を伸ばしましょう。Read AIの月5回までの無料プランは、カードなしでこの考え方を試すのにちょうどいい方法です。

もう1つ、名指ししておく価値のある場面があります。あなたが欲しい価値が、自分は他のことに集中しているあいだにボットが自力で参加し要約してくれることなら、専用の議事録ボットは口述に完全に勝ります。自動参加プラス自動要約こそ、それがやることであり、Whisperがあえてやらないことだからです。Whisperは通話に参加せず、他の話者を文字起こしせず、複数話者のまとめも作りません。あなたが話したことを取り込むだけです。部屋が必要なら、部屋のツールを使ってください。私は、返金メールを読むより、その売上を失うほうがましだと思っています。

料金

Whisperは、ローカルのパイプライン全体が誰にとっても無料です。ローカルの文字起こし、Ollamaによる文章の整え、履歴、プリセット、カスタムホットキーまで、サインアップ時に支払い方法は不要です。Whisper Proはクラウドの面を加えます。OpenAIのクラウド文字起こし、クラウドでのAIによる文章の整え、そして音声によるウェブ検索です。詳しい数字は料金ページに載っています。ボットはシート単位で課金します。Otterの無料Basicは月300分、Firefliesはシートあたり800分の保存容量で永久無料、tl;dvのFree Foreverプランは無制限、Read AIの無料プランは月5回の会議です。「個人利用なら無料」が基準なら、ここのほぼすべてがそれをクリアします。

これらすべてから1つだけ持ち帰るなら、こうです。何かに申し込む前に、部屋が必要なのか、それとも自分の声だけでいいのかを決めましょう。ボットは部屋になるのが得意なので、その役目は任せればいい。でも次に通話を終えて、重要だった3つのことを書こうとキーボードに手を伸ばすときは、代わりにホットキーを押してそれを声に出してみてください。ボットがまとめをメールするのにかかる時間でメモが書き上がり、録音に映る人物はあなただけです。私の下の娘は、私より早くそれに気づきました。まだ会議は1つもないのに。

必要なのは部屋ですか、それとも自分の声だけですか?

求めているのが自分のメモなら、Whisperをダウンロードし、ホットキーを押したまま、重要だった3つのことを口述しましょう。ローカルのパイプラインは無料、サインアップ時にカードは不要です。

サインインした全ユーザーにローカル口述が無料。Proは別の試用でクラウド機能を加えます。

Denys Medvedievの写真

Denys Medvediev

私はうちの問い合わせメールを読んでいる本人です。たぶん返信も口述で書いています。

さらに読む