Denys Medvediev

チュートリアル

Zendeskでの音声入力: 通話と、あなたの返信

Zendesk Talkが文字起こしするのは、お客様の通話です。あなたの返信を入力してくれるわけではありません。実際に書く返信、内部メモ、マクロを音声入力するなら、Whisperのようなシステム全体で使えるホットキーツールの出番です。オフラインで、エージェントワークスペースの中でも、日々使っているあらゆるサイドアプリでも動きます。

最終更新:2026年6月

印刷されたグラフやチケット書類の上にヘッドセットが置かれた、サポートエージェントのデスクのクローズアップ

Zendeskでの音声入力は、まったく別の2つに分かれます。Zendesk Talkは、録音されたお客様の通話やボイスメールを文字起こしし、その内容をチケットのログに添付します。あなたの返信を入力してくれるわけではありません。実際に書く返信、内部メモ、マクロを音声入力する機能は、Zendeskにはありません。それはWhisperのようなシステム全体で使えるツールが、ホットキーひとつで担ってくれます。

この検索にたどり着いたエージェントの多くが求めているのは、ひとつだけ。今日40回目になる同じ回答を打ち込むのをやめて、ただ口に出して言いたいのです。話す速さと打つ速さのギャップは現実にあります。多くの人は1分あたり150語くらい話せますが、キュー(順番待ち)のプレッシャーの中で打てるのはせいぜいその3分の1。これこそ音声入力が役立つ理由です。だから検索するのは当然のこと。ややこしいのは、Zendeskの音声機能が実際には何をするのか、という点です。音声入力のように聞こえて、実はそうではないからです。私はZendeskのドキュメントを読み込んで、エージェント用の音声入力トグルを見落としたに違いないと自分に言い聞かせるのに、たっぷり20分かかりました。見落としてなどいませんでした。そんなものは存在しないのです。ここで線をくっきり引いて、それから本当に使える部分をお見せします。

手短に言うとこうです。Zendeskの音声ツールは電話チャネルにあります。それはお客様の声を聞きます。あなたが思い描いているもの、つまりあなたが話し、その言葉が返信欄に着地する、というのはまったく別のカテゴリーで、Zendeskの中ではなくオペレーティングシステムのレベルに存在します。この区別が見えた瞬間、すべての混乱が消えます。

ホットキーを押して話す。すると返信が勝手に入力される

仕組みはキー1つ。グローバルホットキーを押したまま話し、離すと、テキストはカーソルのある場所にそのまま着地します。公開返信でも、内部メモでも、マクロ本文でも、Guideの記事でも。Windowsでの初期設定はCtrl+Space、macOSではCommand+Optionを押しっぱなしにするプッシュトゥトークです。メニューも、アップロードも、「録音をクリック」もありません。同じキーが、Zendeskのエージェントワークスペースでも、チケットの合間に飛ぶ他のあらゆるアプリ(Slack、Teams、Gmail、Notion)でも同じように動きます。

この最後の部分は、聞こえる以上に大事です。Whisperはブラウザ拡張機能ではなく、WindowsとmacOSのネイティブなデスクトップアプリです。だからZendeskのタブからAlt+Tabで抜けて、バグについてSlackでエンジニアリングに連絡するときも、同じホットキーがそのまま使えます。ブラウザ拡張機能はタブの端で止まってしまいます。同じOSレベルの到達範囲があるからこそ、CRMの中でもこの技が効きます。エージェントはSalesforceでの音声入力HubSpotでの音声入力でも同じように使っています。

Zendesk Talkは通話を文字起こしする。あなたの返信は入力しない。

エージェントのデスクの上、カスタマーサービスのグラフや書類の上に置かれたヘッドセット

ここで誰もがつまずくので、はっきり書きます。Zendesk公式の通話文字起こしFAQによれば、Talkはお客様とエージェントの間で録音された電話通話を対象とし、通話が終わったあとに、その文字起こしと要約を内部メモとしてチケットの会話ログに追加します。文字起こしされるのは録音された通話だけです。Zendeskはボイスメールの音声も文字起こしし、その料金はおおよそ1分あたり1セントほどです。

ここまではすべて音声チャネルの話です。お客様がかけてきた通話を文字起こしします。これは本当に便利な機能です。話された通話の書面記録をチケットに添付したいなら、それこそまさにZendeskの仕事であり、ぜひ使うべきです。

ただし、それはエージェントの音声入力ではありません。これらの機能はどれも、あなたが打ち込む返信を作成欄に話して入れることはできません。地味な事実ですが、Zendeskにはそのためのネイティブ機能がないのです。Zendeskの社員自身が、同社のコミュニティフォーラムでそれを認めています。リアルタイムの音声文字起こしはロードマップ上の予定にとどまり、2024年初頭から後の四半期へとずれ込み、しかもその項目すら通話チャネルに関するもので、エージェントの音声入力ではありませんでした。音声からテキストへの入力を求める別のリクエストスレッドには、返答すらありませんでした。スタッフがスレッド内で提案した回避策は、Chromeのライブキャプションをオンにすることでした。これがどれほど本物の機能から遠いかが分かります。「返信を音声入力できますか」という質問への公式回答が「ブラウザのアクセシビリティメニューを試しましたか」だとすれば、正直な答えは「いいえ」です。

Zendeskに音声まわりで実際にあるもの、ないもの

3つの機能がそれぞれ別の結果を約束していますが、実在するのはそのうち2つだけです。正直に整理すると、こうなります。

  • 録音された通話 — Zendeskが文字起こしし、その内容をチケットのログに記録します。
  • ボイスメールの音声 — これもZendeskが文字起こしし、振り分けや要約に活かします。
  • あなたが打ち込む返信を音声で入力する — これはZendeskにはまったくありません。

ですから、キューを音声でさばこうと思ってここに来たのなら、Zendeskの音声機能ではそこにたどり着けません。これらはお客様の音声を中心に作られていて、あなたのキーボードのためのものではないからです。Whisperはそのギャップに収まります。オペレーティングシステムレベルの音声入力ツールなので、エージェントワークスペースの作成欄でも、打ち込むのとまったく同じように動きます。ブラウザから見れば、それは単にカーソルに届くテキストにすぎないからです。

Zendeskのチケットの返信・メモ・マクロに音声入力する方法

Cancel
話している間に表示される録音オーバーレイ。小さなインジケーターで、Whisperが聞いていることが分かります。画面を乗っ取るようなものではありません。

セットアップは短く済みます。最初から最後まで、これで全部です。

  1. WindowsまたはmacOS用のWhisperをインストールしてサインインします。ローカルパイプライン全体は、サインインしたユーザーなら無料で、登録時にカードは不要です。
  2. モデルを1つ選んでダウンロードさせます。一度きりのダウンロードは、選ぶモデルに応じておよそ140 MBから3 GBまで。そのあとは、文字起こしにインターネットは要りません。
  3. エージェントワークスペースでチケットを開き、入力したい欄をクリックします。公開返信、内部メモ、または編集中のマクロの本文など。
  4. ホットキーを押したまま話します。WindowsならCtrl+Space、macOSならCommand+Option。(PCでこれを設定するなら、Windowsの音声入力ガイドがホットキーをより詳しく解説しています。)お客様の顔を前にして話すのと同じように、返信を口にしてください。
  5. キーを離します。テキストはフォーカスしている欄のカーソル位置に着地します。読んで、必要なら直して、送信。

上の録音オーバーレイが、話している間に見えるものです。小さなライブインジケーターで、画面を乗っ取るようなものではありません。初めて返信が作成欄にぽっと現れたときは、ちょっと反則のように感じます。その感覚はチケット5件目あたりで消えます。消えないのは、手のこわばりがなくなることのほうです。

アプリそのものを、ライブで

Whisper
本物のWhisperデスクトップアプリを、埋め込んでクリックできる状態に。設定、モデル一覧、ホットキーの設定をいじってみてください。ここで見えるものが、そのままインストールされます。

上に埋め込まれているのは本物のデスクトップアプリです。スクリーンショットではなく、実物そのもの。いじってみてください。設定も、モデル一覧も、ホットキー設定も、全部そこにあります。ここで見えるものが、そのままインストールされます。

音声入力を自動でクリーンアップする

Thinking...

話し言葉には「えーと」のような言いよどみが入り、文がつながってしまいがちです。Whisperは、貼り付ける前に、生の文字起こしに対して任意のAIクリーンアップを一度かけられます。句読点、大文字小文字、軽い口調の整えまで。無料のローカルモードでは、このクリーンアップはOllamaを通じてあなたのマシン上で動きます。Whisper Proなら、あなた自身のOpenAIキーを通じて動きます。QAリーダーが目を通す公開返信にとって、この一手間が「話したメモ」と「レビューを通る返信」の差になります。

どちらのモードも90以上の言語に対応します。昼食前にチケットのキューが英語、スペイン語、ドイツ語と切り替わるなら、これは効いてきます。ちなみにこれは、うちの7歳が寝る時間を交渉するのに使う言語の数とだいたい同じくらいです。多言語モデル系統は具体的には99以上の言語に届き、英語専用の系統は英語だけをカバーします。

顧客データを扱うなら、ローカルかつオフラインが大事な理由

鎖と南京錠で巻かれたデバイス。マシンから決して外に出ない、プライベートで施錠されたデータを象徴している

この記事で私が出す唯一の意見はこれです。クラウドでしか動かず、オフラインの選択肢がない音声入力は、サポートエージェントにとってプライバシーの大惨事です。あなたはお客様のメール、注文内容、ときには自宅の住所やカードの異議申し立てまで読み上げます。クラウド専用のツールでは、そのすべてが第三者のサーバーを経由して回り道します。あなたが打つ代わりに話したかった、ただそれだけの理由で。すべてを自分のマシン上で動かせるツールなら、そんな取引を迫られることはありません。

Whisperのローカルモードは、すべてオフラインで動きます。音声がマシンから出ることはなく、ネットワークに触れるのは一度きりのモデルダウンロードのときだけです。あなたが返信に話し込む顧客の個人情報は、デバイス上にとどまります。この検索で上位を占めるブラウザ拡張機能やクラウドの音声入力ツールには、それが言えません。あなたの音声を、文字起こしのために外へ送り出すからです。あなたのサポート組織が規制対象のデータを扱うなら、「音声はノートパソコンから一度も出ていません」という一文は、セキュリティチームがぜひ聞きたい言葉のはずです。

できないこと(正直な限界)

どんなツールも無傷の太鼓判には値しません。だからWhisperの限界もお伝えします。

貼り付けるのは、一度にフォーカスしている1つの欄だけです。複数欄からなるチケットフォーム全体を埋めることはしませんし、あなたの言葉がどの欄に入るべきかを判断することもしません。言葉はカーソルのある場所へ行くだけです。つまり、話す前に、公開返信なのか内部メモなのかの違いに自分で気を配る必要があります。間違ったほうに音声入力すると、内部メモをそのままお客様に漏らしてしまうこともあります。カーソルは、あなたが指した場所に正確にそのとおり振る舞います。それは、どこを指したかによって、長所にも告白にもなります。先にクリック、それから話す。

挿入するのはテキストであって、書式ではありません。作成欄の太字ボタンを動かしたり、音声で箇条書きを組んだりはしません。キーボードと同じように、CKEditorに言葉を打ち込むだけです。そしてどんな音声入力ツールとも同じく、苦手なのは言葉でない文字列です。アカウントID、注文番号、SKUコード、エラーコードなど。私は「チケット ZD ダッシュ 4 4 0 2」が、4が1つ多いものに化けるのを見たことがあります。これはまさに、お客様が気づくたぐいの細部です。言ったことは文字起こししてくれますが、コードは送信前に必ず目で確かめてください。

Whisperを使わず、別のものを選ぶべきとき

キーボードとモニターだけのミニマルなオフィスデスク。どのサポートツールに手を伸ばすかという判断を示している

私としては、うちのものより正しいツールを使ってほしいのです。話された通話の書面記録をチケットに添付したいなら、それはZendesk Talkの通話文字起こしです。それはWhisperではなくZendeskの仕事で、すでにあなたの電話チャネルに組み込まれています。通話のログを残す問題を、音声入力アプリで解決しようとしないでください。

ときどき返信を音声入力できればよくて、何もインストールしたくないなら、あなたのオペレーティングシステムにはすでに無料の選択肢が付いています。WindowsにはWin+Hの音声入力が、macOSには標準の音声入力(Dictation)があります。どちらもシステム全体で動き、Zendeskの作成欄の中でも使えます。これらは単一プラットフォーム向けで、初期設定ではクラウドに寄っていて、制御の自由度は劣ります。それでも、1台のマシンで1日2回くらい音声入力するエージェントには、無料ですでに入っているというのは妥当な取引です。

Whisperに手を伸ばすのは、毎日キューを音声でさばききりたいとき、顧客データを動かさないようオフラインで使いたいとき、Zendeskと日々使うサイドアプリ全部で同じホットキーを使いたいとき、そしてカードなしで無料に使いたいときです。Whisperはサインアップ時点でローカルパイプラインが無料。Proのクラウド機能には7日間のトライアルが付きます。最新の金額は料金ページに載っています。

Zendeskはお客様の通話を聞きます。あなたの側の会話を入力するためには、そもそも作られていません。その2つ目の仕事、つまりあなたが話し、その言葉が返信欄に着地すること。それこそが、200件のチケットの1日を、手首が許してくれる1日に変えてくれます。欄をクリックし、キーを押したまま、話す。Whisperをダウンロードして、チケットを1件、音声でさばいてみてください。お昼までに手が感謝してこなかったら、打ち込むのに戻ってかまいません。

次のチケットを音声でさばこう

欄をクリックし、キーを押したまま、話して、離す。返信はカーソル位置に着地します。Zendeskのエージェントワークスペースでも、日々使うあらゆるサイドアプリでも。

サインインしたアカウントなら、ローカルモードは無料。始めるのにカードは不要です。

Denys Medvedievの写真

Denys Medvediev

うちのサポートメールを読んでいるのは私です。たぶん、返信も音声で入力しながら。