Denys Medvediev

ガイド

ディクテーションにカスタム単語を 追加する方法

ディクテーションが名前・専門用語・ブランド名を聞き間違えるのは、それらが語彙に含まれていないからです。解決策は「教えること」。Windows には単語を登録できる音声認識辞書があり、Whisper のホットワードリストを使えばローカルモデルをあなたの用語に寄せることができます。

最終更新:2026年6月

キーボードの隣に置かれた開いた辞書。言葉と語彙をイメージしている

ディクテーションにカスタム単語を追加するには、ツールに自分の語彙を覚えさせます。Windows では、音声認識の音声辞書に「新しい単語の追加」ウィザードがあります。Whisper by Remskill では、ホットワードリストを使ってローカル Whisper モデルを名前・専門用語・ブランド名に寄せられます。macOS のディクテーション自体にはカスタム単語の設定はなく、それはボイスコントロールにあります。

これまで使ってきたどのディクテーションツールも、一般的な単語はうまく認識しながら、肝心の固有名詞を必ず崩します。「木曜日のレビューをスケジュールして」はきっちり取れるのに、同僚の Csaba は「チャバ」に、プロダクト名は「プロジェクト・アルファルファ」に、「Kubernetes」は「クーパーネッティーズ」に化けます。認識が苦手な単語に共通点があります――名前、業界用語、ブランド名。声を大きくしても、ゆっくり話しても、どうにもならないものばかりです。

だからみんな「ディクテーションにカスタム単語を追加する方法」を検索し、すっきりした設定画面を期待します。正直なところ、答えはツール次第です。Windows には自分で入力できる本物の辞書があります。macOS にも同様の機能はありますが、ほとんどの人が気づかない場所に隠れています。ローカルの Whisper モデルはホットワードリストで自分の用語に寄せられます。この記事では三つすべてを解説し、Whisper の設定まで実際に走ります。そして、標準機能だけで十分なときを正直にお伝えします。

多くの解説ページが飛ばすところから始めます。音声認識は単語を「スペルアウト」するわけではありません――聞こえた音から、最も可能性の高い単語を推測するのです。「Csaba」が「チャバ」に負けるのは、モデルが「チャバ」に似た音を何百万回も聞いてきたのに対して、同僚の名前はほとんど聞いたことがないからです。カスタム単語を追加しても、モデルに新しい文字を教えるわけではありません。推測に重みを加えるのです。

その重みの付け方は、ツールごとに異なります。Windows は手動で編集できる音声辞書に保存します。Whisper のローカルモデルはホットワードのリストを受け取り、文字起こし中にそこへ引き寄せます。そしてよく誤解されるポイント――このホットワードによる補正はローカル Whisper 専用の機能です。Parakeet はホットワードを受け付けませんし、クラウド経由でも同様です。どれがどれか混同すると半日が無駄になるので、明確に整理して進めます。

ディクテーションが名前や専門用語を崩す理由

壁に貼られた手書きの付箋に名前や用語が書かれている。個人用語集のようなイメージ

ディクテーションは確率マシンです。音のかたまりを聞いて、そのモデルが学習した何百万時間分のデータをもとに、最も起きやすい単語の並びを選びます。日常会話ならこの賭けに楽勝できます。問題はレアなもの――Csaba という名の同僚、Helios という社内プロジェクト、薬品名、法律事務所名、英語圏では珍しい自分の苗字など。

モデルはそれらをほとんど聞いたことがないので、音が近い一般的な単語を選びます。「Helios」は「ヒーリーアス」に、「Remskill」は「レムスキル」か「リムスキル」になります。毎回同じ五つの単語を直し続けるのは、まさにディクテーションをやめてキーボードに戻る原因です。改善策はマイクの性能でも発話速度でもありません。これらの変わった単語が候補に入ることを、事前にツールに伝えることです。

それがカスタム単語の役割です。多くのツールでは発音を教えているのではなく、その単語を「認識してよい候補」のリストに追加しています。音が曖昧なとき、一般的な単語ではなくあなたの用語が勝つように。退屈な真実として、10~15語の短いリストが、ほとんどの人のほとんどの悩みをカバーします。辞書を丸ごと渡す必要はありません。いつも崩す数語を渡せばいい。

Windows と Mac の標準機能を使う方法

まず、すでに手元にある機能から試しましょう。それだけで解決する人も多いです。Windows には別々の二つの標準機能があり、カスタム単語の扱い方がまったく異なります。Windows 音声認識(古いデスクトップ機能)には本物の編集可能な音声辞書があります。音声認識を開いて「音声辞書を開く」と言うかクリックし、「新しい単語の追加」を選んでウィザードに従うだけです。その単語はディクテーションが認識するようになります。新しい Windows 11 のボイスアクセスにも独自の仕組みがあり、「語彙に追加」コマンド(とヘルプメニューのオプション)で追加した単語への認識を優先させられます。

日常的によく使われる Win+H の音声入力バーはその中間的な存在です。直接編集できる辞書はなく、時間をかけてあなたの修正履歴や入力テキストから学習する仕組みです。手動でカスタム単語リストを編集したい場合は、音声認識の音声辞書かボイスアクセスの語彙が置き場所です――Win+H バーではありません。

Cancel
録音オーバーレイ:話している間に表示される小さなカプセル。これが出ていれば聞き取り中です。

macOS は注意が必要です。見た目に明らかな機能に、この設定がないからです。標準の macOS ディクテーション――任意のテキストフィールドで音声入力できる機能――にはカスタム単語や語彙のカスタマイズ設定がありません。まったくないのです。別途存在するのが、アクセシビリティ機能のボイスコントロール。「システム設定」→「アクセシビリティ」→「ボイスコントロール」の「語彙」パネルから最大1000語を追加でき、各単語の発音を録音することもできます。本物の機能でよくできていますが、多くの Mac ユーザーが「ディクテーション」と呼ぶものとは別のツールです。「macOS ディクテーションにカスタム単語を追加できる」と書いているページがあれば、静かに両者を混同しています。

Whisper でカスタム単語を設定する(Windows・Mac 共通)

Windows でも Mac でも同じ方法でカスタム単語を追加したいなら、専用ツールの出番です。必要なのは Apple Silicon の Mac か Windows 10 以降の PC、動作するマイク、そしてローカル Whisper モデルです――ホットワードはローカル Whisper 専用の機能なので、Parakeet でもクラウドでもなく、このモデルが必要です。ローカルパイプライン全体は、サインイン済みのアカウントなら無料で使えます。サインアップ時にカードは不要。手順はこちらです。

ステップ 1 ― Whisper をインストールしてサインインする。

ダウンロードページからダウンロードしてインストールし、無料アカウントを作成します。カードは不要。ローカル文字起こしパイプラインはすぐに使えます。

アプリのトレイアイコンが表示され、セットアップウィザードでモデルを選ぶ画面が出たら成功です。

ステップ 2 ― ローカル Whisper モデルを選ぶ。

アプリはクラウド・ローカル Parakeet・ローカル Whisper の三つを提示します。カスタム単語が目的なら「ローカル Whisper」を選んでください。ホットワードリストが機能するのは Whisper モデルだけです。Parakeet は高速ですがホットワード非対応、クラウドも同様です。

Whisper モデルのダウンロードが完了し「準備完了」と表示されたら成功です。

ステップ 3 ― ホットワードリストに用語を追加する。

Whisper モデルの設定画面で、いつも崩される名前・専門用語・ブランド名を一項目ずつ追加します。リストは短く、具体的に。よく失敗する単語だけを登録し、語彙全体を詰め込まないようにしましょう。

保存した用語がリストに表示され、録音をまたいで残っていたら成功です。

ステップ 4 ― 難しい単語を含めてディクテーションして確認する。

任意のテキストフィールドにカーソルを置き、ホットキーを押し続けて、登録した用語を含む文を話してから離します。カーソル位置に、保存したとおりのスペルで文字起こしが貼り付けられます。

以前は崩れていた用語が正しく認識されるようになったら成功です。

Whisper
Whisper デスクトップアプリの設定画面。文字起こしと AI のパネルが開いた状態。

最初のリストはあえて小さく保ちましょう。今週最も気になった5、6語を追加して一日使い、新たに崩れる単語が出てきたときだけ追加する。200語を詰め込んだホットワードリストは、意図しない単語へ認識を引っ張り始めることがあります。短く具体的なリストが、長くて楽観的なリストに勝ります。

Windows での音声入力 · Mac での音声入力

ホットワードリストが実際にしていること

ホットワードリストとは、文字起こし前にモデルへ渡す用語の集まりです。内部的には Windows 音声辞書と同じ発想ですが、仕組みが異なります――辞書に項目を追加するのではなく、各録音にバイアスとして用語を添付します。音が自分の用語と一般的な似た言葉のどちらとも取れる場合、バイアスが判断をあなたの用語の方へ傾けます。「Csaba」が「チャバ」に負け続けるのをやめさせるには、Csaba がここで使う単語だとモデルに伝えればいい。

正直に言っておくべき制限が二つあります。まず、ホットワードは「寄せる」だけであって「強制」はしません――発音がまったく違う単語は出てきませんし、ごく短い単語や特殊な単語は引き続きスリップすることがあります。もう一つ、よく誤解されるポイント:ホットワードはローカル Whisper 専用の機能です。高速ローカルエンジンの Parakeet はホットワードリストを受け付けません。クラウドも同様です。カスタム単語が目的でここに来たなら、それができるのはローカル Whisper モデルだけです。

ローカル Whisper モデルは、標準の音声入力ツールにはない細かい設定も提供します――ビームサイズやカスタム語彙など、一般的な音声入力アプリが公開していないものです。数語の名前を追加するだけなら必要ありません。でも「5語直す」から「医療クリニックの専門用語を一日中文字起こしする」へステップアップしたとき、そこにあります。それが Parakeet より Whisper を選ぶ実際の理由の一つです。ローカルモデルを比較検討しているなら、Whisper モデルの選び方でトレードオフを整理しています。

カスタム単語が目的なら、ローカルかクラウドか

アプリは経路を選ばせます。カスタム単語が目的の場合、この選択はいつも以上に重要です。三つのうちホットワードリストに対応しているのは一つだけだからです。後から「このエンジンじゃなかった」と気づかないよう、正直な整理をしておきます。

三つの経路と、それぞれが語彙についてできること:

  • ローカル ParakeetNVIDIA の TDT エンジン。約 600 MB で、最速のローカル選択肢です――CPU 上では Whisper の5〜10倍の速度。英語 + ヨーロッパ言語24種、計25言語対応。英語への翻訳機能はなく、そして重要な点:ホットワード非対応。日常的な英語の高速ディクテーションには最適ですが、カスタム単語が目的なら選択を誤ります。
  • ローカル Whisper同じマシンで Parakeet より遅いですが、ホットワードリストとカスタム語彙制御ができる経路はここだけです。多言語ビルドは99言語をカバーし英語への翻訳も可能。英語専用ビルドは英語のみ。デフォルトの英語モデルは約 480 MB。名前や専門用語を正確に文字起こしする必要があるなら、これを選んでください。
  • クラウド(OpenAI、BYOK)最高の汎用精度とウェブアクセス。自分の OpenAI キーを使い、料金は OpenAI に直接請求されます。デフォルトの文字起こしは gpt-4o-mini-transcribe。レアな単語を素の実力で正しく認識することも多いですが、ホットワードリストは公開されていません。インターネットが必要です。クラウド機能は Whisper Pro の一部です。

まとめると、指針はシンプルです。カスタム単語が主な悩みで自分で管理するリストが欲しいなら、ローカル Whisper モデルを使う。一般的な英語を中心に速度を重視するなら、Parakeet が日常使いとしては優秀です――ただしホットワードは期待しないこと。クラウドは、難しい録音で最高精度が欲しく、データをマシンの外に出してもいいときの逃げ道です。ローカル設定全体を検討中なら、Whisper をローカルで動かす方法Parakeet モデルの解説で両エンジンを詳しく扱っています。

漏れた単語を後から修正する

どんなカスタム単語設定もすべてをカバーするわけではなく、生のディクテーションは常に一続きの文になります。「csaba に helios のロールアウトについて話す えーと project alpha のタグを付ける」と言えば、ホットワードをオンにしていても、句読点やフィラーはあなたが処理する必要があります。ここで仕事が二つに分かれます――ホットワードは難しい単語のスペルを直し、クリーンアップパスは文の形を整えます。

Windows の音声入力は話しながら句読点を追加し、macOS ディクテーションは「カンマ」「ピリオド」と言うと基本的な句読点を処理します。より本格的なクリーンアップ――「えーと」を取り除いたり、続き文を整理したり、話し言葉の段落をそのまま送れる文章に整えたり――には、Whisper が AI パスを実行できます。「Hey whisper」と言うと、テキストが整えられてから貼り付けられます。ローカルモデルでは Ollama 経由、クラウドモードではデフォルトで gpt-5-mini が使われます。クリーンアップパスは、カスタム単語のスペルはそのままに、その周囲を修正します。

Thinking...
生のテキスト

meet csaba about the helios rollout um tag it project alpha before the standup thursday

整形後

Meet Csaba about the Helios rollout, tag it Project Alpha, before the standup Thursday.

ホットワードリストとクリーンアップパスの両方をすり抜けた単語には、昔ながらの方法が使えます――一度手で直して、Windows では音声辞書に追加しておけば次回は問題になりません。手動修正を時々することに引け目は不要です。目標は「絶対に間違えないツール」ではなく「同じ5語を40回ではなく1回だけ間違えるツール」です。カスタム単語でほとんどカバーできて、残りは素早い編集で対応できます。

この「話してから整える」リズムはどこでも使えるようにしておく価値があります。コツをつかめば、Windows 上でクリーンに音声入力することができ、解決しようとしたアプリだけでなく、開いているあらゆるアプリで使えます。

標準機能で十分なとき

きれいなデスクに一枚の付箋。小さくて十分な解決策を示唆している

専用ツールがまったく必要ない場面もあります。正直に言わないのは不誠実です。カスタム単語の問題が小さい場合――Windows で、一度追加すれば忘れられる数語の名前だけ――なら、Windows 音声認識の音声辞書が無料でそのまま対応してくれます。単語を追加して、以上です。それだけのために追加でインストールするのはやりすぎです。

Mac の状況は正直に言うともう少し複雑で、率直に伝える価値があります。標準の macOS ディクテーションにはカスタム単語リストがないので、それしか使っていないなら、用語を追加するための標準機能の選択肢は本当に限られます。ボイスコントロールの「語彙」パネルは機能し、最大1000語を登録できますが、これはアクセシビリティ機能であり、この目的のために有効にすることになります――慣れていれば問題ありませんが、迂回路に感じる人もいるでしょう。Mac では選択が現実です:ディクテーションの間違いと共存する、ボイスコントロールを習得する、ホットワードリストを持つツールを使う。

標準機能が限界に感じてきたら専用のシステム全体ツールを使いましょう:名前と専門用語の長いリスト、Windows と Mac 両方で必要な同じカスタム単語、オフラインプライバシー、あるいはすべてのアプリで同じように動くホットキーと語彙が欲しいとき。そのラインに達していなければ、無料のものを使えばいい。苗字一つのためにソフトをインストールするよう勧めるつもりはありません。

ディクテーションを主に Mac で使っている場合も、同じトレードオフがあります――Mac での音声入力では、標準機能の限界と正直な回避策をこのセクションよりも詳しく扱っています。

カスタム単語の追加は、ディクテーションの中で最も地味な機能でありながら、使い続けるかどうかを決める機能でもあります。いつも崩す5語をリストに入れてしまえば――Windows なら音声辞書に、Whisper ならホットワードリストに――日々のストレスは静かに消えます。私は2年前に自分の苗字をホットワードリストに追加して以来、ツールに崩されるのを一度も見ていません。地味なことですが、朝食前に片付けておきたい種類の問題がそれです。

いつも崩す単語を覚えさせよう

名前・専門用語・ブランド名をローカル Whisper モデルのホットワードリストに追加して、ディクテーションを始めましょう。以前は崩れていた用語が、保存したとおりのスペルで、開いているあらゆるアプリに貼り付けられます。

サインイン済みアカウントなら無料ローカルモードが使えます。開始にカードは不要。

Denys Medvediev の写真

Denys Medvediev

サポートメールを読むのは私です。返信はたいてい音声入力で書いています。

参考リンク