Denys Medvediev

ガイド

音声入力 関節炎のための

タイピングがつらいなら、音声入力で話すだけ。手を休めながら文字にできます。ホットキーを押して話せば、どんなアプリでもカーソルの位置に文章が貼り付けられます。医療機器でも医療アドバイスでもなく、快適さと作業効率のためのツールです。

最終更新: 2026年6月

落ち着いた整頓されたデスクで、キーボードの横に置かれた手。タイピングをひと休みしている様子

関節炎のための音声入力とは、声で文字を打って手を休める方法です。Whisper のようなシステム全体で動くツールなら、ひとつのホットキーから、どんなアプリでも、オフラインで、無料のローカル版を使って話した言葉を文字にできます。これは快適さと作業効率を助けるものであって、医療機器でも医療アドバイスでもありません。

まず何より先に、正直にひとこと。私はディクテーション(音声入力)ソフトを作っている人間で、医者ではありません。そしてここに書かれていることは、関節炎を治したり、和らげたり、診断したりするものではありません。これは医療アドバイスではなく、Whisper は医療機器でもありません。手や関節が痛むなら、相談すべき相手はブログ記事ではなく、医療の専門家です。

そのうえで、ディクテーションが実際にできることは、狭いけれど役に立ちます。キーを押さずに文字を作れるのです。タイピングがつらく感じる部分なら、タイピングを減らすことが、今日すぐ引けるレバーになります。「関節炎 音声入力」と検索する人は、長いメールや書類を書くあいだ手を休められるスイッチを探しているのでしょう。そのスイッチは確かにあります。ただ、特定のアプリの中ではなく、その外側にあって、設定には2分ほどしかかかりません。

このキーワードまわりのページが、たいてい飛ばしてしまう点があります。テキストボックスはテキストボックスです。それが Gmail でも、Word の文書でも、チャット画面でも、検索バーでも変わりません。カーソルの位置に貼り付けるディクテーションツールは、そのカーソルがどのアプリにあるかを気にしません。だから、アプリごとにマイクボタンを追加してもらう必要はないのです。必要なのは、すべての上にかぶさるひとつのツールです。

だから本当の問いは「関節炎向けに音声入力に対応しているのはどのアプリか」ではありません。「すべての上にかぶせて動かすディクテーションツールはどれか」であり、その答えは、無料で標準搭載のものがいいのか、いちばん手間のかからないキー操作がいいのか、それともどのプログラムでも同じように動くオフラインのホットキーがひとつ欲しいのか、によって変わります。それを全部たどって、実際にひとつ設定し、専用ツールを使わなくていい場面も正直にお伝えします。文字だけでなくパソコン全体を声で操作したい場合も、そのひとつです。

なぜ人はタイピングを減らすために声に頼るのか

デスクの上のキーボードと、そのそばで休んでいる手。タイピングはしていない

免責事項は何度でも言います。大事なことだからです。これは医療アドバイスではなく、ディクテーションソフトは何も治しません。できるのは、一日に押すキーの数を減らすことです。あなたが話し、パソコンが打ち、本来打っていたはずのキー操作を省けます。普段なら40分かけてタイピングで返信していた受信トレイなら、それは数百回のキー押しを単に省けるということです。それがこのツールの、地味だけれどすべての利点で、しかも正直な利点です。

人が本当にやってほしいことは、メールより大きなものです。手が言うことを聞かないから先延ばしにしている、あの長い書類。チャットの返信、フォーム、何の負担もなければ書き留めるはずのメモ。アイデアが消える前に、打てる速さではなく考える速さで書き留めること。キーボードがつらい部分なら、文字を声に任せるのは、それを面倒事にせず作業を続ける方法になります。

速さという副次的な効果にも、一文だけ触れておく価値があります。話す速さはたいていの人で1分あたり145語ほど、タイピングは40語に近い。だから手を休められるだけでなく、おおむね3.5倍ほど速く進む傾向があります。遅いほうの選択肢が同時に悩みの種でもあったなら、これはうれしいおまけです。どれも健康についての主張ではありません。キー押しの数についての、ただの算数です。

ホットキーを押して話せば、どのアプリにも文字が届く

仕組みはこれだけで、わざと地味にしてあります。ホットキーを押して、話して、離す。すると文字起こしが、フォーカスのあるテキスト欄のカーソル位置に貼り付けられます。キーを離したあとも Whisper は少しのあいだ録音を続けるので、最後のひと言が切れません。OS のカーソル位置に貼り付けるので、どんなアプリも「ただのテキストボックス」になります。メールソフトでも、Word の文書でも、Slack でも、ブラウザのフォームでも、メモアプリでも。同じキー、同じ流れ、どこでも同じです。

ここがランディングページで余計にややこしくされている部分です。プログラムごとに差し込むプラグインも、貼り付ける API トークンも、言葉を拾い出す別ウィンドウもありません。カーソルが欄にあって、話せば、言葉が欄に現れる。話しているあいだは小さなカプセルが表示され、聞き取り中だとわかります。

Cancel
録音オーバーレイ: 話しているあいだに現れる小さなカプセル。Whisper が聞き取り中だとわかります。

最初にきちんと決めておく価値があるのはホットキーで、快適さに関わるのもここです。Windows の初期設定は Ctrl+Space、Mac は Command+Option で、押しているあいだだけ録音する「押し続け式(プッシュ・トゥ・トーク)」です。複数キーを押し続けること自体がつらいなら、そうする必要はありません。設定 → 録音でタップ切り替え式に変えれば、1回タップで開始、もう1回タップで停止になり、キーを押し続けることはまったくなくなります。(ホットキーがすべてカスタマイズできるのは、最初に固定式で出してしまい、深夜2時に誰かの音楽ソフトとぶつかったからです。私は修士号を持っているのに。)以前にWindows でのディクテーションMac での設定をしたことがあるなら、これはその同じ体の覚えを、一度にあらゆる場所へ向けただけです。

2分でセットアップ(Windows でも Mac でも)

必要なのは、Apple Silicon の Mac か Windows 10 以降の PC、動くマイク、そして文字を打ち込みたいアプリをバックグラウンドで開いておくことだけです。ローカルの処理一式は、サインインしたアカウントなら無料で、登録時に支払い方法を聞かれることもありません。手順はこちらです。

ステップ1 — Whisper をインストールしてサインインする。

ダウンロードページから入手し、インストールして、無料アカウントを作成します。カードは不要。ローカルの文字起こし一式がすぐに使えるようになります。

うまくいったかどうかは、アプリのトレイアイコンが現れ、セットアップウィザードがモデルを選ぶよう案内してくれることでわかります。

ステップ2 — 文字起こしの方式を選ぶ。

アプリは勝手に選びません。選べるのは3つ。Cloud(OpenAI、自分のキーを使用)、Local Parakeet、Local Whisper。メモを自分のマシン内にとどめたいなら、まずはローカルから。詳しくは2つ先のセクションで。

うまくいったかどうかは、モデルのダウンロードが完了して「準備完了」と表示されることでわかります。

ステップ3 — 手にやさしいホットキーを設定する。

Windows の初期設定は Ctrl+Space、Mac は押し続け式の Command+Option です。複数キーを押し続けるのがつらいなら、タップ切り替え式に変えて、1回タップで開始、もう1回タップで停止にしましょう。Mac では、求められたらアクセシビリティの権限を許可してください。これがないと、カーソル位置への貼り付けが他のアプリに届きません。

うまくいったかどうかは、試しの録音がどんなテキスト欄にも貼り付けられることでわかります。

ステップ4 — どこでもカーソルを置いて話す。

どれかのテキストボックスをクリックし、録音を始めて、一文話し、止めます。文字起こしが、まるで自分で打ったかのようにカーソルの位置に現れます。

うまくいったかどうかは、話した一文がテキストボックスの中に文字として収まっていることでわかります。

Whisper
設定画面を映した本物の Whisper デスクトップアプリ。文字起こしエンジンを選び、手にいちばんやさしいホットキーの挙動を設定できます。

時間がかかるのはモデルのダウンロードであって、セットアップではありません。それ以外は上の4ステップだけです。動き出してしまえば、考えを画面に出す行為はタイピングの作業ではなく、話す作業になります。タイピングがつらい部分であるとき、それこそが目的のすべてです。

Windows での音声入力 · Mac での設定

すでに使っているすべてのアプリで、ひとつのホットキー

システム全体で動くツールがアプリごとの機能に勝る理由は、プログラムを切り替えても何ひとつ覚え直さなくていいことです。メールの作成欄を埋めるのと同じキーが、Word の文書も、Slack のメッセージも、ブラウザのフォームも、表計算のセルも、そしてコミットメッセージも埋めます。パソコンから見れば、あなたはタイピングをしているのと同じ。だからタイピングが効くところならどこでも効きます。ひとつのツール、すべてのテキスト欄、Windows でも Mac でも。

手を休めるのが目的のとき、これは聞こえる以上に重要です。もしアプリごとに専用のディクテーションボタンがあったら、一日中ちがう操作ボタンを探し回ることになり、しかもその半分は存在すらしないでしょう。ホットキーがひとつなら、始める手間はほぼゼロまで下がります。タップ、話す、完了。「これを書きたい」と「書けた」のあいだのステップが少ないほど、本当は手を休めたいときに、つい習慣でキーボードに手を伸ばすことが減ります。

驚かれないように、正直な範囲を。これはカーソルの位置に言葉を置きます。カーソルを動かしたり、メニューをクリックしたり、ウィンドウを操作したりはしません。たいていの人にとってキーボードの負担の大部分は文字そのもの — メール、書類、メッセージ、メモ — なので、文字を任せるだけで、もう負担のほとんどが取れます。声でそれ以上のことをパソコンにさせたいなら、下にもっと良い先を案内するセクションがあります。

ローカルかクラウドか: どちらのモードを選ぶか

まずはローカルモードから。声で書く内容の多くは個人的なものです — かかりつけの病院への連絡、保険の書類、家族へのメッセージ — それが文字になるためにノートパソコンの外へ出ていく理由はありません。ローカルの文字起こしは完全に自分のマシン上で、オフラインで動き、サーバーには何も送られません。Mac が Apple Silicon なら、あるいは PC がここ数年のものなら、ローカルで日常のディクテーションは難なくこなせます。そしてクラウドは初期設定ではなく、いざというときの逃げ道になります。

アプリはあなたに選ばせるので、せっかくなら良い選び方をしてほしくて、3つの方式のちがいを説明します。

  • Local ParakeetNVIDIA の TDT エンジンで、約600 MB、ローカルでいちばん速い選択肢です — CPU 上では Whisper の5〜10倍速い。英語に加えて他の24のヨーロッパ言語、合計25言語に対応します。英語への翻訳機能はありません。英語かほかのヨーロッパ言語で書くなら、これが手早く、完全オフラインの選択肢です。
  • Local Whisper同じマシン上では Parakeet より遅いものの、多言語版は99言語に対応し、英語への翻訳もできます。英語専用版は英語専用で、99言語ではありません。中国語、日本語、韓国語、あるいは Parakeet にはできない翻訳作業には、こちらを選んでください。標準の英語モデルは約480 MB です。
  • Cloud(OpenAI、自分のキーを使用)精度が最も高く、ウェブにもアクセスでき、自分の OpenAI キーを使って OpenAI から直接課金されます。文字起こしは標準で gpt-4o-mini-transcribe で動きます。インターネットが必要なので、これだけはマシンの外に出る唯一の方式です。Cloud の領域は Whisper Pro の一部です。

地味な真実ですが、日常の文章のほとんどには、ローカルで十分です。両方のローカルエンジンは完全に自分のマシン上で動き、どこにも何も送りません。声で個人的なことを打つときの、正しい初期設定です。クラウドが出番を得るのは、聞き取りにくい録音で最高の精度がほしいときや、文の途中でウェブから事実をひと拾いしてほしいときです。一日分のメールとメモなら、まずローカルで始めて、ローカルでは物足りないと感じたときだけクラウドに手を伸ばしましょう。

手で直さなくて済むよう、AI が仕上げる

このステップは、手を休めるという点で、最初に見えるよりずっと大切です。話し言葉は乱れます。「えーと」と言い、文を言い直し、語尾が消える。それを後から打ち込んで直さなければならないなら、結局キー操作を戻してしまい、意味がなくなります。そこで Whisper には、文字を貼り付ける前にフィラー(無駄な口ぐせ)を削り、言い回しを整える、任意の AI 処理があります。直しが減れば、押すキーも減ります。

Windows の音声入力は話すときに基本的な句読点を付け、macOS のディクテーションは「カンマ」や「ピリオド」と言えば対応します。もっとしっかり整えたいとき — フィラーを取り除き、続けてしまった文を直し、話した段落を実際に送れるものに変える — には、Whisper が頼まれたときにその AI 処理を実行します。起動フレーズ「Hey whisper」と言えば、文字が届く前に整えられます。ローカルモデルではこれは Ollama を通して、無料で、自分のマシン上で動きます。クラウドモードでは標準で gpt-5-mini です。

Thinking...
そのまま

えーっと はい あの レポートは その だいたい終わってると思う あとは金曜までにマリアに送るだけ

整えたあと

レポートはだいたい終わっていると思います。あとは金曜までにマリアに送るだけです。

この用途における仕上げの狙いは、結果をひと読みしてそのまま進めることで、キーボードで文章に戻らないことです。仕上げが要らないときは、それをオフにして、そのままの文字起こしを貼り付けることもできます。どちらにしても、手で行う編集は減ります。あなたの手が気づく部分です。

この「話してから整える」流れは、書くものすべてで効いてきます。声でもっと速く打つこともできるので、長いメッセージも、一字ずつ押し出す段落ではなく、話した数文で済みます。

こういうディクテーションツールを使わなくていいとき

舗装路にチョークで描かれた、ちがう方向を指す2本の矢印。ツール選びを表している

ときには、ふさわしいツールは私のものではないことがあります。そうでないふりをするのは、あなたへの不義理になります。よく出てくるケースが2つあり、どちらにも「文字へのディクテーション」は間違った答えです。

ひとつめ。パソコン全体を声で操作したいなら — マウスを動かしてクリックし、アプリを開き、メニューを操作し、スクロールする、ただ欄に文字を入れるだけでなく — ディクテーションツールでは行き着けません。Whisper は文字を扱うのであって、マシンを動かすわけではありません。完全にハンズフリーで使うなら、まずは OS のアクセシビリティ機能を見てください。macOS の Voice Control はインターフェース全体を声で操作でき、Windows には Voice Access があります。標準機能を超えるなら、Dragon(Windows)はマウスやメニューの音声コマンドを加え、Talon Voice(Mac、Windows、Linux)が最も先まで進んでいて、音声コマンドに視線追跡や音による(雑音ベースの)クリックを組み合わせて、本当のハンズフリー操作を実現します。それが必要なら、ここではなく、まずそこから始めてください。

ふたつめ。たまに短いメッセージをディクテーションしたいだけなら、まだ何もインストールしないでください。Windows では、Windows ロゴキー + H を押せば、カーソルのある場所に標準の音声入力バーが開きます。自動で句読点を付け、無料です。ただし Microsoft のサーバーを経由し、インターネットが必要です。Mac では、ディクテーションでどんなテキスト欄にも話しかけられます。システム設定のキーボードで設定でき、Apple Silicon なら端末内で動かせます。手早くスマホで使うなら、スマホのキーボードのマイクが、すでにどんな欄にもディクテーションしてくれます。専用ツールが出番を得るのは量があるとき — 長い文章、いちばん手間のかからないキー、オフライン利用、そしてどこでも同じように動くひとつのホットキー。その水準より下なら、無料のもので十分です。

ここでの考え方は、もっと広いRSI のためのディクテーションソフトのガイドで使っているのと同じです — キー操作を減らし、正直であり続け、タイピングだけでなくキーボードそのものが問題のときにだけ、もっと重いツールに手を伸ばす。

さらに読む

これはどれも関節炎を治すものではありませんし、そうだとは言いません。これはキーを押さずに文字を作る方法であり、キーを押すことがつらい部分であるとき、小さくて役に立つことです。カーソルこそが連携の要です。どんな欄にも話しかけ、文字を得て、キーボードに戻らずに仕上げる。このガイドのほとんども、同じホットキーでテキストエディタにディクテーションし、手はほぼキーから離したまま書いて、最後にひと読みしました。トリックはそれだけです。そして、もしあなたの関節がタイピングの休憩以上を必要としているなら、尋ねるべき相手は医学の学位を持つ人たちであって、私ではありません。

次のメールで、手を休めましょう

ホットキーを押し続けるかタップして、話せば、文字起こしがカーソルのある場所に届きます — どのアプリでも、キーボードなしで。

サインインしたアカウントなら、ローカルモードは無料。始めるのにカードは不要です。

Denys Medvediev の写真

Denys Medvediev

サポートメールを読んでいるのは私です。返信もたぶん、ディクテーションで書いています。