Denys Medvediev

ガイド

Macで音声入力を使う 方法

macOSには音声入力機能が標準搭載されています。「システム設定」でオンにして、任意のテキストフィールドにカーソルを置き、ショートカットを押して話すだけ。Apple Siliconなら一度言語をダウンロードすれば、完全オフラインで動作します。正直なセットアップ方法と、専用ツールが役立つ場面も合わせて紹介します。

最終更新:2026年6月

木製のデスクの上にMacのノートパソコンとコーヒーマグ。タイピングではなく話しかけるための環境が整っている

Macで音声入力を使うには、Appleメニューを開いて「システム設定」へ進み、「キーボード」をクリックして「音声入力」をオンにします。あとは任意のテキストフィールドにカーソルを置き、音声入力のショートカット(またはマイクキー)を押して話すだけ。Apple Silicon搭載のMacでは、一度言語をダウンロードすれば端末上でそのまま処理できます。

macOSには長年にわたって音声入力機能が搭載されていますが、使ったことがない人がほとんどです。「Macで音声入力する方法」と検索して、隠れたPro機能のようなものを想像し、ずっと「システム設定」にあったたった一つのスイッチを見つけられずにいる。でも、ちゃんとあります。無料で、Mail、Notes、Slackのテキストボックス、アドレスバーなど、あらゆるテキストフィールドで使えます。

Appleの公式ドキュメントは正確ですが3つのページに分散しているので、スイッチの場所と使い方をここでまとめて説明します。それから、標準機能では物足りなくなる場面についても正直にお伝えします。30文字の返信なら標準機能で十分ですが、長い文章を書くとなると少し辛くなってきます。どちらも本当のことです。

多くのページが触れないポイントがあります。macOSの音声入力はシステム機能であって、開くアプリではありません。一度オンにすれば、カーソルがある場所がそのまま入力先になります。別のウィンドウも、保存するファイルも、アップロードする録音もありません。

本当の問いは「Macにこの機能があるか」ではありません。あります。問いは「自分が書くものにどれだけの精度が必要か」です。短い文章なら標準機能で十分で、そう断言します。長い文章や、句読点の正確さ、聞き違いを修正したい単語、途中で止まらない音声入力が必要なら、専用ツールが活きてきます。両方セットアップして、あとは自分で選んでください。

macOSの音声入力とは何か

Macキーボードのファンクションキー行のクローズアップ。マイクキーのある場所

macOSの音声入力は、Mac上のテキストが入力できる場所ならどこでも、キーボードの代わりに声で入力できる標準機能です。追加費用なしにOSに同梱されており、何もインストールする必要はありません。「システム設定」で一度オンにするだけで、以降はすべてのアプリで使えます。Mailの下書き、Notesのページ、検索フィールド、ウェブサイトのコメント欄でも使えます。

音声ファイルの文字起こしアプリでも、会議の録音ツールでもありません。リアルタイムの音声テキスト変換です。話した言葉がカーソルの位置にリアルタイムで表示されます。Appleのドキュメントによれば40以上の言語・地域の組み合わせに対応しているので、英語専用でもありません。Apple Silicon搭載のMacでは、Appleのサーバーに送らずに端末上で音声処理ができます。プライベートな内容を話す機会があるなら、これは重要なポイントです。

正直に一点だけ。標準機能は、短い日常的な音声入力という設計された用途においては本当によくできています。ただし、長くなるほど、音声環境が乱れるほど精度が落ちてきます。欠点というより、設計上の限界です。このガイドではその限界がどこにあるかをはっきり示します。

システム設定でオンにして、あとは話すだけ

スイッチは一か所にあります。左上のAppleメニューを開いて「システム設定」を選び、サイドバーの「キーボード」をクリックします(スクロールが必要な場合もあります)。「音声入力」のセクションを見つけてオンにします。macOSから「有効にする」の確認が求められ、Appleに音声録音を共有するかどうか聞かれることもありますが、これは任意なので断っても問題ありません。

オンにすれば、Appleの公式手順に従って3つの方法で音声入力を開始できます。キーボードのファンクション行にマイクキーがあればそれを押す、音声入力のキーボードショートカットを使う、またはメニューバーの「編集」から「音声入力を開始」を選ぶ方法です。ショートカットは固定ではなく、音声入力の設定から「ショートカット」メニューを開いて選ぶか、「カスタマイズ」で好きなキーを設定できます。デフォルトが他のショートカットと競合するなら、まずここを変えるのがおすすめです。

使い方はシンプルです。任意のテキストフィールドをクリックしてカーソルを置き、音声入力を起動して、カーソルが点滅し始めるのを待ってから話す。Apple Siliconでは、話しながらでもキーボードで修正できます。終わったら再度ショートカットを押すか、メニューから停止します。これが標準機能のすべてです。スイッチ一つ、ショートカット一つで、Mac上のあらゆるテキストフィールドで使えます。

文の途中で音声入力が切れたり、開始しない場合は、だいたいマイクのアクセス権か接続の問題です。Macの音声入力が止まり続けるときの対処法でよくあるケースをまとめています。

もう一つの方法:ワンキーのプッシュ・トゥ・トーク

専用ツールも基本的な仕組みは標準機能と同じです。キーを押して話すと、カーソルの位置にテキストが入力されます。ただし、長い文章で静かに止まることなく、覚え間違いを教えることができ、貼り付ける前に文章を整えることもできます。Whisperはそういったツールの一つです。Apple Silicon搭載のMac、動作するマイク、数分の時間があれば始められます。ローカルパイプライン全体はログイン済みのアカウントなら無料で、登録時にカードも不要です。手順はこのとおりです。

ステップ1 — Whisperをインストールしてサインイン。

ダウンロードページからダウンロードして、インストールし、無料アカウントを作成します。支払い方法は不要です。ローカル文字起こしパイプラインがすぐに使えるようになります。

アプリがメニューバーに表示され、セットアップウィザードでモデルを選ぶよう促されれば成功です。

ステップ2 — 文字起こしの方式を選ぶ。

アプリが自動で選ぶことはありません。3つの選択肢があります。Cloud(OpenAI、自分のキーを使用)、ローカルのParakeet、またはローカルのWhisperです。プライベートな内容には、まずローカルから始めましょう。詳細は二つ先のセクションで説明します。

モデルのダウンロードが完了して「使用可能」と表示されれば成功です。

ステップ3 — ホットキーを確認してアクセシビリティを許可。

MacのデフォルトはCommand+Optionを押している間だけ録音するプッシュ・トゥ・トークです。アクセシビリティの許可を求められたら許可してください。これがないと、カーソル位置への貼り付けが他のアプリに届きません。ホットキーは変更できます。

テスト録音が任意のテキストフィールドに貼り付けられれば成功です。

ステップ4 — カーソルを置いて話す。

Mail、Notes、または任意のテキストフィールドを開いてクリックし、Command+Optionを押しながら一文話して、離します。カーソルの位置に文字起こし結果が表示されます。

話した内容がきれいなテキストとしてフィールドに入力されれば成功です。

Whisper
Whisperデスクトップアプリの設定画面。「文字起こし」と「AI」パネルが開いている実際の画面。

時間がかかるのは初回のモデルダウンロードだけで、セットアップ自体はすぐ終わります。あとは上記4ステップを繰り返すだけです。基本的な操作感は標準機能と同じ体で覚えられます。違いが出るのは、macOSの音声入力がぐらつき始める長い文章や乱雑な音声のときです。

句読点、コマンド、対応言語

macOSの音声入力では、句読点を音声コマンドで入力します。記号の名前を言うと入力されます。「ピリオド」「コンマ」「疑問符」「感嘆符」のように言います。「改行」や「段落」でテキストを区切ることができ、「ハートの絵文字」のように名前を言って絵文字を入力することも可能です。対応言語では、コンマやピリオドを自動的に追加する機能も使えます。自分でコマンドを言わずに任せたい場合は、音声入力設定に自動句読点のトグルがあります。

Cancel
録音中に表示されるオーバーレイ。話している間、小さなカプセルが表示されて認識中であることがわかります。

専用ツールは句読点の扱い方が違います。コマンドを一つ一つ言う代わりに、話し終えた後にパッセージ全体を一括で整えることができます。一日に何百回も「コンマ」と言い続けるのは疲れるので、これはかなり助かります。さらに、標準機能では解決できない問題にも対応しています。聞き間違えが続く単語の問題です。Whisperにはカスタム語彙機能があるので、いつも使う固有名詞、製品名、略語が正しく入力されるようになります。macOSの音声入力にはそういった辞書登録機能はありません。

言語対応については、どちらも英語以外をサポートしています。AppleはDictationで40以上の言語・地域バリアントに対応していると述べています。Whisperの多言語モデルは99言語をカバーし、英語への翻訳もできます。より高速なParakeetエンジンは英語と24のヨーロッパ言語に対応しています。2か国語で書く場合や翻訳機能が必要な場合は専用ツールが有利です。ただし、英語だけで使うなら差は大きくありません。

ローカルかクラウドか:Mac上で完結させる

macOSの音声入力はApple Siliconでもともとローカル寄りで、端末上で音声処理ができるのが本物の強みです。専用ツールも同じ端末処理の選択肢を用意しつつ、最高精度を求めるときのクラウド経路も選べます。優れたツールはあなたに選ばせます。3つの方式の違いを見てみましょう。

  • ローカル ParakeetNVIDIAのTDTエンジン、約600MB、最速のローカルオプション。CPU上でWhisperより5〜10倍速い。英語と24のヨーロッパ言語、計25言語に対応。英語への翻訳機能はなし。英語または他のヨーロッパ言語で入力するなら、素早く完全オフラインで動作するこの選択肢がおすすめです。
  • ローカル Whisper同じマシンではParakeetより遅いものの、多言語ビルドは99言語をカバーし英語への翻訳も可能。英語専用ビルドはあくまで英語専用で、99言語ではありません。中国語、日本語、韓国語や翻訳が必要な場合はこちらを選んでください。Parakeetにはできません。デフォルトの英語モデルは約480MB。
  • クラウド(OpenAI、BYOK)最高の精度とウェブアクセス。自分のOpenAIキーを使い、料金はOpenAIへの直接課金。デフォルトではgpt-4o-mini-transcribeで文字起こし。インターネット接続が必要なため、マシンの外に出る唯一の方式です。クラウド機能はWhisper Proの一部です。

正直に言うと、Macで入力するもののほとんど、メール、メモ、メッセージ程度であれば、ローカルで十分で、どちらのローカルエンジンもサーバーに何も送りません。クラウドが本領を発揮するのは、難しい録音で最高精度が必要なときや、文の途中でウェブから情報を引き出したいときです。日常の音声入力はまずローカルから始めて、不満を感じたときにだけクラウドに手を伸ばしてください。特定のアプリを中心に使うなら、同じ考え方がApple Notesでの音声テキスト変換にも当てはまります。作業するのはアプリではなく、カーソルです。

句読点なしの文章にしないために

生の音声入力はただの単語の羅列になります。「大家さんに水漏れの件で返信して修理業者が来られる日を聞いて妻もCCに入れてくれ」と言うと、どの音声エンジンでも最初はそのまま句読点なしで出てきます。macOSの音声入力でこれを解決するには、自分でコンマを読み上げるか、自動句読点に任せます。それで動きますが、文を入力しながらリアルタイムで編集している感覚になります。

専用ツールなら、話し終えた後にまとめてクリーンアップできます。Whisperは生のテキストに対してAIをかけ、「えーと」を取り除き、文を整え、句読点を追加してからカーソルに貼り付けることができます。「Hey whisper」という起動フレーズでトリガーします。ローカルモデルではOllamaを通じてマシン上で処理され、クラウドモードではデフォルトでgpt-5-miniが使われます。いずれの場合も届くのは整理された文章で、生のテキストではありません。

Thinking...
AIクリーンアップ処理中のオーバーレイ。整理されたテキストがカーソルに届く前の状態。
元の音声

okay so reply to the landlord about the leak ask when the plumber can come and cc my wife um before friday

整理後

Okay, reply to the landlord about the leak, ask when the plumber can come, and CC my wife before Friday.

この違いは一文では感じにくく、一日の仕事をこなすうちに実感してきます。短いメッセージ一つなら自分で句読点を読み上げても問題ありません。でも十数件のメッセージや長いメモになると、ツールがまとめてきれいにしてくれる仕組みは手放せなくなります。この「話してクリーンアップ」の流れこそが、すべてのアプリで声を使って速く書くを実用的にしているものです。たまに一行を入力するだけにとどまらず。

macOSの音声入力だけで十分なとき

デスクの上に置かれた短い手書きメモ。追加ソフトが不要な素早いタスクを表している

標準機能で十分な場面があります。それを認めないのは不誠実です。短いものが中心の場合、一行のテキスト、素早い検索、30文字程度の返信なら、macOSの音声入力でApple Silicon上で無料かつオフラインで対応できます。「システム設定」でオンにして、好きなショートカットを設定すれば完了です。一文を入力するためだけにアプリを追加する必要はありません。

専用ツールに手を伸ばすのは、標準機能がつらくなってきたときです。長い文章で途中停止する、何度聞いても間違える単語を一度で覚えさせたい、一日に何百回もコンマを読み上げている、リアルタイム編集よりも一括クリーンアップがしたい、そういったときです。「コンマ、ピリオド、段落」と口に出すコストが節約できる時間を上回ったと感じたら、そのタイミングです。その手前であれば、無料のApple標準機能が勝ります。使いましょう。

もう一つ、根本的なハードウェアの話があります。$20のUSBマイクは、標準機能でも専用ツールでも、どんな設定よりも精度を上げます。音声入力がうまく認識されないなら、ソフトウェアを疑う前にマイクを見直してください。macOSの音声入力が止まり続ける場合は、たいてい直せるシステムの問題です。時にはcorespeechdプロセスがCPUを食い尽くしているだけで、機能が壊れているわけではありません。

結局、スイッチ一つと正直な一言に尽きます。macOSの音声入力は長年すべてのMacに搭載されていて、無料で、短い入力なら完璧に機能します。本格的に書くとなったとき、長く、速く、自分だけの言葉で、そのための専用ツールが引き継ぎます。私はこのガイドのほとんどをホットキーで入力しました。コンマを一つも読み上げず、クリーンアップパスが句読点をすべて処理してくれました。家族はもう十分しゃべってると言うでしょうが。

あなたのペースに追いつく音声入力を試す

ホットキーを押して話し、離す。Mac上のどのアプリのカーソル位置にも、きれいなテキストが届きます。コンマを読み上げる必要も、文の途中で止まることもありません。

ログイン済みのアカウントなら、ローカルモードは無料。開始にカードは不要。

Denys Medvedievの写真

Denys Medvediev

サポートメールを読んで返信するのは私の仕事。たぶん返信も音声入力しています。

参考リンク