ガイド
句読点を音声で 入力する方法
「コンマ」「ピリオド」「新しい段落」と声に出せば、単語ではなく記号として入力されます。あるいは、そういったコマンドを一切使わずに普通に話して、AIが句読点を補ってくれる方法もあります。どちらも有効です。ここでは使い分けを解説します。
最終更新:2026年6月

句読点を音声入力するには、話しながら記号の名前を言うだけです。「コンマ」と言えばコンマが入り、「ピリオド」または「フルストップ」と言えばピリオドが、「クエスチョンマーク」と言えば疑問符が入ります。「改行」で1行下がり、「新しい段落」で段落を開始します。Windows 音声入力と macOS 音声入力の両方でこれらの音声コマンドが認識されます。
初めてメールを音声入力したとき、出てきたのは句読点のない長い一文でした。「コンマ」と言えばコンマが入ることは知っていました——ほとんどの人は1分もあれば気づきます。でも誰も教えてくれないのは、「ピリオド」を40回も続けて声に出す奇妙さです。まるで1910年代の電報を読み上げているような気分です。
このガイドでは2つのことを説明します。まず、Windows 音声入力と macOS 音声入力で実際に使える句読点コマンドを正直に教えます——魔法の言葉など存在しません。そして、もう一つの方法として、あなたの流れるような文章を読んで句読点を補ってくれるAIパスを紹介します。コンマをいちいち声に出さなくていいんです。
多くの解説ページが明確にしないポイントを整理します。音声入力テキストに句読点を入れる方法は2つあります。手動で言う——「コンマ」「ピリオド」「新しい段落」——と、音声認識エンジンがその位置に記号を入れます。あるいは何も言わずに話して、あとでソフトウェアが整理する方法です。
手動方式はコントロールが完全:コンマの位置を自分で決められます。自動方式はスムーズさが魅力:人間として普通に話して、ソフトウェアに句読点を判断させます。どちらが「優れている」とは一概に言えません——特定の箇所にコンマが必要か、段落が読みやすければそれでいいかによって変わります。コマンドを教えたうえで、AIという選択肢を示し、私がどちらを使うかもお伝えします。
なぜ音声入力の文章は「ひと息の塊」になるのか

音声認識エンジンは音を聞いて言葉を書き出します。コンマを入れるべき「間」は聞こえませんし、文末のピリオドも見えません。指定しない限り、聞こえた言葉をそのまま書き出すだけ——「それじゃドキュメントをレビューしてマリアに送って木曜日にリマインドして」という一塊が出てきます。これはどのツールでも同じです。
正直な解決策は2つだけで、このガイドの残りはその2つについてです。自分で句読点を読み上げる方法(Windows と macOS の両方が標準でサポート)か、ソフトウェアが後から追加する方法かです。OS自体にも基本的な自動句読点機能があり、専用ツールならフィラーワードも含む本格的なクリーンアップが可能です。
ほとんどの人はコマンド方式から始めます。音声入力をオンにした瞬間から使えるからです。なのでここでも同じ順番で説明します。その後、私が「ピリオド」を声に出すのをやめた理由をお話しします——ほぼ1年間、まるで法廷速記者みたいにやり続けていたんですが。
記号の名前を言えば、記号として入力される
コマンド方式は、一度やってみると簡単です。音声入力中に句読点の名前を言うと、エンジンは単語ではなく記号を書き出します。「ハロー コンマ お元気ですか クエスチョンマーク」と言えば「Hello, how are you?」になります。ポイントは、言った場所に記号が入ること——話しながらリアルタイムで句読点を配置しているわけです。
これは、OS標準の音声入力ツールでも、カーソル位置にテキストを貼り付けるシステム全体ホットキーでも同じように機能します。キーを押して話し、記号の名前を言って、キーを離す。話している間は小さなカプセルが表示されて認識中であることがわかり、テキストはカーソルのある場所——メール、ドキュメント、チャット欄——どこにでも入力されます:
身につけるべき習慣は、記号の前に間を置かないことです。「会議は木曜日 ピリオド」は一息で話してください。「会議は木曜日…ピリオド」のように間を置くと、エンジンが記号ではなく「ピリオド」という単語を書いてしまうことがあります。最初の1日くらいは不自然に感じますが、そのうち脳が慣れていきます——Windows で音声入力を使うホットキーに慣れていくのと同じように。そうなると、もう意識しなくなります。どの言葉がどの記号になるかの一覧は、2つ先のセクションにあります。
AIパスに句読点を追加させる
もう一つの方法は、音声コマンドをまったく使いません。普通の文章で話せば、AIクリーンアップパスがトランスクリプトを読んでコンマ・ピリオド・段落区切りを追加してくれます。Whisper では、音声でトリガーする組み込みのステップとして用意されています。必要なのは、Apple Silicon 搭載の Mac または Windows 10 以降のPC、マイク、そして数分の時間だけ。ローカルパイプライン全体は、サインインしているアカウントなら無料で、サインアップ時にお支払い方法は不要です。手順はこうです。
ステップ1 — Whisper をインストールしてサインイン。
ダウンロードページからダウンロードしてインストールし、無料アカウントを作成します。カード不要。ローカル文字起こしパイプラインがすぐに使えます。
アプリのトレイアイコンが表示され、セットアップウィザードがモデルを選ぶよう案内したら成功です。
ステップ2 — 文字起こし方式を選ぶ。
アプリが自動で選ぶことはありません。3つの選択肢があります:Cloud(OpenAI、自分のキーを使用)、ローカル Parakeet、ローカル Whisper。プライベートなテキストにはローカルがおすすめです——詳しくは2つ先のセクションで。
モデルのダウンロードが完了して「準備完了」と表示されたら成功です。
ステップ3 — ホットキーを確認する。
Windows のデフォルトは Ctrl+Space、Mac はプッシュトーク方式で Command+Option の長押しです。Mac ではアクセシビリティの許可を求められたら承認してください。これがないとカーソル位置への貼り付けが他のアプリに届きません。
テスト録音が任意のテキストフィールドに貼り付けられたら成功です。
ステップ4 — 「Hey whisper」と言って普通に話す。
ホットキーを押し続け、起動フレーズ「Hey whisper」から始めて、句読点コマンドなしで普通の文章を話してください。AIパスがカーソル位置にテキストが届く前に句読点を追加します。
話した流れるような文章がコンマとピリオド付きで届いたら成功です。
それが自動方式の全体像です。速記者から普通に話す人に戻れます。ただし——必ず落とし穴はあるもので——記号の位置を決めるのはAIです、あなたではありません。ほとんどの文章ではそれで問題ありません。問題になるケースでは、手動コマンドがいつでも使えます。最後のセクションで、使い分けを詳しく説明します。
実際に使える音声句読点コマンド
自信を持って紹介できるコマンドを挙げます。Microsoft と Apple が公式にドキュメント化していて、両方のOSで同じように機能するものです。コンマには「コンマ」、ピリオドには「ピリオド」または「フルストップ」、疑問符には「クエスチョンマーク」と言います。改行には「改行」(Return 1回と同じ)、段落開始には「新しい段落」(Return 2回と同じ)です。この5つで日常的な文章のほとんどをカバーできます。
正直なところも言っておきます——この分野はリスト記事が誇張しがちなので。両OSはもっと長いリストの記号に対応しています——感嘆符、コロン、引用符、ダッシュなど——ただしOSのバージョンによって変わる可能性があるため、完全なリストは Microsoft と Apple の公式コマンドページを参照してください。コマンドの言葉は言語や地域によっても多少異なります。英語以外で音声入力する場合は、OSの音声入力ヘルプでローカライズされたコマンドを確認してください。英語の「period」はフランス語では違う言葉になります。
もう一つ知っておくべきことがあります。Windows 音声入力と macOS 音声入力の両方に、コマンドなしで基本的なコンマとピリオドを自動追加する「自動句読点」設定が追加されました。Mac では「システム設定」→「キーボード」→「音声入力」の「自動句読点」トグルで切り替えられます。Windows 音声入力にも設定に同様のオプションがあります。標準ツールでもハンズオフ体験の一端を味わえます。専用AIパスはさらに進んで、フィラーワードや流れるような文章も修正します——でも手短なメモなら、OSの自動句読点を切り替えるだけで十分かもしれません。
ローカルかクラウドか:クリーンアップはどちらで動くのか
AIによる句読点追加の方法を選んだなら、次の問いは「どこで処理するか」です。文字起こしもクリーンアップパスも、自分のマシンで完全にローカル実行できますし、自分の OpenAI キーを使ってクラウドでも動きます。メール・メモ・下書きなど大半のテキストでは、まずローカルを試すことをおすすめします。オフラインで動き、データはノートパソコンの外に出ません。子供の学校や上司の予算についての個人的なメッセージが、句読点を付けたいだけで外部ベンダーのログに残る必要はありません。3つの方式の違いを説明します——アプリが選択を求めてくるので、正しく選べるように:
3つの選択肢をシンプルに:
- ローカル Parakeet — NVIDIAのTDTエンジン、約600MB。CPUでのWhisperより5〜10倍速い最速のローカル選択肢です。英語に加えて24の欧州言語、計25言語に対応。英語への翻訳機能はありません。英語または他の欧州言語で書く場合、手軽に使える完全オフラインの選択肢です。
- ローカル Whisper — 同じマシンでは Parakeet より遅いですが、多言語ビルドは99言語に対応し、英語への翻訳も可能です。英語専用ビルドは99言語ではなく英語のみです。中国語・日本語・韓国語や翻訳作業が必要なら Parakeet では対応できないためこちらを選んでください。デフォルト英語モデルは約480MBです。
- Cloud(OpenAI、BYOK) — 最高の精度とウェブアクセスを実現。OpenAI から直接請求される自分の OpenAI キーを使用します。文字起こしはデフォルトで gpt-4o-mini-transcribe で動きます。インターネット接続が必要で、マシンの外にデータが出る唯一の方式です。Cloud 機能は Whisper Pro の一部です。
AIクリーンアップ専用の話をすれば、ローカルパスは自分のマシン上の Ollama を通じて動き、クラウドパスはデフォルトで gpt-5-mini を使います。つまらない真実を言うと、普通の文章へのコンマとピリオドの追加なら、ローカルで十分に対応できます。クラウドが活躍するのは、難しい録音で最高精度が必要な場合や、文の途中でウェブから情報を引き出す必要がある場合です。句読点だけが目的なら、まずローカルで始めてください。
AIクリーンアップパスが実際にテキストに何をするか
これが私が「コンマ」を声に出すのをやめた理由です。生の音声入力は流れっぱなしになります——「それじゃアーキテクチャのドキュメントをレビューしてプロジェクトアルファのタグをつけて木曜日のスタンドアップ前にリマインドして」という、句読点ゼロの塊が音声認識エンジンから返ってきます。クリーンアップパスがそれを読んで、実際に送れる文章に整えてくれます。
Whisper では起動フレーズ「Hey whisper」で始めることでトリガーされ、カーソルに届く前にテキストが整えられます。コンマとピリオドが追加され、流れるような文章がセンテンスに区切られ、保持したくなかった「えーと」や言い直しが取り除かれます。ローカルモデルでは Ollama を通じて動き、クラウドモードではデフォルトで gpt-5-mini が使われます。句読点コマンドは一つも言っていません——ただ話しただけです。
okay so review the architecture doc tag it project alpha and remind me thursday um before the standup
Okay, so review the architecture doc, tag it Project Alpha, and remind me Thursday before the standup.
正直な限界もあります。AIはあなたの意図を推測しています。よくできていて——普通の文章なら10回中9回は信頼できます——ただし、文の終わりやコンマの位置については判断を下しています。メールや下書きではそのトレードオフは正しい選択です。コンマの位置が意味を変えるような場合には、そうではありません。それが次のセクションの全テーマです。
この「話してから整える」フローは句読点だけでなく大きな効果を発揮します——あらゆるアプリで音声入力を使ってより速く書くことができるので、タイプしていた段落が話した数文になり、すでに整った状態で届きます。
自分で句読点を言うべき場面

手動コマンドが正解の場面もあります。AIがすべてを処理するように見せかけるのは正直ではありません。経験則:記号の位置が意味を持つ場合は、自分で言いましょう。AIの推測は優秀ですが、あくまで推測です——推測に任せたくない場面があります。
私が記号を声に出すのは3つのケースです。一つ目は句読点が意味を変える場合——契約書の条項、医療指示、「さあ食べよう、おばあちゃん」とおばあちゃんが夕食になるバージョンの違い。二つ目はコードや構造化テキスト——コンマやコロンはスタイルではなく構文であり、AIはあなたが設定ファイルを書いていることを知りません。三つ目は自動句読点が選んでくれない特定の記号——リストの前のコロン、本当に入れたい感嘆符、文法的には平叙文だが疑問符を付けたい文。そういった箇所では、音声コマンドが入力→確認→修正よりも速くて確実です。
短い内容なら、標準機能で十分です。2行のメッセージを送るなら、Windows 音声入力(Windows キー + H)も macOS 音声入力も基本的な句読点を自動で追加してくれます。何もインストールする必要はありません。Windows 音声入力の注意点は、Microsoft のサーバーを経由するためインターネット接続が必要で、オフラインでは使えないことです。文章が長くなったり、多言語になったり、プライバシーが気になったりしたとき——あるいは「ピリオド」という言葉を二度と声に出したくなくなったとき——専用ツールを選んでください。
同じトレードオフは Mac でも当てはまります。音声入力の標準句読点機能は短いメモには十分です——Mac でのテキスト音声入力も同じ考え方です:位置が重要な場合は記号を自分で言い、そうでないときはツールに任せる。
まとめるとこうなります。記号を特定の場所に入れたいなら「コンマ」「ピリオド」「クエスチョンマーク」「改行」「新しい段落」と言う。普通に話して英語らしく読めればいいなら、AIパスに任せる。このガイドの大部分は後者の方法で音声入力しました。400個のコンマを声に出す代わりに「Hey whisper」と言って、手動コマンドを使ったのはサンプル文を書くときだけ——このガイドで唯一、「ピリオド」と声に出すことに意味があった場面でした。
もう「ピリオド」と声に出すのはやめましょう
普通の文章で話して「Hey whisper」と言えば、AIパスがカーソルに届く前にコンマとピリオドを追加してくれます。
サインインしているアカウントなら無料のローカルモードが使えます。開始時にカード不要。



