Denys Medvediev

ガイド

音声からテキストへ Coda で

Coda には音声入力機能が組み込まれていません。解決策はシステム全体で動くツールです。ホットキーを押して話せば、Coda のどのドキュメント、テーブルのセル、キャンバスでも、文字起こしがカーソル位置に貼り付けられます。短い入力なら OS の音声入力も使えます。

最終更新: 2026年6月

暗い机の上、コーヒーカップの隣に置かれたノートパソコンとノート。計画と音声入力を思わせる風景

Coda での音声からテキストへの入力は、Coda 自体ではなくシステム全体で動くツールを通して実現します。Coda には音声入力機能が組み込まれていません。解決策は Whisper のようなツールです。ホットキーを押して話せば、どのドキュメント、テーブルのセル、キャンバスでも文字起こしがカーソル位置に貼り付けられます。短い入力なら OS の音声入力も使えます。

私は Coda でいくつかのトラッカーを動かしています。読書ログと、Coda が本当に得意とするネストしたテーブルを使ったサイドプロジェクト用のボードです。ずっと欲しかったのは、行をタイプするのではなく話して入力することでした。そこで音声入力の設定を探しに行きました。音声入力の設定はありません。Coda にはマイクボタンがなく、ドキュメントとメーカーコミュニティをかなり掘り下げた末に、隠された設定もないと確信しています。

人々は「Coda での音声からテキスト」を検索し、アプリ内で何も見つからず、トグルを見落としたと思い込みます。見落としてなどいません。そのトグルは最初から作られていないのです。良い知らせは、解決には2分ほどしかかからず、望めば完全にオフラインで動き、おまけに開く他のすべてのアプリでも使えることです。

このキーワードの周りで言葉を濁すほとんどのページが、はっきり言わないことがあります。Coda のドキュメント、テーブルのセル、キャンバスのテキスト――それらはすべて、Gmail や検索バーと同じ、ただのテキストボックスです。カーソル位置に貼り付ける音声入力は、カーソルがどのアプリにあるかを気にしません。

だから本当の問いは「Coda で音声入力をどうオンにするか」ではありません。スイッチなどないのです。問いは「Coda の上でどの音声入力ツールを動かすか」であり、その答えは、無料のブラウザ拡張機能が欲しいのか、OS の音声入力か、それともブラウザでもデスクトップアプリでも同じように動く一つのオフライン・ホットキーが欲しいのかによります。すべて解説して、2分でセットアップし、専用ツールを使わなくていい場面もお伝えします。

Coda に音声入力機能は組み込まれている?

机でノートパソコンのキーボードを打つ手。タイピングと音声入力を対比させている

いいえ。Coda には、声でドキュメントに書き込むための音声認識・音声入力・音声タイピング機能が組み込まれていません。行にマイクボタンはなく、音声コマンドも、隠れた設定もありません。設定を探してきたなら、もうやめて大丈夫です。それは存在せず、メーカーコミュニティは2021年から要望し続けていますが、実装されていません。

存在するのは ElevenLabs Voice AI という Coda のパックですが、ここで人々は混乱します。そのパックは逆方向に働きます――ドキュメントのテキストを音声に変えるのです。これは音声からテキストではなく、テキストから音声です。ドキュメントを読み上げてほしいなら便利ですが、行を話して入力したいなら役に立ちません。同じ機能のように聞こえて、まったく正反対なのです。こうした命名の衝突は午後をまるごと無駄にしかねません。その午後を無駄にしてほしくないのです。

ブラウザ拡張機能の話も一段落分の価値があります。間違ったセットアップに迷い込まないために。Chrome と Edge の人気拡張機能に Voice In があり、ブラウザ版の Coda を含めウェブページに音声入力できます。これは機能しますが、一つ構造的な落とし穴があります。ブラウザ拡張機能なので、Coda がタブにあるときしか届きません。Coda のデスクトップアプリを開くと、拡張機能はそれを見ることができません。これは2つ先のセクションで詳しく。今のところのポイントは、Coda の中には何もないということです。その上に乗るツールが必要です。

ホットキーを押して話せば、テキストがセルに着地する

これが仕組みのすべてで、いい意味で退屈です。ホットキーを押し、話し、離すと、文字起こしがカーソル位置の――フォーカスのあるどんなテキストフィールドにでも――貼り付けられます。Whisper はキーを離した後も短い余韻を保つので、最後の言葉が切れません。OS のカーソル位置に貼り付けるので、Coda のテーブルセルは単なる「どんなテキストボックス」でもあります。ブラウザのタブでもデスクトップアプリでも、同じ動作です。

ランディングページが複雑にしすぎているのはこの部分です。Coda にインストールするパックも、貼り付ける API トークンも、世話をする自動化もありません。カーソルがセルにあって、話せば、言葉がセルに現れます。話している間は小さなカプセルが表示され、聞き取り中だとわかります。

Cancel
録音オーバーレイ。話している間に現れる小さなカプセルで、Whisper が聞き取り中だとわかります。

ホットキーは最初にきちんと押さえておく価値のある唯一のことです。Windows では Ctrl+Space、Mac では Command+Option――話しながら押さえる、修飾キーだけのプッシュ・トゥ・トークです。どちらも、すでに使っている何かと衝突するなら設定で変更できます。(下の娘が以前、お絵かきアプリでホットキーが「効かない」と言ったことがあります。バグではなく衝突でした。これで、普通の人はホットキーの衝突が何なのかすら見当もつかないのだと学びました。だから今ではどのホットキーもカスタマイズできます。)これまでに Windows での音声入力Mac での音声入力 を設定したことがあるなら、これは同じ手の覚え方を別のアプリに向けるだけです。

2分でセットアップ(Windows でも Mac でも)

必要なのは、Apple Silicon の Mac か Windows 10 以降の PC、動作するマイク、そしてデスクトップアプリかブラウザタブで開いた Coda です。ローカルのパイプライン全体は、サインインしたアカウントなら誰でも無料で、サインアップ時に支払い方法を尋ねられることもありません。手順は次のとおりです。

ステップ1 — Whisper をインストールしてサインイン。

ダウンロードページから入手し、インストールして、無料アカウントを作成します。カードは不要。ローカルの文字起こしパイプライン全体がすぐに開きます。

アプリのトレイアイコンが現れ、セットアップウィザードがモデル選択を提案したら成功です。

ステップ2 — 文字起こしの方法を選ぶ。

アプリは代わりに選んでくれません。3つから選びます。Cloud(OpenAI、自分のキーを使う)、Local Parakeet、Local Whisper。日々の Coda メモには、まずローカルから始めましょう――詳しくは2つ先のセクションで。

モデルのダウンロードが完了し、準備完了と表示されたら成功です。

ステップ3 — ホットキーを確認する。

Windows は既定で Ctrl+Space、Mac は Command+Option をプッシュ・トゥ・トークとして押さえます。Mac では、求められたらアクセシビリティ権限を許可してください。それがないと、カーソル位置への貼り付けが他のアプリに届きません。

テスト録音がどのテキストフィールドにでも貼り付けられたら成功です。

ステップ4 — Coda のセルにカーソルを置いて話す。

ドキュメントを開き、セルかキャンバスのテキスト行をクリックして、ホットキーを押さえ、一文話し、離します。文字起こしがカーソルのある場所に現れます。

話した一文が Coda のセルにテキストとして収まっていたら成功です。

Whisper
本物の Whisper デスクトップアプリの設定画面。Transcription と AI のパネルが開いています。

時間がかかるのはモデルのダウンロードで、セットアップではありません。それ以外はすべて上の4ステップです。動き始めれば、Coda のテーブルの行を埋めるのはタイピングの作業ではなく、話す作業になります。

Windows での音声からテキスト · Mac での音声入力

ブラウザの Coda とデスクトップアプリ

Coda は2つの形で提供されています――ブラウザ版と、Mac・Windows 向けのデスクトップアプリ――そして、どの音声入力ルートが効くかは、どちらを使うかによります。このキーワードで上位に出るほとんどのページは、Chrome と Edge の拡張機能 Voice In をまっすぐ勧めます。一つ構造的な制限がある以外は良い選択です。ブラウザ拡張機能なので、Coda がそのブラウザのタブにあるときしか届きません。Coda のデスクトップアプリを動かすと、拡張機能はそのウィンドウを見ることすらできません。

システム全体のホットキーはそれを回避します。どのウィンドウが所有していようと OS のカーソル位置に貼り付けるので、ブラウザで Coda のセルを埋める同じキーが、Coda のデスクトップアプリのセルも、Gmail の作成欄も、Slack のメッセージも、そして コミットメッセージ も埋めます。一つのツールで、あらゆるテキストフィールド、ブラウザでもネイティブアプリでも。切り替えても学び直すことは何もなく、今日たまたまどう Coda を開いているかによって別の解決策を用意する必要もありません。

Coda にブラウザタブでしか触れず、デスクトップアプリは決して使わないなら、拡張機能はすっきりした、的を絞った選択肢で、見てみる価値があります。Coda のデスクトップアプリを使った瞬間、あるいは開くすべてのプログラムで同じ流れが欲しくなった瞬間、システム全体のルートが勝ちます。私は一つのホットキーに手を伸ばします。1時間に40回くらいアプリを切り替えるので、覚えるべき40個の違う音声入力ボタンなど欲しくないからです。

ローカルかクラウドか:ドキュメントにはどのモード

たいていの Coda 作業には、まずローカルモードを試してください。Coda のドキュメントに着地するものの多くは、ベンダーのログを通したくない類いのものです――プロジェクト計画、クライアントのメモ、テーブルの中の生煮えのアイデア。Mac が Apple Silicon なら、あるいは PC がここ数年のものなら、ローカルは日々の音声入力を文句なくこなし、クラウドは既定ではなく非常口になります。

3つの方法がどう違うかを示します。アプリが選択を迫るので、上手に選んでほしいからです。

  • Local ParakeetNVIDIA の TDT エンジン、約600 MB、そして最速のローカルオプション――CPU 上で Whisper の5〜10倍速い。英語に加え24のヨーロッパ言語、合計25言語をカバー。英語への翻訳はなし。英語や別のヨーロッパ言語で作業するなら、これが手早く、完全にオフラインの選択肢です。
  • Local Whisper同じマシンで Parakeet より遅いですが、多言語版は99言語をカバーし、英語に翻訳できます。英語専用版は英語専用で、99言語ではありません。中国語、日本語、韓国語、あるいは Parakeet にできないどんな翻訳作業にも、これを選んでください。既定の英語モデルは約480 MB です。
  • Cloud(OpenAI、BYOK)最高の精度とウェブアクセス。自分の OpenAI キーを使い、OpenAI から直接請求されます。文字起こしは既定で gpt-4o-mini-transcribe で動きます。インターネットが必要なので、唯一マシンの外に出るルートです。Cloud の領域は Whisper Pro の一部です。

退屈な真実は、ほとんどの人が Coda に入れる類いのテキストには、ローカルで十分だということです。両方のローカルエンジンは完全にマシン上で動き、サーバーには何も送りません。クラウドが活きるのは、難しい録音で最高水準の精度が欲しいときや、文の途中でモデルにウェブから事実を引っぱってほしいときです。日々のドキュメント習慣には、ローカルから始め、ローカルでは物足りないときだけクラウドに手を伸ばしましょう。

句読点、整え、そして Coda の書式を声で

生の音声入力は、だらだら続いた一文になって出てきます。「えーとじゃあ行を追加してローンチドキュメントをレビュー担当は私期限は木曜ステータスはブロック」と言えば、それがどの音声エンジンも渡してくる句読点なしの壁です。それを整えるところで、方法が分かれます。

Windows の音声入力は話すそばから句読点を付け、macOS のディクテーションは「カンマ」や「ピリオド」と言えば基本的な句読点を扱います。もっと重い整え――「えーと」を取り除き、だらだらを直し、話した文をドキュメントに本当に残したくなるものに変える――には、Whisper が AI による処理を走らせます。起動フレーズ「Hey whisper」と言えば、着地する前にテキストが整えられます。ローカルモデルではこれは Ollama を通して走り、クラウドモードでは既定で gpt-5-mini です。

Thinking...

えーとじゃあ行を追加してローンチドキュメントをレビュー担当は私期限は木曜えーとスタンドアップの前に

整え後

では、行を追加: ローンチドキュメントをレビュー、担当は私、期限は木曜、スタンドアップの前まで。

Coda 自体の構造――テーブルを作る、列の型を設定する、選択肢を追加する、数式を書く――については、正直な答えはこうです。声はテキストをもたらし、構造は Coda 自身のインターフェースがもたらします。セルの中身を音声入力したら、いつもどおりにテーブルを作り、列の型を設定します。命令一つで Coda のテーブルスキーマを生み出す音声入力ツールなどありません。「3列のテーブルを新規作成と言って組み上がるのを見て」と約束する者は、火曜日の現実ではなくデモを売っているのです。言葉は声で素早く落とし込み、ドキュメントの形はすでに知っているコントロールで整えましょう。

その「話してから整える」流れは、ドキュメントの域をはるかに超えて役立ちます――一つのホットキーで どんなアプリにもきれいな文章を音声入力 できるので、長い段落は打ち込むものではなく、話す数文になります。

Coda で音声入力ツールを使わなくていいとき

舗道にチョークで描かれた、別々の方向を指す2本の矢印。ツール選びを表している

ときには、正しいツールはすでにマシンにある無料のものであり、そうでないふりをするのは不誠実です。Coda に短い入力――さっとした行、二語のステータス――を落とすだけなら、OS がただで賄います。

Windows では、Windows キー + H を押すと、組み込みの音声入力バーがカーソルのある場所――Coda のセルを含む――に開きます。自分で句読点を付け、短い入力には十分です。落とし穴は、Microsoft のサーバーを経由しインターネット接続が必要なので、オフラインの選択肢ではないことです。Mac では、ディクテーションを使えば入力できる場所ならどこにでも声でテキストを入れられ、システム設定の「キーボード」で設定し、Apple Silicon では一般的なテキストをデバイス上で処理できます。そして Coda をブラウザタブでしか使わないなら、Voice In 拡張機能はまさにそのために作られた、的を絞った無料の選択肢です。

組み込みのものがつらくなってきたら、専用のシステム全体のツールに手を伸ばしましょう。長いメモ、多言語作業、Windows でのオフラインのプライバシー、タブではなく Coda のデスクトップアプリ、あるいは Coda でもメールでもエディターでも同じように動く一つのホットキーが欲しいとき。その水準を下回るなら、無料のものを使いましょう。一行のステータス更新のためにアプリをインストールしろとは言いません。

同じ天秤は、他のツールでも仕事を抱えているなら現れます――Google ドキュメントへの音声入力 のロジックも同じです。そこでもプラグインではなくカーソルが本当の統合だからです。

さらに読む

Coda はマイクボタンを一度も出荷しませんでしたし、これを書いた今、これからも出さないとかなり確信しています。出す必要がないのです。なぜなら、カーソルこそが統合だからです。セルに話しかけてテキストを得て、すでに知っているコントロールでドキュメントを整える。私はこのガイドの大半を、Coda ではないテキストボックスに、どのボックスかを気にしないツールで音声入力し、それをまとめてドキュメントに貼り付けました。それがからくりのすべてです。

次の Coda ドキュメントで試す

ホットキーを押さえ、話し、離す。文字起こしはカーソルのあるどのセルにでも着地します――そして他のすべてのアプリでも。

サインインしたアカウントなら誰でも無料のローカルモード。開始にカードは不要です。

Denys Medvediev の写真

Denys Medvediev

サポートメールを読んでいるのは私です。たぶん返信も音声入力しています。