チュートリアル
音声入力で Airtableに
Airtableには、デスクトップアプリにもブラウザにもモバイルアプリにも、組み込みの音声入力機能がありません。解決策は、システム全体で動くツールを使うこと。ホットキーを押して話せば、文字起こしされたテキストがそのままカーソル位置に貼り付けられます。Airtableのセル、長文フィールド、コメント、どこでも同じです。短い入力ならOSの音声入力でも対応できます。
最終更新:2026年6月

Airtableでの音声入力は、Airtable自体ではなく、システム全体で動くツールを通して実現します。Airtableには、ブラウザにもデスクトップアプリにもモバイルにも、組み込みの音声入力機能がありません。解決策はWhisperのようなツールです。ホットキーを押して話せば、文字起こしされたテキストがカーソル位置に貼り付けられます。セル、長文フィールド、コメント、どこでも同じです。短い入力なら、OSの音声入力でも対応できます。
私はアプリのリリースをすべて記録するベースを運用しています。バージョンごとに1行、変更履歴用の長文フィールド、そして自分自身とスコープについて議論するコメントスレッド。長いあいだ、私はそのすべてを手で打ち込んでいました。ある日、長文フィールドにマイクのボタンがないかと探し始めたのです。これだけデータの構造化が得意なツールなら、きっと話しかけて入力できるはずだと思って。でも、マイクのボタンはありませんでした。かなり調べてみましたが、Airtableがどこかに隠し持っているわけでもないと、今では確信しています。
「Airtable 音声入力」と検索しても、アプリ内には何も見つからず、設定のどこかを見落としたのだと思い込む人がいます。そうではありません。そのスイッチはそもそも作られていないのです。良い知らせは、解決策が2分ほどで済み、望むなら完全にオフラインで動き、おまけにあなたが開く他のすべてのアプリでも使えること。
ほとんどのページがこのキーワードの周りで言葉を濁して、はっきり言わないことがあります。Airtableのセルは、ただのテキストボックスです。Gmailや検索バーと同じ。長文フィールドや行コメントは、もう少し大きなテキストボックスにすぎません。カーソル位置に貼り付ける音声入力は、そのボックスがどれかなど気にしません。
だから本当の問いは「Airtableで音声入力をどうやってオンにするか」ではないのです。スイッチなどありません。問うべきは「Airtableの上にどの音声入力ツールを走らせるか」であり、その答えは、無料で組み込み済みがいいのか、ブラウザ専用でいいのか、それともどこでも同じ動きをするオフラインのホットキーが1つほしいのか、によって変わります。すべてを順に見ていき、2分でセットアップし、専用ツールを使わなくていい場合もお伝えします。
Airtableに組み込みの音声入力はある?

ありません。Airtableには、セル、長文フィールド、コメントに音声でテキストを入力するための、組み込みの音声認識、音声入力、ディクテーション機能がありません。ブラウザにも、デスクトップアプリにも、モバイルにもです。フィールドにマイクボタンはなく、音声コマンドもなく、隠れた設定もありません。設定画面をくまなく探していたなら、もうやめて大丈夫。そこにはないのです。
実在するのは音声の文字起こしで、ここで人は混乱します。音声ファイルを添付フィールドにアップロードし、Airtable AIや自動化を通せば、文字起こしの結果を得られます。それは便利ですが、ライブの音声入力ではありません。セルにカーソルを置いて話し、言葉が現れていくのを見る、ということはできません。これらのワークフローは録音済みのファイルを後から処理するもので、あなたが考えている最中に代わりに入力してくれるわけではないのです。この2つを混同すると、別の問題を解く自動化の配線に午後を1つ費やすことになります。その午後は省いてほしいので、ここではっきりさせておきます。
この問題のために作られたサードパーティ製ツールでさえ、率直に認めています。「Airtable 音声入力」で上位に出るブラウザ拡張機能や音声入力アプリは、まず「Airtableにはネイティブの音声入力がない」と切り出してから、外側から後付けしましょうと提案するのです。診断は正しい。ほとんどの人が実際に作業するデスクトップアプリやブラウザのグリッドでは、Airtableの上に乗るツールが必要になります。正直な選択肢は3つあり、このガイドの残りでそれらをすべて扱います。
ホットキーを押して話す、テキストがセルに着地する
これが仕組みのすべてで、いい意味で退屈なほど単純です。ホットキーを押し、話し、離す。すると文字起こしが、フォーカスのあるテキストフィールドのカーソル位置に貼り付けられます。Whisperはキーを離した後も少しの間だけ録音を続けるので、最後の単語が切れません。OSのカーソル位置に貼り付けるので、Airtableのセルも「ただのテキストボックス」にすぎないのです。デスクトップアプリでもブラウザ版でも、動きは同じ。
ここが、ランディングページが必要以上に複雑にしてしまう部分です。認証すべきAirtable連携も、貼り付けるAPIキーも、面倒を見るべき自動化もありません。カーソルがセルにあり、話せば、言葉がセルに現れる。話している間は小さなカプセルが表示され、ちゃんと聞き取っていることが分かります。
ホットキーだけは、最初にきちんと決めておく価値があります。Windowsでは Ctrl+Space、Macでは Command+Option で、これは話している間だけ押し続ける修飾キーのみのプッシュ・トゥ・トークです。どちらも、すでに使っている操作とぶつかる場合は設定で変更できます。(うちの下の娘が以前、お絵かきアプリで「ホットキーが効かない」と言ってきたことがありました。原因はバグではなく、キーの競合でした。これで、普通の人はホットキーの競合という概念さえ知らないのだと学びました。だから今では、どのホットキーもカスタマイズできるようにしてあります。)もし以前にWindowsで音声入力 や Macで を設定したことがあるなら、これは同じ筋肉の記憶を別のアプリに向けるだけです。
2分でセットアップ(WindowsまたはMac)
必要なのは、Apple SiliconのMacかWindows 10以降のPC、動作するマイク、そしてデスクトップアプリかブラウザのどちらかで開いたAirtableです。ローカルのパイプライン全体は、サインインしたアカウントなら誰でも無料で、サインアップ時に支払い方法を聞かれることはありません。手順は次のとおり。
ステップ1 — Whisperをインストールしてサインイン。
ダウンロードページからダウンロードし、インストールして、無料アカウントを作成します。カードは不要。ローカルの文字起こしパイプライン全体がすぐに使えるようになります。
アプリのトレイアイコンが現れ、セットアップウィザードがモデルの選択を促してきたら、うまくいった証拠です。
ステップ2 — 文字起こしの経路を選ぶ。
アプリは代わりに選んでくれません。3つの選択肢があります。クラウド(OpenAI、自前のキーを使用)、ローカルのParakeet、ローカルのWhisper。日々のベースへの入力には、まずローカルから始めましょう。詳しくは2セクション先で。
モデルのダウンロードが完了し、準備完了と表示されたら、うまくいった証拠です。
ステップ3 — ホットキーを確認する。
Windowsの既定は Ctrl+Space、Macは Command+Option をプッシュ・トゥ・トークとして押し続けます。Macでは、求められたらアクセシビリティの権限を許可してください。これがないと、カーソル位置への貼り付けが他のアプリに届きません。
テスト録音がどれかのテキストフィールドに貼り付けられたら、うまくいった証拠です。
ステップ4 — Airtableのフィールドにカーソルを置いて話す。
ベースを開き、セル、長文フィールド、コメント欄のいずれかをクリックし、ホットキーを押し続けて一文を話し、離します。文字起こしがカーソルのある場所に現れます。
話した一文がテキストとしてAirtableのフィールドに収まっていたら、うまくいった証拠です。
時間がかかるのはモデルのダウンロードであって、セットアップではありません。それ以外は上の4ステップだけ。一度動き出せば、長文フィールドを埋めるのは「打つ作業」ではなく「話す作業」になります。
短いセル、長文フィールド、そしてコメント
Airtableはテキストボックスが1種類ではなく、3種類あります。そして音声入力はそのすべてを同じように扱います。カーソルはカーソルだからです。1行のセルには、名前、ステータス、タイトルといった短い値をさっと入れます。長文フィールドには段落を入れますが、ここがまさに音声が本領を発揮する場所です。段落こそ、タイピングが遅くなるところだからです。行コメントには、行を読みながら片手でぽつぽつ打つような一文を入れます。同じホットキー、3つの違うボックス。
このキーワードで上位に出るほとんどのページは、ブラウザ拡張機能を勧めてきます。Voice InやVoicyのような、ウェブページ上のどんなテキストフィールドにも音声入力を追加してくれるもので、Airtableも含まれます。ブラウザのタブの中で暮らしているなら、拡張機能は十分に良い答えです。ただし構造的な限界が1つあります。ブラウザが届く範囲でしか動かないのです。Airtableのデスクトップアプリはブラウザのタブではないので、Chromeの拡張機能からは見えません。システム全体のホットキーなら見えます。どのウィンドウが所有しているかに関係なく、OSのカーソル位置に貼り付けるからです。
そこが本当の分かれ目です。拡張機能はブラウザの範囲、ホットキーはすべての範囲。Airtableの長文フィールドを埋めるのと同じキーが、Gmailの作成画面も、Slackのメッセージも、コミットメッセージ も埋めてくれます。1つのツールで、あらゆるテキストフィールドを、WindowsでもMacでも。Airtableをいつもブラウザのタブでしか触らないなら、拡張機能で十分ですし、無料のものもいくつかあります。けれどデスクトップアプリを開いた瞬間、あるいはどのプログラムでも同じ流れがほしくなった瞬間に、システム全体のやり方が勝ります。私なら1つのホットキーに手を伸ばします。1時間に40回くらいアプリを切り替えるので、40種類もの音声入力ボタンを覚えておきたくないからです。
ローカルかクラウドか:あなたのベースにはどちらか
Airtableなら、まずローカルモードを試してください。ベースに入る情報の多くは、ベンダーのログに通したくないたぐいのものです。顧客のメモ、価格の列、社内のロードマップ、同僚のアイデアについてのコメント。MacがApple Siliconか、PCがここ数年のものなら、ローカルは日々の音声入力を文句なくこなしますし、クラウドは既定ではなく非常口になります。
3つの経路がどう違うかを示します。アプリが必ず選ばせるので、うまく選べるようにしてほしいからです。
- ローカル Parakeet — NVIDIAのTDTエンジンで、約600 MB、ローカルで最速の選択肢です。CPU上のWhisperより5〜10倍速い。英語に加えてヨーロッパの24言語、合計25言語をカバーします。英語への翻訳機能はありません。ベースを英語か他のヨーロッパ言語で埋めるなら、これが手早く完全にオフラインな選択肢です。
- ローカル Whisper — 同じマシンではParakeetより遅いものの、多言語版は99言語をカバーし、英語への翻訳もできます。英語専用版は英語専用で、99言語ではありません。中国語、日本語、韓国語、あるいは翻訳作業にはこちらを選んでください。Parakeetにはできないことです。既定の英語モデルは約480 MBです。
- クラウド(OpenAI、BYOK) — 最高の精度とウェブアクセス。自分のOpenAIキーを使い、料金はOpenAIから直接請求されます。文字起こしは既定で gpt-4o-mini-transcribe で動きます。インターネットが必要なので、唯一マシンの外に出る経路です。クラウド機能はWhisper Proの一部です。
面白みのない真実ですが、ほとんどの人がベースに入れるたぐいのテキストには、ローカルで十分です。どちらのローカルエンジンも完全にマシン上で動き、サーバーには何も送られません。クラウドが活きるのは、難しい録音で最高水準の精度がほしいときや、文の途中でモデルにウェブから事実を引いてきてほしいときです。日々のデータ入力は、まずローカルから始めて、ローカルでは物足りないと感じたときだけクラウドに手を伸ばしてください。
句読点、整形、そして音声でのAirtableの構造づくり
生の音声入力は、だらだらと続く一文になって出てきます。「えーとじゃあステータスをレビュー中にしてマリアに割り当てて予算が約12パーセント超過してるって書いといて」と話せば、どんな音声エンジンもそのまま、句読点のない文字の壁を返してきます。それを整えるところで、経路が分かれます。
Windowsの音声入力は話すそばから句読点を付けてくれますし、macOSのDictationは「カンマ」「ピリオド」と言えば基本的な句読点に対応します。もっと本格的な整形——「えー」を取り除く、だらだら文を直す、話した段落を実際に長文フィールドに残したい形にする——には、WhisperがAIによる仕上げをかけられます。起動フレーズの「Hey whisper」と言えば、着地する前にテキストが整えられます。ローカルモデルではOllamaを通して動き、クラウドモードでは既定で gpt-5-mini が使われます。
えーとじゃあステータスをレビュー中にしてマリアに割り当てて予算が約12パーセント超過してるって書いといてあスプリントが終わる前に
では、ステータスをレビュー中にして、マリアに割り当て、スプリントが終わる前に予算が約12パーセント超過していると書いておいてください。
Airtable自体の構造——単一選択から値を選ぶ、レコードをリンクする、日付フィールドを設定する——については、正直に言えば、音声はテキストを入れてくれて、構造はAirtable自身のインターフェースが作ってくれる、ということです。長文フィールドを音声で入力したら、単一選択はドロップダウンをクリックし、リンクするレコード名はいつもどおりに入力します。Airtableのフィールドタイプを命令一つで生み出してくれる音声入力ツールはありません。「ステータスをレビュー中と言えば選択肢を選んでくれる」と約束する人がいたら、それは普段使いではなくデモを売っているのです。言葉は音声で素早く落とし込み、レコードはあなたがすでに知っている操作で形づくりましょう。
その「話してから整える」流れは、ベースの外でも大いに役立ちます。1つのホットキーでどんなアプリにもきれいな文章を音声入力 できるので、長いコメントも、打ち込む段落ではなく、いくつかの話した文になります。
Airtableで音声入力ツールを使わなくていいとき

ときには、正しいツールがすでにマシンにある無料のもので、そうでないふりをするのは不誠実です。ベースに短い値——ステータス、名前、2語のタグ——を入れるだけなら、OSがそれを無料でこなしてくれます。
Windowsでは、Windowsキー + H を押すと、組み込みの音声入力バーがカーソルのある場所に開きます。Airtableのセルも含まれます。自分で句読点を付けてくれて、短いひと吹きには十分です。ただし注意点があります。Microsoftのサーバーを経由し、インターネット接続が必要なので、オフラインの選択肢ではありません。列に人に見せたくないものが入るときには、これが効いてきます。Macでは、Dictationが、入力できる場所ならどこでも音声でテキストを入れさせてくれます。設定はシステム設定の「キーボード」から行い、Apple Siliconでは一般的なテキストをデバイス上で処理できます。1行のセルにさっと入れるだけなら、どちらの組み込み機能も賢い選択です。
専用のシステム全体ツールに手を伸ばすのは、組み込み機能が辛くなってきたとき——長文フィールド、多言語の入力、Windowsでのオフラインのプライバシー、あるいはAirtableでもメールでもエディタでも同じ動きをするホットキーが1つほしいとき——です。その基準より下なら、無料のものを使えばいい。ステータスフィールドを1つ音声入力するためにアプリをインストールしろ、なんて私は言いません。
同じトレードオフは、あなたの仕事がトラッカーの中にもあるなら現れます。Jiraへの音声入力 のロジックも同じです。どちらもフィールドとコメントのツールであり、本当のつながりは連携ではなくカーソルだからです。
Airtableはマイクボタンを一度も出荷しませんでしたし、これを書いた今、これからも出さないだろうと私はかなり確信しています。出す必要がないのです。カーソルこそが連携だからです。セルに話しかけ、テキストを得て、あなたがすでに知っている操作でレコードを形づくる。このガイドのほとんどは、Airtableではないテキストボックスに、どのボックスかなど気にしないツールで音声入力し、その全部を、私が下書きをためている長文フィールドに貼り付けたものです。これが、からくりのすべてです。
次のAirtableのフィールドで試してみる
ホットキーを押し続けて、話して、離す。文字起こしが、カーソルのあるセル、長文フィールド、コメントに着地します。そして、他のあらゆるアプリでも。
サインインしたアカウントなら誰でもローカルモードが無料。始めるのにカードは不要です。



