Denys Medvediev

チュートリアル

Canvaで音声入力: ホットキーで口述する

Canvaにはリアルタイムの音声入力機能はありません。Magic Writeはプロンプトから文章を生成し、Speech to Textはファイルを文字起こしします。Canvaのテキストボックスやコメント、Docに自分の言葉を話して入力するには、Whisperのようなシステム全体で使えるデスクトップのホットキーを使います。

最終更新:2026年6月

ノートパソコン、ノート、カラースウォッチが並ぶデザイナーのデスク。ビジュアルな制作作業の様子

Canvaの音声入力は標準機能ではありません。CanvaにはMagic Write(入力したプロンプトからAIが文章を生成)とSpeech to Text(録音済みのファイルを文字起こし)はありますが、テキストボックスへのリアルタイム音声入力はありません。Whisperのようなシステム全体で使えるデスクトップツールがその隙間を埋めます。ホットキーを押して話すだけで、Canvaのどのフィールドでもカーソル位置に言葉が入力されます。

この一文でつまずく人が多いので、もう少しゆっくり説明します。Canvaには「音声」や「AI」と名のつく機能が4つありますが、そのどれも、あなた自身の言葉をテキストボックスに口述するものではありません。これらを混同すると、最初から存在しない音声入力ボタンを20分も探し回ることになります。

これはハウツー記事です。Canvaの4つの「音声」機能をほどき、ひとつのホットキーで実際のCanvaのテキストボックス・コメント・Docに口述する方法を示し、この方法でできない唯一のことを挙げ、私のツールをまったく使わなくてよい場面もお伝えします。

Canvaに音声入力はある?Magic Writeは口述ではない

デザインブック、ペン、カラフルなステッカーが並ぶフラットレイのデスク。レイアウト作業用

Canvaには音声っぽい機能があります。でもリアルタイムの口述機能はありません。混同されがちな4つを、ここで切り分けておきます。

Magic WriteはAIによる文章生成であって、あなたの声ではありません。プロンプトを入力すると——「ヨガスタジオのキャッチコピーを3つ書いて」——CanvaのAIが文章を下書きします。CanvaのMagic Write公式ページ にも、プロンプトを入力するのはあなたであり、声は入力にならないと明記されています。Magic Writeはあなたの代わりに書きます。口述はあなたが言ったことを書き取ります。役割が違うのです。

Speech to Textは、録音済みのファイルを文字起こしします。Canvaの Speech to Text機能 は、既存の録音や動画——ページにはMP4、MOV、M4Vで最大500 MB・90分未満、またはYouTubeリンクと記載——を受け取り、後からテキストに変換します。本当に便利なので、あとでこちらにご案内します。でもこれはファイルを文字起こしするものであって、テキストボックスにリアルタイムで話すものではありません。

Text to Speechは逆方向に動きます。CanvaのAI Voice Generatorは、入力したテキストを動画用のナレーション音声に変えます。テキストを入れて音声を出す。口述とは正反対です。

CanvaのAIマイクはプロンプト欄を埋めるだけです。アシスタントにはマイクのアイコンがありますが、それはAIプロンプトを音声で埋めるもの——アシスタントにコマンドを話しかけるものです。デザインのテキストにも、コメントにも、Docの本文にも入力はしません。

だから正直な結論はこうです。Canvaにはテキストフィールドへのリアルタイム口述機能はありません。その仕事——話せば言葉がカーソル位置に現れる——は、別のデスクトップツールが担います。それこそが、この記事を書いた理由のすべてです。

ホットキーでCanvaのテキストボックスやDocに口述する

解決策はCanvaの下、オペレーティングシステムのレベルにあります。デスクトップの口述アプリをインストールすると、それがグローバルなホットキーを取得し、そのホットキーが文字起こしされたテキストを、カーソルのあるフィールドへ貼り付けます——Canvaのテキストボックス、コメント、Canva Doc、どこでもです。ツールがブラウザのタブの中ではなくOSのレベルにあるので、同じキーがSlackでもGmailでも、あなたのエディタでも使えます。

Whisperの初期設定のホットキーは、WindowsではCtrl+Space、macOSではCommand+Optionです。どのCanvaの画面でも流れは同じです。

Cancel
録音オーバーレイ:話している間に表示される小さなカプセル。Whisperが聞いていることが分かります。
  1. 入力したいフィールドをクリックします——キャンバス上のテキストボックス、コメント行、またはCanva Doc。
  2. ホットキーを押しながら話します。声に出すときのように、その一文を言ってください。
  3. 離します。1〜2秒後にカーソル位置に言葉が現れます。
  4. ちらっと見て、必要なら単語を直し、そのままデザインを続けます。

やることはこれだけです。「口述を開始」ダイアログも、2つ目のウィンドウも、どこかからのコピー&ペーストもありません。あなたは元々いたCanvaのフィールドにそのまま留まります。ツールは画面に何があるかを気にしないので、Canvaをブラウザで使っていても、Canvaデスクトップアプリを使っていても動きます。

この記事での私の唯一の意見を、数字つきで述べます。最高の生産性向上は、入力が速くなることではなく——手順が減ることです。タイピングは毎分40語くらい、話す方は約145語で、およそ3.6倍速い。本当の節約は、止まって・座って・打つという姿勢の切り替えを飛ばせることにあります。カルーセルをレイアウトしていて、頭の中にキャプションがある。それを言えば、もうそこにある。音声は手順を速くするのではありません。いくつか消すのです。

Whisper
本物のWhisperデスクトップアプリ——文字起こしの方式を選び、ホットキーを押し、テキストがフィールドに着地するのを見守ります。

上の埋め込みはスクリーンショットではなく、本物のアプリです。文字起こしの方式を選び、ホットキーを押し、テキストが着地するのを見てください。Canvaはこのツールの存在をまったく知りません——Canvaから見れば、あなたが入力したのと寸分違わず同じ。ただ、入力という手間がないだけです。

方式は3つあり、アプリが勝手に選ぶことはありません。Cloudモードはあなた自身のOpenAIキーを使い、最高の精度とウェブ回答を得られます。Parakeetは英語と24のヨーロッパ言語に対応した、最速のローカルオプションです。Whisperの多言語モデルは自動検出を含む99以上の言語をカバーし、英語への翻訳もできます。日々のCanva作業——見出し、キャプション、コメント——なら、小さめのローカルモデルでも十分ついてきます。多言語キャンペーンを書くなら、両モードあわせて90以上の言語に対応というのが、お客様向けにお伝えしている数字です。

口述を自動でクリーンアップする

Thinking...

生の話し言葉には「えーと」や、言い直しや、「いや、今のなし」が混じります。Whisperは文字起こしの上に、任意のAIクリーンアップを用意しています。無料モードならあなた自身のマシン上で動くローカル処理、Pro(自分のキーを使う場合)ならクラウド処理です。これをオンにすれば、「えーと見出しを太字でフレンドリーに今週だけ10パーセントオフみたいな感じで」が、きれいな一文として着地します。オフにすれば、一字一句そのままの文字起こし——「えーと」もすべて含まれ、それはそれで一種の正直さです。録音ごとに、あなたが決められます。

ここはMagic Writeの混同が戻ってくる場所でもあるので、はっきり片付けておきましょう。Magic Writeは、あなたが入力したプロンプトから文章を生成します。Whisperのクリーンアップは、あなたが実際に話した言葉を整えます。一方は文を考え出し、もう一方はあなたの文を整える。AIにキャッチコピーを書いてほしいなら、それはMagic Write。キャッチコピーを声に出して、それをきれいに入力してほしいなら、それがこちらです。

貼り付けられる場所と、できない唯一のこと

さて、正直な範囲の話です。これをはっきり言う人は、この検索結果の中で他にいないので。Whisperは、文字起こしされたテキストを、フォーカスのある単一のフィールド——カーソルのある場所のテキストボックス、コメント、またはDoc——に貼り付けます。それが約束のすべてです。

音声でCanvaの要素を作成・移動・サイズ変更・色変更・デザインすることはできませんし、Canvaのコマンドを実行することもできません。「フレームを追加」「フォントを太字に」「ロゴを大きく」と言っても、そうはなりません。話し言葉をカーソル位置でテキストに変えるだけです。デザインツールを操作するわけではありません。(私は始めたばかりの頃、音声コマンドで図形を動かそうと、ある午後を丸ごと無駄にしました。図形は寸分も動きませんでした。私は修士号を持っているのですが。)

知っておく価値あり:MacとWindows向けの同種の口述アプリWillowは、ある一点で先を行っています——文中の音声フォーマットコマンドに対応しているので、口述しながら「箇条書き」や「改行」と言うと、その書式がそのまま現れます。Whisperはそれをうたっていません。プレーンテキストを貼り付け、書式は自分の手でつけてもらう方式です。音声で書式を操りたいなら、それはWillowを検討する本当の理由になります。あなたがインストールしてから気づくより、ここで言っておきたいのです。

オフラインで、プライベートに

テーブルの上でセキュリティの鍵アイコンを表示するノートパソコン。プライベートなオフライン処理を示唆

デザイナーは、社外に出してはいけない文章を扱います。未発表の製品名。NDA下のクライアントの発売日。まだ公開されていない価格の一行。それをクラウド専用のツールに口述すると、音声はサーバーへ行って戻り、テキストになります。

Whisperのローカルモードは、すべてあなたのマシン上で動きます。文字起こし中はインターネットを使わず、音声はノートパソコンから出ません。必要な接続は、モデルの初回ダウンロードの一度きりだけ——選ぶモデルによって、およそ140 MBから3 GBの間です。そのあとは、Wi-Fiを切った飛行機の中でも、デッキ1冊分のCanvaキャプションをまるごと口述できます。

ここが、Canvaの口述の隙間を埋めるツールたちを最もはっきり分ける線です。ブラウザ拡張機能のVoice Inはクラウドベースです。WillowのCanvaページはデータ保持ゼロをうたっていますが、オフラインモードには触れていません。Whisperは、端末上でのローカル文字起こしをはっきり提供しています。「今週の見出し」程度のコピーなら関係ないでしょう。でも、オープンなオフィスで声に出して読むのをためらうようなものなら、端末上処理が地味で正しい既定値です。同じ理屈は、Figmaでの音声入力Miroでの音声入力 を追加するガイドにも通っています——デザインツールは変わっても、理屈は変わりません。

Magic WriteやOSの口述の方が向いている場合

ノートパソコン、本、ランプが整然と並ぶデスク。集中したデザイン作業向けのセットアップ

Whisperが毎回正解だとは言いません。そうでない3つのケースです。

実は既存の録音を文字起こししたい場合。ボイスメモやウェビナーのクリップ、YouTubeリンクが既にあって、その中から言葉を取り出したいなら、それは口述ではなく——ファイルの文字起こしです。Canva自身の Speech to Text が、追加ツールなしでエディタ内でやってくれます。Canvaの標準機能を使ってください。その仕事には、それが正解です。

ずっとCanvaのブラウザタブだけで作業していて、無料のブラウザアドオンが欲しい場合。Voice Inは、まさにそのために作られたChromeとEdgeの拡張機能です。Canvaデスクトップアプリやブラウザ外には届きませんが、ブラウザがあなたの世界のすべてなら、ぴったりです。

コンピュータに既にある音声機能を使いたい場合。WindowsにはWin+Hの音声入力があり、macOSにはApple Dictationがあります。どちらもCanvaにシステム全体で口述でき、ブラウザでもデスクトップでも、無料で何もインストール不要です。それぞれ単一プラットフォーム向けで品質にもばらつきがありますが、短い区切りでの利用なら、まずまずの無料の選択肢です。

Whisperを選ぶのは、音声を端末上に留めておきたいとき、登録時にカード不要の無料ツールが欲しいとき、あるいはCanvaデスクトップアプリと、あなたが触れる他のすべてのアプリで同じように使える1つのホットキーが欲しいときです。

費用について

Canva自身のMagic WriteとSpeech to Textは、Canvaの無料プランとProプランの中にあります——Canvaの価格設定であって、私のではありません。WillowのCanvaページは、試用に週2,000語の無料枠(カード不要)を提供し、その先は有料プランです。Voice Inはフリーミアムのブラウザ拡張機能です。Whisperのローカルパイプライン全体——Canvaのフィールドに口述する部分——は、登録時に無料で、カード不要です。Whisper ProはCloud機能を追加し、7日間のCloudトライアルが付いてきます。カードが必要なのはそのアップグレードのときだけで、最初の登録時に必要になることは決してありません。この2つを混同しないでください。あなたのCanva作業をこなす口述は、無料の部分です。数字を知りたい方は、料金ページ に載っています。

「Canvaの音声入力」を検索する人の多くは、同じささやかな失望にたどり着きます。口述ボタンを探しに行き、Magic Writeを見つけ、それがあなたの代わりにコピーを書きたがるもので、あなたが言ったことを入力するものではないと気づくのです。ボタンはCanvaの中にはありません。一層下、ホットキーの中にあります。下の娘に一度この動きを見せたら——クリックして、押さえて、話して、離す——私が説明し終える前に、彼女はバースデーカードのキャプションを書いてしまいました。7歳です。追加の質問は一つもしませんでした。これは、私がオンボーディングしてきた大人の大半より上等です。どこでもキーボードなしの方法が欲しいなら、音声で速く入力する 方法はこちら。Macでの音声入力 も含みます。

次のCanvaのキャプションを口述しよう

フィールドをクリックし、キーを押さえ、話して、離す。文字起こしはカーソルのある場所に着地します——Canvaでも、他のすべてのアプリでも。

サインイン済みのどのアカウントでもローカルモードは無料。開始にカードは不要です。

Denys Medvedievの写真

Denys Medvediev

サポートメールを読んでいるのは私です。たぶん、返信も口述しています。