AI音声アシスタント
機能
どこでも口述
ホットキーを押しながら話すと、カーソルの位置にテキストが現れます。MacとWindows、入力できるあらゆるアプリで — Slack、Gmail、VSCode、Notes、Jiraチケット、子どもの学校の連絡帳まで。
ローカルモード
完全オフライン。文字起こしはOpenAI WhisperまたはNVIDIA Parakeetで、AIクリーンアップは信頼できるオープンソースモデルとOllamaで実行。クラウドなし、サーバーなし、何一つマシンの外に出ません — 共有すべきでない音声のために。
クラウドモード
最高クラスの精度とリアルタイムのウェブ回答を1つのキーで。文字起こしはOpenAIのgpt-4o-transcribe、/usr/bin/bash.003/min — 音声1時間あたり約18¢です。同じキーがResponses API経由でリアルタイムの事実検索も実現。キーはあなたが用意し、当社のマークアップはゼロです。
Webを検索
文章の途中で、Whisperに調べてもらいましょう — 株価、天気、昨夜のスコア、同僚の出身地のスペル。答えはフォーマット済みでインラインに届きます。タブの切り替えなし、思考の流れを失うこともありません。
話しながら磨く
とりとめなく話して、整理された形で出力。「Whisper、メール形式にして」と言えば、ぼそぼそとした下書きが、挨拶と署名付きの三段落のメールに変わります。どんな場面でも、自分専用のトリガーを書けます。
話しながら翻訳
日本語で話して、英語で貼り付け。英語で話して、中国語で貼り付け。ポーランド語で話して、ドイツ語で貼り付け。90+言語、双方向、クラウドモードでもローカルモードでも — 追加アプリなし、追加サブスクリプションなし、Google翻訳のタブも不要。
画面に映っているものについて質問できます
エラー、グラフ、UI のバグの上にカーソルを重ねて、口述ホットキーを押して質問するだけ。カーソルの下のスクリーンショットが音声プロンプトとともに OpenAI に送られ、回答がその場に貼り付けられます。画像コストは1質問あたり1セント未満。クラウドモードの Pro 機能です。
話すときは音楽をミュート
Spotify でアルバムを再生中、タブで YouTube チュートリアルを開きっぱなし、横でポッドキャストを流していても — Whisper は録音を開始した瞬間にシステムが再生中のものをミュートし、停止した瞬間に音量を元に戻します。同じセクションでソフトな開始・停止の合図と組み合わせれば、画面を見なくてもフィードバックが得られます。
すでに書いた文章を書き直す
どんなアプリでも — Slack、Gmail、エディタ — テキストを選択して口述ホットキーを押し、書き直しを話すだけ。「フォーマルにして」「もったいぶった言い回しを削って」「ドイツ語に翻訳して」。選択範囲がその場で置き換えられます。同じホットキーで、メニューは不要。クラウドモードでもローカルモードでも動作します。
ホットキーで指示
あらゆる場面の指示パックを保存 — 開発者向けプロンプト、フォーマルなメール、フレンドリーなSlack更新、学校の連絡帳の箇条書き。最初の9個をCtrl/Cmd + 1..9に割り当て、録音中にアプリを離れずアクティブなスタイルを切り替えられます。
あなたの言葉を正しく綴る
ブランド名、略語、同僚の名字、よく書き間違える同僚の珍しい名字 — 一度追加するだけ。クラウドでもローカルでも、すべての文字起こしがそれらを尊重し、AIトークンも消費しません。
えーと、あのー、みたいな — 消滅
トグル一つで、出力時に「えーと」や「みたいな」がすべて除去されます。確定的、無料、すべてのエンジンで動作。これで口述は、第一稿ではなく第三稿のように仕上がります。