Getting Started with DijiFlow Dictate: Setup, Hotkeys, and Your First Dictation
dictation1 min read

DijiFlow Dictate を始める: セットアップ、ホットキー、そして最初のディクテーション

DijiFlow Dictate のインストール、ホットキーの選択、そしてプライベートでオンデバイスの音声テキスト変換を使ってあらゆるアプリにディクテーションする方法を解説する実践的なガイドです。

ダウンロードしたてから、画面に最初の一文が出るまで、DijiFlow Dictate はコーヒーを淹れるくらいの時間しかかかりません。キーを押し、話すと、言葉がカーソルのあるところへそのまま現れます——メール、ドキュメント、チャット欄、コードのコメント、いまいるどのアプリでも。あつかうべきウィンドウも、コピー&ペーストも、アカウントもありません。

そして、何もマシンを離れません。DijiFlow Dictate は OpenAI の Whisper 音声モデルを、WhisperKit と CoreML を通じてローカルで動かすので、サインインも、テレメトリーも、アップロードされる音声のただの 1 バイトもありません。このガイドは、インストールから音声入力まで、短い 4 ステップでご案内します。

  • ~12 MB
    アプリのダウンロード
  • 90+
    オンデバイスで文字化できる言語
  • 0
    アカウントや音声のアップロード

まず必要なもの

多くはありません。DijiFlow Dictate は小さなメニューバーアプリです——ダウンロードはおよそ 12 MB。音声モデルは別になっていて、求める精度と言語のカバー範囲に応じておよそ 300 MB から 6 GB の幅があります。ダウンロードは一度きりで、そのあとはすべてが完全にオフラインで動きます。

  • Mac または PC。Apple Silicon 上の macOS 14 以降、あるいは Windows 10 か 11。Windows では AMD、Intel、NVIDIA の GPU がすべて動きます。NVIDIA のカードは CUDA と最新のドライバを必要とします。
  • マイク。始めるには内蔵マイクで十分です。騒がしい部屋ではヘッドセットが役立ちますが、最初の一回には要りません。

プランを前もって決める必要はありません。無料プランはずっと使え、30 日間の Trial はクレジットカードなしで Pro の全機能を解放します。賢い進め方は、まずインストールして、どのプランが合うかを考える前に、実際の音声入力を一度試してみることです。

4 ステップで設定する

各ステップは一度きりのことです。一度すませば、それ以降、音声入力はキーひと押しになります。

  1. ダウンロードして開く

    アプリをインストールして起動します。大きなウィンドウではなく、メニューバー(macOS)またはシステムトレイ(Windows)に常駐します。初回起動時、オペレーティングシステムがマイクへのアクセスと、カーソル位置に文字を入力する許可を求めます——どちらも承認してください。さもないとアプリはあなたの声を聞けず、テキストも置けません。

  2. 音声モデルを選ぶ

    モデルのダウンロードを促されます。小さいモデルは速くて軽く、大きいモデルはアクセントや専門用語によりよく対応します。まずは中くらいのサイズから始めましょう——あとで入れ替えられます。インターネット接続が必要なのは、この部分だけです。

  3. ホットキーを設定する

    設定を開き、音声入力を起動するショートカットを割り当てます。文の途中で衝突しないよう、ほかで使っていないキーの組み合わせを選びましょう。たいていのアプリや場面では、空いている静かな修飾キーやファンクションキーがあるものです。

  4. 最初の音声入力を実行する

    任意のテキスト欄をクリックし、ホットキーを押して話します。ほどなく、言葉がカーソル位置に届きます。これがすべての流れです——押す、話す、完了。

モデルのダウンロードが終われば、あなたは完全にオフラインです。その最初のステップのあとは、何にも接続は要りません。

最初の一文をうまく決める

最初の音声入力は、続けるかどうかを決める一回なので、勝てるように整えましょう。いきなり実際のメールにホットキーを向けるのではなく、空のメモか走り書き用のドキュメント——間違っても困らないところ——を開いてください。

そして、いつものペースで一つの完全な文を言ってみます。たとえば「打ち合わせを木曜に動かして、前夜に資料を送ろう」のように。過剰に発音したり、一語ずつ話したりしたくなる衝動はこらえてください。Whisper は句読点や綴りのためにフレーズ全体を読むので、丁寧に区切った文より、自然でまとまった文のほうがきれいに出てきます。

要点

単語ひとつずつではなく、完全な文で話す——Whisper は前後の文脈を使って句読点や綴りを決めるので、まとまったフレーズのほうが目に見えてきれいに文字化されます。

精度を微調整する

初期設定のままでも箱から出してすぐ十分ですが、ちょっとした調整を二つ加えると、よりよくなります——とくに、名前や専門用語の多い仕事ならなおさらです。

  • 言語を設定する。DijiFlow Dictate は 90+ の言語を文字化します。話している言語を指定すれば、結果がすぐに、より信頼できるものになります。
  • 背景の雑音を減らす。静かな部屋が役立ち、通話や共有スペースではヘッドセットのマイクがさらに役立ちます。
  • モデルのサイズを一段上げる——小さいモデルが専門用語、固有名詞、強いアクセントでつまずくなら。大きいモデルは、わずかな速度と引き換えに、はっきりとよい精度をもたらします。

なぜオンデバイスの部分が大切なのか

ほとんどの音声入力ツールは、文字化のためにあなたの声をサーバーへストリーミングします。DijiFlow Dictate はその逆です——作業はすべてあなた自身のハードウェア上で起こります。サインインなし、利用の追跡なし、どこにも送られる音声なし。だからこそ、機密のメモ、顧客の仕事、まだ共有する気のない初期の下書き、そして安定した接続が当てにできないあらゆる場所に、すんなり収まります。待つべき往復がないので、あなたのネットワーク速度は一切関係しません。

ここから先へ

ふだん暮らしているアプリで、10 分ほど音声入力してみてください。ホットキーが手に馴染んでくると、話すことがあっという間に、初稿を書き留める最速の方法になります——そして無料プランなら、それを自分のペースで確かめられます。全機能の準備ができたら、DijiFlow Dictate Pro をご覧ください

DijiFlow DictateDijiFlow Dictate

DijiFlow Dictate チーム

プライバシーを守るオンデバイスの音声入力と、声でもっとはかどる仕事術についてのノート。

ハンズフリーの音声入力を、 今日から始めましょう。

プライバシーを守る100%オンデバイスの音声入力を90+言語で。ずっと無料、必要になったらPro へ。