Type in 90+ Languages, Fully Offline: Multilingual Dictation Without the Cloud
DijiFlow Dictate1 min read

90+言語を完全オフラインで入力。クラウドに頼らない多言語ディクテーション

DijiFlowなら、90+言語をすべて端末上でディクテーションできます。クラウドなし、アカウントなし、テレメトリーなし。精度は約98%、一度ダウンロードすれば完全にオフラインで動作します。

文の途中で言語を切り替えると、たいていの音声入力ツールはつまずきます。すべての語を遠くのサーバーへ送り、1 セッションにつき 1 言語に縛り、接続が切れた瞬間に黙り込みます。DijiFlow Dictate は逆のやり方です。OpenAI の Whisper 音声モデルを、WhisperKit と CoreML を通じてあなた自身のマシン上で動かすため、音声をただの 1 バイトもデバイスの外へ出さずに 90+ の言語で音声入力できます。

このたった一つの決定——モデルをローカルに置くこと——が、多言語の音声入力を実際に実用的なものにしています。何もアップロードされず、何もネットワークを待たず、計量すべきクラウドの利用分もありません。ホットキーを押し、話すと、いまいるどのアプリでも言葉がカーソル位置に届きます。

  • 90+
    オンデバイスで文字化できる言語
  • 29
    専用の語彙チューニング付き
  • 100%
    モデルのダウンロード後はオフライン

90+ 言語を文字化、うち 29 言語はあなたの言葉に合わせて調整

この数字は正確に押さえておく価値があります。二つの別々のことを意味しているからです。Whisper large-v3 モデルは 90+ の言語を文字化します——これが DijiFlow Dictate がテキストに変換できる範囲の全体です。その範囲の中で、29 の言語にはもう一段の語彙チューニングがかかり、分野固有の用語、名前、そしてあなたが実際に使う言い回しが、推測されるのではなく、よりきれいに通るようになります。

つまり、幅は広く、深さも本物です。スペイン語で段落を音声入力し、英語の技術用語を差し込み、ドイツ語でメモを締めくくる——すべて同じ設定で、モードの切り替えもメニューもなしに行えます。クリアな発話では精度が約 ~98% に達し、音声入力はタイピングの数倍の速さで動きます。日ごろ使わないキーボード配列を探しながら打つのが代わりの手段だとすれば、その差は一気に広がります。

なぜオフラインこそが要点であって、脚注ではないのか

複数の言語にまたがって作業するということは、たいてい、第三者には渡したくない素材を扱うということです。顧客とのやり取り、法律文書、医療メモ、調査インタビュー、社内文書。その音声がクラウドサービスへ行った瞬間、それは他人が答えを出すべき問題になります。オンデバイスの文字化は、その問いをまるごと取り除きます。アカウントなし、アップロードなし、テレメトリーなし——あなたの声と、それがなるテキストは、目の前のマシンを決して離れません。

オフラインはまた、多言語の作業をひそかに鈍らせる摩擦も取り除きます。

  • 往復のレイテンシがありません。文字化はローカルで動くので、遠くのサーバーの応答を待つものは何もありません。
  • 接続が要りません。飛行機の中、地下のオフィス、数分おきに切れるホテルの Wi-Fi——音声入力はただ動き続けます。
  • 分単位の課金メーターがありません。利用カウンターを気にせず、どの言語でも好きなだけ話せます。

要点

すべての言語がオンデバイスで動くため、音声入力は接続ゼロでも動きます——飛行中でも、圏外でも、Wi-Fi が途切れるどこででも。

オンデバイスの多言語 対 クラウド

並べてみれば、トレードオフはきれいに整います。

機能DijiFlow(オンデバイス)クラウド音声入力
音声がマシンにとどまる
接続なしで動く
文の途中で言語を切り替える
アカウントも分単位の課金もなし

容量で何を払い、速度で何が返ってくるのか

アプリ本体は小さく、およそ 12 MB です。音声モデルは別になっていて、ダウンロードは一度きり、選ぶものに応じておよそ 300 MB から 6 GB の幅があります。その最初のダウンロードのあとは、すべてが完全にオフラインで動きます。大きいモデルはアクセント、入り混じった語彙、あまり一般的でない言語をより自信をもって扱い、小さいモデルはリソースを軽く保ちます。その線のどこに座るかは、あなたが選びます。

日々の中で、DijiFlow Dictate はメニューバーに常駐し、邪魔をしません。管理すべきウィンドウも、そこからコピーして取り出すべきドキュメントもありません。メールクライアント、コードエディタ、チャットアプリ、ワープロ——文字を打ち込めるものになら、音声で入力できます。

誰がいちばん恩恵を受けるか

オンデバイスの多言語音声入力は、業務の当たり前の一部として言語を行き来する人にとって、最も効果を発揮します。

  • 翻訳者や通訳者——言語ペアをまたいで下書きや見直しをする人。
  • 研究者やジャーナリスト——元の素材を露出させずにインタビューやメモを文字化する人。
  • バイリンガルの専門職——同僚や顧客に、毎日複数の言語で書く人。
  • プライバシーを大切にするすべての人——自分の発話を遠くのサーバーに触れさせたくない、という人。

あなたが実際に使う言語で試す

DijiFlow Dictate には、ずっと無料の無料プラン、全機能を備えた 30 日間の Trial、そして月額、6 か月、12 か月、あるいは買い切りの永続ライセンスで購入できる Pro があります。正直なテストは、インストールして Trial を始め、あなたの本当の言語で音声入力してみることです——オンデバイスの文字化が自分のワークフローにどう合うかを感じ取る、唯一の方法です。

マシンを決して離れない多言語の音声入力こそ、あなたに足りなかったものなら、ぜひ DijiFlow Dictate があなたの働き方にどう合うか をご覧ください。

DijiFlow DictateDijiFlow Dictate

DijiFlow Dictate チーム

プライバシーを守るオンデバイスの音声入力と、声でもっとはかどる仕事術についてのノート。

ハンズフリーの音声入力を、 今日から始めましょう。

プライバシーを守る100%オンデバイスの音声入力を90+言語で。ずっと無料、必要になったらPro へ。