Privacy-First by Design: What "Nothing Leaves Your Device" Really Means
data-security1 min read

設計段階からプライバシー優先 ―「何もデバイスから出ない」が本当に意味すること

オンデバイスのディクテーションは、あなたの声をあなたのマシンの中にとどめます。アカウントなし、クラウドなし、テレメトリーなし。プライベートな音声認識が本当に意味することをお伝えします。

ありふれた音声入力アプリを開くと、あなたの声は旅に出ます。マイクが録音し、音声がサーバーへアップロードされ、どこか遠くでモデルが文字化し、ほんの一瞬あとにテキストが返ってきます。一見、即座のように感じられます。けれど、そのわずか数秒のあいだ、あなたの言葉は、あなたが所有しないハードウェアの上、あなたが書いていないポリシーに支配されて、置かれていたのです。

DijiFlow Dictate は、それを決して送りません。あなたの発話は、目の前の Mac の上だけで捉えられ、文字化され、テキストになります。何もアップロードされません。サーバーに保存されるものは何もありません。「何もデバイスを離れない」と言うとき、それは安心させるための言葉ではありません——このアプリがどう作られているかを述べているのです。

要点

設計によるプライバシーとは、漏洩が起きないとポリシーが約束することではなく、アーキテクチャが漏洩を不可能にするということです。

「暗号化されている」は「プライベート」と同じではない

多くの音声入力ツールは、転送中の暗号化を前面に押し出します。それはあって良いものですが、それが実際に何をカバーするのかを読んでください——音声がサーバーへ向かうあいだ、それを保護します。届いた瞬間、モデルが読めるように、提供元がそれを復号します。

その時点から先、あなたは目に見えないものの連なりを信頼することになります——保持の設定、アクセスの一覧、ベンダーの善意、来四半期には書き換えられうるプライバシー通知。暗号化は道を守ります。行き先については何もしません。

オンデバイス処理は、その行き先を取り除きます。ループの中にサーバーがないので、あなたの声が復号され、ログに記録され、保持される第二の場所が存在しません。録音も、文字化も、仕上がったテキストも、すべてあなたがすでに所有するハードウェアの内側にとどまります。

DijiFlow はどのように発話をローカルに保つのか

DijiFlow Dictate は、Apple の CoreML と WhisperKit を使って、Whisper 音声モデルをあなたの Mac 上で直接動かします。作業を行う遠隔のサービスもなければ、モデルが確信を持てないときにひそかに音声をどこかへ送る予備の経路もありません。あなたのマシン上のモデルが、システムのすべてです。

作業がローカルで起きるからこそ、ほとんどのクラウドツールが及ばないいくつかのことが当然のように続きます。

  • アカウントなし。音声入力を始めるのに、登録も、ログインも、メールアドレスの提出も要りません。侵害されるプロフィールがないのは、そもそもプロフィールがないからです。
  • クラウドなし。音声は決してアップロードされません。モデルはあなた自身のプロセッサ上で動きます。
  • テレメトリーなし。このアプリは、利用データも、文字起こしも、分析情報も、本国へ送りません。
  • オフラインで動く。モデルさえ入れてしまえば、ネットワークを切った飛行機の中でも、セキュアな施設の内側でも音声入力できます。

最後の点は、あなた自身で確かめられるものです。ネットワークケーブルを抜き、Wi-Fi を切って、音声入力を続けてみてください。それでも動くなら——実際に動きます——その文字化は、そもそも一度も外へ手を伸ばしていなかったということです。確かめられる振る舞いは、信じるしかない約束に勝ります。

あなたのデバイス上 対 ありふれたクラウドツール

並べてみると対比がいちばんはっきりします。それぞれのやり方で、あなたのデータがどこにあるのかを示します。

あなたのデータに起きることDijiFlow(オンデバイス)ありふれたクラウドツール
音声がマシンにとどまる
文字起こしがデバイスを離れない
アカウントもメールも不要
利用テレメトリーを送り返さない
ネットワークを切っても動く
ベンダーから召喚状で取り出せるものがない

数字も、三つの数で同じ話を語ります。

  • 0
    アップロードされる音声のバイト数
  • 0
    作成するアカウント数
  • 0
    本国へ送られるテレメトリー

なぜこれが機微な作業の正しい初期設定なのか

多くの人にとって、音声入力は、他人のログに置かれるいわれのない素材に触れます。厳格な守秘義務のもとで患者メモを書く臨床医。秘匿特権のあるやり取りを音声入力する弁護士。内密を約束された情報源を文字化するジャーナリスト。社内のアーキテクチャをドキュメントに語り込むエンジニア。

そのどの場合でも、最も安全なデータは、そもそも送信されなかったデータです。オンデバイスの音声入力は、第三者の侵害も、召喚状も、ひそかなポリシー変更も、あなたの文字起こしに届かないところに保ちます——なぜなら、その第三者がそもそも一度も受け取っていないからです。

トレードオフのないプライバシー

かつての思い込みは、ローカルに保つことは精度や速度を犠牲にする、オンデバイスのモデルは劣る選択肢だ、というものでした。それはもう本当ではなくなりました。Apple Silicon は Whisper クラスのモデルを速く、しっかりと動かし、DijiFlow は 90+ の言語をオンデバイスで扱い、そのうち 29 言語では語彙チューニングによって名前、専門用語、頭字語が正しく通ります。

あなたは、自分の Mac と求める精度に合うモデルサイズを選びます。その結果が、かつてはデータセンターを要した文字化の品質——それを、ただの 1 バイトも机から出すことなく生み出せるのです。

あなた自身の条件で試す

ここでのプライバシー優先は、オンにする機能ではありません。アプリがローカル推論を中心に作られているため、プライベートな振る舞いはそのまま振る舞いそのものなのです——探すべき設定も、覚えておくべきモードもありません。DijiFlow Dictate は日常の利用にずっと無料で、Pro の全機能を 30 日間試せる Trial が付き、準備ができたら Pro へ進めます。

あなたの言葉があなたのものであり続けるべきなら、オンデバイスの音声入力があなたの仕事にどう合うか をご覧ください。

DijiFlow DictateDijiFlow Dictate

DijiFlow Dictate チーム

プライバシーを守るオンデバイスの音声入力と、声でもっとはかどる仕事術についてのノート。

ハンズフリーの音声入力を、 今日から始めましょう。

プライバシーを守る100%オンデバイスの音声入力を90+言語で。ずっと無料、必要になったらPro へ。