Dictation vs Typing: How Speaking Your Words Can Be 3-8x Faster
dictation1 min read

音声入力 vs タイピング:言葉を話すことが3〜8倍速くなる理由

ほとんどの人は、タイプするよりもはるかに速く話します。音声入力が3〜8倍速くなる理由と、それを正確で信頼できるものにする方法をご紹介します。

あなたはタイプするより速く考えています。誰もがそうです。たいていの人はおよそ毎分 40〜60 語でタイプしますが、話すときは毎分 130〜150 語——ふだんの会話ではもっと速くなります。タイピングは、考えと画面のあいだにある最も遅い段階であり、音声入力はそれをただ取り除くだけです。

「タイピングより 3〜8× 速い」という主張は、まさにこの差から生まれています。それが成り立つのはどこか、タイピングがなお勝るのはどこか、そして音声入力を毎日使えるほど信頼できるものにするには実際に何が要るのか——を見ていきましょう。

速度差を、目盛りどおりに描く

これはマーケティング上の誇張ではありません。人が言葉を生み出す仕組みから自然に導かれるものです。

タイピング~50 wpm
発話~140 wpm

計算してみましょう。毎分 50 語でタイプする人が 500 語のメールを書くと、キーボードの前でおよそ 10 分かかります。同じ言葉を毎分 140 語で話せば、3 分強で終わります。これは差のいちばん小さい側です。タイプが遅い、キーを探しながら打つ、第二言語で書く——そうした場合、倍率は 8× へと近づいていきます。

なぜこれほど差が大きいのか

理由は二つ。どちらも地味で、どちらも本当のことです。

  • 話すことは生まれつき、タイプは後付けです。あなたはよちよち歩きの頃から話してきました。タイピングは習得した運動技能であり、ほとんどの人にとって会話の速さには決して届きません。
  • 音声は、考えそのものではなくボトルネックを取り除きます。あなたの脳は話す速さで文を組み立てます。タイピングはその出力を 10 本の指に押し込みますが、音声入力はそれを全帯域で外へ出してくれます。

見出しは速さですが、得られるのはそれだけではありません。音声入力は手首と手の負担を減らします。反復性のひずみに対処している人にとっては大切なことです。さらに、フローを保てます。部屋を歩き回りながらでも、資料にちらりと目をやりながらでも、次のキーを探して止まることなく、ただ声に出して考えられます。

タイピングがなお勝るところ

誇張より正直さです。音声入力は何にでも向く道具ではなく、その線引きは予測がつきます。

作業音声入力タイピング
初稿や長めのメッセージ
メモ、日記、ドキュメント作成
コードや記号の多い構文
既存の段落の一語ずつの編集
静かなオフィスや混んだ電車

本当の答えが、すべてか無か、になることはめったにありません。音声入力を続ける人の多くは、初稿、長いメッセージ、メモを話して入力し、細かな編集ではキーボードに切り替えます。この組み合わせは、どちらか一方だけよりも優れています。

誰も触れない落とし穴——精度と摩擦

かつて音声入力を試して、やめてしまった人は少なくありません。当時のツールは精度が低く、設定に手間取り、クラウドのアカウントに縛られていました。もし音声入力が 10 語に 1 語を取り違えるなら、話して節約した時間は、まるごと修正に消えていきます。

それは変わりました。現代の音声モデルをきちんと動かせば、クリアな発話でおよそ 98% の精度が得られます。その水準になると、音声入力は座興ではなくなり、何も考えずに手が伸びる道具になります。残る問いは一つ。どれだけ早く始められるのか、そしてあなたの声は実際どこへ行くのか、です。

DijiFlow Dictate はその両方にどう答えるか

DijiFlow Dictate は、すぐ始められて、プライベートであり続けるように作られています。CoreML を使って Whisper 音声モデルをすべてあなた自身のデバイス上で動かします——アカウントなし、クラウドなし、テレメトリーなし。あなたの声がマシンを離れることはないので、精度がネットワークに左右されることはなく、文字化のために何かが外へ送られることもありません。

  • 3–8×
    タイピングより速い
  • ~98%
    クリアな発話での精度
  • 90+
    オンデバイスで文字化できる言語

その流れは意図して小さくしてあります。アプリはメニューバーに常駐します。ホットキーを押し、話すと、テキストがカーソル位置に届きます——メール、ドキュメント、チャット画面、コードのコメント、いまいるどこにでも。管理すべき別ウィンドウも、コピー&ペーストの手順もありません。90+ の言語を文字化し、そのうち 29 言語では語彙チューニングを使って名前や分野固有の用語をくっきりさせられます。

要点

オンデバイスの文字化は、音声が決してアップロードされないということ——ちょっとした個人的なメモにも、機微な顧客の仕事にも、同じツールが使えます。

自分の倍率を見つける

書くことを生業にしているなら、得られるものは正直に言って本物です。10 分かかっていた下書きが 3 分になり、手も休まります。自分の数字を知る唯一の方法は、ふだんいちばん多く書いている文章で試してみることです。DijiFlow Dictate はずっと無料で、Pro 機能すべてを 30 日間試せる Trial が付き、カードも不要です——あなたのワークフローへの合い方を見る

DijiFlow DictateDijiFlow Dictate

DijiFlow Dictate チーム

プライバシーを守るオンデバイスの音声入力と、声でもっとはかどる仕事術についてのノート。

ハンズフリーの音声入力を、 今日から始めましょう。

プライバシーを守る100%オンデバイスの音声入力を90+言語で。ずっと無料、必要になったらPro へ。