Getting Started with DijiFlow Dictate: Setup, Hotkeys, and Your First Dictation
dictation1 min read

DijiFlow Dictate 入门:安装、快捷键与你的第一次听写

一份实用指南,介绍如何安装 DijiFlow Dictate、选择快捷键,并通过私密的设备端语音转文字在任意应用中进行听写。

从下载完成到屏幕上出现你的第一句话,DijiFlow Dictate 花的时间,差不多够你冲杯咖啡。你按下一个键、开口说,文字就出现在你光标所在的地方——在邮件、文档、聊天框、代码注释里,你人在哪个软件,它就出现在哪个软件。没有窗口要应付,不用复制粘贴,也没有账户。

而且没有任何东西离开你的机器。DijiFlow Dictate 通过 WhisperKit 和 CoreML 在本地运行 OpenAI 的 Whisper 语音模型,因此不用登录、没有遥测,也没有哪怕一个字节的音频被上传。本指南用四个简短的步骤,带你从安装走到开始口述。

  • ~12 MB
    软件下载体积
  • 90+
    种语言在设备端转写
  • 0
    账户或音频上传

你首先需要什么

没多少东西。DijiFlow Dictate 是一个小巧的菜单栏软件——下载约 12 MB。语音模型是单独的,视你想要的准确率和语言覆盖而定,从大约 300 MB 到 6 GB 不等。它们只需下载一次;此后,一切完全离线运行。

  • 一台 Mac 或 PC。搭载 Apple Silicon 的 macOS 14 或更高版本,或者 Windows 10 或 11。在 Windows 上,AMD、Intel 和 NVIDIA 的 GPU 都能用;NVIDIA 显卡需要 CUDA 和一个较新的驱动。
  • 一个麦克风。内置麦克风足够你起步。在嘈杂的房间里耳麦会有帮助,但第一次跑起来并非必需。

你不必一开始就敲定某个版本。免费版永久可用,30 天 Trial 则解锁每一项 Pro 功能,无需信用卡。明智的做法是先装上它、试一次真正的口述,再去想哪个版本适合自己。

四步搞定设置

每一步都是一次性的。做完一次,此后口述就只是一次按键的事。

  1. 下载并打开

    装好软件并启动它。它住在你的菜单栏(macOS)或系统托盘(Windows)里,而不是一个大窗口。首次运行时,你的操作系统会请求麦克风访问权限,以及在你光标处打字的权限——两个都批准,否则软件听不到你,也放不了文字。

  2. 挑一个语音模型

    系统会提示你下载一个模型。较小的模型又快又轻;较大的模型在口音和专业词汇上更准。先从一个中等尺寸的开始——以后随时可以换。这是唯一需要联网的环节。

  3. 设置你的快捷键

    打开设置,指定触发口述的那个快捷键。选一个你在别处还没用过的组合键,这样它就永远不会在句子说到一半时撞键。多数软件和场合里,总有个清闲的修饰键或功能键可用。

  4. 跑一次你的第一段口述

    点进任意一个文本框,按下你的快捷键,然后说。片刻之后,你的话便落在光标处。整个循环就是这样——按键、说话、完成。

模型下载一完成,你就完全离线了。那第一步之后,做任何事都不再需要网络连接。

把你的第一句话说对

你的第一段口述,往往决定了你会不会接着用下去,所以把它布置得稳赢。打开一个空白笔记或一个草稿文档——一个出错也无所谓的地方——而不是把快捷键直接按进一封正式邮件里。

然后以正常语速说一个完整的句子。比如这样:「咱们把会议改到周四,前一天晚上把幻灯片发出去。」别去刻意咬字或一个词一个词地说。Whisper 会读整个短语来加标点、定拼写,所以自然、完整的句子,比小心翼翼、断断续续的句子出来得更干净。

核心要点

说完整的句子,别说单个的词——Whisper 会借助周围的上下文来加标点、定拼写,所以完整的短语转写出来明显更干净。

把你的准确率调到位

默认设置开箱即用就很好,但几处小调整能让它更上一层,尤其是当你的工作里满是人名和技术术语时。

  • 设定你的语言。DijiFlow Dictate 能转写 90+ 种语言。把你正在说的那一种告诉它,结果立刻就更可靠。
  • 压低背景噪声。更安静的房间有帮助;在通话中和共用空间里,耳麦帮助更大。
  • 往上调一档模型尺寸,如果较小的模型在行话、专有名词或浓重口音上栽了跟头。更大的模型用一点点速度,换来明显更好的准确率。

设备端这一点为什么要紧

多数口述工具都把你的语音流式传到服务器去转写。DijiFlow Dictate 反着来——工作完全在你自己的硬件上发生。不用登录,没有使用追踪,没有音频被发往任何地方。这让它天然适合机密笔记、客户工作、你还不愿分享的早期草稿,以及任何稳定网络并非理所当然的场合。你的网速从不掺和进来,因为压根没有要等的来回。

从这里出发

花十分钟,在你天天泡着的那些软件里口述。一旦快捷键变成肌肉记忆,快速说话很快就会成为把初稿落地最快的方式——而免费版让你按自己的节奏去发现这一点。等你准备好迎接完整的功能集,来看看 DijiFlow Dictate Pro

DijiFlow DictateDijiFlow Dictate

DijiFlow Dictate 团队

关于私密、设备端听写,以及用声音完成更多工作的笔记。

即刻开始免动手听写 今天就试。

私密、100% 设备端的语音转文字,支持 90+ 种语言——永久免费,需要更多时升级 Pro。