Getting Started with DijiFlow Dictate: Setup, Hotkeys, and Your First Dictation

dictation2026年6月4日1 min read

DijiFlow Dictate 入门：安装、快捷键与你的第一次听写

一份实用指南，介绍如何安装 DijiFlow Dictate、选择快捷键，并通过私密的设备端语音转文字在任意应用中进行听写。

从下载完成到屏幕上出现你的第一句话，DijiFlow Dictate 花的时间，差不多够你冲杯咖啡。你按下一个键、开口说，文字就出现在你光标所在的地方——在邮件、文档、聊天框、代码注释里，你人在哪个软件，它就出现在哪个软件。没有窗口要应付，不用复制粘贴，也没有账户。

而且没有任何东西离开你的机器。DijiFlow Dictate 通过 WhisperKit 和 CoreML 在本地运行 OpenAI 的 Whisper 语音模型，因此不用登录、没有遥测，也没有哪怕一个字节的音频被上传。本指南用四个简短的步骤，带你从安装走到开始口述。

~12 MB
软件下载体积
90+
种语言在设备端转写
0
账户或音频上传

你首先需要什么

没多少东西。DijiFlow Dictate 是一个小巧的菜单栏软件——下载约 12 MB。语音模型是单独的，视你想要的准确率和语言覆盖而定，从大约 300 MB 到 6 GB 不等。它们只需下载一次；此后，一切完全离线运行。

一台 Mac 或 PC。搭载 Apple Silicon 的 macOS 14 或更高版本，或者 Windows 10 或 11。在 Windows 上，AMD、Intel 和 NVIDIA 的 GPU 都能用；NVIDIA 显卡需要 CUDA 和一个较新的驱动。
一个麦克风。内置麦克风足够你起步。在嘈杂的房间里耳麦会有帮助，但第一次跑起来并非必需。

你不必一开始就敲定某个版本。免费版永久可用，30 天试用则解锁每一项 Pro 功能，无需信用卡。明智的做法是先装上它、试一次真正的口述，再去想哪个版本适合自己。

四步搞定设置

每一步都是一次性的。做完一次，此后口述就只是一次按键的事。

下载并打开
装好软件并启动它。它住在你的菜单栏（macOS）或系统托盘（Windows）里，而不是一个大窗口。首次运行时，你的操作系统会请求麦克风访问权限，以及在你光标处打字的权限——两个都批准，否则软件听不到你，也放不了文字。
挑一个语音模型
系统会提示你下载一个模型。较小的模型又快又轻；较大的模型在口音和专业词汇上更准。先从一个中等尺寸的开始——以后随时可以换。这是唯一需要联网的环节。
设置你的快捷键
打开设置，指定触发口述的那个快捷键。选一个你在别处还没用过的组合键，这样它就永远不会在句子说到一半时撞键。多数软件和场合里，总有个清闲的修饰键或功能键可用。
跑一次你的第一段口述
点进任意一个文本框，按下你的快捷键，然后说。片刻之后，你的话便落在光标处。整个循环就是这样——按键、说话、完成。

模型下载一完成，你就完全离线了。那第一步之后，做任何事都不再需要网络连接。

把你的第一句话说对

你的第一段口述，往往决定了你会不会接着用下去，所以把它布置得稳赢。打开一个空白笔记或一个草稿文档——一个出错也无所谓的地方——而不是把快捷键直接按进一封正式邮件里。

然后以正常语速说一个完整的句子。比如这样：「咱们把会议改到周四，前一天晚上把幻灯片发出去。」别去刻意咬字或一个词一个词地说。Whisper 会读整个短语来加标点、定拼写，所以自然、完整的句子，比小心翼翼、断断续续的句子出来得更干净。

核心要点

说完整的句子，别说单个的词——Whisper 会借助周围的上下文来加标点、定拼写，所以完整的短语转写出来明显更干净。

把你的准确率调到位

默认设置开箱即用就很好，但几处小调整能让它更上一层，尤其是当你的工作里满是人名和技术术语时。

设定你的语言。DijiFlow Dictate 能转写 90+ 种语言。把你正在说的那一种告诉它，结果立刻就更可靠。
压低背景噪声。更安静的房间有帮助；在通话中和共用空间里，耳麦帮助更大。
往上调一档模型尺寸，如果较小的模型在行话、专有名词或浓重口音上栽了跟头。更大的模型用一点点速度，换来明显更好的准确率。

设备端这一点为什么要紧

多数口述工具都把你的语音流式传到服务器去转写。DijiFlow Dictate 反着来——工作完全在你自己的硬件上发生。不用登录，没有使用追踪，没有音频被发往任何地方。这让它天然适合机密笔记、客户工作、你还不愿分享的早期草稿，以及任何稳定网络并非理所当然的场合。你的网速从不掺和进来，因为压根没有要等的来回。