Free、Trial 还是 Pro:选择适合你的 DijiFlow 方案(以及每种方案包含的内容)
对比 DijiFlow Dictate 的 Free、Trial 和 Pro 方案。清楚了解每个层级包含的具体内容,从而选择适合自己的设备端听写方案。
您的购物车中有 %itemCount%。合计 %total%
一份实用指南,介绍如何安装 DijiFlow Dictate、选择快捷键,并通过私密的设备端语音转文字在任意应用中进行听写。
从下载完成到屏幕上出现你的第一句话,DijiFlow Dictate 花的时间,差不多够你冲杯咖啡。你按下一个键、开口说,文字就出现在你光标所在的地方——在邮件、文档、聊天框、代码注释里,你人在哪个软件,它就出现在哪个软件。没有窗口要应付,不用复制粘贴,也没有账户。
而且没有任何东西离开你的机器。DijiFlow Dictate 通过 WhisperKit 和 CoreML 在本地运行 OpenAI 的 Whisper 语音模型,因此不用登录、没有遥测,也没有哪怕一个字节的音频被上传。本指南用四个简短的步骤,带你从安装走到开始口述。
没多少东西。DijiFlow Dictate 是一个小巧的菜单栏软件——下载约 12 MB。语音模型是单独的,视你想要的准确率和语言覆盖而定,从大约 300 MB 到 6 GB 不等。它们只需下载一次;此后,一切完全离线运行。
你不必一开始就敲定某个版本。免费版永久可用,30 天 Trial 则解锁每一项 Pro 功能,无需信用卡。明智的做法是先装上它、试一次真正的口述,再去想哪个版本适合自己。
每一步都是一次性的。做完一次,此后口述就只是一次按键的事。
装好软件并启动它。它住在你的菜单栏(macOS)或系统托盘(Windows)里,而不是一个大窗口。首次运行时,你的操作系统会请求麦克风访问权限,以及在你光标处打字的权限——两个都批准,否则软件听不到你,也放不了文字。
系统会提示你下载一个模型。较小的模型又快又轻;较大的模型在口音和专业词汇上更准。先从一个中等尺寸的开始——以后随时可以换。这是唯一需要联网的环节。
打开设置,指定触发口述的那个快捷键。选一个你在别处还没用过的组合键,这样它就永远不会在句子说到一半时撞键。多数软件和场合里,总有个清闲的修饰键或功能键可用。
点进任意一个文本框,按下你的快捷键,然后说。片刻之后,你的话便落在光标处。整个循环就是这样——按键、说话、完成。
模型下载一完成,你就完全离线了。那第一步之后,做任何事都不再需要网络连接。
你的第一段口述,往往决定了你会不会接着用下去,所以把它布置得稳赢。打开一个空白笔记或一个草稿文档——一个出错也无所谓的地方——而不是把快捷键直接按进一封正式邮件里。
然后以正常语速说一个完整的句子。比如这样:「咱们把会议改到周四,前一天晚上把幻灯片发出去。」别去刻意咬字或一个词一个词地说。Whisper 会读整个短语来加标点、定拼写,所以自然、完整的句子,比小心翼翼、断断续续的句子出来得更干净。
核心要点
说完整的句子,别说单个的词——Whisper 会借助周围的上下文来加标点、定拼写,所以完整的短语转写出来明显更干净。
默认设置开箱即用就很好,但几处小调整能让它更上一层,尤其是当你的工作里满是人名和技术术语时。
多数口述工具都把你的语音流式传到服务器去转写。DijiFlow Dictate 反着来——工作完全在你自己的硬件上发生。不用登录,没有使用追踪,没有音频被发往任何地方。这让它天然适合机密笔记、客户工作、你还不愿分享的早期草稿,以及任何稳定网络并非理所当然的场合。你的网速从不掺和进来,因为压根没有要等的来回。
花十分钟,在你天天泡着的那些软件里口述。一旦快捷键变成肌肉记忆,快速说话很快就会成为把初稿落地最快的方式——而免费版让你按自己的节奏去发现这一点。等你准备好迎接完整的功能集,来看看 DijiFlow Dictate Pro。
私密、100% 设备端的语音转文字,支持 90+ 种语言——永久免费,需要更多时升级 Pro。