Free、Trial 还是 Pro:选择适合你的 DijiFlow 方案(以及每种方案包含的内容)
对比 DijiFlow Dictate 的 Free、Trial 和 Pro 方案。清楚了解每个层级包含的具体内容,从而选择适合自己的设备端听写方案。
您的购物车中有 %itemCount%。合计 %total%
设备端听写让你的声音留在你自己的电脑上:无账户、无云端、无遥测。这才是真正私密的语音转文字。
打开一款常见的口述软件,你的声音就要去出趟门。麦克风把你录下来,音频上传到服务器,一个模型在远方某处把它转写出来,片刻之后文字传回。它感觉是即时的。但在那几秒里,你的话停留在你并不拥有的硬件上,受一份并非你撰写的政策约束。
DijiFlow Dictate 从不把它们发出去。你的语音被采集、转写、变成文字,全程都在你面前这台 Mac 上完成。没有任何内容被上传。没有任何内容被存到服务器上。当我们说没有任何东西离开你的设备时,这不是一句宽慰之辞——而是对这款软件如何构建的描述。
核心要点
隐私由设计而来,意味着架构本身让泄露成为不可能,而不是靠一份政策承诺它不会发生。
不少口述工具都把传输加密摆在最前面。这东西值得拥有,但要看清它实际管的是什么:它在你的音频驶向服务器的途中保护它。音频一到达,服务商就会把它解密,好让模型读取。
从那一刻起,你信任的是一连串你看不见的东西——一项保留期设置、一份访问名单、一家供应商的善意、一份下个季度就可能被改写的隐私声明。加密守的是这条路。对于终点,它什么也做不了。
设备端处理则取消了那个终点。回路里没有服务器,因此不存在第二个地方让你的声音被解密、记录或留存。录音、转写,以及最终的文字,全都留在你早已拥有的硬件之内。
DijiFlow Dictate 使用 苹果 CoreML 和 WhisperKit,直接在你的 Mac 上运行 Whisper 语音模型。没有远端服务在干活,也没有那种在模型拿不准时悄悄把你的音频送往别处的回退机制。你机器上的那个模型,就是整个系统。
正因为工作发生在本地,便有几件多数云端工具无法企及的事情随之而来:
最后这一点你可以亲手验证。拔掉网线,关掉 Wi-Fi,接着口述。如果它依然管用——而它确实管用——那就说明转写从一开始就没向外伸过手。能验证的行为,胜过你只能凭信念去接受的承诺。
并排来看,反差最为清晰。在每一种做法下,你的数据住在哪里,这里一目了然。
| 你的数据会怎样 | DijiFlow(设备端) | 常见云端工具 |
|---|---|---|
| 音频留在你的机器上 | ✓ | ✗ |
| 转写永不离开你的设备 | ✓ | ✗ |
| 无需账户或邮箱 | ✓ | ✗ |
| 不回传使用遥测 | ✓ | ✗ |
| 关掉网络也能用 | ✓ | ✗ |
| 无可向供应商传唤取证之物 | ✓ | ✗ |
用三个数字来讲,是同一个故事。
对许多人来说,口述会触及那些根本不该躺在别人日志里的材料。一位临床医生在严格保密规定下起草病历。一位律师口述享有特权保护的往来函件。一位记者转写一位被承诺保密的消息源。一位工程师把内部架构口述进文档。
在上述每一种情形里,最安全的数据,就是那份从未被传输过的数据。设备端口述把你的转写置于第三方的数据泄露、传唤取证或悄然变更的政策所触及不到的地方——因为那个第三方从一开始就没收到过它们。
从前的设定是:把东西留在本地要以准确率或速度为代价,设备端模型是更弱的那个选项。这个说法已不再成立。Apple Silicon 又快又好地运行着 Whisper 级别的模型,DijiFlow 在设备端处理 90+ 种语言,其中 29 种配有词汇调校,让人名、行话和缩写都能准确呈现。
你挑选适合你 Mac 和你准确率需求的模型尺寸。其结果,是一种过去需要数据中心才能达到的转写质量,而它的产出过程没有一个字节离开过你的桌面。
这里的隐私优先,不是你要去打开的一项功能。因为这款软件是围绕本地推理构建的,私密的行为就是它本来的行为——没有要找的设置,也没有要记的模式。DijiFlow Dictate 日常使用永久免费,并提供完整 Pro 功能集的 30 天 Trial,待你准备好再用 Pro。
如果你的话理应只属于你,那就看看设备端口述如何贴合你的工作。
私密、100% 设备端的语音转文字,支持 90+ 种语言——永久免费,需要更多时升级 Pro。