快速上手
从下载页面下载应用并打开安装程序。在 Mac 上,将 DijiFlow 拖入您的应用程序文件夹;在 Windows 上,运行安装程序。首次启动时,该应用在 Mac 上常驻菜单栏(在 Windows 上则在系统托盘),并引导您授予所需权限以及下载您的第一个语音模型。整个过程只需几分钟,而且无需创建账户。
默认情况下,您通过全局快捷键进行口述——在 Mac 上是 右 Option + 空格。按住它说话(按住说话),松开即可插入文字;或者轻按一下来开关录音(切换式)——怎么顺手怎么来。该快捷键在任何应用、电脑上的任何位置都有效。您可以在设置中将它重新映射为其他组合键,Pro 版还允许您为不同语言或快捷方式设置最多三个独立槽位。
在 Mac 上,DijiFlow 需要两项权限(在 Windows 上仅需麦克风)。麦克风用于在您口述时录音——而且麦克风只在您主动录音时才开启。辅助功能仅用于一个目的:检测您的全局口述快捷键(右 Option + 空格),让按住说话和切换式录音可在任何应用中工作,并把完成的文字插入光标所在处。它不会读取、监视或记录您在其他地方输入的内容,您输入的任何内容都不会被记录或发送到任何地方。
语音模型是真正把您的声音转成文字的部分,它完全在您的电脑上运行。为了让应用保持小巧(约 12 MB),我们在您首次使用时才下载模型,而不是把每个选项都打包进去。这次一次性下载需要联网;之后,口述和文件转写就能完全离线工作。Pro 版可以获取更大、最准确的模型,包括 Large-v3。
隐私与安全
哪儿都不去。您的音频和生成的文字都保留在您的电脑上,绝不会上传。麦克风只在您录音时才开启,随后 DijiFlow 会把文字直接插入您正在输入的应用中。应用内没有任何遥测、分析或崩溃报告,使用它也无需创建账户。
可以验证。由于一切都在设备上运行,这份隐私保障是可验证的,而非空头承诺:一旦语音模型下载完成,口述和文件转写完全无需任何网络连接。您可以亲自确认——关闭 Wi-Fi(或整个网络连接),看着转写依然正常工作。没有任何内容离开设备,因此根本不存在需要保留的服务器端使用记录。
没有。应用不含任何遥测、分析或崩溃报告——它不会回传数据。您无需创建账户,也无需登录。(另外,DijiFlow 网站是一个普通的 Shopify 商店,确实使用 cookie 和分析来处理订单和衡量站点流量;这与应用完全无关,应用两者都不使用。)
很少,而且全都在本地。激活只会存储您授权密钥的哈希值和硬件 ID 的哈希值,保存在您的电脑上——没有服务器端的资料档案,也没有任何关于您转写内容的记录。该硬件 ID 是一个不透明的标识符,不是您的姓名或邮箱,它仅用于确认授权是否被用于合理数量的设备上。
非常合适。由于音频和文字从不离开您的电脑,没有任何第三方处理您的录音,也不存在需要保护的云端副本——这非常适合法律、医疗等涉及数据存放地和 GDPR 类义务的敏感、机密口述工作。我们无法代您做出正式的合规认证声明,但这种在设备上运行、无账户、无遥测的设计消除了常见的云端转写隐私风险。如需面向整个组织的部署,请查看我们的企业授权方案。
功能
两种口述方式,任您选择。按住说话:说话时按住快捷键,说完松开——非常适合短句和快速回复。切换式:轻按一下开始,再按一下停止——更适合不想一直按键的较长段落。两者都会把完成的文字插入光标所在处,可在任何应用中使用。
可以。DijiFlow 会把语音输入到光标所在的任何应用中——邮件、聊天、文档、代码编辑器、浏览器输入框、笔记,任何可以打字的地方都行。它并不局限于某一个程序。由于它常驻菜单栏并监听全局快捷键,您无需切换窗口或先打开应用即可口述。
可以。除了实时口述,DijiFlow 还能完全在您的电脑上转写已有的音频和视频文件——无需上传。Free 版支持最长 3 分钟的文件;Pro 版则取消该限制,支持无限时长的文件和视频转写,让您在本地处理长录音、访谈和会议。
可以,在 Pro 版中。Pro 版为转写文本添加说话人标注(谁说了什么)和时间戳,让访谈、会议和多人录音更易于阅读和查阅。两者都和其他功能一样在设备上运行。这些功能不包含在 Free 版中。
可以,在 Pro 版中。添加您自己的自定义术语并使用词汇包,让人名、品牌、产品名称和行业行话都能正确转写,而不是凭读音猜测。这对于专业词汇常见的医疗、法律和技术工作大有帮助。
支持 90+ 种语言,并具备自动多语言模型选择功能,因此您无需手动挑选——DijiFlow 会根据听到的内容选择合适的模型。全部 90+ 种语言在 Free 版中均可使用。Pro 版增加了最大、最准确的模型(包括 Large-v3),在口音、专业术语和较长录音上提供最佳效果。
准确率与模型
DijiFlow 通过 WhisperKit 和 Apple 的 CoreML 运行 OpenAI 的 Whisper 语音识别模型,因此转写都在您自己的设备上完成——Mac 的 GPU 和 Neural Engine,或 PC 的 AMD、Intel 或 NVIDIA GPU——而不是远程服务器。结果就是快速、准确、完全在设备上完成的转写,无需任何云端往返。
在清晰的语音下,识别准确率约为 98%。实际效果取决于您的麦克风、背景噪音、口音以及所选的模型——更大的模型在处理困难音频时更准确。在 Pro 版中,您可以添加自定义词汇,让人名和专业术语都能正确识别,从而进一步提升专业工作的准确率。
比实时快很多倍。借助 Pro 版的 GPU 加速——Mac 上的 Apple Neural Engine,或 Windows 上的 AMD、Intel 和 NVIDIA GPU——DijiFlow 处理音频的速度比播放它快好几倍,因此实时口述感觉即时完成,长文件转写也能很快结束。Free 版使用 CPU 处理,速度较慢但功能依然完整。
对于日常口述,较小的模型已经足够快速准确,它也是默认选项。如果您需要最高准确率——应对浓重口音、技术或医学术语,或长录音——请选择更大的模型。Pro 版解锁最大的模型,包括 Large-v3,并配合 GPU 加速,让即便是大模型也保持流畅响应。
平台
有的。DijiFlow Dictate 同时支持 Mac 和 Windows。Windows 支持 AMD、Intel 和 NVIDIA GPU(NVIDIA 需要安装 CUDA;AMD 和 Intel 需要最新驱动)。一个 Pro 授权同时涵盖两个平台。
DijiFlow 运行于 macOS 14(Sonoma)或更高版本,搭载 Apple Silicon(M1 及更新机型)。它依靠 Metal GPU 和 Neural Engine 进行在设备上的转写,因此必须使用 Apple Silicon——不支持 Intel 版 Mac。在 Windows 上,DijiFlow 运行于 Windows 10 或 11(64 位),并使用您的 GPU 进行加速:NVIDIA 通过 CUDA,AMD 或 Intel 则需要最新驱动。应用本身只是约 12 MB 的小型下载。语音模型是单独的,首次使用时下载一次:基础模型约 300 MB,最大的(Large-v3)约 6 GB。DijiFlow 常驻菜单栏,随时待命,只待您按下快捷键。
价格与授权
Free 版(永久免费)为您提供核心的按住说话和切换式口述、全部 90+ 种语言、一个语言/快捷键槽位、最长 3 分钟的文件转写,以及 CPU 处理。Pro 版增加了三个语言/快捷键槽位、无限时长的文件和视频转写、说话人标注、时间戳、词汇包和自定义术语、GPU/Neural Engine 加速,以及最大、最准确的模型(包括 Large-v3)。完整对比请见功能页面。
试用为您提供 30 天完整的 Pro 功能,无需信用卡——包括每一项 Pro 能力:最大的模型、GPU/Neural Engine 加速、无限时长的文件和视频转写、说话人标注以及时间戳。30 天结束后,应用会直接回退到 Free 版(永久免费),因此您仍保留核心口述、全部 90+ 种语言以及短文件转写。只需下载 DijiFlow 即可开始——试用在首次启动时开始计算。
共有四种 Pro 方案:月付 £4.99、6 个月 £20.94、12 个月 £29.94(5 折,最超值)以及终身 £39 一次性付款。每个付费方案的应用都完全相同——它们的区别仅在于授权的有效期长短。较大的组织还可获得定制的企业价格。完整详情请见方案页面。
这取决于您打算使用 DijiFlow 多久。月付(£4.99)承诺最低,也易于取消——很适合在实际工作中试用 Pro。12 个月方案(£29.94,5 折,最超值)适合打算用上一整年的人。终身(£39 一次性付款)不到一年就能回本,而且永不续费。大致来说:如果您预计使用超过约八个月,终身版更划算。6 个月方案(£20.94)则介于两者之间。
是的。终身版是一次性支付 £39,没有任何续费——您的 Pro 授权永久有效。如果您经常使用 DijiFlow,它是最划算的长期之选;而且由于一个 Pro 授权同时涵盖 Mac 和 Windows,终身购买可跨平台使用。
是的。只要您的授权有效,更新就一直包含在内——终身版即意味着永久包含,不收取任何额外费用。新功能或改进无需单独付费;有效的 Pro 授权会让您始终保持在最新版本。
可以——我们提供 30 天退款。如果在购买后 30 天内您觉得 DijiFlow 不合适,请发邮件至 info@pitirtech.com,我们会为您处理。我们在一个工作日内回复,英国时间周一至周五 9:00–18:00。完整详情请见我们的退款政策页面。
提供。如果您是为团队或组织采购,我们提供批量和企业授权及定制价格——非常适合需要大规模在设备上转写的注重隐私的团队。请访问我们的企业授权页面,或发邮件至 info@pitirtech.com,我们会为您准备报价。
故障排查
通常以下几点会有帮助:
- 在 Pro 版中,启用 GPU/Neural Engine 加速——它比 CPU 快很多倍。
- 日常口述使用较小的模型;把最大的模型留给困难或关键的音频。
- 关闭其他占用资源的应用,让 GPU 空闲下来。
Free 版在 CPU 上运行,按设计本就较慢——升级到 Pro 版是最大的单项提速。
请按以下顺序尝试:
- 对于困难或嘈杂的音频,选择更大、更准确的模型。
- 通过自定义词汇和词汇包(Pro 版)添加您自己的术语,让人名、品牌和行话都能正确转写。
- 减少背景噪音,并以平稳、自然的语速说话。
- 检查您的系统声音设置中是否正确选择了麦克风。
仍然没有解决?请发邮件至 info@pitirtech.com,我们会提供帮助——通常在一个工作日内回复。
从菜单栏打开 DijiFlow,选择授权或激活选项,然后粘贴您订单确认邮件中的密钥(密钥格式形如 PTIR-XXXX-XXXX-XXXX-XXXX)。激活只会在本地存储密钥的哈希值和硬件 ID 的哈希值——无需登录账户。如果密钥无法激活,请先核对它是否与您的订单一致,然后联系 info@pitirtech.com,我们会帮您解决。
排障
没问题。您的密钥就在最初的订单确认邮件中,请先查看那封邮件(包括垃圾邮件文件夹)。如果找不到,请用您下单时使用的邮箱发送邮件至 info@pitirtech.com,我们会重新发送给您。我们会在一个工作日内回复,周一至周五,英国时间 9:00–18:00。
我们很乐意 为您解答。
我们会亲自回复,在一个工作日内(英国时间周一至周五 9:00–18:00)。
永久免费 · 无需账户 · 100% 在设备上运行