Trung tâm trợ giúp
Câu hỏi,
đã có lời giải.
Tất cả những gì bạn cần biết về DijiFlow Dictate — cài đặt, quyền riêng tư, tính năng, giá cả và những cách khắc phục nhanh.
Bắt đầu sử dụng
Tải ứng dụng từ trang tải về và mở trình cài đặt. Trên Mac, kéo DijiFlow vào thư mục Applications; trên Windows, chạy trình cài đặt. Lần đầu khởi chạy, ứng dụng nằm trên thanh menu ở Mac (hoặc khay hệ thống ở Windows) và hướng dẫn bạn cấp các quyền cần thiết cũng như tải về mô hình giọng nói đầu tiên. Việc này mất vài phút, và không cần tạo tài khoản nào cả.
Theo mặc định, bạn đọc chính tả bằng một phím tắt toàn cục — Right Option + Space trên Mac. Giữ phím để nói (nhấn-để-nói) rồi thả ra để chèn văn bản, hoặc nhấn một lần để bật/tắt ghi âm — tùy cách nào tự nhiên với bạn. Phím tắt hoạt động trong mọi ứng dụng, ở bất cứ đâu trên máy tính của bạn. Bạn có thể đổi nó sang tổ hợp khác trong phần cài đặt, và bản Pro cho phép bạn thiết lập tới ba khe riêng biệt cho các ngôn ngữ hoặc lối tắt khác nhau.
Trên Mac, DijiFlow cần hai quyền (trên Windows chỉ cần micro). Micro cho phép nó ghi âm khi bạn đọc chính tả — và micro chỉ hoạt động khi bạn đang chủ động ghi âm. Accessibility được dùng cho một mục đích duy nhất: phát hiện phím tắt đọc chính tả toàn cục của bạn (Right Option + Space) để nhấn-để-nói và bật/tắt hoạt động được từ mọi ứng dụng, đồng thời chèn văn bản hoàn chỉnh vào nơi con trỏ của bạn đang đặt. Nó không đọc, theo dõi hay ghi lại những gì bạn gõ ở nơi khác, và không có gì bạn gõ bị ghi lại hay gửi đi đâu cả.
Mô hình giọng nói là phần thực sự biến giọng nói của bạn thành văn bản, và nó chạy hoàn toàn trên máy tính của bạn. Để giữ cho ứng dụng nhỏ gọn (~12 MB), chúng tôi tải mô hình về vào lần đầu tiên bạn sử dụng thay vì gói kèm mọi tùy chọn. Lần tải về một lần này cần kết nối internet; sau đó, việc đọc chính tả và phiên âm tệp hoạt động hoàn toàn ngoại tuyến. Bản Pro có thể tải về các mô hình lớn hơn, chính xác nhất, bao gồm cả large-v3.
Quyền riêng tư & bảo mật
Không đi đâu cả. Âm thanh và văn bản kết quả của bạn ở lại trên máy tính và không bao giờ được tải lên. Micro chỉ hoạt động khi bạn đang ghi âm, và sau đó DijiFlow chèn thẳng văn bản vào bất kỳ ứng dụng nào bạn đang gõ. Trong ứng dụng không có việc thu thập dữ liệu, không có phân tích và không có báo cáo sự cố nào, và không cần tài khoản để sử dụng.
Có. Vì mọi thứ chạy trên thiết bị, cam kết về quyền riêng tư có thể kiểm chứng được chứ không chỉ là lời hứa: một khi mô hình giọng nói đã được tải về, việc đọc chính tả và phiên âm tệp không cần bất kỳ truy cập mạng nào. Bạn có thể tự xác nhận điều này — hãy tắt Wi-Fi (hoặc toàn bộ kết nối mạng) và thấy việc phiên âm vẫn tiếp tục hoạt động. Không có gì rời khỏi thiết bị, nên đơn giản là không có bản ghi nào về việc sử dụng của bạn ở phía máy chủ để lưu giữ.
Không. Ứng dụng không chứa việc thu thập dữ liệu, không phân tích và không báo cáo sự cố — nó không gửi dữ liệu về máy chủ. Bạn không tạo tài khoản và không đăng nhập. (Riêng phần website của DijiFlow là một cửa hàng Shopify thông thường và có dùng cookie cùng công cụ phân tích để xử lý đơn hàng và đo lưu lượng truy cập trang; điều đó hoàn toàn độc lập với ứng dụng, vốn không dùng cả hai.)
Rất ít, và tất cả đều nằm cục bộ. Việc kích hoạt chỉ lưu một mã băm của khóa giấy phép và một mã băm của ID phần cứng, giữ trên máy tính của bạn — không có hồ sơ phía máy chủ và không có bản ghi về những gì bạn phiên âm. ID phần cứng là một định danh ẩn danh, không phải tên hay email của bạn, và nó chỉ được dùng để xác nhận giấy phép đang được sử dụng trên một số lượng thiết bị hợp lý.
Rất phù hợp. Vì âm thanh và văn bản không bao giờ rời khỏi máy tính của bạn, không có bên thứ ba nào xử lý bản ghi và không có bản sao trên đám mây cần bảo vệ — điều này phù hợp với công việc nhạy cảm như pháp lý, y tế và các trường hợp đọc chính tả bảo mật khác, nơi vấn đề lưu trú dữ liệu và các nghĩa vụ kiểu GDPR là quan trọng. Chúng tôi không thể đưa ra tuyên bố chứng nhận chính thức thay cho bạn, nhưng thiết kế trên thiết bị, không tài khoản, không thu thập dữ liệu sẽ loại bỏ những rủi ro về quyền riêng tư thường gặp ở dịch vụ phiên âm trên đám mây. Để triển khai trên toàn tổ chức, hãy xem các tùy chọn cấp phép doanh nghiệp của chúng tôi.
Tính năng
Hai cách đọc chính tả, tùy bạn chọn. Nhấn-để-nói: giữ phím tắt khi bạn nói và thả ra khi xong — tuyệt vời cho những câu ngắn và phản hồi nhanh. Bật/tắt: nhấn một lần để bắt đầu, nhấn lại để dừng — phù hợp hơn cho những đoạn dài mà bạn không muốn giữ phím. Cả hai đều chèn văn bản hoàn chỉnh vào nơi con trỏ của bạn đang đặt, trong mọi ứng dụng.
Có. DijiFlow đọc chính tả vào bất kỳ ứng dụng nào đang có con trỏ của bạn — email, trò chuyện, tài liệu, trình soạn mã, ô nhập trên trình duyệt, ghi chú, bất cứ nơi nào bạn có thể gõ. Nó không bị giới hạn vào một chương trình duy nhất. Vì nó nằm trên thanh menu và lắng nghe một phím tắt toàn cục, bạn có thể đọc chính tả mà không cần chuyển cửa sổ hay mở ứng dụng trước.
Có. Bên cạnh đọc chính tả trực tiếp, DijiFlow phiên âm các tệp âm thanh và video có sẵn hoàn toàn trên máy tính của bạn — không tải lên. Bản Free xử lý các tệp dài tới 3 phút; bản Pro gỡ bỏ giới hạn đó để phiên âm tệp và video không giới hạn, nên bạn có thể xử lý các bản ghi dài, phỏng vấn và cuộc họp ngay trên máy.
Có, trên bản Pro. Pro bổ sung nhãn người nói (ai nói gì) và dấu thời gian vào bản phiên âm, giúp các cuộc phỏng vấn, cuộc họp và bản ghi nhiều người dễ đọc và dễ tra cứu hơn nhiều. Cả hai đều chạy trên thiết bị như mọi thứ khác. Những tính năng này không có trên bản Free.
Có, trên bản Pro. Hãy thêm các thuật ngữ tùy chỉnh của riêng bạn và dùng gói từ vựng để tên riêng, thương hiệu, tên sản phẩm và biệt ngữ ngành được phiên âm đúng thay vì bị đoán theo cách phát âm. Điều này tạo khác biệt lớn cho công việc y tế, pháp lý và kỹ thuật, nơi từ vựng chuyên ngành thường xuất hiện.
90+ ngôn ngữ, với khả năng tự động chọn mô hình đa ngôn ngữ để bạn không phải chọn thủ công — DijiFlow chọn đúng mô hình cho những gì nó nghe được. Cả 90+ ngôn ngữ đều có sẵn trên bản Free. Bản Pro bổ sung các mô hình lớn nhất, chính xác nhất (bao gồm large-v3) để có kết quả tốt nhất với giọng vùng miền, thuật ngữ kỹ thuật và các bản ghi dài hơn.
Độ chính xác & mô hình
DijiFlow chạy các mô hình nhận dạng giọng nói Whisper của OpenAI thông qua WhisperKit và CoreML của Apple, nên việc phiên âm diễn ra ngay trên thiết bị của bạn — GPU và Neural Engine của máy Mac, hoặc GPU AMD, Intel hay NVIDIA của máy PC — thay vì trên một máy chủ từ xa. Kết quả là phiên âm nhanh, chính xác, hoàn toàn trên thiết bị mà không cần gửi đi đám mây.
Với giọng nói rõ ràng, độ chính xác đạt khoảng 98%. Kết quả thực tế phụ thuộc vào micro, tiếng ồn nền, giọng đọc và mô hình bạn chọn — mô hình lớn hơn sẽ chính xác hơn với âm thanh khó nghe. Trên bản Pro, bạn có thể bổ sung từ vựng tùy chỉnh để tên riêng và thuật ngữ kỹ thuật được nhận đúng, giúp nâng độ chính xác hơn nữa cho công việc chuyên ngành.
Nhanh hơn thời gian thực gấp nhiều lần. Với khả năng tăng tốc GPU của bản Pro — Apple Neural Engine trên Mac, hoặc GPU AMD, Intel và NVIDIA trên Windows — DijiFlow xử lý âm thanh nhanh hơn nhiều lần so với thời gian phát lại nó, nên việc đọc chính tả trực tiếp cảm giác tức thì và việc phiên âm các tệp dài cũng hoàn tất nhanh chóng. Bản Free dùng xử lý bằng CPU, chậm hơn nhưng vẫn đầy đủ chức năng.
Với việc đọc chính tả hằng ngày, một mô hình nhỏ hơn là đủ nhanh và đủ chính xác, và đó là mặc định. Nếu bạn cần độ chính xác cao nhất — cho giọng đọc nặng, thuật ngữ kỹ thuật hay y tế, hoặc các bản ghi dài — hãy chọn một mô hình lớn hơn. Bản Pro mở khóa các mô hình lớn nhất, bao gồm large-v3, cùng với khả năng tăng tốc GPU giúp ngay cả những mô hình lớn cũng phản hồi nhanh nhạy.
Nền tảng
Có. DijiFlow Dictate chạy trên cả Mac và Windows. Windows hỗ trợ GPU AMD, Intel và NVIDIA (NVIDIA cần cài CUDA; AMD và Intel cần trình điều khiển mới nhất). Một giấy phép Pro dùng được cho cả hai nền tảng.
DijiFlow chạy trên macOS 14 (Sonoma) trở lên với Apple Silicon (M1 trở về sau). Nó dựa vào GPU Metal và Neural Engine để phiên âm trên thiết bị, nên bắt buộc phải có Apple Silicon — máy Mac dùng Intel không được hỗ trợ. Trên Windows, DijiFlow chạy trên Windows 10 hoặc 11 (64-bit) và dùng GPU của bạn để tăng tốc: NVIDIA qua CUDA, còn AMD hoặc Intel qua các trình điều khiển mới nhất. Bản thân ứng dụng là một tệp tải về nhỏ gọn ~12 MB. Các mô hình giọng nói tách riêng và tải về một lần khi sử dụng lần đầu: mô hình base khoảng 300 MB, còn mô hình lớn nhất (large-v3) khoảng 6 GB. DijiFlow nằm trên thanh menu, sẵn sàng bất cứ khi nào bạn nhấn phím tắt.
Giá & cấp phép
Free (miễn phí trọn đời) cho bạn tính năng đọc chính tả cốt lõi kiểu nhấn-để-nói và bật/tắt, toàn bộ 90+ ngôn ngữ, một khe ngôn ngữ/phím tắt, phiên âm tệp tối đa 3 phút và xử lý bằng CPU. Pro bổ sung ba khe ngôn ngữ/phím tắt, phiên âm tệp & video không giới hạn, nhãn người nói, dấu thời gian, gói từ vựng và từ ngữ tùy chỉnh, tăng tốc GPU/Neural Engine, cùng các mô hình lớn nhất, chính xác nhất (bao gồm large-v3). Xem bảng so sánh đầy đủ trên trang tính năng.
Bản dùng thử cho bạn 30 ngày dùng đầy đủ các tính năng Pro mà không cần thẻ tín dụng — mọi khả năng của Pro, bao gồm các mô hình lớn nhất, tăng tốc GPU/Neural Engine, phiên âm tệp và video không giới hạn, nhãn người nói và dấu thời gian. Khi 30 ngày kết thúc, ứng dụng đơn giản trở về bản Free (miễn phí trọn đời), nên bạn vẫn giữ tính năng đọc chính tả cốt lõi, toàn bộ 90+ ngôn ngữ và phiên âm tệp ngắn. Chỉ cần tải DijiFlow để bắt đầu — bản dùng thử khởi động ngay từ lần chạy đầu tiên.
Có bốn gói Pro: Monthly £4.99, 6-Month £20.94, 12-Month £29.94 (giảm 50%, giá trị tốt nhất của chúng tôi), và Lifetime £39 trả một lần. Ứng dụng giống hệt nhau ở mọi gói trả phí — chúng chỉ khác nhau ở thời hạn hiệu lực của giấy phép. Các tổ chức lớn hơn cũng có thể nhận mức giá Enterprise tùy chỉnh. Xem chi tiết đầy đủ trên trang các gói.
Điều này tùy thuộc vào việc bạn dự định dùng DijiFlow trong bao lâu. Monthly (£4.99) là mức cam kết thấp nhất và dễ hủy — phù hợp để thử Pro trong công việc thực tế. Gói 12-Month (£29.94, giảm 50%, giá trị tốt nhất của chúng tôi) hợp với những ai đã ổn định cho cả năm. Lifetime (£39 trả một lần) hoàn vốn trong chưa đầy một năm và không bao giờ gia hạn. Tạm tính: nếu bạn dự kiến dùng quá khoảng tám tháng, Lifetime là lựa chọn tốt hơn. Tùy chọn 6 tháng (£20.94) nằm ở giữa.
Có. Gói Lifetime là một khoản thanh toán duy nhất £39 không có gia hạn — giấy phép Pro của bạn luôn hoạt động mãi mãi. Đây là giá trị dài hạn tốt nhất nếu bạn dùng DijiFlow thường xuyên, và vì một giấy phép Pro dùng được cho cả Mac và Windows, một lần mua Lifetime sẽ hoạt động trên cả hai nền tảng.
Có. Các bản cập nhật được bao gồm chừng nào giấy phép của bạn còn hiệu lực — với Lifetime thì điều đó nghĩa là mãi mãi, không tính thêm phí. Bạn không phải trả riêng cho các tính năng mới hay cải tiến; một giấy phép Pro còn hiệu lực luôn giữ cho bạn ở phiên bản mới nhất.
Có — có chính sách hoàn tiền trong 30 ngày. Nếu DijiFlow không phù hợp với bạn trong vòng 30 ngày kể từ khi mua, hãy gửi email tới info@pitirtech.com và chúng tôi sẽ giải quyết. Chúng tôi phản hồi trong vòng một ngày làm việc, từ Thứ Hai đến Thứ Sáu, 9:00–18:00 giờ UK. Thông tin đầy đủ có trên trang chính sách hoàn tiền của chúng tôi.
Có. Nếu bạn mua cho một nhóm hay một tổ chức, chúng tôi cung cấp cấp phép số lượng lớn và Enterprise với mức giá tùy chỉnh — lý tưởng cho các nhóm coi trọng quyền riêng tư cần phiên âm trên thiết bị ở quy mô lớn. Hãy truy cập trang cấp phép doanh nghiệp của chúng tôi hoặc gửi email tới info@pitirtech.com và chúng tôi sẽ chuẩn bị một báo giá.
Khắc phục sự cố
Một vài điều thường có ích:
- Trên bản Pro, hãy bật tăng tốc GPU/Neural Engine — nó nhanh hơn CPU gấp nhiều lần.
- Dùng một mô hình nhỏ hơn cho việc đọc chính tả hằng ngày; để dành các mô hình lớn nhất cho âm thanh khó hoặc quan trọng.
- Đóng các ứng dụng nặng khác để GPU được rảnh.
Bản Free chạy trên CPU, vốn chậm hơn theo thiết kế — nâng cấp lên Pro là cách tăng tốc đơn lẻ lớn nhất.
Hãy thử lần lượt các cách sau:
- Chọn một mô hình lớn hơn, chính xác hơn cho âm thanh khó nghe hoặc nhiều tạp âm.
- Thêm thuật ngữ riêng của bạn qua từ vựng tùy chỉnh và gói từ vựng (Pro) để tên riêng, thương hiệu và biệt ngữ được nhận đúng.
- Giảm tiếng ồn nền và nói với tốc độ đều, tự nhiên.
- Kiểm tra micro đã được chọn đúng trong cài đặt âm thanh của hệ thống.
Vẫn chưa được? Gửi email tới info@pitirtech.com và chúng tôi sẽ hỗ trợ bạn — thường trong vòng một ngày làm việc.
Mở DijiFlow từ thanh menu, chọn tùy chọn giấy phép hoặc kích hoạt, rồi dán mã từ email xác nhận đơn hàng của bạn (mã có dạng PTIR-XXXX-XXXX-XXXX-XXXX). Việc kích hoạt chỉ lưu một mã băm của khóa và một mã băm của ID phần cứng trên máy bạn — không cần đăng nhập tài khoản. Nếu mã không kích hoạt được, hãy kiểm tra lại xem nó có khớp với đơn hàng không, sau đó liên hệ info@pitirtech.com và chúng tôi sẽ giúp bạn vận hành.
Không vấn đề gì. Khóa của bạn nằm trong email xác nhận đơn hàng ban đầu, vì vậy hãy kiểm tra ở đó trước (kể cả thư rác). Nếu không tìm thấy, hãy gửi email từ địa chỉ bạn đã dùng để đặt hàng tới info@pitirtech.com và chúng tôi sẽ gửi lại. Chúng tôi phản hồi trong vòng một ngày làm việc, từ thứ Hai đến thứ Sáu, 9:00–18:00 giờ Anh.
Chúng tôi luôn sẵn lòng giúp bạn.
Chúng tôi phản hồi trực tiếp, trong vòng một ngày làm việc (Thứ Hai đến Thứ Sáu, 9:00–18:00 giờ UK).
Miễn phí trọn đời · Không cần tài khoản · 100% trên thiết bị