Getting Started with DijiFlow Dictate: Setup, Hotkeys, and Your First Dictation
dictation4 min read

Pierwsze kroki z DijiFlow Dictate: instalacja, skróty klawiszowe i pierwsze dyktowanie

Praktyczny przewodnik po instalacji DijiFlow Dictate, wyborze skrótu klawiszowego i dyktowaniu w dowolnej aplikacji za pomocą prywatnej zamiany mowy na tekst działającej na urządzeniu.

Od świeżo pobranej aplikacji do pierwszego zdania na ekranie DijiFlow Dictate zajmuje mniej więcej tyle, co zaparzenie kawy. Naciskasz klawisz, mówisz, a słowa pojawiają się dokładnie tam, gdzie jest Twój kursor — w e-mailu, dokumencie, oknie czatu, komentarzu w kodzie, w dowolnej aplikacji, w której akurat jesteś. Bez okna do ogarniania, bez kopiuj-wklej, bez konta.

I nic nie opuszcza Twojego komputera. DijiFlow Dictate uruchamia modele mowy Whisper od OpenAI lokalnie poprzez WhisperKit i CoreML, więc nie ma logowania, nie ma telemetrii i nie ma ani jednego bajtu dźwięku wysłanego do sieci. Ten przewodnik przeprowadzi Cię od instalacji do dyktowania w czterech krótkich krokach.

  • ~12 MB
    pobranie aplikacji
  • 90+
    języków transkrybowanych na urządzeniu
  • 0
    kont lub wysłanych nagrań

Czego potrzebujesz na początek

Niewiele. DijiFlow Dictate to niewielka aplikacja na pasku menu — około 12 MB do pobrania. Modele mowy są osobne i mają od mniej więcej 300 MB do 6 GB w zależności od dokładności i zakresu języków, jakich potrzebujesz. Pobierają się raz; potem wszystko działa w pełni offline.

  • Mac lub PC. macOS 14 lub nowszy na Apple Silicon albo Windows 10 lub 11. Na Windowsie działają karty graficzne AMD, Intel i NVIDIA; karty NVIDIA wymagają CUDA i aktualnego sterownika.
  • Mikrofon. Wbudowany mikrofon w zupełności wystarczy na start. Zestaw słuchawkowy pomaga w hałaśliwym pomieszczeniu, ale nie jest wymagany przy pierwszym uruchomieniu.

Nie musisz decydować o planie z góry. Plan Free działa na zawsze, a 30-dniowy okres Trial odblokowuje każdą funkcję Pro bez karty kredytowej. Właściwy ruch to zainstalować i spróbować prawdziwego dyktowania, zanim zaczniesz się zastanawiać, który plan pasuje.

Skonfiguruj w czterech krokach

Każdy krok to rzecz jednorazowa. Zrób je raz, a dyktowanie staje się odtąd jednym naciśnięciem klawisza.

  1. Pobierz i otwórz

    Zainstaluj aplikację i uruchom ją. Mieszka na pasku menu (macOS) lub w zasobniku systemowym (Windows), a nie w dużym oknie. Przy pierwszym uruchomieniu system operacyjny poprosi o dostęp do mikrofonu oraz o pozwolenie na wpisywanie w kursorze — zatwierdź oba, bo inaczej aplikacja nie usłyszy Cię ani nie umieści tekstu.

  2. Wybierz model mowy

    Pojawi się propozycja pobrania modelu. Mniejsze modele są szybkie i lekkie; większe są dokładniejsze przy akcentach i specjalistycznym słownictwie. Zacznij od średniej wielkości — możesz go później wymienić. To jedyna część, która wymaga połączenia z internetem.

  3. Ustaw skrót klawiszowy

    Otwórz Ustawienia i przypisz skrót, który uruchamia dyktowanie. Wybierz kombinację klawiszy, której jeszcze nigdzie indziej nie używasz, by nigdy nie kolidowała w połowie zdania. W większości aplikacji i pomieszczeń jakiś cichy modyfikator lub klawisz funkcyjny jest wolny.

  4. Wykonaj pierwsze dyktowanie

    Kliknij w dowolne pole tekstowe, naciśnij skrót klawiszowy i mów. Po chwili Twoje słowa trafiają do kursora. To cała pętla — naciśnij, mów, gotowe.

Gdy model skończy się pobierać, jesteś w pełni offline. Po tym pierwszym kroku do niczego nie jest potrzebne połączenie.

Trafnie wykonaj pierwsze zdanie

Twoje pierwsze dyktowanie jest tym, które decyduje, czy będziesz kontynuować, więc ustaw je tak, by się udało. Otwórz pustą notatkę lub dokument na brudno — gdzieś, gdzie pomyłki nie mają znaczenia — zamiast odpalać skrót klawiszowy prosto w aktywnego e-maila.

Następnie wypowiedz całe zdanie w zwykłym tempie. Coś w stylu: „Przesuńmy spotkanie na czwartek i wyślijmy prezentację wieczorem dnia poprzedniego”. Powstrzymaj odruch przesadnego wymawiania czy mówienia słowo po słowie. Whisper czyta całą frazę, by postawić interpunkcję i poprawnie zapisać, więc naturalne, kompletne zdania wychodzą czyściej niż staranne, urywane.

Najważniejszy wniosek

Mów pełnymi zdaniami, a nie pojedynczymi słowami — Whisper wykorzystuje otaczający kontekst, by stawiać interpunkcję i poprawnie zapisywać, więc kompletne frazy transkrybują się zauważalnie czyściej.

Dostrój swoją dokładność

Domyślna konfiguracja jest dobra od razu po wyjęciu z pudełka, ale kilka drobnych korekt czyni ją lepszą, zwłaszcza jeśli Twoja praca jest pełna nazw i terminów technicznych.

  • Ustaw swój język. DijiFlow Dictate transkrybuje ponad 90+ języków. Powiedz mu, w którym mówisz, a wyniki od razu stają się bardziej niezawodne.
  • Ogranicz hałas w tle. Cichsze pomieszczenie pomaga; mikrofon w zestawie słuchawkowym pomaga bardziej podczas rozmów i we wspólnych przestrzeniach.
  • Przejdź o rozmiar wyżej w modelu, jeśli mniejszy model potyka się na żargonie, nazwach własnych lub silnym akcencie. Większe modele wymieniają odrobinę prędkości na wyraźnie lepszą dokładność.

Dlaczego część „na urządzeniu” ma znaczenie

Większość narzędzi do dyktowania przesyła Twój głos strumieniowo na serwer, by go przepisać. DijiFlow Dictate robi odwrotnie — praca odbywa się w całości na Twoim własnym sprzęcie. Bez logowania, bez śledzenia użycia, bez dźwięku wysyłanego gdziekolwiek. To czyni go łatwym wyborem do poufnych notatek, pracy z klientami, wczesnych wersji, których nie jesteś jeszcze gotów udostępnić, i każdego miejsca, gdzie stałe połączenie nie jest pewne. Prędkość Twojej sieci nigdy nie wchodzi w grę, bo nie ma podróży w obie strony, na którą trzeba by czekać.

Dalsze kroki

Poświęć dziesięć minut na dyktowanie w aplikacjach, w których żyjesz. Gdy skrót klawiszowy wejdzie w pamięć mięśniową, szybkie mówienie szybko staje się najszybszym sposobem na zapisanie pierwszej wersji — a plan Free pozwala Ci się o tym przekonać we własnym tempie. Gdy będziesz gotów na pełny zestaw funkcji, zajrzyj do DijiFlow Dictate Pro.

DijiFlow DictateDijiFlow Dictate

Zespół DijiFlow Dictate

Uwagi o prywatnym dyktowaniu na urządzeniu i o tym, jak zrobić więcej za pomocą głosu.

Zacznij dyktować bez użycia rąk już dziś.

Prywatna zamiana mowy na tekst w 100% na urządzeniu, w 90+ językach — za darmo na zawsze, a Pro wtedy, gdy potrzebujesz więcej.