Getting Started with DijiFlow Dictate: Setup, Hotkeys, and Your First Dictation
dictation3 min read

Начало работы с DijiFlow Dictate: установка, горячие клавиши и первая диктовка

Практическое руководство по установке DijiFlow Dictate, выбору горячей клавиши и диктовке в любом приложении с приватным преобразованием голоса в текст прямо на устройстве.

От свежей загрузки до вашего первого предложения на экране DijiFlow Dictate занимает примерно столько же времени, сколько сварить кофе. Вы нажимаете клавишу, говорите, и слова появляются ровно там, где ваш курсор, — в письме, документе, окне чата, комментарии к коду, в каком бы приложении вы ни оказались. Никакого окна, с которым нужно возиться, никакого копирования-вставки, никакого аккаунта.

И ничто не покидает ваш компьютер. DijiFlow Dictate запускает речевые модели Whisper от OpenAI локально через WhisperKit и CoreML, так что нет ни входа в систему, ни телеметрии, ни единого загруженного байта звука. Это руководство проведёт вас от установки до диктовки за четыре коротких шага.

  • ~12 MB
    загрузка приложения
  • 90+
    языков распознаётся на устройстве
  • 0
    аккаунтов или загрузок звука

Что понадобится сначала

Немного. DijiFlow Dictate — маленькое приложение в строке меню, около 12 MB для загрузки. Речевые модели хранятся отдельно и занимают от примерно 300 MB до 6 GB в зависимости от нужной точности и охвата языков. Они загружаются один раз; после этого всё работает полностью офлайн.

  • Mac или ПК. macOS 14 или новее на Apple Silicon либо Windows 10 или 11. На Windows работают GPU AMD, Intel и NVIDIA; картам NVIDIA нужны CUDA и актуальный драйвер.
  • Микрофон. Встроенного микрофона достаточно для старта. Гарнитура помогает в шумной комнате, но для первого запуска она не нужна.

Не обязательно выбирать тариф заранее. Тариф Free работает вечно, а 30-дневный Trial открывает все возможности Pro без банковской карты. Правильный шаг — установить приложение и попробовать настоящую диктовку, прежде чем думать, какой тариф подходит.

Настройка за четыре шага

Каждый шаг делается один раз. Сделайте их однажды — и диктовка с этого момента становится одним нажатием клавиши.

  1. Загрузите и откройте

    Установите приложение и запустите его. Оно живёт в строке меню (macOS) или в системном трее (Windows), а не в большом окне. При первом запуске операционная система запросит доступ к микрофону и разрешение печатать у курсора — одобрите оба, иначе приложение не сможет вас услышать или поставить текст.

  2. Выберите речевую модель

    Вам предложат загрузить модель. Меньшие модели быстры и легки; более крупные точнее с акцентами и специализированным словарём. Начните со среднего размера — позже можно сменить. Это единственная часть, которой нужно интернет-подключение.

  3. Задайте горячую клавишу

    Откройте настройки и назначьте сочетание, запускающее диктовку. Выберите комбинацию клавиш, которую больше нигде не используете, чтобы она никогда не сталкивалась посреди предложения. У большинства приложений и в большинстве ситуаций найдётся свободная клавиша-модификатор или функциональная клавиша.

  4. Проведите первую диктовку

    Кликните в любое текстовое поле, нажмите горячую клавишу и говорите. Через мгновение ваши слова появятся у курсора. Вот и весь цикл — нажать, сказать, готово.

Как только модель загрузится, вы полностью офлайн. После того первого шага ни для чего не нужно подключение.

Сделайте первое предложение правильно

Ваша первая диктовка — та, что решает, продолжите ли вы, поэтому настройте её на успех. Откройте пустую заметку или черновой документ — где-нибудь, где ошибки не важны, — а не запускайте горячую клавишу сразу в реальном письме.

Затем произнесите полное предложение в обычном темпе. Например: «Давайте перенесём встречу на четверг и отправим презентацию накануне вечером». Удержитесь от того, чтобы переусердствовать с артикуляцией или говорить по слову. Whisper читает всю фразу, чтобы расставить пунктуацию и написание, поэтому естественные, полные предложения выходят чище, чем осторожные и обрывочные.

Главное

Говорите полными предложениями, а не отдельными словами — Whisper использует окружающий контекст для пунктуации и написания, так что цельные фразы расшифровываются заметно чище.

Настройте точность под себя

Стандартная настройка хороша из коробки, но пара небольших правок делает её лучше, особенно если ваша работа полна имён и технических терминов.

  • Укажите язык. DijiFlow Dictate распознаёт 90+ языков. Скажите ему, на каком вы говорите, и результаты сразу станут надёжнее.
  • Уберите фоновый шум. Более тихая комната помогает; микрофон гарнитуры помогает сильнее на звонках и в общих помещениях.
  • Поднимитесь на размер модели выше, если меньшая модель спотыкается на жаргоне, именах собственных или сильном акценте. Более крупные модели жертвуют небольшой скоростью ради заметно лучшей точности.

Почему часть «на устройстве» важна

Большинство инструментов диктовки передают ваш голос потоком на сервер, чтобы его расшифровать. DijiFlow Dictate делает наоборот — работа происходит целиком на вашем собственном оборудовании. Никакого входа в систему, никакого отслеживания использования, никакого звука, отправленного куда-либо. Это делает его удобным для конфиденциальных заметок, работы с клиентами, ранних черновиков, которыми вы пока не готовы делиться, и любого места, где устойчивое подключение не гарантировано. Скорость вашей сети тут вообще не при чём, потому что нет пересылки, которую надо ждать.

Что дальше

Уделите десять минут диктовке в тех приложениях, где вы живёте. Как только горячая клавиша превратится в мышечную память, быстрая речь станет самым быстрым способом записать первый черновик — и тариф Free позволяет убедиться в этом в своём темпе. Когда будете готовы к полному набору возможностей, взгляните на DijiFlow Dictate Pro.

DijiFlow DictateDijiFlow Dictate

Команда DijiFlow Dictate

Заметки о приватной диктовке прямо на устройстве и о том, как успевать больше с помощью голоса.

Начните диктовать, не касаясь клавиатуры уже сегодня.

Приватный перевод речи в текст на 90+ языках, на 100% на вашем устройстве — бесплатно навсегда, а Pro, когда нужно больше.