Meet PITIR TECH: The Mission and Principles Behind DijiFlow Dictate
about3 min read

Знайомтеся, PITIR TECH: місія та принципи, що стоять за DijiFlow Dictate

Історія та продуктові принципи, що стоять за DijiFlow Dictate від PITIR TECH: приватне перетворення голосу на текст на пристрої, яке ніколи не залишає вашу машину.

Відкрийте майже будь-який застосунок для диктування — і поза очима стається те саме: ви говорите, і ваш голос залишає кімнату. Він мандрує до сервера, його транскрибує модель, якої ви не бачите, і за мить він повертається текстом. Зручність справжня. Та справжній і обмін, який ви щойно вчинили, — найнезахищеніша форма вашого введення, записана й оброблена на обладнанні, яке вам не належить.

PITIR TECH почалася з упертого питання: чому це має бути нормою? Ми — програмна студія Ninu Limited у Великій Британії, і ми створюємо інструменти ШІ із приватністю передусім, що працюють повністю на вашому власному обладнанні. Наш перший продукт, DijiFlow Dictate, — найчіткіше втілення цієї ідеї. Ця сторінка не так про нас, як про те, що ми намагаємося довести.

Хороше програмне забезпечення має заслуговувати вашу довіру самим задумом, а не просити приймати її на віру. Якщо ваш голос ніколи не залишає пристрій, приватність перестає бути обіцянкою й стає фактом.

Чому на пристрої і чому це важливо для нас

Рішення в основі DijiFlow Dictate легко вимовити й важко спроєктувати: усе працює локально. Розпізнавання мовлення відбувається на вашій власній машині за допомогою мовленнєвих моделей Whisper з відкритим кодом через Apple CoreML та WhisperKit з відкритим кодом. Нічого не завантажується в мережу. Без облікового запису, без хмари, без телеметрії.

Це не функція, яку ми доточили заради маркетингового рядка. Це і є вся суть. Коли аудіо ніколи не залишає ваш комп'ютер, немає серверного журналу, що міг би витекти, немає зламу, який міг би розкрити ваші транскрипти, і немає тихої зміни політики, що почала б відправляти ваші слова кудись по-новому. Архітектура робить роботу, яку зазвичай доводиться робити політикам приватності. Ми радше побудуємо гарантію, ніж напишемо її.

Це також означає, що застосунок продовжує працювати, коли мережа — ні. Ви можете висмикнути з'єднання посеред речення, і диктування триватиме точнісінько так само. Це планка, яку ми тримаємо для себе: якщо інструменту потрібна хмара, щоб виконувати свою головну роботу, він не справді ваш.

У що ми віримо

Жменя принципів формує майже кожне наше рішення щодо DijiFlow Dictate.

  1. Приватність структурна

    Найбезпечніші дані — це ті, що ніколи не збиралися. Ми проєктуємо так, щоб чутлива річ — ваш голос — просто ніколи не мандрувала туди, де її можна втратити.

  2. Не заважати

    Диктування має відчуватися як продовження друкування, а не як місце, куди ви навідуєтеся. Застосунок живе в рядку меню; ви натискаєте комбінацію клавіш, говорите — і текст опиняється там, де вже стоїть курсор.

  3. Чесно говорити про компроміси

    Ми прямо кажемо, чого кожна мовленнєва модель коштує в розмірі й що дає в точності, і ми тримаємо справді корисний рівень Free, замість того щоб калічити його заради примусового оновлення.

  4. Будувати на міцному ґрунті

    Ми стоїмо на відкритих засадах, а не винаходимо їх наново. DijiFlow Dictate побудовано на EasyDictate від Charles Lukowski, що використовується за ліцензією MIT, і ми раді про це сказати.

Стоячи на відкритих засадах

Ми не винайшли розпізнавання мовлення й не вдаватимемо інакше. DijiFlow Dictate виріс із праці з відкритим кодом — Whisper, WhisperKit та EasyDictate від Charles Lukowski, чий код під ліцензією MIT є частиною того, на чому ми будували. Згадувати це — не примітка, яку ми терпимо; це частина того, як, на нашу думку, має працювати галузь. Цікава задача ніколи не була в самій моделі. Вона полягала в тому, щоб зробити щось приватне, швидке й достатньо приємне, аби ви тяглися до нього не замислюючись, — на Mac уже сьогодні, а згодом і на Windows.

Хто ми є і ким не є

PITIR TECH — невелика, зосереджена справа. Ми не будуємо платформу, яка монетизує ваші дані, і нам нецікаво збирати більше, ніж потрібно продукту для роботи, — а це, за задумом, по суті нічого. Ми не хочемо ні вашої пошти, щоб почати диктування, ні вашого використання, щоб уточнити рекламний профіль, ні ваших записів, щоб навчити наступну модель. Нічого з цього немає на столі, бо нічого з цього до нас узагалі не доходить.

Мірило успіху, яке нас справді хвилює, — тихе. Це коли DijiFlow Dictate стає частиною того, як ви працюєте, не вимагаючи вашої уваги, тож вам ніколи не доводиться гадати, куди подівся ваш голос. Відповідь завжди та сама, і це вся причина, чому ми це створили. Він лишився з вами.

Якщо такий спосіб будувати вам відгукується, найкраще його зрозуміти — побачити, як люди застосовують його в роботі: погляньте на способи, якими DijiFlow Dictate вписується в реальну роботу.

DijiFlow DictateDijiFlow Dictate

Команда DijiFlow Dictate

Нотатки про приватне диктування на пристрої та про те, як зробити більше за допомогою голосу.

Почніть диктувати без рук вже сьогодні.

Приватне перетворення голосу на текст, 100% на пристрої, 90+ мовами — безкоштовно назавжди, а Pro, коли потрібно більше.