Meet PITIR TECH: The Mission and Principles Behind DijiFlow Dictate
about4 min read

Γνωρίστε την PITIR TECH: η αποστολή και οι αρχές πίσω από το DijiFlow Dictate

Η ιστορία και οι αρχές προϊόντος πίσω από το DijiFlow Dictate της PITIR TECH: ιδιωτική μετατροπή φωνής σε κείμενο που εκτελείται στη συσκευή και δεν φεύγει ποτέ από τον υπολογιστή σας.

Ανοίξτε σχεδόν οποιαδήποτε εφαρμογή υπαγόρευσης και το ίδιο πράγμα συμβαίνει κρυφά: μιλάτε, και η φωνή σας φεύγει από το δωμάτιο. Ταξιδεύει σε έναν διακομιστή, μεταγράφεται από ένα μοντέλο που δεν μπορείτε να δείτε και επιστρέφει ως κείμενο μια στιγμή αργότερα. Η ευκολία είναι γνήσια. Όμως το ίδιο είναι και η ανταλλαγή που μόλις κάνατε — η πιο αφύλακτη μορφή εισόδου σας, ηχογραφημένη και επεξεργασμένη σε εξοπλισμό που δεν σας ανήκει.

Η PITIR TECH ξεκίνησε από ένα επίμονο ερώτημα: γιατί να είναι αυτό η προεπιλογή; Είμαστε το στούντιο λογισμικού της Ninu Limited στο Ηνωμένο Βασίλειο, και χτίζουμε εργαλεία τεχνητής νοημοσύνης με προτεραιότητα στην ιδιωτικότητα που τρέχουν εξ ολοκλήρου στον δικό σας εξοπλισμό. Το πρώτο μας προϊόν, το DijiFlow Dictate, είναι η πιο ξεκάθαρη έκφραση αυτής της ιδέας. Αυτή η σελίδα αφορά λιγότερο εμάς και περισσότερο αυτό που προσπαθούμε να αποδείξουμε.

Το καλό λογισμικό πρέπει να κερδίζει την εμπιστοσύνη σας εκ σχεδιασμού, όχι να σας ζητά να την αποδεχτείτε στα τυφλά. Αν η φωνή σας δεν φεύγει ποτέ από τη συσκευή σας, η ιδιωτικότητα παύει να είναι μια υπόσχεση και γίνεται ένα γεγονός.

Γιατί στη συσκευή, και γιατί έχει σημασία για εμάς

Η απόφαση στην καρδιά του DijiFlow Dictate είναι εύκολη στη διατύπωση και δύσκολη στη μηχανική: τα πάντα τρέχουν τοπικά. Η αναγνώριση ομιλίας γίνεται στο δικό σας μηχάνημα, με τη χρήση των ανοιχτού κώδικα μοντέλων ομιλίας Whisper μέσω του CoreML της Apple και του ανοιχτού κώδικα WhisperKit. Τίποτα δεν ανεβαίνει. Χωρίς λογαριασμό, χωρίς cloud, χωρίς τηλεμετρία.

Αυτή δεν είναι μια λειτουργία που προσθέσαμε για μια ατάκα μάρκετινγκ. Είναι όλο το νόημα. Όταν ο ήχος δεν φεύγει ποτέ από τον υπολογιστή σας, δεν υπάρχει αρχείο καταγραφής διακομιστή για να διαρρεύσει, καμία παραβίαση που να μπορεί να εκθέσει τα κείμενά σας και καμία σιωπηλή αλλαγή πολιτικής που να αρχίσει να στέλνει τις λέξεις σας κάπου αλλού. Η αρχιτεκτονική κάνει τη δουλειά που συνήθως πρέπει να κάνουν οι πολιτικές ιδιωτικότητας. Προτιμούμε να χτίσουμε την εγγύηση παρά να τη γράψουμε.

Σημαίνει επίσης ότι η εφαρμογή συνεχίζει να λειτουργεί όταν το δίκτυο δεν λειτουργεί. Μπορείτε να κόψετε τη σύνδεσή σας στη μέση μιας πρότασης και η υπαγόρευση συνεχίζει ακριβώς το ίδιο. Αυτός είναι ο πήχης που θέτουμε στον εαυτό μας: αν ένα εργαλείο χρειάζεται το cloud για να κάνει την κύρια δουλειά του, δεν είναι πραγματικά δικό σας.

Σε τι πιστεύουμε

Μια χούφτα αρχές διαμορφώνουν σχεδόν κάθε απόφαση που παίρνουμε για το DijiFlow Dictate.

  1. Η ιδιωτικότητα είναι δομική

    Τα ασφαλέστερα δεδομένα είναι αυτά που δεν συλλέχθηκαν ποτέ. Σχεδιάζουμε έτσι ώστε το ευαίσθητο πράγμα — η φωνή σας — απλώς να μην ταξιδεύει ποτέ κάπου όπου θα μπορούσε να χαθεί.

  2. Μένουμε διακριτικοί

    Η υπαγόρευση πρέπει να νιώθεται σαν προέκταση της πληκτρολόγησης, όχι σαν ένα μέρος που επισκέπτεστε. Η εφαρμογή ζει στη γραμμή μενού· πατάτε ένα πλήκτρο συντόμευσης, μιλάτε, και το κείμενο εμφανίζεται εκεί όπου βρίσκεται ήδη ο δείκτης σας.

  3. Είμαστε ειλικρινείς για τους συμβιβασμούς

    Σας λέμε ξεκάθαρα τι κοστίζει κάθε μοντέλο ομιλίας σε μέγεθος και τι αποδίδει σε ακρίβεια, και διατηρούμε ένα πραγματικά χρήσιμο δωρεάν επίπεδο αντί να το ακρωτηριάσουμε για να επιβάλουμε μια αναβάθμιση.

  4. Χτίζουμε σε στέρεο έδαφος

    Στεκόμαστε πάνω σε ανοιχτά θεμέλια αντί να τα επανεφεύρουμε. Το DijiFlow Dictate είναι χτισμένο πάνω στο EasyDictate του Charles Lukowski, που χρησιμοποιείται υπό την άδεια MIT, και χαιρόμαστε να το λέμε.

Στεκόμαστε πάνω σε ανοιχτά θεμέλια

Δεν εφεύραμε εμείς την αναγνώριση ομιλίας, και δεν πρόκειται να προσποιηθούμε το αντίθετο. Το DijiFlow Dictate ξεπήδησε από δουλειά ανοιχτού κώδικα — Whisper, WhisperKit και EasyDictate του Charles Lukowski, του οποίου ο κώδικας με άδεια MIT είναι μέρος αυτού πάνω στο οποίο χτίσαμε. Η αναγνώρισή αυτού δεν είναι μια υποσημείωση που ανεχόμαστε· είναι μέρος του πώς πιστεύουμε ότι πρέπει να λειτουργεί ο τομέας. Το ενδιαφέρον πρόβλημα δεν ήταν ποτέ μόνο το μοντέλο. Ήταν να φτιάξουμε κάτι αρκετά ιδιωτικό, γρήγορο και ευχάριστο ώστε να καταφεύγετε σε αυτό χωρίς δεύτερη σκέψη, σε ένα Mac σήμερα και σε Windows επίσης.

Τι είμαστε, και τι δεν είμαστε

Η PITIR TECH είναι μια μικρή, εστιασμένη ομάδα. Δεν χτίζουμε μια πλατφόρμα που εμπορευματοποιεί τα δεδομένα σας, και δεν μας ενδιαφέρει να συλλέγουμε περισσότερα απ' όσα χρειάζεται το προϊόν για να λειτουργεί — που, εκ σχεδιασμού, είναι ουσιαστικά τίποτα. Δεν θέλουμε το email σας για να ξεκινήσετε να υπαγορεύετε, τη χρήση σας για να βελτιώσουμε ένα διαφημιστικό προφίλ ή τις ηχογραφήσεις σας για να εκπαιδεύσουμε το επόμενο μοντέλο. Τίποτα από αυτά δεν είναι στο τραπέζι, επειδή τίποτα από αυτά δεν φτάνει ποτέ σε εμάς.

Το μέτρο επιτυχίας που πραγματικά μας νοιάζει είναι ήσυχο. Είναι το DijiFlow Dictate να γίνεται μέρος του τρόπου που εργάζεστε χωρίς να απαιτεί την προσοχή σας, ώστε να μη χρειάζεται ποτέ να αναρωτηθείτε πού πήγε η φωνή σας. Η απάντηση είναι πάντα η ίδια, και είναι ολόκληρος ο λόγος που το φτιάξαμε. Έμεινε μαζί σας.

Αν αυτός ο τρόπος δημιουργίας σας αγγίζει, ο καλύτερος τρόπος να τον κατανοήσετε είναι να δείτε πώς τον αξιοποιούν οι άνθρωποι — ρίξτε μια ματιά στους τρόπους με τους οποίους το DijiFlow Dictate ταιριάζει σε πραγματική δουλειά.

DijiFlow DictateDijiFlow Dictate

Η ομάδα του DijiFlow Dictate

Σημειώσεις για την ιδιωτική, 100% τοπική υπαγόρευση και για το πώς να κάνετε περισσότερα με τη φωνή σας.

Ξεκινήστε να υπαγορεύετε χωρίς χέρια σήμερα.

Ιδιωτική, 100% τοπική μετατροπή φωνής σε κείμενο σε 90+ γλώσσες — δωρεάν για πάντα, με Pro όταν χρειάζεστε περισσότερα.