Getting Started with DijiFlow Dictate: Setup, Hotkeys, and Your First Dictation
dictation4 min read

Primeros pasos con DijiFlow Dictate: configuración, atajos de teclado y tu primer dictado

Una guía práctica para instalar DijiFlow Dictate, elegir un atajo de teclado y dictar en cualquier aplicación con conversión de voz a texto privada y en el dispositivo.

Desde una descarga recién hecha hasta tu primera frase en pantalla, DijiFlow Dictate tarda más o menos lo que se tarda en hacer un café. Pulsas una tecla, hablas y las palabras aparecen justo donde tienes el cursor: en un correo, un documento, una caja de chat, un comentario de código, la aplicación en la que estés. Sin una ventana que lidiar, sin copiar y pegar, sin cuenta.

Y nada sale de tu equipo. DijiFlow Dictate ejecuta los modelos de voz Whisper de OpenAI en local a través de WhisperKit y CoreML, así que no hay inicio de sesión, ni telemetría, ni un solo byte de audio subido. Esta guía te lleva de la instalación al dictado en cuatro pasos cortos.

  • ~12 MB
    descarga de la aplicación
  • 90+
    idiomas transcritos en el dispositivo
  • 0
    cuentas o subidas de audio

Qué necesitas primero

No mucho. DijiFlow Dictate es una pequeña aplicación de barra de menús: unos 12 MB de descarga. Los modelos de voz van aparte y van desde aproximadamente 300 MB hasta 6 GB según la precisión y la cobertura de idiomas que quieras. Se descargan una sola vez; a partir de ahí, todo se ejecuta totalmente sin conexión.

  • Un Mac o un PC. macOS 14 o posterior con Apple Silicon, o Windows 10 u 11. En Windows funcionan las GPU de AMD, Intel y NVIDIA; las tarjetas NVIDIA necesitan CUDA y un controlador actualizado.
  • Un micrófono. El micrófono integrado sirve para empezar. Unos auriculares con micro ayudan en una sala ruidosa, pero no hacen falta para tu primera prueba.

No tienes que decidir un plan de entrada. La versión Free funciona para siempre, y la Trial de 30 días desbloquea todas las funciones Pro sin tarjeta de crédito. Lo más sensato es instalarlo y probar un dictado real antes de pensar en qué versión encaja.

Configúralo en cuatro pasos

Cada paso es algo de una sola vez. Hazlos una vez y a partir de entonces dictar es una sola pulsación de tecla.

  1. Descarga y abre

    Instala la aplicación y ábrela. Vive en tu barra de menús (macOS) o en la bandeja del sistema (Windows), no en una ventana grande. En la primera ejecución, tu sistema operativo pedirá acceso al micrófono y permiso para escribir en tu cursor; aprueba ambos, o la aplicación no podrá oírte ni colocar texto.

  2. Elige un modelo de voz

    Se te pedirá descargar un modelo. Los modelos más pequeños son rápidos y ligeros; los más grandes son más precisos con acentos y vocabulario especializado. Empieza con uno de tamaño medio: puedes cambiarlo después. Esta es la única parte que necesita conexión a internet.

  3. Configura tu atajo

    Abre los Ajustes y asigna el atajo que activa el dictado. Elige una combinación de teclas que no uses ya en otro sitio, para que nunca choque a mitad de frase. La mayoría de las aplicaciones y salas tienen libre alguna tecla modificadora o de función discreta.

  4. Haz tu primer dictado

    Haz clic en cualquier campo de texto, pulsa tu atajo y habla. En un momento tus palabras caen en el cursor. Ese es el bucle entero: pulsa, habla, listo.

Una vez que el modelo termine de descargarse, estás totalmente sin conexión. No hace falta conexión para nada después de ese primer paso.

Acierta con tu primera frase

Tu primer dictado es el que decide si sigues, así que prepáralo para ganar. Abre una nota en blanco o un documento de pruebas —algún sitio donde los errores no importen— en lugar de disparar tu atajo directo en un correo en marcha.

Luego di una frase completa a un ritmo normal. Algo como: «Movamos la reunión al jueves y enviemos la presentación la noche anterior». Resiste el impulso de sobrevocalizar o de hablar palabra por palabra. Whisper lee la frase entera para puntuar y deletrear, así que las frases naturales y completas salen más limpias que las cuidadas y entrecortadas.

Idea clave

Habla en frases completas, no en palabras sueltas: Whisper usa el contexto que las rodea para puntuar y deletrear, así que las frases completas se transcriben notablemente más limpias.

Afina tu precisión

La configuración por defecto es buena de fábrica, pero un par de pequeños ajustes la mejoran, sobre todo si tu trabajo está lleno de nombres y términos técnicos.

  • Configura tu idioma. DijiFlow Dictate transcribe más de 90 idiomas. Dile cuál estás hablando y los resultados se vuelven más fiables al instante.
  • Reduce el ruido de fondo. Una sala más silenciosa ayuda; un micrófono de auriculares ayuda más en llamadas y espacios compartidos.
  • Sube un tamaño de modelo si uno más pequeño tropieza con la jerga, los nombres propios o un acento marcado. Los modelos más grandes cambian un poco de velocidad por una precisión claramente mejor.

Por qué importa lo de estar en el dispositivo

La mayoría de las herramientas de dictado transmiten tu voz a un servidor para transcribirla. DijiFlow Dictate hace lo contrario: el trabajo ocurre por completo en tu propio hardware. Sin inicio de sesión, sin seguimiento de uso, sin audio enviado a ninguna parte. Eso lo hace encajar fácil con notas confidenciales, trabajo con clientes, primeros borradores que no estás listo para compartir y cualquier lugar donde una conexión estable no sea un hecho. La velocidad de tu red nunca entra en juego, porque no hay viaje de ida y vuelta que esperar.

A partir de aquí

Dedica diez minutos a dictar en las aplicaciones en las que vives. Una vez que el atajo se convierte en memoria muscular, hablar rápido se convierte en la forma más veloz de sacar un primer borrador, y la versión Free te deja descubrirlo a tu propio ritmo. Cuando estés listo para el conjunto completo de funciones, échale un vistazo a DijiFlow Dictate Pro.

DijiFlow DictateDijiFlow Dictate

El equipo de DijiFlow Dictate

Apuntes sobre dictado privado en tu dispositivo y cómo hacer más con tu voz.

Empieza a dictar con las manos libres hoy.

Voz a texto privada, 100% en tu dispositivo y en 90+ idiomas — gratis para siempre, y Pro cuando necesites más.