Mi camino hacia la creación de prototipos de voz

La tecnología de voz es una de las tendencias más populares en este momento. Cada empresa está tratando de entrar en acción y no se les puede culpar. De acuerdo a OberloAproximadamente el 71% de los consumidores incluso prefieren usar la búsqueda por voz en lugar de escribir, por lo que no hace falta decir que las personas quieren usar su voz para hacer las cosas. Pero, ¿se puede usar algo tan nuevo como la voz para resolver los desafíos de una industria tan compleja como la de la salud? ¿Hay alguna manera de probar estos flujos de trabajo? Estas son las preguntas que nos propusimos responder cuando nos embarcamos en nuestro viaje de prototipo de voz.

Contenido del Articulo

Selección de plataforma

Herramientas como Figma o Invision pueden imitar fácilmente las funciones de una interfaz de usuario “en la que se puede hacer clic”, pero no son capaces de interactuar con la voz. Necesitábamos una nueva herramienta que permitiera a los usuarios hablar y escuchar comentarios de audio desde nuestra aplicación. Según las herramientas de creación de prototipos disponibles con funciones de voz, consideramos usar Adobe XD y Voiceflow.

Captura de pantalla Adobe XD

Adobe XD tiene una potente interfaz de usuario y capacidades de diseño visual con funciones básicas de creación de prototipos de voz.

Adobe XD es una aplicación de diseño vectorial completa que admite la creación de prototipos de voz, mientras que Voiceflow tiene capacidades de edición visual muy limitadas, pero es una herramienta de creación de prototipos de voz muy poderosa. Asumimos que nuestras necesidades estarían centradas casi por completo en la voz, por lo que se tomó la decisión de utilizar Voiceflow.

Voiceflow Builder tiene la capacidad de arrastrar y soltar para crear rápidamente interacciones de voz.

Voiceflow también tenía algunas características que ayudaron a consolidarlo como nuestra primera opción. Los prototipos son fáciles de compartir y cualquier persona puede probarlos con poca o ninguna configuración, ya que los prototipos están disponibles directamente en su navegador y se pueden compartir a través de un hipervínculo. Otra característica que nos llamó la atención es la experiencia integrada en la herramienta, lo que significa que siempre tienes los mejores trucos y consejos prácticos al alcance de tu mano. No era tan confiable con Adobe XD ya que esta herramienta no solo se enfoca en el diseño de voz. Voiceflow también tenía increíbles niveles de personalización para su asistente de voz: podía elegir diferentes tonos de voz, tono y, lo que es más importante, velocidad. También admite variables; por ejemplo, puede decirle al prototipo su nombre y lo recordará y le responderá.

Definición del problema

Cualquier profesional de UX con una buena relación calidad-precio sabe que no puede crear una solución sin comprender completamente el problema. Si bien hay muchas maneras de hacer esto, comenzamos nuestro proceso con dos talleres con algunos de nuestros usuarios y expertos en dominios para averiguar qué flujos de trabajo les causan los mayores problemas. Luego evaluamos si estos flujos podrían simplificarse mediante comandos de voz. Luego, estas dos rutas separadas se compararon utilizando una herramienta de desarrollo de flujo de trabajo llamada Extraño. Lo más importante que debe recordar durante estos talleres es asegurarse de que las tareas que estamos simplificando sean realmente tareas significativas y no soluciones simples como “abrir correo electrónico”, que en realidad serían más fáciles de realizar con un par de clics.

Parte de un diagrama de flujo de trabajo creado en Whimsical

Ejemplo de flujo de trabajo elegante

¡Tiempo de prototipos!

Voiceflow tiene una experiencia de incorporación bastante agradable en la que tienen un prototipo completo configurado para mostrarle los conceptos básicos. El flujo de voz es bastante rico en funciones, pero nuestro prototipo se centró principalmente en el uso de bloques de “elección”, imágenes y sonido.


Una grabación de nuestro prototipo de voz creado en Voiceflow.

Bloques de selección

Esta es la base de nuestros prototipos. Esencialmente, puede escribir lo que está a punto de decir y especificar a qué bloque desea saltar cuando suceda. Para aquellos que están inclinados a codificar, piensen en esto como una declaración si-entonces. De hecho, el núcleo de todo nuestro prototipo se basa en un solo bloque con nueve “opciones” derivadas de él. Este patrón es especialmente útil si su aplicación o sitio tiene un único centro principal desde el que se origina la mayor parte de la acción.

Captura de pantalla de la interfaz de usuario de Voiceflow con múltiples acciones ramificadas

Ejemplo de concentrador

En nuestro prototipo, varios de los flujos de trabajo que mencionamos anteriormente comenzaron desde este centro y casi siempre regresaron aquí después de que finalizó el flujo de trabajo. Las “opciones” que puede decir en estos casos son lo que Voiceflow llama “dichos”. Un ejemplo de un dicho común sería “¿Cómo está el clima?”.

Captura de pantalla de Voiceflow que muestra posibles dichos

Cualquiera de estas declaraciones anteriores significa que necesita la segunda opción en la lista que se muestra en la pantalla.

Otra parte extremadamente importante de los cuadros de selección es el “texto único”. El texto de una sola vez son comodines que existen en sus extractos. Si aplicáramos esta lógica al ejemplo del clima anterior, se vería así en Voiceflow: “{one-time text} weather”. En este caso, cada vez que terminas lo que estás diciendo con “clima”, te envía por ese camino de expresión. Esto puede ser extremadamente útil cuando tiene palabras que Voiceflow tiene dificultades para reconocer. En nuestro caso, la aplicación con la que estábamos trabajando usa terminología médica complicada y oraciones que confundirían cualquier solución de voz estándar. También hizo que las demostraciones fueran más fluidas.

Captura de pantalla de Voiceflow que muestra la inserción de texto descartable

A veces, Voiceflow se confundía con “agregar protocolos”, por lo que implementamos un mensaje de texto único.

Tenga cuidado con el texto desechable, Pero. Siempre debe asegurarse de que cualquiera de sus prototipos pueda funcionar de manera efectiva en su aplicación con el entrenamiento adecuado del modelo de voz.

Efectos visuales

Si bien Adobe XD es mucho más adecuado para la creación de prototipos visuales, puede obtener más de lo que espera en Voiceflow… Solo necesita pensar en cada elemento visual que le gustaría ver y establecer un retraso de tiempo entre bloques. Por ejemplo, tenemos un flujo de trabajo para abrir la cámara de nuestra aplicación. Para completar el primer paso en este flujo de trabajo, mantenga presionada la barra espaciadora para permitir que Voiceflow “escuche” y pronuncie el nombre de nuestra aplicación para “despertar” a nuestro asistente virtual. Luego aparece una imagen en la que aparece un globo de diálogo en la pantalla con las palabras “Estoy escuchando”.

Después de que la aplicación “escuche”, mantenga presionada la barra espaciadora nuevamente y diga “abrir la cámara”. Voiceflow luego escucha su comando y, si lo reconoce, recorrerá las imágenes restantes para pasar al siguiente bloque de “elección”.

Audio

En nuestro prototipo, el sonido tenía varios usos principales. El primero indica que la aplicación realmente escuchó su comando de activación. Era un simple clip de sonido gratuito que encontré en Internet y no era molesto ni desagradable, ya que lo escuchabas cada vez que querías despertar a nuestro asistente. Otros casos de uso consistieron principalmente en confirmaciones, como guardar configuraciones o enviar un mensaje. En tales casos de uso, un asistente que dice el comando completo sería un poco exagerado y muy molesto después de algunas veces. Imagínese si cada vez que recibe un mensaje de texto, su teléfono diría: “Tiene un mensaje”.

Iteración

Hubo innumerables iteraciones a lo largo del proceso de creación de prototipos. Cada vez que se completaba un flujo de trabajo, se probaba y periódicamente se demostraban los flujos de trabajo a varios miembros del personal médico y otras partes interesadas. Se crearon diferentes versiones para diferentes especialidades, se agilizaron las respuestas de voz y se eliminaron pantallas innecesarias. Después de todo, uno de los principales atractivos de la voz es acelerar los flujos de trabajo de las personas y reducir la cantidad de clics necesarios para completar las tareas.

Una experiencia

Como especialista en experiencia de usuario, crear un prototipo de voz con Voiceflow fue un desafío interesante para mí. Debe lidiar con problemas similares al diseño normal (qué sucede si alguien hace clic en algo que no debe hacer, VS lo que sucede cuando alguien dice que no debe hacerlo), pero también hay algunas diferencias. Aquí no hay píxeles ni colores, por lo que las cosas no tienen que ser perfectas en ese sentido, pero también hay estándares o convenciones limitados, por lo que realmente debe concentrarse en lo que es tuyo las necesidades del usuario y los puntos débiles, no lo que podría ser una heurística de la industria.

Consejos de demostración

Dado que la mayoría de las empresas utilizan software de creación de prototipos de voz como Voiceflow como prueba de concepto, probablemente lo esté demostrando… mucho. A lo largo de las muchas demostraciones que he realizado para obtener comentarios de los usuarios, aquí hay algunos consejos:

Para mayor claridad, utilice imágenes pequeñas.

Si usa imágenes, y probablemente debería hacerlo, use imágenes que sean lo más pequeñas posible mientras mantiene la fidelidad visual para que los prototipos grandes no se interpongan en el camino. Por lo general, diseñaba imágenes a tamaño completo, pero las exportaba a 0,5 veces su tamaño original.

Abra solo la demostración y el script de Voiceflow.

Cierra todo lo que tengas abierto durante la demo. Sí, eso significa Chrome con 10,153 pestañas abiertas. Esto reducirá en gran medida el retraso de su demostración. Todavía recomendaría dejar abierta la pestaña del script o el programa. Esto me lleva al siguiente punto…

Tenga un guión bien pensado, palabra por palabra.

Como investigador de UX, sé que la flexibilidad es primordial durante una sesión, pero en mi opinión, tener un guión textual de los momentos clave de su interacción es increíblemente importante. Una entrevista completa puede desaparecer si te emocionas lo suficiente como para perder tu asiento. Lo mismo ocurre con la demostración de voz… Solo tienes una oportunidad de causar una primera impresión.

Habla claro y tómate tu tiempo.

El reconocimiento de voz en Voiceflow es bastante bueno, pero aún se vuelve confuso debido a las palabras inusuales (si pudiera borrar la palabra “intramail” de la faz de la tierra, lo haría). Así que asegúrate de hablar con naturalidad, pero con la mayor claridad posible.

Utilice comodines o “texto de una sola vez”.

Tan bueno como es el software de reconocimiento de voz, lo más probable es que no espere a que coincida una frase completa. Lo más probable es que use palabras clave y su prototipo no debería ser diferente. Muchas frases pueden estar completas, pero para otras tiene sentido tener solo palabras clave y texto único si las palabras clave son suficientes para no confundir al programa de creación de prototipos de voz.

Conclusión

Debido a que la tecnología de voz aún está en pañales, los únicos estándares que existen son comandos simples como “leer mis mensajes” o “ir a…”, pero en mi empresa tratamos de asegurarnos de que estamos resolviendo problemas reales y no solo agregando voz como una función de “nosotros también”. Esto hace que sea aún más importante que coincidamos con los modelos mentales de nuestros usuarios, pero de una manera diferente. En uno de nuestros talleres, incluso les dijimos a los participantes que deberían pretender que somos un ayudante humano. ¿Le pedirías a tu asistente humano que envíe un mensaje por ti? No, lo harías tú mismo porque es igual de fácil. Sin embargo, una tarea como “pedir X prescripción para este paciente, 100 mg” puede ser increíblemente eficiente debido a la gran cantidad de clics y entradas que ahorra.

Súper guía de diseño de interacción

La guía completa para principiantes sobre diseño de interacción

¿Listo para sumergirte en el diseño interactivo? En este artículo, abordaremos brevemente todos los aspectos del diseño de interacción: resultados, pautas, diseñadores famosos, sus herramientas y más. Incluso si usted mismo es un diseñador interactivo, lea el artículo y comparta sus pensamientos.

Previous post Cómo crear backlinks naturales que produzcan resultados
Next post Microsoft Ads presenta descripciones dinámicas para DSA

Deja una respuesta