Cómo crear una interfaz de usuario por voz exitosa para tus productos digitales

Una interfaz de usuario por voz es una tecnología que permite a las personas interactuar con una computadora o dispositivo mediante comandos hablados. Piensa en el Capitán Kirk parado en el puente de la nave espacial Enterprise y pidiéndole a la computadora un análisis. Lo que antes era solo ciencia ficción, hoy en día la VUI (Voice User Interface) es una de las tecnologías de más rápido crecimiento en el planeta.

Cómo crear una interfaz de usuario por voz exitosa para tus productos digitales - Desarrollo | Imagen 1 Newsmatic

Cada mes se realizan mil millones de búsquedas por voz, y el 72% de las personas que utilizan búsquedas por voz lo hacen a diario. La tecnología de voz de Google reconoce actualmente más de 100 idiomas, y las últimas estadísticas sugieren que su procesamiento de lenguaje natural tiene una precisión de más del 95%. No se puede negar que las VUI están logrando grandes avances en cuanto a adopción y precisión. Uno podría incluso argumentar que los avances en adopción son el resultado de los avances en precisión. Hay algo de verdad en eso, pero no es toda la historia.

Índice de Contenido
  1. Cómo la VUI ayuda a futurizar los productos digitales
  2. Prácticas recomendadas para la VUI
    1. Comienza con la interacción ideal
    2. Más opciones no significa más valor
    3. Contexto, contexto, contexto
    4. Manejo de errores específicos para la voz
    5. Recopila oraciones de los usuarios
    6. No te olvides de la privacidad y seguridad
  3. Cómo elegir la tecnología de VUI adecuada

Cómo la VUI ayuda a futurizar los productos digitales

Los seres humanos estamos programados para el habla. Como especie, hemos estado comunicándonos con la palabra hablada desde hace al menos 50 mil años. En promedio, podemos hablar entre 125 y 150 palabras por minuto, más de tres veces la velocidad promedio de escritura. Cuando lo piensas de esa manera, comienzas a preguntarte si las futuras generaciones se molestarán en aprender a escribir.

Si estás construyendo un producto o servicio digital, es muy probable que una VUI esté o esté en tus planes. Hace veinte años, agregar una interfaz de usuario por voz a una aplicación requería un equipo de ingenieros especializados, hardware costoso y, con frecuencia, resultaba en algo que sonaba como el Speak & Spell.

Hoy en día, incluso como principiante, puedes construir tu primera aplicación de voz en menos de una hora utilizando algo como el Alexa Skills Kit. Pero no es solo la tecnología la que hará que tu VUI tenga éxito o fracase. Para construir una interfaz de usuario por voz que eleve tu oferta digital al siguiente nivel, deberás entender algunas prácticas recomendadas y filosofías.

Cómo instalar y administrar un servidor Linux con YunoHost

Prácticas recomendadas para la VUI

Comienza con la interacción ideal

Querrás comenzar el diseño de tu interacción por voz trazando un flujo de diálogo de principio a fin. Comienza con el camino dorado y luego trabaja en completar las ramificaciones y casos específicos. Ten cuidado con los callejones sin salida en tus árboles de conversación. Al igual que cuando hablas con personas, el silencio incómodo mata la conversación.

Más opciones no significa más valor

Recuerda que los usuarios comienzan sin una clara indicación de qué opciones están disponibles, por lo que es esencial un proceso de incorporación adecuado. Comienza con una descripción general de lo que la interfaz puede hacer. Mantén las listas cortas, generalmente tres o menos opciones. Considera introducir identificadores numéricos antes de esas opciones para que tus usuarios tengan menos que recordar. También es importante tener en cuenta que los motores de texto a voz generalmente recitan la información mucho más lento de lo que las personas leen, por lo que es mejor redactar tus opciones de menú de manera concisa.

Contexto, contexto, contexto

Descifrar y mantener el contexto de manera programática es difícil tanto dentro de una sola sesión como en múltiples sesiones. Cuando los humanos interactuamos entre nosotros, tenemos acceso a una serie de señales no verbales. La entonación, el tono e incluso las expresiones faciales proporcionan contexto adicional. La mayoría de los programas comerciales de VUI ignoran estas señales de contexto. Curiosamente, sin embargo, casi todos pueden transmitir algo de contexto adicional en la respuesta, a través del lenguaje de marcado de síntesis de voz. El SSML permite a un desarrollador introducir pausas, entonaciones e incluso algo de emoción en las respuestas, aumentando la sensación de conversación de tu VUI.

Manejo de errores específicos para la voz

El manejo de errores en una VUI tiene desafíos específicos. Los mensajes de error deben ser específicos y sugerir un próximo curso de acción para el usuario. Por ejemplo: "Me temo que no sé cómo ayudarte con eso. Como recordatorio, puedo ayudarte con lo siguiente..."

También debes tener cuidado con un manipulador de errores genérico tipo "try-catch" que envíe un error a nivel de sistema hasta tu sistema TTS. No querrás que tu asistente de voz le diga a los usuarios "conexión cerrada por host remoto" u otro error común a nivel bajo. Llevar un registro es tu mejor amigo cuando se trata de depurar una VUI. Solo recuerda que tus registros contienen lo que la VUI escuchó, no necesariamente lo que el usuario dijo.

Recopila oraciones de los usuarios

Uno de los aspectos más desafiantes de crear una buena VUI es entrenar tu modelo en todas las diferentes formas en que tus usuarios pueden pedir lo mismo. Nunca podrás pensar en todas las variaciones por tu cuenta, y las encuestas generalmente no funcionan porque las personas escriben de manera diferente a cómo hablan.

Cómo instalar y acceder a Cockpit en Debian Server

En su lugar, deberás observar y, cuando sea posible, grabar a los usuarios en la vida real para comprender un número razonable de entradas de usuario en el lanzamiento. Asegúrate de observar a usuarios representativos de tu público objetivo: los médicos usan un conjunto de abreviaturas y jerga muy diferente al de los mecánicos o soldados.

No te olvides de la privacidad y seguridad

Cuando desarrollas una VUI, es tu responsabilidad comprender las preocupaciones de privacidad y seguridad. Los altavoces inteligentes comerciales están constantemente buscando una palabra de activación. Sin embargo, una vez activados, generalmente graban y descifran todo lo que se dice, lo que requiere hasta ocho segundos entre comandos antes de volver a la escucha pasiva.

Los desarrolladores deben ser conscientes de cualquier información sensible que pueda ser necesaria para un caso de uso específico, así como de las políticas y regulaciones que rigen el manejo de esos datos. También ten en cuenta que es imposible saber quién puede entrar en una habitación entre el momento en que se solicitó información y cuando realmente se habla la respuesta.

Cómo elegir la tecnología de VUI adecuada

Hoy en día, hay una lista bastante extensa de opciones para comenzar el desarrollo de tu interfaz de usuario por voz. Antes de seleccionar una solución específica, asegúrate de tener un buen entendimiento de tus requisitos no funcionales:

  • Conectividad
    • ¿El dispositivo estará conectado a Internet todo el tiempo?
  • Velocidad y precisión
    • ¿Es necesario que la traducción se realice en tiempo real?
    • ¿Cuál es el equilibrio entre velocidad y precisión?
  • Modelos de datos del dominio
    • ¿Qué tan bien entrenados están los modelos en tu dominio?
    • ¿Necesitas entender oraciones completas o simplemente identificar palabras clave?
  • Respaldo
    • ¿Hay un teclado o pantalla táctil en caso de que falle la entrada de voz?
  • Consecuencias
    • ¿Un comando de voz procesado incorrectamente resultará en una acción irreversible?
  • Entorno
    • ¿Bajo qué condiciones de entorno debe funcionar tu solución?

La VUI representa un cambio fundamental en la interacción humano-computadora. Al construir una aplicación con voz incorporada, los diseñadores y desarrolladores deben replantear el enfoque. Enfócate en experiencias verdaderamente conversacionales y centradas en la voz, y tus clientes te lo agradecerán.

Cómo instalar Docker CE en AlmaLinux: Guía paso a paso

En Newsmatic nos especializamos en tecnología de vanguardia, contamos con los artículos mas novedosos sobre Desarrollo, allí encontraras muchos artículos similares a Cómo crear una interfaz de usuario por voz exitosa para tus productos digitales , tenemos lo ultimo en tecnología 2023.

Artículos Relacionados

Subir

Utilizamos cookies para mejorar su experiencia de navegación, mostrarle anuncios o contenidos personalizados y analizar nuestro tráfico. Al hacer clic en “Aceptar todo” usted da su consentimiento a nuestro uso de las cookies.