La compañía que revoluciona tus apps con video y voz para el futuro de las comunicaciones

Los desarrolladores y diseñadores de software se preguntan cómo pueden agregar fácilmente funcionalidades de voz y video en sus aplicaciones. Twilio afirma tener la respuesta, y en este episodio de Dynamic Developer hablo con el jefe de voz y video de la compañía. A continuación, una transcripción de esta entrevista, editada para mayor claridad.

Escucha la versión en podcast de este episodio de Dynamic Developer en SoundCloud

Índice de Contenido
  1. Introducción a Twilio y su rol
  2. Desafíos para los desarrolladores al incorporar voz y video en aplicaciones
  3. Cómo pueden los desarrolladores incluir video en sus aplicaciones
  4. Plataforma de comunicación como servicio (CPaaS)
  5. Plataforma de comunicación en vivo de Twilio
  6. Lanzamiento de Twilio Live

Introducción a Twilio y su rol

Bill Detwiler: Soy tu anfitrión Bill Detwiler, y me acompaña Hakim Mehmood, Vicepresidente y Gerente General de voz y video de Twilio. Hakim, gracias por unirte a nosotros.

Hakim Mehmood: Gracias por invitarme, Bill.

Bill Detwiler: Hakim, para aquellos que no estén familiarizados con Twilio, cuéntanos un poco sobre la compañía y tu rol.

Hakim Mehmood: Bill, permíteme comenzar hablando un poco de mi experiencia. No porque sea engreído, sino en general. Pasé casi 19 años en una compañía llamada Cisco, donde, en cierta medida, fuimos pioneros en la voz sobre IP y video sobre IP, creando soluciones como Telepresencia, WebEx y demás. Desde la distancia, siempre he seguido de cerca a Twilio. Lo que Twilio hizo desde el principio fue desmitificar todo este tema de la telefonía compleja y hacerlo muy, muy fácil para los desarrolladores, creando un ecosistema de API alrededor de estos servidores de telefonía complejos. Tenías a empresas como Cisco, Nortel y Alcatel en aquel entonces. Jeff Lawson, nuestro cofundador y CEO, comenzó a analizar la complejidad. Empezó a pensar en cómo simplificarlo para los desarrolladores cotidianos. Esa fue la génesis de Twilio, y desde entonces, la compañía ha evolucionado. Ahora somos una gran empresa pública.

Colaboración eficiente: ciudadanos desarrolladores y líderes de negocio creando soluciones con plataformas de bajo código

Hoy en día, si piensas en nosotros, Bill, somos una empresa de interacción con el cliente. Permíteme definir lo que eso significa. Hoy en día recibes un mensaje de texto de tu dentista recordándote que tu cita de limpieza es mañana, o recibes una llamada de voz de ellos. O durante esta pandemia, haces una visita virtual con tu médico familiar. Todos estos canales de interacción y puntos de contacto para los consumidores en los que las empresas ya estaban comenzando a utilizar. Esta digitalización ha estado ocurriendo durante un tiempo, y se ha acelerado enormemente en los últimos 15 o 18 meses desafortunados.

Twilio es una plataforma en el centro de esta digitalización, donde las empresas pueden interactuar con sus clientes con datos, contexto y el canal que elijan, desde mensajes de texto hasta voz, video, correo electrónico y todo lo demás. Y todos los tipos de mensajería, ya sea en Asia, donde la gente usa WhatsApp o Facebook, o simplemente mensajes de texto. Eso es lo que hacemos. Literalmente, desmitificamos todas estas modalidades para los desarrolladores para que puedan construir estas modalidades en su flujo de trabajo. Solo en tu ejemplo, tal vez tu dentista te envía un mensaje de texto. O recibes un OTP de tu banco, tal vez un desarrollador escribió unas líneas de código que permitieron que ese flujo de trabajo se hiciera realidad. Eso es lo que hacemos. Somos una empresa de interacción con el cliente. Literalmente alojamos billones y billones de transacciones en nuestra plataforma todos los años.

Desafíos para los desarrolladores al incorporar voz y video en aplicaciones

Bill Detwiler: Creo que eso es una excelente introducción a lo que realmente queremos hablar, que es, como mencionaste, la interacción con el dentista y las visitas de telemedicina con el médico familiar. Creo que eso es lo que espero que puedas ayudar a nuestra audiencia a entender y desmitificar la complejidad de las comunicaciones de voz y video, porque hoy en día los clientes quieren interactuar en la plataforma que elijan, como dijiste, y cada vez más eso es la voz y el video. Eso puede ser algo difícil, si eres un desarrollador, de incorporar en tu aplicación. Entonces, comencemos quizás con tu impresión. ¿Cuáles son algunos de los desafíos a los que se enfrentan los desarrolladores y los equipos al intentar incorporar la interacción de voz y video en las aplicaciones y sistemas que están desarrollando?

Hakim Mehmood: Volveré a mi historia. Comencé como ingeniero, como programador en un par de empresas startup antes de trabajar para Cisco. En aquellos tiempos, teníamos chipsets como las DSP donde escribías código especial de procesamiento de señal, donde obtenías bits y bytes de audio, los empaquetabas y los enviabas al otro lado, los demultiplexabas y reconstruías el video. Todo el proceso es súper complejo. Si piensas en internet desde su inicio, no se creó para ser en tiempo real. Con el tiempo, ha evolucionado. La voz, en cierta medida, y el video aún más, son en tiempo real. Mientras tú y yo estamos hablando en esta interacción, si mi conversación o mi chiste tuvieran un retraso de 30 segundos, sería inefectivo.

Entonces, la parte más difícil de la voz y el video es preservar la fidelidad mientras se es en tiempo real. Para cada desarrollador, no es que no puedan hacerlo, lo hicimos en nuestro tiempo. Es un trabajo realmente, realmente arduo configurar la infraestructura, configurar la infraestructura de enrutamiento, atravesar los cortafuegos, tener los códecs correctos, tener los bits correctos fluyendo por el conducto. Es súper complejo. Es mucho trabajo. Lo que hacemos en Twilio es convertir esos bloques de construcción en parte de nuestra infraestructura y, en cierta medida, ocultar toda esa complejidad a un desarrollador para que simplemente pueda llamar a una API, como llamarme a mí y simplemente funcione.

Permíteme darte un ejemplo, especialmente en video, el video tiene múltiples aspectos. Tú y yo estamos hablando, es importante que estemos sincronizados en los labios. Todos esos pequeños detalles son muy importantes. Tenemos un código de muestra de aplicación que es de código abierto al que, Bill, te prometo que puedes descargar y escribir tu primera aplicación de video en cinco minutos. Esa es la promesa de Twilio al tiempo que preservamos la calidad prístina o la infraestructura que hemos construido con el tiempo.

Aprende Python en 2022 con el paquete completo del programador de Python 2022.

Entonces, en resumen, no queremos que los desarrolladores dediquen mucho de su valioso tiempo a crear la infraestructura, pensar en los códecs, pensar en los bits. Queremos que agreguen valor a un nivel más alto. Como mencionaste, tu visita de telemedicina debería llevarte a un vestíbulo donde un representante médico o asistente interactúa contigo. Luego, toda esa interacción debería trasladarse a la sala donde te encuentras con tu médico. Ese es el nivel en el que esperamos que las empresas trabajen a medida que el video se integra cada vez más en todo lo que hacemos a diario.

Cómo pueden los desarrolladores incluir video en sus aplicaciones

Bill Detwiler: Más bien sería video como servicio, ¿no es así? Quiero decir, estás proporcionando voz y video como una opción de complemento para los equipos de desarrollo, para que puedan centrarse en las aplicaciones y sistemas de su empresa que están construyendo. No tienen que preocuparse por los aspectos técnicos, como dijiste, del enrutamiento. Creo que esa es una gran analogía.

¿Qué recomendaciones tienes para los equipos de desarrollo que buscan incorporar voz y video en sus aplicaciones? Ahora estoy pensando menos desde una perspectiva técnica, porque realmente, como lo describiste, utilizando la API, el proceso técnico se ha vuelto mucho más fácil desde que comenzaste. Pero estoy pensando aquí más en la forma correcta de diseñar, de incorporar el video en una aplicación, cuando tiene sentido y cómo hacerlo de la manera correcta.

¿Tienes consejos para los equipos y los desarrolladores que están considerando eso, incluso si es tan simple como dónde debería ir una ventana, o esta es una situación en la que funciona bien, o esta es una situación en la que no funciona bien, o si lo vas a hacer, aquí hay una mejores prácticas? ¿Cuáles son algunos consejos que darías a los oyentes y espectadores?

Hakim Mehmood: Creo, Bill, que una de las cosas clave es que para los desarrolladores, quiero reiterar uno de los puntos. Hemos hecho que sea súper sencillo incluir video, ya sea que tengas un navegador web, una aplicación móvil o cualquier otra modalidad. Hemos hecho que sea simple. Esa es la parte. Lo que les pediría a los desarrolladores es que se centren en el caso de uso empresarial y la experiencia. Como mencionaste, si un paciente debería aparecer en el panel superior o inferior en una cita de telemedicina, eso es más importante. Tenemos datos para compartir sobre lo que ha funcionado bien para nuestros clientes, por lo que podemos asesorarles sobre cómo hacerlo, cómo no hacerlo. También tenemos muchos consejos para nuestros clientes basados en nuestra experiencia, cómo configurar sus SDK mientras desarrollan aplicaciones de video y voz en sus aplicaciones móviles o de escritorio, cómo parametrizarlos según las diferentes condiciones de red.

Fíjate, Bill, tú y yo hemos visto esto. Entras a un hotel: tienes una conexión Wi-Fi terrible, y tienes que realizar una importante conferencia o cita o flujo de trabajo. Te doy otro ejemplo. Tenemos un cliente muy bueno que básicamente ha tomado el flujo de trabajo de un notario, que antes solíamos hacer y teníamos que hacer filas, y lo han utilizado video para crear un flujo de trabajo completo de principio a fin. Mi consejo para los desarrolladores que piensan en expandir su marca, que piensan en adquirir más negocios a través de medios virtuales, es que la pandemia acabará y el video se convertirá en una extensión natural. Enfóquense en la experiencia del usuario. Enfoquense en los datos que necesitan para simplificar esa experiencia del usuario y el flujo de trabajo empresarial. Dejen los aspectos técnicos y de transporte para nosotros. Sabemos cómo hacerlo mejor y le asesoraremos en cada paso del camino.

Entrevistas con Desarrolladores Dinámicos: Novedades

Tenemos muchos clientes en la industria de seguros médicos que intentan construir experiencias basadas en nuestra plataforma de atención médica. La forma en que los asesoramos es diciendo: "Mira, según nuestra experiencia, esto es lo que ha funcionado desde el punto de vista de la experiencia del usuario para otros clientes". Hacemos alrededor de mil millones de minutos de video. No hablo de conferencias. Mira, no somos una plataforma de conferencias entre Zoom, Microsoft, Cisco y Google. Esa modalidad ya está cubierta, pero estamos aquí para ayudar en los otros casos de uso empresarial. Uno de ellos es que simplemente lanzamos la versión beta de Twilio Live, que me emociona mucho. Básicamente, lo que está sucediendo son estas mega tendencias.

Siempre ha habido videos de transmisión. Haces webinars y tienes miles y decenas de miles de usuarios escuchando en demanda. Pero con la aparición de Clubhouse y TikTok, ha surgido este nuevo prefijo llamado "interactivo", y es súper crítico. ¿Por qué es súper crítico? Porque tiene características casi en tiempo real. Imagina que tú y yo estamos en un panel y tenemos una audiencia escuchando, y estamos tratando de obtener respuestas de ellos en una encuesta o algo así en medio de la conversación. Por lo tanto, las características deben ser casi en tiempo real, y no tiene sentido que cada empresa invente esa experiencia. Ya hemos invertido mucho en la infraestructura, en las API, en las pautas, en la documentación de los aspectos y no aspectos de esa experiencia. Ahí es donde realmente podemos ayudar a los desarrolladores a acelerar estas modalidades en sus flujos de trabajo o en cualquier otro caso de uso.

Plataforma de comunicación como servicio (CPaaS)

Bill Detwiler: Sí, hablemos sobre la experiencia del usuario. Creo que eso es realmente importante. Hablaste sobre, porque me encantó el ejemplo que diste de dónde colocar la casilla del paciente en el chat de video, porque eso es algo que creo que a veces puede pasarse por alto si no estás haciendo un esfuerzo consciente durante el proceso de desarrollo de tenerlo en cuenta. ¿Cuáles son algunas de las lecciones que has aprendido y visto en los datos sobre la experiencia del usuario en voz y video? ¿Hay cosas que a los usuarios les disgusten cuando se trata de voz y video y que sean relevantes para los desarrolladores? ¿Hay cosas que a los clientes realmente les gustan o te han dicho que sí, esta es la forma en que quiero interactuar con una empresa a través de la voz o el video?

Hakim Mehmood: Una de las cosas que hemos aprendido es que tenemos una amplia gama de clientes. Te mencioné un ejemplo de una notaría. Podría darte un ejemplo de personas que, desafortunadamente, están encarceladas y tienen visitas virtuales. Tenemos educación. Tenemos un conjunto muy, muy diverso de clientes. Tenemos banca. Entonces, no hay una solución única, pero ahí es donde se vuelve súper poderoso ser una compañía de plataforma, Bill. Lo que quiero decir con eso es que te proporcionamos un SDK en el lado del cliente. Puedes orquestar y jugar con la experiencia que funcione mejor para ti en términos de puntuación de interacción. Por lo tanto, en mi opinión, las mejores experiencias se construyen, no se compran.

Lo que vimos durante la pandemia, por ejemplo, fue que la gente se inclinó rápidamente hacia plataformas como Zoom y WebEx porque era la única forma de mantener la continuidad del negocio. Pero desde entonces, hemos visto que los clientes han comenzado a construir experiencias personalizadas. Te daré ejemplos. En las empresas, tienes grupos de recursos para empleados que respaldan una causa en particular, quieren decorar sus salas de cierta manera. Por lo tanto, requieren plataformas, las plataformas listas para usar no les permiten hacerlo. Además de los fondos virtuales básicos, no les permiten hacerlo.

Entonces, lo que estamos viendo es que debido a la flexibilidad que nuestro SDK proporciona en el lado del cliente, las personas pueden personalizar mucho estas experiencias. Te daré un ejemplo de una compañía de fitness que se ha estandarizado en Twilio. Había una serie de experiencias. ¿Debería poner cuadrículas cuadradas? ¿Debería poner caras redondas? ¿Qué debería hacer? Eventualmente, se inclinaron por tener una cara redonda en el centro del entrenador y que todos los demás estuvieran en los lados porque esa era la experiencia que era más agradable para sus usuarios. Eso solo es posible cuando tienes una plataforma que permite esa flexibilidad. Muy simple. No puede ser que tus desarrolladores tengan que empezar de cero y escribir decenas de miles de líneas de código. En cambio, pueden ajustar rápidamente algunos parámetros y probar las experiencias realmente rápido. Eso es lo que hemos observado.

Aprende a programar desde cero con el Ultimate Learn to Code Bundle por solo $39

Es realmente importante, Bill. Somos una empresa de interacción con el cliente. Me canso de decir eso una y otra vez. Es muy importante lograr que esa experiencia sea correcta, ya sea cuando te enviamos un mensaje para tu cita con el dentista o cuando estás en una experiencia de video que está alojada y se mantiene en nuestra plataforma.

Plataforma de comunicación en vivo de Twilio

Bill Detwiler: Sí, tiene mucho sentido decir que se trata de la singularidad de la compañía y de los clientes y la experiencia. No es una solución única para todos. Entonces, en los últimos minutos que tengo contigo, me gustaría obtener un poco más de información técnica y aprovechar un poco más esa experiencia de ingeniería, los antecedentes técnicos que tienes. Si estuvieras hablando con desarrolladores, ¿tienes alguna recomendación o algún consejo? ¿Importa qué entorno de desarrollo están utilizando o qué lenguajes dominan? ¿Importa? ¿Hay alguna información que compartirías con ellos para ayudarlos a desarrollar sus habilidades en el uso de la voz y el video e incorporar eso en las aplicaciones y sistemas que están construyendo? O debido a lo que estás diciendo, tienes la API que es tan simple. Realmente no importa. Tu plataforma es un poco agnóstica al entorno.

Hakim Mehmood: Hasta cierto punto, somos agnósticos al entorno. Pero para cada desarrollador hoy en día, mi recomendación sería: no inventes la rueda. Tenemos código abierto con nuestras aplicaciones de muestra. Descarga esas aplicaciones, mira nuestro código fuente y utilízalo como punto de partida para tu experiencia. Acabo de hablar con el fundador de una aplicación de citas muy única. El fundador tenía a otro desarrollador que estaba escribiendo código. Ya habían escrito mucho y tuvieron algunos problemas. Entonces nos encontramos en una llamada con ellos. Al final, lo que hicimos fue enviarlos de vuelta a nuestro código abierto para que no tuvieran que. Ya hemos resuelto algunos de los problemas con los que se encontraron en los últimos años. Ese sería mi punto de partida recomendado para ellos.

Luego, el segundo punto sería leer nuestra documentación. En realidad, en mi trabajo anterior, solíamos envidiar las API y la documentación de Twilio porque Twilio inventó este espacio llamado CPaaS, plataforma de comunicación como servicio. Nuestra documentación es muy, muy buena. Léanla, descarguen nuestro código de ejemplo y úsenlo como punto de partida y aprovechen nuestro excelente servicio de soporte para ayudarlos a navegar. Mira, somos desarrolladores. Tenemos millones de desarrolladores en nuestra plataforma. Nos enorgullece mucho hacer del desarrollador un ciudadano de primera clase en nuestra plataforma. Así es como vendemos nuestros servicios. Si escuchas las charlas de nuestro CEO, él dirá: "Mira, mi primer cliente fue de unos centavos y los vi crecer a lo largo del tiempo a millones de dólares en ARR". Somos una plataforma basada en usuarios. Nos importa y atendemos a los desarrolladores y su experiencia todos los días. Son nuestros clientes familiares. Así sería el punto de partida.

Bill, si no te importa, quiero volver un poco sobre este Twilio Live, si no te importa. Creo que hablé sobre el surgimiento de estos nuevos paradigmas de interacción con el cliente. El video ha sido un canal de interacción con el cliente. Si estuviéramos hablando de algo más, usaríamos video, ya sea que seamos colegas, clientes o amigos. Pero este nuevo paradigma, si piensas en lo que ha hecho TikTok, lo que Clubhouse está haciendo a través del audio, y nosotros proporcionamos soluciones, somos agnósticos a la modalidad en nuestra plataforma. Se puede hacer audio, video, contenido y se puede tener millones de espectadores detrás de nuestra plataforma de una manera muy interactiva donde envían emojis, donde envían respuestas. Es un problema realmente, realmente difícil de resolver.

Tengo muchos clientes empresariales que vienen a nosotros y dicen: "Oye, estamos buscando una mayor participación de los empleados. ¿Cómo podemos construir estas experiencias? ¿Es un trabajo pesado?" Muchos de ellos lo intentaron por su cuenta y es un trabajo pesado y complejo. Ahora vienen a nosotros y están empezando a usar esta plataforma. Acabamos de anunciar la versión beta de este producto y ya tengo cerca de 500 clientes registrados y estamos tratando de llevarlos a través del embudo lo más rápido posible. Entonces, este nuevo canal de interacción, ya sea que lo pienses en las compras grupales donde tienes grandes audiencias como en los videos de TikTok, o en el fitness donde tienes clases muy grandes, o en las transmisiones de video tipo programa de entrevistas.

La guía definitiva para el software de gestión de proyectos: Qué necesitan los desarrolladores

Estas nuevas experiencias para interactuar con tus clientes y obtener datos sobre ellos son la última modalidad en la interacción con el cliente. Nuestro objetivo es, ya somos líderes en esta plataforma, crear una plataforma donde los desarrolladores de las empresas o los proveedores de tecnología que construyen estas experiencias para los clientes sean la plataforma para eso. Estoy muy, muy emocionado por este lanzamiento. No puedo decirte lo suficiente lo mucho que hemos generado interés en este punto en la vida.

Lanzamiento de Twilio Live

Bill Detwiler: Entonces, ¿cuándo se lanza Twilio Live? La versión beta ya está disponible, dijiste. ¿Ya tienen una fecha de lanzamiento oficial en caso de que las personas quieran consultarla, o cómo pueden obtener más información sobre la versión beta?

Hakim Mehmood: Twilio.com/live, una URL muy simple. Estaremos disponibles en general alrededor de octubre, durante Signal, que es nuestro evento más importante del año. Ahí es cuando estaremos disponibles en general. Es una extensión de nuestra plataforma de video. No solo hace video, también hace audio. Mira, si piensas en los eventos, en las grandes conferencias, Signal, solía ser un evento presencial. Lo que ha sucedido durante estos últimos 15 o 18 meses es que las conferencias se volvieron virtuales. Surgieron plataformas como Hopin y otras. Pero la forma en que pensamos en el futuro es que todo será híbrido. Tendrás personas que asistan físicamente a las conferencias. Las personas, por naturaleza, son gregarias. Queremos estrecharnos la mano. Queremos vernos. Pero para llegar a un público más amplio, habrá plataformas construidas sobre una plataforma como Twilio Live que amplíen estas experiencias de forma virtual a un gran número de clientes, expandiendo así el alcance y creando mucho más compromiso. Estoy muy, muy emocionado por esto, Bill.

En Newsmatic nos especializamos en tecnología de vanguardia, contamos con los artículos mas novedosos sobre Desarrollo, allí encontraras muchos artículos similares a La compañía que revoluciona tus apps con video y voz para el futuro de las comunicaciones , tenemos lo ultimo en tecnología 2023.

Artículos Relacionados

Subir

Utilizamos cookies para mejorar su experiencia de navegación, mostrarle anuncios o contenidos personalizados y analizar nuestro tráfico. Al hacer clic en “Aceptar todo” usted da su consentimiento a nuestro uso de las cookies.