La importancia de los datos confiables y el futuro de la inteligencia artificial

Con la proliferación de la inteligencia artificial generativa en el mundo empresarial actual, es fundamental que las organizaciones comprendan de dónde provienen los datos utilizados en las aplicaciones de IA y quién tiene acceso a ellos.

Hablé con Moe Tanabian, director de productos de la empresa de software industrial Cognite y ex vicepresidente global de Microsoft Azure, sobre la adquisición de datos confiables, las alucinaciones de la IA y el futuro de la inteligencia artificial. A continuación, se transcribe la entrevista con Tanabian. La entrevista ha sido editada por cuestiones de longitud y claridad.

Índice de Contenido
  1. Los datos confiables provienen de una combinación de conocimiento humano e IA
  2. Encontrar el equilibrio entre la información pública y privada es clave
  3. Preguntas para reducir las alucinaciones de la IA

Los datos confiables provienen de una combinación de conocimiento humano e IA

La importancia de los datos confiables y el futuro de la inteligencia artificial - Inteligencia artificial | Imagen 1 Newsmatic

Megan Crouse: Define qué son los datos confiables para ti y cómo los ve Cognite.

Moe Tanabian: Los datos tienen dos dimensiones. Una es el valor real de los datos y el parámetro que representan; por ejemplo, la temperatura de un activo en una fábrica. Luego, está también el aspecto relacional de los datos, que muestra cómo se conecta la fuente de ese sensor de temperatura con el resto de los generadores de datos. Este aspecto orientado al valor de los datos y el aspecto relacional de esos datos son importantes tanto para la calidad, la confiabilidad y el historial, la revisión y la versión de los datos.

Obviamente, está el canal de comunicación, y debes asegurarte de que donde las fuentes de datos se conectan a tu plataforma de datos haya suficiente sentido de confiabilidad y seguridad. Asegúrate de que los datos viajen con integridad y estén protegidos contra intenciones maliciosas.

Primero, obtienes los datos dentro de tu plataforma de datos y luego comienzan a tomar forma, y ahora puedes detectar y construir el aspecto relacional de los datos.

El futuro de la ética en la inteligencia artificial: preocupaciones y desafíos

Obviamente, necesitas una representación bastante precisa de tu mundo físico en tu dominio digital, y lo hacemos a través de Cognite Data Fusion. La inteligencia artificial es excelente para hacer el 97% del trabajo, pero en el último 3%, siempre hay algo que no está del todo ahí. El modelo de IA no se entrenó para ese 3%, o los datos que utilizamos para entrenar ese 3% no eran de alta calidad. Entonces, siempre hay un mecanismo de auditoría en el proceso. Se involucra a un humano y el humano captura esos 3%, básicamente las deficiencias: deficiencias en la calidad de los datos y deficiencias en la precisión de los datos. Luego, se convierte en un ciclo de entrenamiento para el motor de IA. La próxima vez, el motor de IA tendrá suficiente conocimiento para no cometer el mismo error.

Permitimos que ChatGPT consulte un grafo de conocimiento, ese "clon" digital que llamamos un modelo de datos flexible. Y allí reducimos la tasa de alucinaciones. Así que esta combinación de conocimiento que representa el mundo físico versus un modelo de lenguaje amplio que puede tomar una consulta en lenguaje natural y convertirla en un lenguaje de consulta comprensible por la computadora: la combinación de ambos crea magia.

Encontrar el equilibrio entre la información pública y privada es clave

Megan Crouse: ¿Qué tiene implementado Cognite para controlar qué datos utiliza el servicio interno en su entrenamiento y qué información pública puede acceder la IA generativa?

Moe Tanabian: La industria está dividida en cómo abordar esto. Como en los primeros días de, no sé, Windows o Microsoft DOS o la industria de las PC, los patrones de uso aún no estaban establecidos. Creo que en el próximo año más o menos llegaremos a una arquitectura estable. Pero en este momento, hay dos formas de hacerlo.

Una forma es, como mencioné, utilizar un modelo de IA interno, lo llamamos un modelo estudiante, que se entrena con los datos privados de los clientes y no sale de sus instalaciones y entornos en la nube. Y el gran modelo maestro, que es básicamente ChatGPT u otros modelos de lenguaje amplio, se conecta a través de un conjunto de APIs. De esta manera, los datos permanecen dentro de la tenencia del cliente y no salen. Esa es una arquitectura que se practica en la actualidad, Microsoft es partidario de ella. Es la invención de la arquitectura estudiante-maestro de Microsoft.

La segunda forma es no utilizar ChatGPT o modelos de lenguaje amplio alojados públicamente y alojar tu propio modelo de lenguaje amplio, como Llama. Recientemente se anunció Llama 2 por Meta. Llama y Llama 2 están disponibles ahora en código abierto y para uso comercial. Esto supone un cambio tectónico importante en la industria. Es tan grande que aún no hemos comprendido sus impactos, y la razón es que de repente tienes un transformador preentrenado bastante bien entrenado. [Nota del autor: Un transformador en este contexto es un marco para la IA generativa preentrenada. GPT significa generative pre-trained transformer]. Y puedes alojar tu propio LLM como cliente o como proveedor de software como nosotros. De esta manera, proteges los datos del cliente. Nunca sale y se va a un LLM alojado públicamente.

Generative AI en el trabajo: reemplazará o potenciará a los empleados

Preguntas para reducir las alucinaciones de la IA

Megan Crouse: ¿Qué deben tener en cuenta los profesionales de tecnología que se preocupan por las alucinaciones de la IA al decidir si utilizar productos de IA generativa?

Moe Tanabian: Lo primero es: ¿Cómo represento mi mundo físico y dónde está mi conocimiento?

Lo segundo es los datos que ingresan a ese grafo de conocimiento: ¿Son datos de alta calidad? ¿Sé de dónde provienen los datos? ¿La línea de datos? ¿Son precisos? ¿Son oportunos? Ahora hay muchas dimensiones. Una plataforma de operaciones de datos moderna puede manejar todo esto.

Y lo último es: ¿Tengo un mecanismo que me permita conectar el modelo de lenguaje amplio de IA generativa con mi plataforma de datos, con mi clon digital, para evitar alucinaciones y pérdida de datos?

Si las respuestas a estas tres preguntas son claras, tengo una base bastante sólida.

Megan Crouse: ¿En qué estás más emocionado actualmente en cuanto a la IA generativa?

Inteligencia Conversacional Impulsa el Mercado de Centros de Contacto con un Crecimiento del 16%

Moe Tanabian: La IA generativa es una de esas tecnologías fundamentales, como cuando el software cambió el mundo. Mark [Andreesen, socio de la firma de capital de riesgo Andreessen Horowitz en Silicon Valley] dijo en 2011 que el software se está comiendo al mundo, y el software ya se lo comió. Ello llevó 40 años. Creo que la IA va a crear otro cambio paradigmático en nuestras vidas y en la forma en que vivimos y hacemos negocios dentro de los próximos cinco años.

En Newsmatic nos especializamos en tecnología de vanguardia, contamos con los artículos mas novedosos sobre Inteligencia artificial, allí encontraras muchos artículos similares a La importancia de los datos confiables y el futuro de la inteligencia artificial , tenemos lo ultimo en tecnología 2023.

Artículos Relacionados

Subir

Utilizamos cookies para mejorar su experiencia de navegación, mostrarle anuncios o contenidos personalizados y analizar nuestro tráfico. Al hacer clic en “Aceptar todo” usted da su consentimiento a nuestro uso de las cookies.