El impacto de la exclusión de datos en los resultados de IA

Índice de Contenido
  1. El caso de reducir los datos
  2. Cómo la IA "falla" cuando faltan datos
  3. Lo que las empresas pueden hacer

El caso de reducir los datos

La reducción intencional de datos ocurre como una cuestión de política y conveniencia.

Roya Ensafi, profesora asistente de ciencias de la computación e ingeniería en la Universidad de Michigan, descubrió que la censura estaba aumentando en 103 países.

La mayoría de las acciones de censura "fueron impulsadas por organizaciones o proveedores de servicios de Internet que filtran contenido", informó Ensafi. "Si bien Estados Unidos experimentó un aumento menor en la actividad de bloqueo, se sentaron las bases para dicho bloqueo".

En otros sectores de la industria, los proveedores y empresas de análisis trabajan arduamente para reducir la cantidad de datos que admiten en sus procesamientos y repositorios de datos. Solo quieren datos que consideren relevantes para el problema que están tratando de resolver.

En 2018, la Oficina del Censo de Estados Unidos decidió reducir la cantidad de datos que estaba recopilando sobre los ciudadanos, incluso si eso significaba obtener datos menos precisos, con el fin de proteger la privacidad de los ciudadanos.

Todos estos casos de uso tienen objetivos claros en términos de negocio, pero ¿cuál es el impacto neto de sus exclusiones de datos en la calidad de la IA que opera sobre ellos?

La nueva ley de regulación de la contratación con IA llega a Nueva York en 2023

Cómo la IA "falla" cuando faltan datos

Sanjiv Narayan, profesor de medicina en la Escuela de Medicina de la Universidad de Stanford, explica cómo los datos faltantes pueden afectar la atención médica.

"Piense en la altura en Estados Unidos", dijo Narayan. "Si los recopilara y los pusiera todos en un gráfico, encontraría grupos superpuestos o conglomerados de personas más altas y más bajas, indicando en términos generales, adultos, niños y aquellos en medio. Sin embargo, ¿a quiénes se encuestó para obtener las alturas? ¿Se hizo esto durante los días de la semana o los fines de semana, cuando diferentes grupos de personas están trabajando? Si se midieron las alturas en consultorios médicos, las personas sin seguro médico pueden quedar excluidas. Si se hiciera en los suburbios, obtendría un grupo de personas diferente en comparación con aquellos en el campo o en las ciudades. ¿Qué tan grande fue la muestra?"

El algoritmo de contratación de Amazon que atrajo controversia en 2019 ilustra esto muy bien.

El motor de reclutamiento impulsado por IA de Amazon se entrenó con datos históricos sobre candidatos a empleo exitosos, en un momento en el que la mayoría de los candidatos eran hombres. Al observar este patrón, la IA se enseñó a sí misma que los candidatos masculinos eran preferibles a las mujeres. En consecuencia, la compañía dejó pasar a muchas solicitantes mujeres calificadas.

Lo que las empresas pueden hacer

El costo de procesar y adquirir datos, junto con la importancia de obtener resultados más rápido, ha llevado a las empresas a considerar la exclusión de datos.

Tiene sentido: cuantos más datos puedas excluir de antemano, menos tiempo llevará procesar los resultados y menos recursos de cómputo se consumirán. Pero ¿hasta qué punto debes atreverte a cerrar la lente de datos?

AWS lanza servicio de monitoreo de video que distingue entre mascotas

Las empresas pueden tomar buenas decisiones si hacen estas tres cosas:

  1. Considerar las compensaciones. Si excluyes datos de clientes que no viven a menos de 25 millas de tu oficina, ¿te perderás a aquellos que vendrían de más lejos si supieran de tus servicios?
  2. Estar dispuesto a ampliar la lente de datos. Es posible que descubras que tus datos no son precisos para los pacientes que estás tratando de analizar. ¿Tienes suficientes datos para llegar a una conclusión analítica sólida? Si la respuesta es no, siempre puedes ampliar la lente para verificar mejoras en la precisión.
  3. Explicar tus fuentes de datos y limitaciones a los usuarios. Aquellos que dependen de los datos que proporcionas necesitan comprender de antemano tus datos y sus limitaciones. Por ejemplo, si un usuario desea examinar las tendencias de transporte durante los últimos 10 años, pero solo tienes ocho años de datos, necesitan conocer esa información.

En Newsmatic nos especializamos en tecnología de vanguardia, contamos con los artículos mas novedosos sobre Inteligencia artificial, allí encontraras muchos artículos similares a El impacto de la exclusión de datos en los resultados de IA , tenemos lo ultimo en tecnología 2023.

Artículos Relacionados

Subir

Utilizamos cookies para mejorar su experiencia de navegación, mostrarle anuncios o contenidos personalizados y analizar nuestro tráfico. Al hacer clic en “Aceptar todo” usted da su consentimiento a nuestro uso de las cookies.