Cómo mejorar la gobernanza de datos no estructurados en la empresa

Las empresas deben gobernar sus datos para mantenerlos limpios y organizados para un mejor uso. La gobernanza de datos es un conjunto de procesos, roles, políticas, estándares y métricas que garantizan el uso efectivo y eficiente de la información para permitir que una organización alcance sus objetivos con esos datos.

MIRA: Kit de contratación: Ingeniero de bases de datos (Newsmatic Premium)

Las organizaciones se centran en la gobernanza de datos para sus sistemas de registro y datos estructurados, pero ¿qué pasa con los datos grandes y no estructurados como fotos, videos, documentos en formato digital y mensajes de texto continuos de las redes sociales?

Ramesh Koovelimadhom de RCG Global Services señaló varias debilidades en la gobernanza de datos grandes:

  • Depender de científicos de datos que carecen de habilidades en TI para establecer estándares y procedimientos para los datos.
  • Falta de disciplina y cumplimiento de procesos en el desarrollo de esquemas de datos.
  • No limpiar datos incorrectos.
  • No apoyar a las personas y los procesos con tecnología.

"El éxito de la gobernanza de datos resuelve problemas empresariales mediante la identificación de las causas fundamentales de los problemas de datos que obstaculizan la eficacia empresarial", dijo Koovelimadhom.

Entonces, ¿cómo podemos mejorar la gobernanza de datos no estructurados que ahora comprende aproximadamente el 80% de los datos corporativos administrados? Aquí hay cinco formas de abordar el problema en la empresa.

Vale la pena invertir en minería de datos
Índice de Contenido
  1. 1. Utilizar fuentes de datos confiables
  2. 2. Establecer pautas de acceso y permisos de usuario para datos no estructurados
  3. 3. Asegurar todos los datos
  4. 4. Utilizar registros y trazabilidad
  5. 5. Eliminar los datos incorrectos

1. Utilizar fuentes de datos confiables

Los datos que las organizaciones han creado y acumulado directamente son confiables, pero la mayoría de las organizaciones también adquieren datos de fuentes externas en la nube a medida que construyen un repositorio de datos agregados para análisis.

¿Cómo sabes si los datos de estas fuentes externas son confiables? No lo sabes a menos que evalúes al proveedor de datos, entiendas de dónde ha obtenido sus datos el proveedor y sepas cómo ha preparado y asegurado los datos. Si estás en una industria sensible como la salud, también querrás saber que los datos de los pacientes individuales se han anonimizado para cumplir con los requisitos de privacidad.

MIRA: 4 pasos para garantizar que tus análisis sean limpios y saludables (Newsmatic)

Comprobar los estándares de gobierno del proveedor para asegurarse de que se alinean con los propios debería ser una tarea de rutina que se realice antes de firmar cualquier contrato con un proveedor. Antes de firmar un contrato, también debes solicitar la auditoría de TI más reciente del proveedor para poder revisar el desempeño reciente en cuanto a gobierno y seguridad.

2. Establecer pautas de acceso y permisos de usuario para datos no estructurados

Los datos estructurados tienen reglas sólidas en cuanto a acceso y permisos de usuario, pero los datos no estructurados quizás no las tengan. El acceso a los datos no estructurados debe seguir las mismas reglas que los datos estructurados.

En otras palabras, el acceso a los datos no estructurados debe estar limitado a los usuarios que necesiten los datos. Dentro de la categoría de acceso, también es probable que haya niveles de permisos, con algunos usuarios teniendo más acceso a los datos que otros, dependiendo de la función laboral o el rol.

Fase de análisis: Entendiendo lo que el cliente quiere

Estas decisiones de acceso de usuario deben ser tomadas entre los departamentos de TI y los usuarios finales. Debería haber revisiones como mínimo anuales, y deben establecerse procedimientos para que si un individuo abandona la empresa, se le quite el acceso de inmediato como parte del proceso de separación.

3. Asegurar todos los datos

Los conceptos básicos de seguridad de datos incluyen redes confiables; métodos y monitoreo de acceso de usuario sólidos; monitoreo perimetral que busca vulnerabilidades y posibles brechas; y hábitos de usuario que se alinean con las mejores prácticas de seguridad (como no compartir contraseñas o no copiar datos en unidades USB que puedan llevarse). Si los datos se almacenan en hardware en los límites de la empresa, ese hardware debe estar físicamente protegido y solo las personas autorizadas deben tener acceso.

La mayoría de estos estándares y prácticas están en su lugar con datos estructurados, pero no necesariamente con datos no estructurados, como los datos del Internet de las cosas.

Los datos no estructurados deben cumplir con las mismas pautas y prácticas de seguridad que su contraparte estructurada.

4. Utilizar registros y trazabilidad

Debería haber software de registros y trazabilidad robusto en funcionamiento continuo cuando se trata de datos grandes. ¿Quién o qué accede a los datos? ¿Cuándo y desde dónde? Si surge algún problema, ¿qué evento inició el problema?

MIRA: Expertos en ciberseguridad celebran nueva ley de IoT (Newsmatic)

Los 12 errores más comunes al trabajar con el objeto Recordset en Access

Los registros, la trazabilidad y (en el futuro) la observabilidad aceleran el tiempo de resolución de problemas y son fundamentales para la seguridad.

5. Eliminar los datos incorrectos

Como práctica de limpieza de datos inicial, se deben eliminar los datos incorrectos al procesar los flujos de datos grandes entrantes. Hay muchos datos grandes incorrectos, ya sean documentos innecesarios, flujos de IoT que contienen tantos protocolos de conexión de dispositivos como información relevante o hilos superfluos de las redes sociales.

El proceso de preparación de datos que forma parte de la ingesta de datos debe eliminar estos datos para que nunca ocupen espacio de almacenamiento. Los repositorios de datos grandes también deben actualizarse y revisarse regularmente, descartando los datos que ya no son necesarios.

En Newsmatic nos especializamos en tecnología de vanguardia, contamos con los artículos mas novedosos sobre Big Data, allí encontraras muchos artículos similares a Cómo mejorar la gobernanza de datos no estructurados en la empresa , tenemos lo ultimo en tecnología 2023.

Artículos Relacionados

Subir

Utilizamos cookies para mejorar su experiencia de navegación, mostrarle anuncios o contenidos personalizados y analizar nuestro tráfico. Al hacer clic en “Aceptar todo” usted da su consentimiento a nuestro uso de las cookies.