Cómo cerrar la brecha de habilidades en ciencia de datos
La brecha de habilidades en ciencia de datos no se debe a la falta de personas que puedan entrenar y analizar modelos de datos. Hay muchos modeladores de datos talentosos que comprenden la modelización conceptual de datos, la modelización lógica de datos y más. El verdadero desafío está en encontrar personas que puedan recolectar datos, prepararlos, limpiarlos y poner sus modelos en producción.
Me refiero a profesionales que entienden cómo consultar y conectarse a bases de datos, que saben cómo implementar un almacenamiento de objetos y que pueden contenerizar modelos, convertirlos en APIs e incrustarlos en dispositivos periféricos. En resumen, personas que pueden aplicar aplicaciones prácticas a sus conjuntos de datos.
Aquí es donde radica la escasez: científicos de datos que son casi tan habilidosos en ingeniería de software como en modelado de datos. Las empresas necesitan personas que sepan cómo convertir su producción en un producto que se pueda utilizar en casos de uso del mundo real, no solo personas que puedan construir un modelo efectivo. Es por eso que Gartner identificó la ingeniería de IA como una de las principales tendencias tecnológicas estratégicas para 2022, en la cual los profesionales de TI se enfocan en operacionalizar modelos de IA.
Afortunadamente, las universidades y los colegios tienen las herramientas necesarias para proporcionar entornos fantásticos para aprender el lado de la ingeniería de la ciencia de datos, y ellos tienen la clave para minimizar la actual escasez de habilidades en ciencia de datos.
VER: Kit de contratación: Científico de datos (Newsmatic Premium)
Es hora de que las utilicen para abrir puertas a la próxima generación de profesionales en ciencia de datos.
El futuro del trabajo requerirá una experiencia digital centrada en el ser humanoPoniéndose al día
Hasta ahora, solo han dejado la puerta abierta un poquito.
Demasiados profesores todavía se enfocan mucho en los aspectos teóricos y matemáticos de la ciencia de datos y no tanto en la experiencia práctica necesaria para poner en práctica la ciencia de datos. Tal vez eso se deba a que sienten que su papel es avanzar en la ciencia, no necesariamente entrenar a personas para una profesión. Si bien eso es importante, debe haber un equilibrio entre los dos. Efectivamente, las cosas están mejorando y más universidades y colegios están comenzando a ofrecer algunos cursos limitados sobre cómo aplicar la ciencia de datos y el modelado en aplicaciones.
Pero necesitan evolucionar su currículo más rápidamente para satisfacer la demanda. Eso es difícil, ya que a veces puede llevar unos años crear y obtener la aprobación de un nuevo curso. Eso no es aceptable cuando la tecnología avanza rápidamente cada pocos meses. La desconexión entre lo que se enseña y lo que se necesita sigue existiendo.
Mientras tanto, las empresas que tienen los recursos y el conocimiento adecuados intentan compensar. Muchas están contratando administradores de bases de datos experimentados y graduados recientes y capacitándolos en la implementación práctica de modelos y la ingeniería de datos.
Existen inconvenientes en este enfoque. En primer lugar, una organización que carece de habilidades prácticas en la implementación de modelos no tendrá la experiencia necesaria para capacitar a un grupo entrante de científicos en esas habilidades. Después de todo, no pueden enseñar lo que no saben. En segundo lugar, la capacitación puede ser prolongada, consumir recursos y socavar los esfuerzos organizativos para ser más rápidos y eficientes.
Esto no es sostenible o factible para la mayoría de las empresas, especialmente para las organizaciones más pequeñas que pueden no tener los medios para capacitar adecuadamente a sus empleados. Tampoco es justo para los estudiantes, quienes ya ingresan al mercado laboral en desventaja.
Los salarios más altos y más bajos para el talento en tecnología de la nubePero los colegios y las universidades no necesitan pasar años creando nuevos cursos. En cambio, pueden utilizar las herramientas de código abierto que ya tienen a su disposición para incorporar el aprendizaje práctico en sus cursos existentes de informática.
Creando un ingeniero de datos
Las instituciones de educación superior han invertido mucho en tecnologías de código abierto durante varios años y están utilizando el software para resolver creativamente una variedad de desafíos. Les atrae su capacidad de interoperabilidad, seguridad y rentabilidad, entre otros beneficios.
Pero también entienden que más empresas están utilizando código abierto que nunca. De hecho, el 95% de los encuestados en un estudio reciente de Red Hat dijeron que el código abierto es importante para la infraestructura empresarial general de su organización. Sin duda, el código abierto es lo normal en TI. Esto hace que enseñar y utilizar tecnologías de código abierto sea vital.
Ya estamos viendo algunas universidades y colegios que imparten cursos sobre temas como aprender a usar Python o Jupyter Notebooks. Algunos incluso han incorporado estas herramientas en sus entornos de clases diarias. Ahora, es hora de llevar las cosas aún más lejos creando un marco que reúna estas y otras herramientas y que vincule los aspectos teóricos del entrenamiento de modelos con los aspectos más prácticos del desarrollo de software.
Esto no es difícil de hacer, gracias a la naturaleza abierta y flexible del software de código abierto. Las diferentes tecnologías se pueden combinar fácilmente para crear un todo coherente y brindar a los estudiantes una visión más completa de cómo su trabajo puede ser utilizado de manera práctica en una aplicación.
Por ejemplo, una universidad que enseñe y utilice Python y los Jupyter Notebooks puede combinar el uso de estas herramientas en un entorno de clase único. Los profesores pueden crear una sección especializada del curso que muestre a los estudiantes no solo cómo trabajar con los Jupyter Notebooks, sino también cómo transferir ese trabajo a un desarrollador. También pueden mostrar cómo un desarrollador de aplicaciones que utiliza Python podría incorporar sus modelos de datos en sus aplicaciones. Incluso se les puede enseñar a los estudiantes los conceptos básicos de cómo funciona Python sin necesidad de entrenarlos para que sean desarrolladores de aplicaciones ellos mismos.
Participa en el Sorteo de Viajes de $5En esencia, las universidades y los colegios pueden aplicar los principios tanto de la ciencia como de la ingeniería en una sola clase. Los estudiantes pueden aprender cómo experimentar con sus modelos y cómo poner esos modelos en movimiento, llevándolos desde la idea hasta la implementación.
Cerrando la brecha de habilidades
La competencia entre las empresas para encontrar científicos de datos talentosos no muestra signos de desaceleración. Según EY, las organizaciones aún tienen problemas para cubrir roles centrados en los datos debido a programas de capacitación ineficaces, escasez de talento y más. Incluso organizaciones poderosas como la NASA están luchando para encontrar las personas adecuadas para los roles adecuados en ciencia de datos.
La forma más fácil y rápida de cerrar esta brecha de habilidades que se está ampliando cada vez más es que los colegios y universidades amplíen el alcance de algunos de sus cursos actuales. Deben considerar la incorporación de la ingeniería de software y la enseñanza operativa junto con sus ofertas actuales en ciencia de datos. Esto brindará a los estudiantes una perspectiva más completa y útil que los ayudará a prepararse mejor para lo que les espera, al tiempo que brinda a las empresas el talento que buscan.
Guillaume Moutier es un Arquitecto Principal de Ingeniería de Datos en Red Hat Cloud Storage and Data Services, enfocando su trabajo en servicios de datos, cargas de trabajo de IA/ML y plataformas de ciencia de datos. Ex gerente de proyecto, arquitecto y CTO de grandes organizaciones, siempre está buscando y promoviendo soluciones nuevas e innovadoras, siempre con un enfoque en la usabilidad y la alineación empresarial, gracias a sus 20 años de experiencia en arquitectura y gestión de TI.
Cómo establecer confianza entre empleadores y empleados en la era del trabajo remotoEn Newsmatic nos especializamos en tecnología de vanguardia, contamos con los artículos mas novedosos sobre CXO, allí encontraras muchos artículos similares a Cómo cerrar la brecha de habilidades en ciencia de datos , tenemos lo ultimo en tecnología 2023.
Artículos Relacionados