Conviértete en un científico de datos exitoso: consejos y habilidades clave

Dana Seidel estaba "paseando por el campo en Alberta, siguiendo manadas de alces", tratando de entender sus patrones de movimiento, qué comían, qué los llevaba de vuelta al mismo lugar, cuando tuvo una revelación: los datos podrían ayudar a responder estas preguntas.

Índice de Contenido
  1. Un inicio en la academia
  2. Una transición hacia la industria
  3. El campo de la ciencia de datos
  4. Consejos para entrar en la industria
  5. Un día en la vida de Dana Seidel
  6. Lee más artículos de esta serie

Un inicio en la academia

En ese momento, inscrita en un programa de maestría en la Universidad de Alberta, estaba interesada en rastrear el movimiento de ciervos, alces y otros forrajeros centrales. Seidel se dio cuenta de que podía utilizar sus antecedentes en matemáticas y ecología en la Universidad de Cornell para ayudar a evaluar un modelo que pudiera responder a estas preguntas. Continuó sus estudios y obtuvo un doctorado en la Universidad de California Berkeley relacionado con el movimiento animal y la propagación de enfermedades, que monitoreaba, en parte, recolectando datos de collares. Algo así como un Fitbit, explicó Seidel, "rastreando a dónde vas durante todo el día", generando puntos de datos GPS que podrían conectarse a datos de tierra, como imágenes satelitales, ofreciendo una visión del movimiento de la vida silvestre.

Seidel, de 31 años, ha pasado de la academia al mundo de las startups, trabajando como la principal científica de datos en Plenty, una empresa de agricultura vertical en interiores. O como ella misma se llamaría, una "científica de datos interesada en datos temporales y espaciales".

Una transición hacia la industria

Seidel nació en Tennessee, pero creció en Kansas. A sus 31 años, ella dice que es "mayor" para el mundo de las startups. Como alguien que pasó sus veinte años "invirtiendo en una carrera y luego cambiando", ella no necesariamente tiene la misma experiencia en la industria que sus colegas. Entonces, aunque agradece su experiencia, ella dice que un título no es una necesidad.

"No estoy segura de que mi doctorado me ayude en mi trabajo actual", dijo. Sin embargo, una área donde sí le ayudó fue al brindarle acceso a pasantías en Google Maps, analistas cuantitativos y RStudio, donde adquirió experiencia en desarrollo de software.

Seidel aprendió el lenguaje de programación R, que le encantó, en la universidad, y en su programa de maestría comenzó a construir bases de datos. Ella dice que "generalmente se enseñó a sí misma mientras tomaba estos cursos para usar las herramientas". La habilidad más importante de un científico de datos puede ser simplemente "saber cómo buscar cosas en Google", dice ella. "Eso es todo lo que es la codificación, resolución creativa de problemas".

Vale la pena invertir en minería de datos

El campo de la ciencia de datos

Según Seidel, el campo de la ciencia de datos tiene alrededor de una década de existencia. Antes, se trataba de estadísticas. "La idea de tener a alguien con antecedentes en estadísticas o que entienda el modelado inferencial o el aprendizaje automático ha existido durante mucho más tiempo de lo que lo hemos llamado científico de datos", dice ella, y un máster en ciencia de datos no existía hasta el último año de su doctorado.

Además, "científico de datos" es un término muy amplio. Entre los científicos de datos, pueden existir muchos trabajos diferentes. "Hay científicos de datos que se enfocan mucho en análisis avanzados. Algunos científicos de datos solo hacen procesamiento de lenguaje natural", dice ella. Y el trabajo abarca muchas habilidades diversas, como "habilidades de gestión de proyectos, habilidades de datos, habilidades de análisis, habilidades de pensamiento crítico".

Consejos para entrar en la industria

Seidel ha sido mentora de otras personas interesadas en ingresar al campo, comenzando con una hora semanal de café para mujeres en aprendizaje automático y ciencia de datos en Berkeley. ¿Su primer consejo? "Les diría: 'Tienes habilidades'", dice Seidel. Muchos estudiantes jóvenes, especialmente mujeres, no se dan cuenta de cuánto saben. "No creo que nos comuniquemos con nosotros mismos de manera positiva sobre todas las cosas que sabemos hacer y cómo eso puede traducirse", dice ella.

Para aquellos interesados ​​en hacer la transición de la academia a la industria, también recomienda obtener experiencia en desarrollo de software y mejores prácticas, que pueden haber faltado en la educación formal. "Si comprendes cosas como las prácticas estándar de la industria, como el control de versiones y git, y el scripting de bash un poco para que tengas algo de ese lenguaje, algo de ese conocimiento, puedes ser un colaborador más efectivo". Seidel también recomienda aprender SQL, uno de los lenguajes más fáciles, en su opinión, que ella llama "la lengua franca del análisis de datos y la ciencia de datos. Aunque creo que es algo que definitivamente puedes aprender en el trabajo, será la principal forma en que accedas a los datos si estás trabajando en un equipo de ciencia de datos de la industria. Tendrán grandes bases de datos con datos y necesitas una forma de comunicarlo", dice ella. También recomienda desarrollar habilidades a través de cosas como el Advent of Code de 25 días y otras formas de demostrar un estilo de código limpio. "Requiere un buen trabajo, y hasta que tengas tu trabajo en la industria, no te pagarán por eso, pero realmente puede ayudarte a destacar", dice ella.

Un día en la vida de Dana Seidel

En una mañana típica en su trabajo actual, trabajando desde casa, Seidel toma café y responde mensajes en Slack en su oficina en casa/estudio de acolchado. Verifica si hay preguntas sobre los datos, algo incorrecto en el tablero de control o una pregunta sobre la salud de las plantas. También puede haber preguntas de los ingenieros de software que trabajan en los datos, dice ella. Generalmente hay una reunión de scrum por la mañana y operan con equipos de sprint (reuniones cada dos semanas) y flujos de trabajo ágiles.

Seidel tiene una posición bastante única donde puede moverse entre los diferentes equipos de datos en los que trabajan. Ella puede decidir en qué equipo contribuir en cada sprint. Dos veces por semana hay una reunión de liderazgo, donde ella se encuentra con los líderes de software y datos y puede escuchar lo que se está trabajando actualmente y lo que se avecina en el futuro. Ella dice que es una de las reuniones más importantes para ella, ya que puede escuchar directamente "cuando se produce un cambio en el software o hay un nuevo requisito que surge de las operaciones para el software o para los datos".

Fase de análisis: Entendiendo lo que el cliente quiere

Por la tarde, ella tiene un buen bloque de tiempo para desarrollar los temas en los que está trabajando durante ese sprint.

Seidel administra el almacén de datos y se asegura de que los flujos de datos se estén mostrando a los usuarios finales en los modelos de datos principales. La semana pasada, trabajó en el equipo de rendimiento de la granja, "validando las mediciones que provienen de la granja, pensando en las nuevas mediciones que necesitamos recopilar y pensando en las mediciones que tenemos en nuestra granja de San Francisco sur, mediciones que recibimos de varios miles de dispositivos". Ella necesita asegurarse de que los flujos de medición sean precisos, que van desde la temperatura hasta el riego, para garantizar la salud de las plantas y responder preguntas como: "¿Por qué el rúcula de la semana pasada fue mejor que el rúcula de esta semana?"

La tarea principal es saber si están midiendo lo correcto y ser capaz de preguntar y decir: "Oh, ¿vale, qué es lo que quieres que explique esos datos? ¿Cuál es la pregunta que estás haciendo?", dice ella. Necesita estar unos pasos por delante y preguntar: "¿Cuáles son todas las nuevas fuentes de datos de las que debo estar al tanto y que necesitamos admitir?"

La parte más difícil del trabajo, según Seidel, es "realmente no tener la respuesta. Odio tener que decir: 'No, todavía no medimos eso'. O 'Lo tendremos en el próximo sprint'. Equilibrar el dar respuestas a las personas con darles herramientas para acceder a las respuestas por sí mismas es un desafío diario", dice ella, con el objetivo final de hacer que los datos sean accesibles.

Y decir: "Oh, sí, esos datos están ahí y es una consulta simple" o "Oh, ¿has visto esta herramienta que construí hace un año que puede resolver este problema?" es realmente gratificante.

"Ayudar a alguien a aprender a hacer y responder preguntas a partir de los datos es como darles un superpoder", dice Seidel.

Los 12 errores más comunes al trabajar con el objeto Recordset en Access

Lee más artículos de esta serie

  • Detrás de escena: Un día en la vida de un gerente de proyectos de TI
  • Detrás de escena: Un día en la vida de un desarrollador independiente de JavaScript
  • Detrás de escena: Un día en la vida de un director de CloudOps
  • Detrás de escena: Un día en la vida de un experto en ciberseguridad

En Newsmatic nos especializamos en tecnología de vanguardia, contamos con los artículos mas novedosos sobre Big Data, allí encontraras muchos artículos similares a Conviértete en un científico de datos exitoso: consejos y habilidades clave , tenemos lo ultimo en tecnología 2023.

Artículos Relacionados

Subir

Utilizamos cookies para mejorar su experiencia de navegación, mostrarle anuncios o contenidos personalizados y analizar nuestro tráfico. Al hacer clic en “Aceptar todo” usted da su consentimiento a nuestro uso de las cookies.