Cómo extraer cadenas delimitadas en Power Query de Excel
Es posible que recibas datos extranjeros en forma de caracteres concatenados que debas importar en Microsoft Excel. Por lo general, importarás el conjunto de datos completo, incluso si solo necesitas una parte de la cadena.
Por ejemplo, podrías recibir una lista de números de transacción que contienen el número de identificación del cliente. Solo necesitas las partes del cliente en Excel para establecer una relación entre ese cliente y una tabla que contiene los nombres de los clientes. De esta manera, cuando generes informes, los espectadores verán los nombres de los clientes en lugar de un número sin sentido.
Cuando esto sucede, puedes utilizar las funciones "Extraer" y "Dividir columna" de Power Query para extraer cadenas delimitadas en sus componentes. Estoy utilizando Microsoft 365 Desktop y Power Query en Microsoft Excel. Power Query está disponible en versiones anteriores a través de Excel 10. Puedes descargar el archivo de demostración de Microsoft Excel para este tutorial.
Por qué deberías usar Power Query de Excel
Puedes utilizar las funciones de texto de Excel, "Texto en columnas" o "Relleno rápido", pero aquí tienes algunas razones por las que es posible que no lo hagas:
- "Texto en columnas" sobrescribe los datos originales.
- Tus datos podrían no encontrarse en Excel, y aunque Power Query está disponible en Excel, también puede importar datos de muchas otras fuentes, no solo de Excel.
- El conjunto de datos de origen contiene más filas de las que puedes importar en Excel.
- Tal vez necesites utilizar Power Query para algo mucho más complejo, y extraer un subconjunto de la entrada original es solo el primer paso.
Si los datos se encuentran en Excel, podrías utilizar funciones o fórmulas, pero a menos que seas un experto, eso llevará un poco de tiempo. La mayoría de nosotros no podemos simplemente escribir la sintaxis necesaria y hacerlo bien a la primera. Power Query es rápido y no requiere ningún conocimiento especializado de las funciones de Excel.
Cómo importar los datos en Power Query
Trabajaremos con una hoja de cálculo de Excel simple con algunas cadenas delimitadas en una tabla llamada "TablaCustomerID". No es necesario que cambies el nombre de tabla predeterminado, pero los nombres significativos son más fáciles de trabajar si tienes múltiples tablas. Sin embargo, los datos deben estar formateados como un objeto de tabla. Si no lo están, Power Query te pedirá que conviertas el rango de datos.
Aprende un nuevo idioma y viaja sin límites con Babbel Language LearningSupongamos que tienes una lista de números de identificación de clientes con tres secciones cada uno. Además, el caracter guion (-) sirve como delimitador entre las tres secciones (Figura A). Quieres utilizar el componente central de cada cadena porque esa es la sección que identifica realmente a cada cliente. Los otros dos componentes identifican la región donde reside el cliente y un número de transacción.
Figura A
El primer paso es cargar los datos en Power Query de la siguiente manera:
- Haz clic en cualquier lugar dentro de la tabla.
- Haz clic en la pestaña "Datos".
- En el grupo "Obtener y transformar datos", haz clic en "Desde tabla/rango".
Eso es todo. La simple tabla que se muestra en Figura A ahora está en Power Query.
Con los datos en Power Query, puedes comenzar a extraer secciones.
Las mejores soluciones de gestión de activos informáticos en 2023Cómo extraer cadenas delimitadas utilizando las opciones de "Extraer" en Power Query
Realmente hay dos formas de extraer datos en Power Query. Comenzaremos utilizando las opciones de "Extraer", las cuales devuelven un subconjunto del valor original. Para comenzar:
- Haz clic en la pestaña "Transformar".
- Haz clic en el menú desplegable "Extraer" en el grupo "Columna de texto". Como puedes ver en Figura B, hay varias opciones y en su mayoría son autoexplicativas. Vamos a ver las opciones de delimitador para que veas qué hace cada una.
Figura B
- Después de hacer clic en el encabezado del campo "Customer ID" para seleccionar la columna, haz clic en la pestaña "Transformar", si es necesario.
- Haz clic en "Extraer" en el grupo "Columna de texto".
- Elige la opción "Texto antes del delimitador". En el diálogo resultante, ingresa el carácter guion (Figura C) y haz clic en "Aceptar".
Figura C
Como puedes ver en Figura D, esta opción devuelve solo el primer carácter (o caracteres) antes del delimitador.
Descubre las herramientas gratuitas de Microsoft PowerToys para Windows 11Figura D
Para recuperar los datos originales, elimina el paso "Texto extraído antes del delimitador" en el panel "Pasos aplicados" que se muestra en Figura E haciendo clic derecho en el elemento y seleccionando "Eliminar" en el menú contextual.
Figura E
Ahora, hagamos lo mismo con la siguiente opción, "Texto después del delimitador". Cuando se te solicite, ingresa el carácter guion y haz clic en "Aceptar" para ver los resultados que se muestran en Figura F. Esta vez, Power Query elimina los dos primeros caracteres, el primer número y el primer guion.
IBM y Apptio anuncian nuevas integraciones de productos para optimizar costos en la nubeFigura F
Nuevamente, recupera los datos originales eliminando el paso de extracción y luego elige la opción "Texto entre delimitadores". Esta vez, Power Query te solicitará dos delimitadores. En este caso, ambos son el carácter guion (Figura G).
Figura G
Haz clic en "Aceptar" para ver los resultados que se muestran en Figura H.
Las mejores soluciones gratuitas de software de recursos humanos para tu negocioFigura H
Ahora, vamos a ver otra forma de dividir las tres secciones de cada cadena, pero esta vez no vamos a extraer piezas de las cadenas, sino a dividirlas. Recupera los datos originales antes de continuar.
Cómo extraer cadenas delimitadas utilizando la opción "Dividir columna" en Power Query
La función "Dividir columna" de Power Query te permite obtener más de una parte de la cadena. Por ejemplo, supongamos que deseas obtener tres columnas de datos, una para cada sección. Para lograr esto, utiliza "Dividir columna" de la siguiente manera:
- Después de seleccionar la columna, haz clic en la pestaña "Inicio".
- En el grupo "Transformar", haz clic en "Dividir columna".
- Haz clic en la primera opción, "Por delimitador".
- En el diálogo resultante, no necesitas hacer mucho, porque Power Query se encarga de discernir tus necesidades. Asegúrate de que Power Query seleccione "Cada aparición del delimitador" en la sección "Dividir en" (Figura I).
Figura I
Potencia tu análisis de datos con Microsoft Lists y Power BI- Haz clic en "Aceptar" para ver los resultados en Figura J.
Figura J
Esta opción separa cada cadena en tres columnas utilizando el carácter delimitador para determinar dónde comienza y termina cada sección.
Como puedes ver, tanto "Extraer" como "Dividir columna" te ayudan a separar los datos rápidamente. Es probable que encuentres usos para ambos métodos.
Revisión de Teamwork: característicasEn Newsmatic nos especializamos en tecnología de vanguardia, contamos con los artículos mas novedosos sobre Software, allí encontraras muchos artículos similares a Cómo extraer cadenas delimitadas en Power Query de Excel , tenemos lo ultimo en tecnología 2023.
Artículos Relacionados