Comenzando con el análisis de datos desde cero - Introducción a PowerBi

Este artículo ayuda a todos a comprender el uso de la herramienta de BI: PowerBi. ¡A través de este artículo, puedes crear fácilmente tu propia señalización visual sin ningún conocimiento! En el futuro se lanzarán otras herramientas de BI convencionales, pero la lógica general y el uso de las herramientas de BI son similares.

1. El concepto de mesa

Antes de presentar formalmente powerbi, es muy necesario tener un conocimiento profundo del concepto de 'mesa'.

1. Categorías de tablas: tablas de dimensiones y tablas de hechos

(1) Tabla de hechos: Su característica principal es que cada fila de datos suele representar un evento, hecho o registro, y puede ser extraído Contiene información de medición y una gran cantidad de datos, y también se denomina tabla de datos (por ejemplo: tabla de datos de ventas, tabla de datos de pedidos, tabla de datos de comportamiento del usuario, etc.).

(2) Tabla de dimensiones: su característica principal es que contiene información de atributos de categoría y una pequeña cantidad de datos, incluidos campos únicos como fecha, nombre de la tienda, ID del producto e ID del cliente que no se repiten. . También se llama tabla de búsqueda porque en Excel a menudo las usamos como tabla de consulta de destino en la función Vlookup (por ejemplo: tabla de calendario, tabla de información de la tienda, tabla de productos, tabla de información del cliente, etc.).

2. Ejemplos de tablas de dimensiones y tablas de hechos

Da un ejemplo para que todos lo entiendan más fácilmente:

Esta tabla es una tabla de hechos. Puede ver que cada elemento es para registrar un hecho:

En comparación con la tabla de hechos anterior, la siguiente tabla es la tabla de dimensiones:

2. Conceptos básicos de PowerBi

<. p>1. Introducción a PowerBi: PowerBi es una combinación de servicios de software, aplicaciones y conectores que trabajan juntos para transformar fuentes de datos relevantes en conocimientos interactivos, coherentes y visualmente realistas.

2. Definición de visualización de datos: Obtención de información de forma más intuitiva a través de la combinación de datos e imágenes.

3. Power Bi consta principalmente de tres partes: Power Query (expresión de análisis de datos), modelado de datos y panel visual.

(1) Consulta de energía: la consulta de edición nos ayuda a completar la organización de la fuente de datos. Después de cerrar y aplicar la operación, los resultados se almacenan en la consulta editable.

(2) Modelado de datos: establezca una relación correspondiente entre la tabla de dimensiones y la tabla de hechos a través de un determinado campo (1 a 1 o 1 a muchos) para conectar los datos. También llamada vista relacional.

(3) Visual Kanban: complete la construcción de Visual Kanban a través de varios componentes visuales, segmentaciones, etc.

4. Valores de medición y DAX

(1) Valores de medición: se utilizan para mostrar indicadores clave. Puede comprender que el valor de medición existe en Power Bi en forma de fórmula y no creará nuevas columnas o filas en su tabla de datos. Por lo tanto, en comparación con la inserción directa de columnas en EXCEL, lo que genera una gran cantidad de datos nuevos, los valores de medición casi no ocupan memoria. El lenguaje para construir medidas se llama DAX (Expresión de análisis de datos).

(2) DAX: Es muy similar a la fórmula en EXCEL, excepto que la fórmula en EXCEL se refiere a celdas (como 'A1', 'B3'). DAX se refiere al nombre de una columna en una tabla.

Por ejemplo: [Ventas]=sum('Datos de ventas'[Cantidad])

Nota: En DAX, la comilla simple '' es el nombre de la tabla. Los corchetes [] son ​​nombres de columnas.

Si desea crear un panel visual, el proceso general se puede dividir en: adquisición de datos → limpieza de datos → modelado de datos → construcción del panel visual. A continuación se presentarán los detalles paso a paso.

3. Adquisición de datos

PowerBi admite múltiples fuentes de datos, como varios archivos locales: Excel, CSV, carpetas, etc. Soporta varias bases de datos: Oracle, Mysql, etc. Soporta Web, etc., cuyo front-end está compuesto por tablas.

Tome Excel como ejemplo. Dado que un archivo de Excel puede incluir muchas hojas, puede marcarlas a la izquierda y hacer clic para cargar. "Convertir datos" significa que los datos se pueden procesar previamente antes de cargarlos en PowerBi. Por supuesto, también se pueden procesar después de la carga. Sin embargo, si la cantidad de datos es demasiado grande o hay muchas columnas o filas en la fuente de datos que son inútiles, se recomienda preprocesar los datos antes de cargarlos (el método de preprocesamiento es el mismo que el método de limpieza de datos, que se explicará en detalle en el capítulo de limpieza de datos).

4. Limpieza de datos

¿Qué es la limpieza de datos? En una frase, se puede resumir en: convertir los datos en lo que quieres y puedes usar.

(1) Métodos y métodos de limpieza de datos

El método se refiere a las herramientas o formas de lograr la limpieza, por ejemplo, se puede limpiar a través de Power Query en Powerbi, o antes de cargar En Powerbi, la limpieza de datos se implementa a través de programas SQL.

Los métodos incluyen eliminar valores nulos, eliminar valores duplicados, fusionar columnas, dividir columnas, modificar tipos de datos, desvincular datos, etc.

(2) Tomando Power Query como ejemplo, podemos implementar la limpieza de datos a través de varios métodos en la barra de herramientas de Power Query:

En la interfaz de Power Query, haga clic en Powerbi "Convertir datos " se puede ingresar. La parte 1 de la figura muestra los métodos de limpieza de datos que puede realizar. La parte 2 de la figura muestra los datos que se han cargado en Powerbi. La parte 3 de la figura registra los registros de cada operación que realiza (por ejemplo , si elimina una columna, su operación de eliminar una columna se registrará a la derecha).

Una vez completada la limpieza, haga clic en Cerrar y Aplicar en la esquina superior izquierda. Todos los datos de fondo se guardarán y volverán a la interfaz del lienzo.

5. Visualización de datos

Después de obtener y limpiar los datos, puede utilizarlos para crear un panel.

1. Introducción a la interfaz funcional del lienzo

Parte de ella es el área funcional, las más utilizadas incluyen: obtener datos, convertir datos, actualizar, etc.

Las partes de arriba a abajo son: visualización del lienzo, descripción general de datos y modelado de datos. El modelado de datos se refiere a vincular datos de diferentes fuentes de datos.

Los componentes visuales están disponibles (haga clic y arrastre). Debajo de los componentes visuales están los campos mostrados por los componentes visuales (que pueden entenderse simplemente como los datos mostrados en las coordenadas horizontales y verticales).

La parte muestra la información de cada tabla de datos, la información de cada columna de cada tabla y la información del valor de la medida insertada.

2. Introducción a los componentes visuales

(1) Tome el gráfico de barras y el gráfico de líneas como ejemplo:

Primero haga clic para ingresar a la interfaz del lienzo, seleccione el tipo de componente visual y luego arrastre los campos de los datos al eje X o al eje Y para crear un gráfico visual simple.

(2) Edición del formato del gráfico

El círculo rojo en la imagen de arriba es la edición del formato del ícono, como el color del ícono, el título, la etiqueta de datos, etc., si está en el " Opción "Objeto Visual" Si no encuentras el atributo que deseas cambiar, puedes editarlo en la opción "General".