¿Qué significan gestión de datos, gobernanza de datos, centro de datos, centro de datos y lago de datos, y cuál es su relación?

Gobierno de datos y gestión de datos

Simplemente hablando, el gobierno es la gestión de la gestión.

Para la gestión, se debe seguir un determinado sistema estándar, un determinado proceso y una determinada división organizativa de roles, y estos contenidos primero deben definirse claramente a través del gobierno de datos. La gerencia solo desempeña responsabilidades de gestión y supervisión de acuerdo con el sistema de especificación de gobierno de datos.

La base para la implementación de la gestión es el sistema de normas de gobernanza.

Plataforma intermedia de datos y lago de datos

No es fácil explicar esto claramente, así que trato de simplificarlo tanto como sea posible.

El lago de datos es generalmente un concepto propuesto por los proveedores de servicios de nube pública, es decir, todos los datos estructurados y no estructurados de la empresa se pueden recopilar y almacenar aquí. Un lago de datos es una gran estación de almacenamiento. Este almacenamiento está distribuido y se puede ampliar infinitamente. Los datos almacenados no se limpiarán ni procesarán, sino que permanecerán como están.

Después de guardar, el lago de datos proporciona algunas interfaces abiertas estándar para que usted utilice los datos. Estas interfaces incluyen interfaces de consulta SQL, interfaces de motor informático, interfaces de procesamiento de flujo, etc. El propósito de proporcionar una interfaz también es muy simple. Puede utilizar fácilmente los datos que almacena.

El almacenamiento de los lagos de datos es generalmente almacenamiento de objetos distribuidos o almacenamiento de archivos distribuidos. Incluso si recopila datos de una base de datos estructurada, se convertirá en un método de almacenamiento unificado para facilitar la expansión.

En pocas palabras, la plataforma intermedia de datos es la capacidad de la empresa para compartir datos que se están hundiendo y abiertos al mundo exterior.

La plataforma intermedia de datos incluye la plataforma de tecnología de datos subyacente (que pueden ser las capacidades de la plataforma de big data con las que estamos familiarizados), la capa intermedia de activos de datos y la apertura de datos de la capa superior a capacidades externas.

La capa de activos central en sí también está dividida en capas, desde los datos de origen de nivel más bajo hasta los datos de aplicaciones de dominio específico, pasando por el almacén de datos de nivel superior y la biblioteca de etiquetas de datos. El lago de datos corresponde más a la capa de fuente de datos en el concepto de plataforma intermedia de datos.

Cuando las empresas realmente construyen centros de datos, rara vez utilizan el concepto de lago de datos.

La comparación y mapeo entre los dos es la siguiente:

Centro de datos

La palabra centro de datos aparece a menudo en las aplicaciones del sistema BI.

Pero ahora los centros de datos generalmente se refieren a infraestructura de TI, grandes salas de datos en la nube pública, etc. Este término rara vez se utiliza en sistemas de BI o centros de datos. Es decir, el término centro de datos está sesgado hacia el nivel de infraestructura de hardware de TI.