Análisis multidimensional de los precios mundiales del petróleo
En una estructura de datos multidimensional, las tablas de hechos y las tablas de dimensiones están vinculadas entre sí mediante relaciones directas o indirectas. Para la selección de registros en la tabla, puede encontrar registros de datos relevantes en otras tablas relacionadas, realizar análisis estadísticos de los datos seleccionados y los datos relacionados, y obtener la distribución, la tendencia y otros resultados de análisis de estos datos. Después de configurar las dimensiones del análisis multidimensional, los datos se pueden analizar desde diferentes ángulos de combinación de acuerdo con la relación jerárquica entre las dimensiones para formar un análisis multidimensional en tiempo real.
El contenido de desarrollo del almacén de datos generalmente se puede dividir en dos partes: el diseño del almacén de datos y la implementación del análisis multidimensional. El diseño del almacén de datos incluye la construcción de un esquema en estrella, la determinación del modo de extracción de datos, la implementación de la conversión y purificación de datos y el almacenamiento de datos multidimensionales. La implementación del análisis multidimensional incluye la selección de dimensiones de análisis multidimensional, la definición de valores de medición, el método de conversión de dimensiones, la definición de rutas de perforación y la determinación del método de visualización de datos de perforación.
Durante el proceso de desarrollo de este sistema, debido a la incertidumbre de la demanda y las limitaciones de integridad de los datos que plantea el sistema prototipo, cómo diseñar una buena estructura para mostrar mejor los datos multidimensionales y qué forma utilizar para mostrar Los datos multidimensionales son una cuestión clave. Se discuten el patrón arquitectónico del almacén de datos en el sistema y la definición de estructuras de datos multidimensionales, y se discuten los problemas y soluciones en la complejidad de las fuentes de datos originales del sistema, la integridad de los datos y la validez de los datos. El diseño de análisis multidimensional incluye la correlación entre dimensiones, el contenido y la forma de los datos fácticos, la exploración de datos, etc.
5.3.2.1 Análisis de correlación de tablas de dimensiones
La estructura de la tabla de origen de datos incluye una tabla de hechos y varias tablas de dimensiones. Para estas tablas de dimensiones, se pueden diseñar dimensiones para análisis multidimensionales, es decir, dimensiones de productos petrolíferos, mercados comerciales, tipos de transacciones, unidades de precios y fechas de precios. Existe una relación directa entre los datos de dimensión y las tablas de hechos intermedias, y se generan relaciones concisas entre los datos de dimensión a través de tablas de hechos intermedias. Por lo tanto, sobre la base de los datos fácticos existentes, se pueden visualizar las relaciones entre las dimensiones.
La Figura 5.29 muestra datos de contenido en cuatro dimensiones y enumera los valores de los campos en cada dimensión, que se relacionan a través de la tabla de hechos. Después de seleccionar el petróleo crudo, el fondo de los valores del campo en las otras tres dimensiones cambia. El fondo blanco indica que hay mercados comerciales relacionados con el petróleo crudo en la tabla de hechos, a saber, Cushing, OK y Brent europeo, lo que indica que la tabla de hechos tiene datos de precios del petróleo crudo para estos dos mercados, pero no hay datos de precios para otros. mercados.
Figura 5.29 Lista de dimensiones del análisis multidimensional
De forma predeterminada, la lista de dimensiones muestra todos los valores de dimensión posibles. Después de seleccionar una dimensión, como el valor del petróleo crudo en el nombre del producto, los valores de dimensión asociados con el valor seleccionado en esa dimensión a través de los datos del precio del petróleo se resaltarán en otras dimensiones. Mediante la visualización de correlaciones entre dimensiones, se pueden analizar algunos patrones de distribución ocultos en los datos de origen. En este ejemplo, podemos ver que hay precios spot del petróleo crudo FOB en los mercados de Cushing, OK y Brent europeo en el sistema, y el tiempo del precio existe desde 1986 hasta 2008, el nombre unitario del precio del petróleo está solo en el existe la forma de dólares estadounidenses por barril. El análisis de correlación dimensional del análisis multidimensional también le permite seguir reduciendo los valores seleccionados en función de un único análisis.
5.3.2.2 Análisis de correlación y visualización de tablas de dimensiones y tablas de hechos
En el análisis multidimensional en tiempo real, además del análisis de correlación entre tablas de dimensiones, también se pueden asociar tablas de dimensiones. con tabla de hechos para análisis. En este análisis, además de mostrar las asociaciones entre tablas de dimensiones en el lado izquierdo de la interfaz, también se pueden mostrar datos de tablas de hechos y algunos análisis estadísticos basados en datos de tablas de hechos en la parte principal de la interfaz. La Figura 5.30 muestra el análisis comparativo de diferentes tipos de transacciones de los precios mundiales del petróleo, lo que refleja la comparación de precios de varias variedades de petróleo en el comercio al contado, el comercio de futuros, etc. Los resultados del análisis pueden cambiar en tiempo real a medida que cambia la selección de la dimensión izquierda.
Figura 5.30 Análisis comparativo de precios de transacción
Para la visualización de la tabla de hechos, además de realizar análisis estadístico según el orden de dimensiones predeterminado, también puede arrastrar la posición de los dimensión en la interfaz Convierta directamente el orden entre dimensiones para realizar la función de rotación del análisis multidimensional, que no se describirá aquí.
5.3.2.3 Exploración de datos de tablas de hechos
Otro contenido importante del análisis multidimensional es la exploración de datos. En el análisis multidimensional en tiempo real, se pueden enriquecer las funciones de exploración de datos. Para facilitar el análisis, predefinimos la ruta de perforación:
Mercado→Tipo de precio→Año de precio→Nombre del producto.
De esta manera, se puede perforar y analizar los precios del petróleo según este camino. Por primera vez, los precios históricos del petróleo se calculan por nombre de mercado de forma predeterminada. Después de seleccionar un mercado, profundice en dos niveles para obtener los precios históricos del petróleo calculados por año de precio. El análisis de exploración aquí se puede combinar con el análisis de correlación de dimensiones para lograr una exploración de datos más flexible (Figura 5.31, Figura 5.32).
Figura 5.31 Análisis de perforación de datos 1
Figura 5.32 Análisis de perforación de datos 2
5.3.2.4 Análisis de tendencia de precios.
El análisis de tendencias de precios puede complementar la previsión de precios. Su función es mostrar información relevante sobre diferentes productos petroleros, diferentes tipos de transacciones y unidades de precios en el pasado, expresando así intuitivamente las tendencias futuras y las tendencias de los productos petroleros. Este módulo se ha completado con un módulo de programa modelo independiente (Figura 5.33).
Figura 5.33 Análisis de tendencia de precios multidimensional
En la visualización del almacén de datos, la asociación entre tablas de dimensiones y la asociación entre tablas de dimensiones y tablas de hechos en el análisis multidimensional en tiempo real se pueden utilizar para actualizar Amplía excelentemente la funcionalidad del análisis multidimensional. Para determinar las necesidades de análisis multidimensional, puede considerar utilizar el método prototipo. A través de la visualización multidimensional en tiempo real del almacén de datos, puede descubrir la connotación de los datos y la correlación entre los datos, y ayudar gradualmente a determinar las dimensiones. valores de medición, métodos de presentación, etc. que deben analizarse y analizar la fuente de datos El diseño de la estructura de la tabla se ve afectado negativamente.