16 métodos de análisis de datos de uso común: análisis de series de tiempo
Las series de tiempo son una secuencia numérica en la que los valores observados de una determinada variable en el sistema se ordenan en el tiempo (con el mismo intervalo de tiempo), mostrando el proceso de cambio del objeto de investigación dentro de un cierto período, a partir del cual encontrar y analizar las características cambiantes, las tendencias de desarrollo y las leyes de las cosas. Es el resultado total de que una determinada variable del sistema se vea afectada por varios otros factores.
El objetivo principal del estudio de series temporales es hacer predicciones y predecir cambios futuros basándose en los datos de series temporales existentes. La clave para el pronóstico de series de tiempo es determinar el patrón de cambio en una serie de tiempo existente y asumir que este patrón continuará en el futuro.
Características básicas de las series temporales
Se supone que la tendencia de desarrollo de las cosas se extenderá hacia el futuro
Los datos en los que se basa la predicción son irregulares
Independientemente de la relación causal entre el desarrollo de las cosas
Los datos de series temporales se utilizan para describir las características de los fenómenos que se desarrollan a lo largo del tiempo.
Consideraciones de series de tiempo
El análisis de series de tiempo se puede dividir en análisis de series de tiempo tradicional y análisis de series de tiempo moderno según su etapa de desarrollo histórico y los métodos de análisis estadístico utilizados según la observación. time Diferente, el tiempo en la serie temporal puede ser año, trimestre, mes o cualquier otra forma de tiempo.
Los principales factores a considerar al analizar series de tiempo son:
l ¿Tendencia a largo plazo?
Las series de tiempo pueden ser bastante estables o cambiar con el tiempo mostrando una cierta tendencia.
Las tendencias de las series temporales generalmente son funciones lineales, cuadráticas o exponenciales.
lVariación estacional (Variación estacional)
Secuencia de comportamientos repetitivos que cambia con el tiempo.
Los cambios estacionales suelen estar relacionados con la fecha o el clima.
Los cambios estacionales suelen estar relacionados con ciclos anuales.
lVariación cíclica (Variación cíclica)
En relación con la variación estacional, las series temporales pueden experimentar una "variación cíclica".
Los cambios cíclicos suelen deberse a cambios en la economía.
lEfectos aleatorios
Además, también hay factores accidentales que afectan la serie temporal, provocando que la serie temporal muestre algunas fluctuaciones aleatorias. Las fluctuaciones accidentales en una serie temporal después de eliminar las tendencias, la periodicidad y la estacionalidad se denominan aleatoriedad, también conocidas como variaciones irregulares.
Principales componentes de las series temporales
Los componentes de las series temporales se pueden dividir en 4 tipos:
l Tendencia (T),
>l Estacionalidad o cambios estacionales (S),
l fluctuaciones cíclicas o cíclicas (C),
l aleatoriedad o fluctuaciones irregulares (I).
Uno de los contenidos principales del análisis de series de tiempo tradicional es separar estos componentes de la serie de tiempo, expresar la relación entre ellos con ciertas expresiones matemáticas y luego analizarlos por separado.
Pasos básicos del modelado de series de tiempo
1) Utilice observación, encuestas, estadísticas, muestreo y otros métodos para obtener datos dinámicos de series de tiempo del sistema observado.
2) Haga un diagrama de correlación basado en datos dinámicos, realice análisis de correlación y encuentre la función de autocorrelación.
Los gráficos de correlación pueden mostrar tendencias y ciclos cambiantes, y pueden encontrar puntos de salto y puntos de inflexión.
Un punto de salto es una observación que es inconsistente con otros datos. Si el punto de salto es un valor de observación correcto, se debe tener en cuenta al modelar. Si es una anomalía, el punto de salto se debe ajustar al valor esperado.
El punto de inflexión se refiere al punto en el que la serie temporal cambia repentinamente de una tendencia ascendente a una tendencia descendente. Si hay un punto de inflexión, se deben utilizar diferentes modelos para ajustar la serie temporal por partes durante el modelado, como un modelo de regresión de umbral.
3) Identificar el modelo estocástico apropiado y realizar un ajuste de curvas, es decir, utilizar un modelo estocástico general para ajustar los datos de observación de series temporales.
Para series temporales cortas o simples, se pueden utilizar modelos de tendencia y modelos estacionales más errores para el ajuste.
Para series temporales estacionarias, se pueden utilizar para el ajuste el modelo ARMA general (modelo de media móvil autorregresivo) y su modelo autorregresivo de caso especial, el modelo de media móvil o el modelo ARMA combinado.
Cuando hay más de 50 observaciones generalmente se utiliza el modelo ARMA. Para series de tiempo no estacionarias, la serie de tiempo observada primero debe diferenciarse en una serie de tiempo estacionaria y luego se utiliza un modelo apropiado para ajustar la secuencia de diferencias.
Proceso de análisis de series temporales de spss
El primer paso: definir la cantidad de etiquetas de fecha:
Abra el archivo de datos, haga clic en "Datos", seleccione "Definir fecha y hora" y aparecerá el cuadro de diálogo "Definir fecha".
La hora de inicio de los datos es la primera vez que aparece la celda. el archivo de datos. El primero es agosto de 1997. Cada fila representa el volumen de ventas mensual. Por lo tanto, debo seleccionar "Año, Mes" en el cuadro "Caso es" en el lado izquierdo del cuadro de diálogo "Definir fecha". ingréselo a la izquierda '1997', ingrese '8' en el cuadro de mes, indicando que el mes de inicio del primer caso es agosto de 1997.
Finalmente, haga clic en Aceptar, para que se muestren 3 nuevos generado en el archivo de datos spss
Como se muestra a continuación:
Paso 2: Comprender la tendencia cambiante de la serie temporal
Los resultados son como se muestra en la figura
Según el análisis del diagrama de secuencia, sabemos que la fluctuación de la secuencia se vuelve cada vez mayor con las estaciones, por lo que elegimos el modelo multiplicativo;
Paso 3: Análisis
Haga clic en "Analizar", seleccione el pronóstico de series de tiempo y luego seleccione "Descomposición estacional". Aparecerá el cuadro de diálogo "Descomposición estacional". Después de confirmar que es correcto, haga clic en Aceptar, como se muestra en la figura:
Hay cuatro variables más:
lERR representa el análisis de errores
lSAS. representa la serie corregida por el factor estacional;
lSAF representa el factor estacional
lSTC representa la tendencia a largo plazo y la secuencia de cambio cíclico.
Podemos hacer un diagrama de secuencia de las cuatro nuevas variables, media y FECHA_. Primero haga un diagrama de secuencia de ERR, SAS, STC, valor promedio y DATE_, el efecto es el siguiente:
Luego, haga un diagrama de serie de tiempo separado de SAT y DATE_
Paso 4: Pronóstico
1. Haga clic en "Analizar", seleccione "Pronóstico de series temporales", luego seleccione "Crear modelo tradicional" y luego aparecerá el cuadro de diálogo "Modelado de series temporales". caja arriba.
2. Mueva "Promedio" al cuadro "Variable dependiente", luego determine el "Método" en el medio, seleccione el elemento "Modelador experto" en la lista desplegable y haga clic en " Haga clic en Botón "Condiciones" para abrir el cuadro de diálogo "Modelador de series temporales: Condiciones del modelador experto".
3. En la pestaña "Modelo" del cuadro de diálogo "Modelador de series temporales: Condiciones del modelador experto", seleccione el elemento "Todos los modelos" en el cuadro "Tipo de modelo" y marque "El modelador experto considera estacional". "Modelos de series temporales", después de configurar, haga clic en el botón "Continuar".
4. En el cuadro de diálogo "Modelador de series temporales", cambie a la pestaña "Guardar", marque la casilla de verificación "Valor previsto", haga clic en Botón "Examinar" detrás de "Archivo XML" en el cuadro "Condiciones del modelo de exportación", luego configure el archivo del modelo exportado y guarde la ruta, y luego haga clic en el botón "Aceptar".
Después de completar los pasos anteriores, aparecerá otra columna de valores predichos en los datos originales. Como se muestra en la figura:
El modelo de predicción se guardó antes y ahora usaremos ese modelo para predecir los datos.
1. Haga clic en "Analizar", seleccione "Previsión de series temporales" y luego seleccione "Aplicar modelo tradicional" para que aparezca el cuadro de diálogo "Aplicar secuencia de modelo". La operación específica es como se muestra a continuación:
?
El último paso es cambiar a la interfaz "Guardar", marcar "Valor previsto" y hacer clic en Aceptar.
No se puede ver directamente desde el valor predicho. Puede juntar los datos predichos y los datos originales y verlos, o simplemente hacer un diagrama de secuencia.
De esta forma se completa un modelo de serie temporal. Los datos de previsión específicos se pueden ver en la nueva columna de datos que aparece encima de los datos originales.
- Fin -