Caso de análisis estadístico de SPSS: red neuronal perceptrón multicapa
Caso de análisis estadístico de SPSS: red neuronal perceptrón multicapa
El modelo de red neuronal se originó a partir del estudio del modo de pensamiento del cerebro humano. Es una herramienta de modelado de datos no lineal. desarrollado por La capa de entrada, la capa de salida y una o más capas ocultas constituyen neuronas. A las conexiones entre neuronas se les asignan pesos relevantes. El algoritmo de aprendizaje de entrenamiento ajusta continuamente estos pesos durante el proceso iterativo, minimizando así el error de predicción y brindando precisión de predicción. .
En la red neuronal SPSS, existen dos métodos: perceptrón multicapa (MLP) y función de base radial (RBF).
Este problema se centra principalmente en el aprendizaje de redes neuronales de perceptrones multicapa. Es difícil explicarlo claramente. Para sentir intuitivamente sus funciones, primero comenzamos con un caso y finalmente resumimos el conocimiento.
Datos de caso
Este archivo de datos se relaciona con los esfuerzos de un banco para reducir las tasas de morosidad de los préstamos. El archivo contenía información financiera y demográfica de 700 clientes que habían recibido préstamos en el pasado. Cree un modelo de red neuronal de perceptrón multicapa utilizando una muestra aleatoria de estos 700 clientes. Los bancos necesitan este modelo para clasificar los datos de nuevos clientes como de alto o bajo riesgo crediticio.
Primer Análisis: Parámetros del Menú
Para ejecutar el análisis del Perceptrón Multicapa, seleccione en el menú:
Análisis>Red Neuronal>Perceptrón Múltiple Capa
Como se muestra en la imagen de arriba, el panel principal de MLP tiene 8 pestañas. Se deben configurar al menos "Variables", "Partición", "Salida", "Guardar" y "Exportar". acepte la configuración predeterminada del software para los demás.
▌ Pestaña "Variables"
Mueva "Si está en mora" al cuadro de variable dependiente;
Mueva la variable categórica "Educación" al cuadro de factor, y otras variables numéricas Vaya al cuadro "Covariables";
Debido a que las dimensiones de cada covariable son diferentes, seleccione procesamiento "Estandarización";
▌ pestaña "Partición"
Aquí antes, primero configure la semilla fija de número aleatorio en 9191972 en el menú "Convertir > Generador de números aleatorios" (esto es lo mismo que el documento oficial de SPSS, el usuario puede configurarlo libremente), porque la pestaña "Partición" requiere que el archivo de datos original sea El muestreo aleatorio divide los datos en tres bloques: "muestras de entrenamiento", "muestras de soporte" y "muestras de prueba" Para que el proceso aleatorio sea repetible, aquí se especifica una semilla fija; p>
Primera vez Para el modelado, el 70% se muestrean primero como muestras de entrenamiento para completar el autoaprendizaje y construir un modelo de red neuronal, y el 30% se utilizan como muestras de soporte para evaluar el rendimiento del modelo establecido. no se asignará por el momento;
▌ pestaña "Salida"
Marque "Descripción" y "Gráfico";
Marque "Resumen del modelo", " Resultados de clasificación" y "Mapa medido previsto";
Marque "Resumen de procesamiento de casos";
Constituya "Análisis de importancia de variable independiente";
Este es el primer análisis tentativo. Los parámetros principales se configuran como se indica arriba. Acepte la configuración predeterminada del software en otras pestañas y finalmente regrese al panel principal, haga clic en el botón "Aceptar" y el software comenzará a ejecutar el proceso MLP.
Resultados del primer análisis:
Los principales resultados son los siguientes:
Tabla resumen de procesamiento de casos, registros de 700 clientes de crédito, entre ellos, 480 los clientes fueron asignados a muestras de capacitación, lo que representa el 68,6 %, y los otros 220 clientes fueron asignados a muestras de soporte.
Tabla de resumen del modelo, el porcentaje de predicción incorrecta del modelo de red neuronal MLP creado por primera vez es del 12,7%, el porcentaje de predicción incorrecta del modelo de prueba de muestra de soporte independiente es del 20,9% y aparece el mensaje "Excedido el número máximo de cursos de tiempo", El modelo termina de forma anormal, lo que indica sospecha de sobreaprendizaje.
Sentencia: Es necesario evitar el sobreentrenamiento del modelo establecido por primera vez.
Segundo análisis: parámetros del menú
El primer análisis sospechaba de sobreentrenamiento, por lo que el segundo análisis se centró principalmente en agregar nuevas muestras de prueba y generar los resultados finales del modelo.
Para ejecutar un análisis de Perceptrón Multicapa, seleccione en el menú:
Análisis>Redes Neuronales>Perceptrón Multicapa
▌ Opción "Partición" Ka
Redistribuir muestras, con un total de 700 muestras, las muestras de soporte continúan siendo el 30%, las muestras de capacitación se reducen del 70% original al 50% y el otro 20% se asigna al espacio de muestra de pruebas independientes;
p>
▌ Pestaña "Guardar"
Guarde el valor o categoría predicha de cada variable dependiente;
Guarde la pseudoprobabilidad predicha de cada variable dependiente;
▌ Pestaña "Exportar"
Exportar estimaciones de peso sináptico a un archivo XML;
Nombre el archivo de modelo XML y especifique una ruta de almacenamiento;
Las operaciones de otras pestañas siguen siendo las mismas que en el primer análisis. Regrese al panel principal y haga clic en "Aceptar" para iniciar el segundo análisis.
Los resultados del primer análisis:
El ratio de distribución de la muestra total en las tres particiones.
Diagrama de red neuronal MLP, el modelo incluye 1 capa de entrada, 1 capa oculta y 1 capa de salida. El número de neuronas en la capa de entrada es 12, la capa oculta es 9 y la capa de salida es 2. .
Tabla de resumen del modelo, el error del modelo no parece reducirse mediante la optimización en 1 paso consecutivo y el modelo finaliza según lo programado. El porcentaje de predicciones incorrectas del modelo es relativamente cercano en las 3 particiones.
Tabla de clasificación del modelo, el software toma por defecto 0,5 como límite de probabilidad entre correcto e incorrecto. Las tasas correctas de las muestras de las tres particiones principales se comparan de forma cruzada, lo que muestra que la predicción es NO, es decir. , la probabilidad de no incumplir es mayor que la de morosidad, el modelo tiene una menor capacidad de identificación de riesgos para los clientes de préstamos con incumplimientos.
El gráfico de medición real de predicción se agrupa según si los clientes del préstamo están en mora y los resultados de la predicción. El eje vertical es la probabilidad de predicción. Cuando se utiliza 0,5 como línea divisoria, el efecto de identificación de los clientes de alta calidad es mejor, pero existe una mayor probabilidad de cometer errores al identificar a los clientes morosos.
Obviamente, usar 0,5 como línea divisoria no es la solución óptima. Puede intentar mover la línea divisoria hacia abajo a aproximadamente 0,3. Esta operación reclasificará correctamente una gran cantidad de morosos en el cuarto diagrama de caja. morosos de préstamos, mejorar las capacidades de identificación de riesgos.
Gráfico de importancia de variable independiente, el gráfico de importancia es un gráfico de barras de los valores de la tabla de importancia, ordenados en orden descendente de valor de importancia. Muestra que las variables relacionadas con la estabilidad del cliente (empleo, dirección) y la deuda (creddebt, deudatinc) tienen un impacto significativo en cómo la red clasifica a los clientes;
Finalmente, mire el archivo de modelo XML exportado: p> p>
El segundo modelo de red neuronal MLP construido se almacena en un archivo XML, que se puede utilizar para clasificar nuevos clientes e identificar riesgos.
Clasificación de nuevos clientes
Supongamos que ahora hay 150 nuevos clientes, y ahora es necesario utilizar el modelo previamente establecido para clasificar e identificar rápidamente los riesgos de estos clientes.
Abra los datos del nuevo cliente, seleccione en el menú:
Utilidades>Asistente de calificación
Escriba el archivo XML, haga clic en "Siguiente":
Compruebe si la definición de las nuevas variables del archivo de datos es precisa.
Seleccione la salida "Probabilidad de la categoría prevista".
Se agregan tres nuevas columnas para proporcionar la probabilidad prevista. y clasificación de riesgo de cada nuevo cliente (si debe un préstamo)
Resumen de la red neuronal perceptrón multicapa
Un método de aprendizaje supervisado;
Los perceptrones multicapa pueden descubrir relaciones extremadamente complejas;
Si la variable dependiente es categórica, la red neuronal dividirá los registros en la categoría más adecuada;
Si la variable dependiente La variable es continua, el valor continuo predicho por la red Shenjiang es una función continua de los datos de entrada;
Se recomienda crear tres particiones de soporte de prueba de entrenamiento, la capacitación y el aprendizaje de la red serán más efectivos ;
El modelo se puede exportar a formato XML para puntuar nuevos datos;