Establecimiento de un modelo de evaluación de idoneidad del suelo basado en la teoría de nubes y conjunto aproximado
(1. Hunan Wanyuan Assessment Consulting Co., Ltd., Changsha, 410011; 2. Facultad de Recursos y Ciencias Ambientales, Universidad de Wuhan, Wuhan, 430079)
Este artículo presenta y analiza dos métodos matemáticos no clásicos: la teoría de nubes y la teoría de conjuntos aproximados. Al comparar y combinar estos dos métodos, se estableció un modelo de evaluación de la idoneidad del terreno basado en la teoría de nubes y la teoría de conjuntos aproximados y, sobre esta base, se llevaron a cabo estudios de caso y aplicaciones.
Palabras clave: teoría de conjuntos aproximados; teoría de la nube; minería de datos; evaluación de idoneidad de la tierra
La evaluación de la idoneidad de la tierra es una evaluación de la idoneidad y la idoneidad de un tipo de uso de la tierra específico. Es una parte importante de la utilización racional de la tierra. A través del estudio de todos los recursos de la tierra en la región, podemos proporcionar una base científica para el equilibrio humano-tierra, el ajuste de la distribución y la estructura de la tierra, el desarrollo y la utilización de la tierra en la planificación general del uso de la tierra. Por lo tanto, evaluar correctamente la idoneidad de la tierra y clasificar razonablemente los niveles de idoneidad es una de las tareas principales de las decisiones de planificación, y los métodos de evaluación son particularmente importantes como una forma de obtener resultados de evaluación correctos.
Los métodos de evaluación tradicionales, como el método de condición límite, el método de análisis de regresión, el método de índice empírico, el proceso de jerarquía analítica, etc., son demasiado simples y no pueden reflejar de manera objetiva y completa la situación real hasta cierto punto. Con el continuo desarrollo y mejora de la tecnología inteligente, los métodos de evaluación también se han desarrollado desde métodos numéricos simples tradicionales hasta métodos inteligentes. Debido a la incertidumbre sobre la idoneidad de la tierra, resulta ventajoso utilizar técnicas de minería para procesar grandes cantidades de datos inciertos.
1 Características de la teoría de conjuntos aproximados y la teoría de nubes
La teoría de conjuntos aproximados es una herramienta matemática que describe lo incompleto y la incertidumbre, y puede analizar y abordar eficazmente imprecisiones e información incompleta como la inconsistencia. y lo incompleto se utiliza para descubrir conocimientos ocultos y revelar patrones subyacentes. Puede descubrir eficazmente reglas de asociación a partir de datos existentes y puede admitir la adquisición de conocimientos en varios pasos, como el preprocesamiento de datos, la reducción de datos, la generación de reglas, la adquisición de dependencia de datos, etc. La teoría de las nubes es un modelo de conversión cualitativa y cuantitativa basado en la teoría tradicional de conjuntos difusos y las estadísticas de probabilidad. El concepto cualitativo está representado por el valor esperado ex, la entropía en y la superentropía he. Es un sistema basado en el estudio de la transformación de la incertidumbre entre cualitativo y cuantitativo. Como nueva teoría para abordar la incertidumbre, puede ayudar con la discretización de datos y el razonamiento de reglas, acercando este método al campo del pensamiento humano y sentando las bases para un mejor desarrollo de la inteligencia artificial.
La teoría de las nubes y la teoría aproximada de conjuntos son generalizaciones de la teoría de conjuntos clásica para abordar la incertidumbre y la inexactitud. Ambas pueden usarse para describir la inexactitud y la incompletitud del conocimiento, pero el punto de partida es el mismo. es diferente. La teoría de las nubes combina borrosidad y aleatoriedad, mientras que los conjuntos aproximados describen la incertidumbre a través de conjuntos de aproximación superior e inferior. Los conjuntos aproximados no requieren ninguna información de datos adicional y tienen ventajas únicas a la hora de derivar reglas de asociación. El método de la teoría de las nubes para tratar información incierta requiere cierta información adicional o conocimiento previo de los datos, pero proporciona un método de conversión cualitativa y cuantitativa. Aunque la teoría de las nubes y la teoría de conjuntos aproximados tienen características diferentes, están estrechamente relacionadas y son muy complementarias en el estudio de datos inciertos. Introducir la teoría de la nube en los métodos de conjuntos aproximados y mejorar el modelo estructurado de conjuntos aproximados no solo puede mejorar la eficiencia del algoritmo de descubrimiento, sino también la solidez del modelo del sistema. La idoneidad de la tierra es un concepto cualitativo. El uso de la teoría de conjuntos aproximados y la teoría de nubes para establecer un modelo de evaluación de la idoneidad de la tierra puede complementar las fortalezas de cada uno y aprovechar las fortalezas de cada uno, haciendo posible que la evaluación de la idoneidad de la tierra sea objetiva.
2. Establecimiento de un modelo de evaluación basado en la teoría de la nube y el conjunto aproximado.
La combinación de la teoría de la nube y el método del conjunto aproximado utiliza el método de conversión cuantitativo-cualitativo basado en la teoría de la nube como modelo aproximado. El método de preprocesamiento significa convertir datos cuantitativos en datos cualitativos, o convertir datos cualitativos en nuevos datos cualitativos en diferentes niveles conceptuales, luego aplicar el método de conjunto aproximado para descubrir el conocimiento de la toma de decisiones de clasificación y, finalmente, utilizar el método de razonamiento de incertidumbre de la teoría de la nube. aplicar este conocimiento, es decir, inferir resultados cuantitativos o cualitativos basados en nuevos datos condicionales cuantitativos o cualitativos, expresando y transmitiendo así la incertidumbre del conocimiento y el razonamiento. En lo que respecta al modelado específico, primero se elabora una tabla de decisión inicial basada en los datos originales y, para cada atributo de condición, se verifica si es un atributo discreto. Si es así, se discretiza hasta que toda la tabla de decisión se convierte completamente en datos discretos y luego se crea la tabla de decisión final. Sobre la base de esta tabla de decisión, las reglas de asociación se descubren mediante el método de conjunto aproximado y se calcula la importancia de los atributos para obtener las reglas de asociación.
Finalmente, los resultados del razonamiento cualitativo se obtienen mediante el método de razonamiento basado en la teoría de las nubes. El modelo completo se muestra en la Figura 1.
Figura 1 Diagrama del modelo de evaluación
Entre ellos, el proceso detallado de razonamiento de reglas basado en la teoría de la nube se muestra en la Figura 2.
2.1 Establecimiento de la tabla de decisión
Recoger datos que afectan a la idoneidad del suelo, como pendiente, textura, contenido de materia orgánica, espesor, etc. , muestrear y organizar los datos originales, y crear una tabla de decisiones de información basada en el propósito de la evaluación de la idoneidad de la tierra (como apta para silvicultura, apta para pastoreo, etc.). ).
2.2 Preprocesamiento de datos
En muchos casos, la tabla de información a procesar no es una tabla de información completa y se omiten algunos valores de atributos en la tabla. En este caso, esto se puede solucionar dando al atributo de vacante un valor especial para distinguirlo de otros valores de atributo.
Figura 2 Razonamiento teórico de la nube
2.3 Discretización de datos
Utilice el modelo de nube para simular el pensamiento humano y dividir el espacio de atributos. Cada atributo se trata como una variable lingüística (o una combinación de variables lingüísticas). Para cada variable lingüística, se definen varios valores lingüísticos y se permite que los valores lingüísticos adyacentes se superpongan. El usuario puede proporcionar nubes que representan valores lingüísticos de forma interactiva. Sea una nube A1 (Ex1, En1, He1), A2 (Ex2, En2, He2),..., dado un atributo numérico (Exn, Enn, Hen), cualquier valor de atributo X se ingresa a la nube como un elemento de lenguaje. medio. μ2, ..., μn, es decir, los valores de atributo μ y A1, A2, ..., an, y recupera el grado máximo de membresía μi, y luego asigna X a Ai. Si los dos grados de pertenencia μi y μj son iguales al valor máximo, entonces X se asigna aleatoriamente a Ai o Aj.
2.4 Reducción de atributos de la tabla de decisión
Con base en la adquisición de conocimientos de la teoría de conjuntos aproximados, la tabla de decisión original se reduce utilizando el algoritmo de reducción de atributos de la matriz de diferencias de la tabla de decisión y la función de diferencia, que incluye Reducción de atributos y reducción del valor de los atributos.
Supongamos que s = < u, r, v, f > es el sistema de tablas de decisión, r = p ∪ d es el conjunto de atributos, el subconjunto p = {ai i = 1,..., m} y d = {d} son el conjunto de atributos de condición y el conjunto de atributos de decisión respectivamente, u = {x1. CD (i, J) representa el elemento de la fila I y la columna J en la matriz de diferencias, entonces la matriz de diferencias CD se define como: {AK | AK ∈ P ∧ AK (xi) ≠ AK (xj)}, d(Xi )≠d (XJ);
Innovación en tecnología de la información terrestre y desarrollo de ciencia y tecnología terrestres: Actas de la Conferencia Académica Anual de 2006 de la Sociedad China de Ciencias Terrestres.
Donde I, j = 1,…,n.
Según la definición de la matriz de diferencias, cuando los atributos de toma de decisiones de dos muestras (instancias) toman el mismo valor, la matriz de diferencias correspondiente toma el valor 0 cuando los atributos de toma de decisiones de la; dos muestras son diferentes, puede usar Al distinguir por diferentes valores de ciertos atributos condicionales, el valor del elemento de matriz identificable correspondiente es el conjunto de atributos condicionales con diferentes valores de atributos de las dos muestras, es decir, el conjunto de atributos condicionales de las dos muestras se puede distinguir cuando las dos muestras entran en conflicto, es decir, todos los atributos de condición tienen el mismo valor, pero los atributos de decisión tienen valores diferentes, entonces los valores de los elementos en sus correspondientes. las matrices de diferencias están vacías.
2.5 Calcular el peso del atributo
La importancia del subconjunto de atributos de clasificación B '?B en la derivación del conjunto de atributos c se puede medir mediante la diferencia de correlación entre los dos, es decir:
Rubidio (carbono) - rubidio - boro' (carbono)
Esto muestra cómo la clasificación de objetos de un determinado subconjunto de atributos B' se ve afectada cuando se elimina del conjunto B. dominio positivo de clasificación U/C..
Donde Rb (c) = tarjeta (POSP (q))/tarjeta (u)
es una medida de dependencia del conocimiento, donde tarjeta Representando la base del conjunto:
Innovación en tecnología de la información terrestre y desarrollo de ciencia y tecnología terrestre: Actas de la Conferencia Académica Anual de 2006 de la Sociedad China de Ciencias Terrestres.
El dominio positivo de P se llama Q. Para la clasificación de U/P, el dominio positivo de U/Q es que todo el conocimiento expresado al clasificar U/P se puede clasificar claramente en U/Q A. colección de objetos en el dominio de una clase.
2.6 Extracción minimizada de reglas de decisión basadas en reducción de valor
La extracción de reglas de decisión basada en reducción de valor se basa en la reducción de valor de la tabla de decisión.
Suponga que la tabla de decisiones tiene tres atributos de condición A, B, C y un atributo de decisión d. Al reducir los valores de los atributos de [x] a, [x] b, [x] c y [x] d, bajo el principio de minimización de reglas Calcule la regla de decisión mínima.
2.7 Razonamiento de reglas basado en la teoría de la nube
El razonamiento de incertidumbre basado en la teoría de la nube se puede dividir en razonamiento de una sola regla y de múltiples reglas según la cantidad de reglas en las que se basa cada regla. sobre el antecedente de la regla. El número se puede dividir en reglas de una sola condición y reglas de múltiples condiciones. La evaluación de la idoneidad de la tierra requiere sólo resultados de razonamiento cualitativo, por lo que el modelo se resuelve calculando la importancia de los atributos. Primero active varias reglas de una instancia y busque las gotas de nube del grado de membresía de cada regla. El valor esperado de la nube virtual es el resultado. Finalmente, los resultados cualitativos se seleccionan en función del grado máximo de membresía.
El sistema de evaluación de idoneidad de la tierra diseñado en base a la teoría anterior se muestra en la Figura 3. El menú trata sobre los métodos básicos de las teorías comúnmente utilizadas, y la serie de pasos de la derecha trata sobre los métodos de implementación para establecer modelos matemáticos. La interfaz de coordenadas en el medio se utiliza para mostrar resultados gráficos.
Figura 3 Interfaz del sistema de evaluación
3 ejemplos de aplicaciones
La ciudad de Qionghai está ubicada en la parte oriental de la provincia de Hainan. Limita con el Mar de China Meridional al este, Wenchang al norte, Tunchang al oeste y el condado de Wanning al sur. La ciudad de Qionghai tiene condiciones naturales agrícolas superiores y ricos recursos turísticos, pero existen limitaciones como una base industrial débil, recursos minerales deficientes, escasez de energía, bajo nivel científico y tecnológico y fondos insuficientes para la construcción. La tarea principal de la evaluación de la idoneidad de la tierra es realizar una evaluación de la idoneidad de toda la tierra dentro del alcance de la evaluación sobre la base de la recopilación de datos de suelo, topografía, conservación del agua, clima y otros, identificar la tierra que no es adecuada para el uso actual y proporcionar recomendaciones. para uso designado.
3.1 Recopilar datos y organizarlos
Recopile todos los datos sobre la evaluación de idoneidad de la tierra en la ciudad de Qionghai, incluidos 5 atributos de condición y 1 atributo de decisión, divididos en 9311 según el ejemplo de unidad original. La tabla 1 es parte de una tabla de decisiones de ejemplo.
Tabla 1 Ejemplo de representación de decisiones
Entre ellos, Yjz representa el contenido de materia orgánica del suelo, Hd representa el espesor del suelo, Zd representa los atributos de la condición de la textura del suelo, Sl representa los atributos de la condición de conservación del agua y S_c representa la idoneidad para la acuicultura.
3.2 Preprocesamiento de datos
Dado que no faltan los datos iniciales obtenidos en este ejemplo, no es necesario preprocesar la tabla de decisión inicial, por lo que este paso se puede omitir, por lo que el final decisión obtenida La tabla es la misma que la Tabla 1.
3.3 Discretización de datos
Para cada atributo en la tabla de decisión, realice los siguientes pasos para obtener resultados discretos.
3.3.1 Calcular la función de distribución de datos del atributo I
Calcule la función de distribución de datos gi (x) del atributo I tomando todos los valores posibles en el dominio del atributo I;Fig. 4 es un gráfico de la función de distribución de datos del atributo espesor (Hd).
Figura 4 Gráfico de distribución de datos de atributos
3.3.2 Calcular la función de distribución de datos de un único modelo de nube.
Encuentre la posición máxima de la función de distribución de datos gi (x), defina su atributo como el centro de gravedad de la nube y luego calcule el modelo de nube que se ajusta a gi (x). El cálculo de la función del modelo de nube fi (x) se muestra en la Figura 5.
Figura 5 Distribución del modelo de nube
Esta figura es la función de distribución de datos basada en la nube (línea roja continua) ajustada al encontrar la posición del segundo pico. Los parámetros del modelo de nube son:
Innovación en tecnología de la información terrestre y desarrollo de ciencia y tecnología terrestres: Actas de la Conferencia Académica Anual de 2006 de la Sociedad China de Ciencias Terrestres.
3.4 Discretización
Después de comprender la nube de conceptos a través de la inducción obtenida en el paso anterior, para cada valor de atributo que necesita discretizarse, calcule el grado de membresía de cada nube de conceptos uno por uno. uno, y tomar el valor máximo como resultado de la discretización. La tabla 2 es parte de los resultados de la discretización.
Tabla 2 Resultados discretos de atributos
3.5 Reducción de atributos
Obtenga la expresión de la función booleana y utilice el algoritmo de minimización de la función booleana para calcular el resultado de la reducción. Convierta la función booleana en una matriz de diferencias binarias, simplifique la matriz de diferencias binarias y obtenga el resultado de reducción de la tabla de decisión, como se muestra en la Tabla 3.
Tabla 3 Resultados de la simplificación de atributos
3.6 Calcular los pesos de los atributos
Según el impacto de los atributos condicionales en la clasificación de los atributos de decisión, calcule la importancia de cada condicional atribuir al grado y coeficiente del resultado de la decisión, como se muestra en la Tabla 4. (Esta medida se obtiene basándose en ejemplos del universo y no se basa en el conocimiento previo humano.
)
Tabla 4 Resultados de ponderación de atributos
3.7 Razonamiento de decisiones
Según el método de razonamiento de múltiples condiciones y reglas de la teoría de la nube, los datos originales están razonados con referencia a las reglas mínimas se obtiene el resultado final de clasificación de calificaciones, como se muestra en la Figura 6.
Figura 6 Resultados de calificación
4 Conclusión
Utilizando el modelo anterior, primero debemos recopilar tantos factores que afectan la idoneidad de la tierra como sea posible. Después de discretizar los datos continuos utilizando la teoría de la nube, los factores de evaluación se pueden seleccionar según el método para determinar la importancia de los atributos. Sobre esta base, se utiliza el método del conjunto aproximado para obtener las reglas de evaluación. Además, también se debe prestar atención a la cuestión de la idoneidad de la tierra. En la evaluación de la idoneidad de la tierra, el grado de cada uso de la tierra debe determinarse por separado, lo cual es diferente del proceso integral de toma de decisiones de fusionar varios atributos de toma de decisiones diferentes en un conjunto de atributos de toma de decisiones en el proceso de procesamiento de información general de conjuntos aproximados. .
Los resultados de la aplicación muestran que el modelo de nube absorbe las ventajas del lenguaje natural, rompe las limitaciones de los métodos existentes y puede combinar orgánicamente borrosidad y aleatoriedad para formar una combinación cualitativa y cuantitativa en la minería de datos espaciales. entre ellos, el conocimiento descubierto es confiable. La teoría de conjuntos aproximados es buena para manejar conocimientos confusos e incompletos, pero su capacidad para procesar datos difusos originales es débil. El método de conversión cualitativa y cuantitativa basado en el modelo de nube es más adecuado como preprocesamiento para conjuntos aproximados. La combinación de los dos métodos en la evaluación de la idoneidad de la tierra puede combinar las ventajas de las dos teorías y es más propicia para resolver problemas prácticos en la evaluación cualitativa.
Referencias
Zhang Wenxiu, Wu, et al. Teoría y método de conjuntos aproximados [M Beijing: Science Press, 2001].
Zeng Huanglin. Teoría aproximada de conjuntos y sus aplicaciones [M]. Chongqing: Chongqing University Press, 1998.
Ma Liang y Zhang Li. Reconocimiento de patrones difusos basado en la reducción aproximada de atributos [J]. Journal of University of Shanghai for Science and Technology, 2003, 25 (1): 50 ~ 53
Yang, Ren. Modelo de nube bidimensional y su aplicación en predicción [J]. Revista China de Ciencias de la Computación, 1998, 21(11):961 ~ 969.
Di Changkai. Minería de datos espaciales y descubrimiento de conocimientos [M]. Wuhan: Wuhan University Press, 2001.12.