¿Qué es la desensibilización de datos estáticos?
La desensibilización de datos estáticos (SDM) se utiliza generalmente en entornos que no son de producción para desensibilizar datos confidenciales del entorno de producción y luego utilizarlos en el entorno que no es de producción. Generalmente se usa para resolver el problema de que las bibliotecas de prueba y desarrollo requieren correlación de la cantidad de datos en la biblioteca de producción para la resolución de problemas o el análisis de datos, pero los datos confidenciales no se pueden almacenar en entornos que no sean de producción.
La desensibilización dinámica de datos (DDM) se utiliza generalmente en entornos de producción para desensibilizar datos confidenciales al acceder a ellos. Generalmente se utiliza para resolver el problema de que se requieren diferentes niveles de desensibilización al leer los mismos datos confidenciales según diferentes situaciones en el entorno de producción.
Datos extendidos:
Según los atributos de datos de la columna, las columnas de datos generalmente se pueden dividir en los siguientes tipos:
Columnas que pueden ubicar con precisión una persona se denominan columnas identificables, como número de identificación, dirección, nombre, etc.
Una sola columna no puede localizar a una persona, pero se pueden utilizar varias columnas de información para identificar potencialmente a una persona. Estas columnas se denominan columnas semiidentificadoras, como código postal, fecha de nacimiento y sexo. Un artículo de investigación estadounidense señaló que el 87% de los estadounidenses pueden identificarse simplemente utilizando el código postal, la fecha de nacimiento y la información de género.
Columnas que contienen información confidencial del usuario, como montos de transacciones, enfermedades e ingresos.
Otras columnas que no contienen información sensible del usuario.
El llamado evitar la fuga de datos privados significa evitar que las personas que utilizan los datos (analistas de datos, ingenieros de BI, etc.) identifiquen que una determinada fila de datos es información de alguien. Las técnicas de enmascaramiento de datos enmascaran datos, como eliminar columnas identificadas y convertir columnas semiidentificadas.
Permite a los usuarios de datos analizar los datos en la columna de semiidentificación n.° 2 (después de la conversión), la columna de información confidencial n.° 3 y otras columnas n.° 4, y garantiza, hasta cierto punto, que los usuarios no puedan ser identificados. basado en los datos, logrando así un equilibrio entre garantizar la seguridad de los datos y maximizar el valor de los datos.
Enciclopedia Baidu-Desensibilización de datos