Caja de herramientas del sistema de recomendación de razonamiento causal-CFF (1)
Con el objetivo de abordar los problemas de las revisiones escasas y desequilibradas en los sistemas de recomendación basados en revisiones existentes, se proponen recomendaciones basadas en características contrafactuales Las muestras se utilizan en escenarios para mejorar el rendimiento del modelo. El autor genera muestras contrafactuales interviniendo en las preferencias del usuario (reflejadas en algunos de los comentarios del usuario) y utiliza muestras de observación y muestras contrafactuales para entrenar conjuntamente el modelo de recomendación y mejorar el rendimiento del modelo. Al generar muestras contrafactuales, utilice métodos basados en el aprendizaje en lugar de generación aleatoria para generar muestras contrafactuales que mejoren mejor el rendimiento del modelo. Además, el autor también realizó un análisis teórico y discutió la relación entre el número de muestras generadas y la interferencia de ruido del modelo.
Los métodos existentes basados en comentarios se pueden dividir en dos categorías, como se muestra en la Figura A a continuación.
Sin embargo, ninguno de los métodos anteriores aborda el problema esencial de las recomendaciones de revisión, es decir, la escasez y el desequilibrio de los datos. La información de revisión puede mejorar en gran medida el rendimiento de los sistemas de recomendación, pero su escasez y desequilibrio plantean grandes desafíos para las recomendaciones precisas y eficientes. Se requiere un gran esfuerzo para lograr un rendimiento satisfactorio del modelo. Los resultados estadísticos del conjunto de datos de Amazon muestran que hay muy pocos usuarios que comentan con frecuencia y que se mencionan muy pocos elementos y aspectos.
Por lo tanto, el autor se basa en la idea de contrafactuales y genera muestras contrafactuales ajustando mínimamente las preferencias del usuario para cambiar los resultados de clasificación de las preferencias del usuario.
El autor utiliza la pérdida BPR [19] para aprender en pares. La función de pérdida específica se muestra en la siguiente figura. La muestra de entrenamiento es la función sigmoidea, el modelo recomendado (este debería ser el modelo de clasificación), y el segundo término en su conjunto representa el término regular. Indica la puntuación de preferencia del usuario para el artículo.
Como se mencionó anteriormente, las opiniones de los usuarios son escasas. Al mismo tiempo, la atención de los usuarios a las diferentes características (aspectos) de los productos afecta sus preferencias. Por ejemplo, en la imagen siguiente, los usuarios elegirán "IPhone" si les preocupa la marca y "Xiaomi" si les preocupa más el precio. Por lo tanto, se pueden obtener contrafactuales interfiriendo con la atención de las características del usuario, y se pueden obtener etiquetas para muestras contrafactuales prediciendo las muestras utilizando un modelo de recomendación (existente, posiblemente previamente entrenado).
El método Naive consiste en utilizar las funciones de atención del usuario en lugar de muestras aleatorias, pero debido a la diferente importancia de las muestras y las funciones, este método es obviamente subóptimo [12]. El autor utiliza un método basado en el aprendizaje para aprender a generar muestras contrafactuales (esta debería ser la operación básica de la generación de muestras contrafactuales ahora). Basándose en [1, 12], el autor aprende cómo cambiar los resultados de la toma de decisiones del modelo cambiando la atención del usuario a las características (las características representan las preferencias del usuario) y genera muestras contrafactuales. De hecho, el límite de decisión del modelo es. Se utiliza para reflejar la estructura o patrón subyacente de los datos. El diagrama esquemático se muestra en la subfigura B de la figura anterior.
Específicamente, el autor introduce la perturbación, y cada elemento del vector de perturbación actúa sobre cada característica del artículo (también puede ser una representación vectorial latente de la característica). que representa el conjunto de todas las características. Luego use la fórmula que se muestra en la siguiente figura para encontrar la perturbación óptima.
Entre ellos, la fórmula de cálculo se muestra en la siguiente figura, que representa la matriz de características de usuarios y elementos respectivamente, es decir, el grado de atención de cada usuario a esta característica y la calidad de cada elemento en esta característica.
Vale la pena señalar que en el proceso de optimización del aprendizaje, el objetivo del primer término en la función de pérdida con parámetros fijos es encontrar la perturbación mínima, y el objetivo del segundo término es cambiar la Clasificación de preferencia del modelo de los dos elementos.
Esta sección explica los antecedentes de investigación del autor, el modelo básico y las ideas para generar muestras contrafactuales. La siguiente sección continúa presentando los detalles de control y el análisis teórico de la generación contrafactual.
El autor de este artículo también es un gran jefe en la Universidad de Rutgers, por lo que la rutina es muy similar a la caja de herramientas del sistema de recomendación de razonamiento causal - CCF (1) y la caja de herramientas del sistema de recomendación de razonamiento causal - DCCF (1 ). Ambos utilizan primero muestras contrafactuales para mejorar el modelo. El método de generación es principalmente un método basado en el aprendizaje. El objetivo es generar las llamadas "muestras duras" para maximizar el rendimiento del modelo. Finalmente, se analiza la relación entre la tasa de error del modelo y el número de muestras y ruido.
Al mismo tiempo, el proceso de generación de contrafactuales consiste en utilizar un modelo de recomendación débil previamente entrenado para juzgar las etiquetas de las muestras contrafactuales y luego obtener un mayor rendimiento en el modelo de entrenamiento (o se siente un un poco como bootstrap).
[1] Ehsan Abbasnejad, Damien Teney, Amin Parvaneh, Javen Shi y Anton van den
Henger. 2020. Visión contrafactual y aprendizaje de idiomas. Actas de la Conferencia IEEE/CVF sobre visión por computadora y reconocimiento de patrones. 10044–10054.
[4] Rose Catalina y William Cohen. 2017.TransNets: aprendizaje en recomendaciones. Preimpresión de arXiv arXiv:1704.02298(2017).
[7], Yin Hongzhi, Ye, Wang Meng 2020. Pruebe esto: Recomendación de sustitutos personalizada y explicable (2020).
[12] Yash Goyal, Ziyan Wu,. Jan Ernst, Dhruv Batra, Devi Parikh y Stefan Lee. 2019. Explicaciones visuales de contrafactuales. Preimpresión de arXiv arXiv:1904.07451 (2019).
Steffen Rendle, Christoph Freudenthaler, Zeno Gantner y Lars Schmidt-Thieme. 2009.BPR: Ranking personalizado bayesiano basado en retroalimentación implícita. "Actas de la 25ª Conferencia sobre la incertidumbre en la inteligencia artificial". Prensa AUAI, 452–461.