La Red de Conocimientos Pedagógicos - Conocimientos matemáticos - Algoritmo HITS del algoritmo gráfico

Algoritmo HITS del algoritmo gráfico

El nombre completo del algoritmo HITS es "Búsqueda de temas inducida por hipervínculos". Este algoritmo fue propuesto por Jon Kleinberg en 1999. Al igual que el algoritmo PageRank, también es un algoritmo para clasificar páginas web. A diferencia del PageRank, HITS divide las páginas web en dos categorías, a saber: páginas centrales y páginas de autoridad. La página Hub es similar a un sitio web de portal común, como la página de inicio de hao123, que proporciona una gran cantidad de enlaces web de alta calidad, mientras que la página de Autoridad se parece más a un sitio web que los usuarios desean visitar, como cuando realizan búsquedas, esperamos; para usar Baidu, comprar En ese momento, esperamos ingresar a Taobao y JD.com. La página Hub actúa como un centro intermedio. Para los usuarios, prestan más atención a las páginas web con alta autoridad. La siguiente es una introducción al principio y al proceso de solución del algoritmo HITS.

? HITS adopta el principio de refuerzo mutuo y se basa en los dos supuestos siguientes:

Estos dos supuestos también son muy fáciles de entender, utilizando los dos supuestos básicos anteriores y el Principios de la relación de refuerzo mutuo Se realizan varias rondas de cálculos iterativos, y cada ronda de cálculos iterativos actualiza los dos pesos de cada página hasta que los pesos son estables y ya no cambian significativamente. Las fórmulas de cálculo para el valor de Autoridad y el valor de Hub de cada página web son las siguientes:

El proceso específico del algoritmo se puede dividir aproximadamente en los siguientes cinco pasos:

Bueno, El principio del algoritmo HITS es en realidad Esto es muy fácil de entender.

En la sección del principio del algoritmo, introdujimos cómo el algoritmo HITS genera el conjunto inicial Gσ. Desde el conjunto raíz Rσ lo ampliamos agregando páginas web a través de enlaces, pero esto también es probable que agregue páginas web que no estén relacionadas con el tema de búsqueda. Si estas páginas web tienen algunas páginas de autoridad de alta calidad, es probable que sean devueltas al usuario y reduzcan su experiencia de búsqueda.

Imagínese que creamos una página que apunta a muchas páginas de autoridad de alta calidad y luego esta página se convierte en una página central de alta calidad. Luego cree un enlace que apunte a su propia página web. Según el algoritmo HITS, el valor de autoridad de su propia página web mejorará enormemente.

Para una colección de páginas web, si se elimina un enlace, el valor central y el valor de autoridad de algunas páginas web pueden cambiar drásticamente.

Referencia:

Algoritmo PageRank y algoritmo HITS