¿Qué significan los algoritmos HITS, TrustRunk, PageRunk y HillTop? ¿Qué orientación tiene para SEO?
Algoritmo HITS
El algoritmo HITS fue propuesto por primera vez por el Dr. Jon Kleinberg de la Universidad de Cornell en 1997 y fue desarrollado por el Centro de Investigación IBM Almaden como parte de un proyecto de investigación llamado. INTELIGENTE. Algoritmo TrustRank
El algoritmo TrustRank surgió originalmente de una investigación conjunta entre la Universidad de Stanford y Yahoo en 2004. Se utilizó para detectar sitios web de spam y solicitó una patente en 2006. El inventor del algoritmo TrustRank también publicó un documento PDF especial que explica la aplicación del algoritmo TrustRank. Los lectores interesados pueden descargar el archivo PDF en la siguiente URL:
El algoritmo TrustRank no fue propuesto por Google, pero dado que Google tiene la mayor participación de mercado, TrustRank también es un factor muy importante en las clasificaciones de Google. Algunas personas creen erróneamente que TrustRank fue propuesto por Google. Lo que es aún más confuso es que Google alguna vez solicitó TrustRank como marca comercial, pero el TrustRank en la marca comercial TrustRank se refiere al método de Google para detectar sitios web que contienen código malicioso, no al índice de confianza en el algoritmo de clasificación.
Basándonos en esta suposición, si puede seleccionar sitios web que sean 100% confiables, estos sitios web tendrán el TrustRank más alto. El índice de confianza de los sitios web conectados a estos sitios web con el rango de confianza más alto será ligeramente menor. pero también será muy alto. De manera similar, el nivel de confianza de los sitios web de tercer nivel vinculados a sitios web en los que los sitios web de segundo nivel no confían sigue disminuyendo. Por varias razones, los buenos sitios web inevitablemente recibirán algunos sitios web no deseados. Sin embargo, cuanto más cerca esté la distancia de clics al sitio web de primer nivel, mayor será el índice de confianza. , el índice de confianza descenderá a su vez. De esta forma, el algoritmo Trustrank puede calcular el índice de confianza correspondiente para todos los sitios web. Cuanto más lejos del sitio web de primer nivel, mayor será la posibilidad de convertirse en un sitio web spam. PageRank
PageRank, o ranking de páginas web, es un algoritmo utilizado por Google para identificar el ranking o la importancia de las páginas web.
Los primeros motores de búsqueda utilizaban el método de clasificación, es decir, clasificar manualmente las páginas web y clasificar los sitios web de alta calidad.
Con el rápido aumento en el número de páginas web, este método obviamente no se puede implementar. Como resultado, los motores de búsqueda han entrado en la era de la recuperación de texto, que devuelve resultados de búsqueda calculando la correlación entre la consulta del usuario y el contenido de la página web. Por ejemplo, los archivos y términos de búsqueda de entrada se convierten en vectores mediante el modelo de espacio vectorial y la correlación se mide calculando la desviación del ángulo entre los dos vectores (generalmente usando la distancia del coseno). Aunque este método puede manejar una gran cantidad de páginas web, el efecto no es muy bueno. Por ejemplo, existen algunos comportamientos de trampa: algunas páginas web cambian repetidamente ciertas palabras clave para mejorar su clasificación de búsqueda.
Así, los dos fundadores de Google, Larry Page y Sergey Brin, que eran estudiantes de posgrado en la Universidad de Stanford en Estados Unidos, comenzaron a estudiar el problema del ranking de páginas web. Propusieron el algoritmo PageRank inspirado en el método de evaluación de la importancia de los artículos académicos por parte de la comunidad académica (el número de citas del artículo).
La idea central de PageRank es en realidad muy simple y se puede resumir de la siguiente manera:
Si una página web está vinculada a muchas otras páginas web, significa que la página web está muy importante y su valor de PageRank será correspondientemente mayor;
Si una página web con un valor de PageRank alto enlaza con otra página web, el valor de PageRank de esa página web también aumentará en consecuencia.
Algoritmo HillTop
HillTop es una patente para clasificar los resultados de los motores de búsqueda. Fue obtenida por Bharat, un ingeniero de Google, en 2001. Las reglas de clasificación de Google cambian con frecuencia, pero el mayor cambio es la optimización basada en el algoritmo HillTop.