- Algoritmo HITS
-
El algoritmo HITS (acrónimo del inglés Hypertext Induced Topic Selection) es un algoritmo diseñado por Jon Kleinberg para valorar, y de paso clasificar, la importancia de una página web.
HITS usa dos indicadores para hacer esta valoración, definiendo recursivamente cada uno a partir del otro:
- el authority, que valora cuán buena es la página como recurso de información; para su cálculo se usa una suma ponderada de valores hub de los enlaces que apuntan hacia esta página.
- el hub, que dice cuán buena es la información que se consigue siguiendo los enlaces que tiene a otras páginas; se calcula como una suma ponderada de valores authority de las páginas a las que apunta ésta. Algunas implementaciones del algoritmo también consideran cuánta es la relevancia de las páginas enlazadas.
Pseudocódigo1 S := semilla de páginas inicial 2 para cada página p en S haga 3 p.aut = 1 // p.aut es el puntaje de autoridad de la página p 4 p.hub = 1 // p.hub es el puntaje de hub de la página p 5 función HubsYAutoridades(S) 6 para iteración 1 a k haga// ejecuta el algoritmo k veces 7 para cada página p en S haga // actualiza todos los valores de autoridad primero 8 para cada página q en p.vecinosQueLlegan haga// p.vecinosQueLlegan es el grupo de páginas que están vinculadas a p 9 p.aut += q.hub 10 para cada página p en S haga // ahora se actualizan los valores de hub 11 para cada página r en p.vecinosQueSalen haga // p.vecinosQueSalen es el grupo de páginas que están vinculadas desde p 12 p.hub += r.aut
(fuente: Wikipedia inglés)
Este procedimiento se repite cierto número de veces recalculando S para obtener un S' a partir de los vínculos de salida de S
Véase también
Enlaces externos
- Algoritmo HITS (en inglés)
Categoría:- Algoritmos
Wikimedia foundation. 2010.