Minería web de Estructura.

La Minería Web de Estructura
                                   Es el proceso que analiza la estructura de la información usada,
                                          que describe el contenido de la Web.

La estructura de la información de la Web puede ser clasificado como: intra-página e inter-página.

·       inter-página, puede analizarse a través de los hiperenlaces y a menudo se llama Web asociado o enlazado a estructuras. En este tipo de minería, el enlace de  estructura puede representarse como un gráfico, en el cuál los documentos son los nodos y los hiperenlaces son las aristas del gráfico.
·       intra-página refiere a las estructuras internas de los actuales tipos de documentos de la Web como HTML o XML, los cuales están usualmente representados por árboles.

Un análisis posterior a la estructura. a éste tipo de análisis también se le llama conectividad de análisis de topología de enlaces. Se pueden considerar dos tipos de descubrimiento de páginas o
topologías llamadas Hubs y Autoridades.

Una autoridad puede verse como, páginas altamente referenciadas en un tema específico, como muestra la figura 2.8.
Un Hub puede definirse como el conjunto de páginas comparables para muchas relaciones de autoridad, como muestra la siguiente figura 2.9.
Los hub y autoridades exhiben una relación mutua fuertemente reforzada, ya que un hub adquiere mayor peso cuando se acopla a una autoridad. Así mismo, la autoridad adquiere mayor peso cuando se asociado a muchos hubs. Este tipo de análisis es llamado análisis de conectividad.



Figura 2.8: Representación del concepto autoridad.














   Figura 2.9: Representación del concepto hub.










El análisis de conectividad puede usarse para descubrir temas o consultas a una comunidad específica por la computación a través de los hub y autoridades para el tema. Encontrar a las comunidades, está relacionado con el problema de segmentación de la gráfica de NP-completo. Este problema se relaciona con la complejidad computacional en las tomas de decisión para la segmentación de la conectividad de las comunidades encontradas.






No hay comentarios.:

Publicar un comentario