Modelo de datos y búsqueda de reglas

Modelo de datos

La preparación de los datos puede generar un conjunto mas pequeños de estos para mejorar la eficiencia del proceso de minería.

Dentro de esta etapa del pre procesamiento de los datos se realizan procesos de limpieza, como eliminar los datos irrelevantes , limpiar el ruido de los datos y datos inconsistentes de los archivos. Todo este proceso se realiza si se tiene un archivo en “bruto”(sacado directamente de un servidor web) o verificar si esta listo para su análisis .
Para la extracción de las reglas de asociación difusas en usuario puede determinar cuales son los ítems de las transacciones que más le interesa y asi poder encontrar reglas relacionadas solamente con esos ítems.
*( ítems :IP , host, fecha/hora , páginas visitadas , páginas referenciadas entre otras )
*( transacciones: posibles tablas transaccionales ejemplo :paginas visitadas/paginas referenciadas , Fecha/hora con paginas visitadas ,etc.)

  
Diagrama inicial para el proceso de búsqueda de reglas



La lógica difusa nos permite manejar datos ruidosos , imprecisos , vagos e incompletos .Este tipo de datos, preciosamente , es muy común en el ámbito de la web , donde un exceso de información y la falta de estructura en los datos dificulta generalmente su manejo .La aplicación de lógica difusa en la minería nos permite , además , mejorar la comprensión de los patrones obtenidos.


No hay comentarios.:

Publicar un comentario