Es importante discutir sobre la
diferencia entre KDD y Minería de Datos, ya que muchos estudios e investigaciones
dan por hecho que ambos son sinónimos. Hay muchos casos que no es posible
identificar o distinguir claramente la etapa de Minería de Datos dentro del
Proceso de Descubrimiento, porque a veces no es necesario realizar todas y cada
una de las etapas del mismo, como pre procesamiento, limpieza de datos, etc.
Entonces, la Minería de Datos la
podemos definir como una etapa particular en el proceso KDD, donde la
Minería de Datos aplica algoritmos específicos o técnicas específicas para la
extracción de patrones de los datos, diferenciándolo del proceso KDD que ya
antes a sido definido.
Si nos detenemos a pensar cuales
serían las diferencias entre estos procesos, deberíamos empezar diciendo que
las fuentes de información sobre las que trabajan son diferentes. La Minería de Datos
principalmente trabaja sobre grandes almacenes de datos y Bases de datos relacionales,
por ejemplo; en cambio la Minería de Texto se centra en documentos y la Minería Web en
todo lo que se relaciona con la World Wide Web. El tipo de información que procesan
es muy distinta. La información que procesa la Minería de Datos es información
estructurada, ya que los datos están almacenados en una base de datos generalmente relacional;
sin embargo, la Minería de Texto, trata con complejas estructurasimplícitas del texto,
generalmente no estructuradas y por último, la Minería Web procesa tanto información
estructurada (procesa información de bases de datos que están relacionadas con las páginas
Web), semi estructurada (páginas HTML con texto y Hiperenlaces) y no estructurada
(texto libre). Un aspecto a mencionar, es que en la literatura se mencione, a la Minería de
Texto como KDT o a la Minería Web como KDW, para hablar sobre el proceso de
descubrimiento en esas áreas, que es el mismo caso que ya hemos mencionado
sobre el KDD y Minería de Datos.
No hay comentarios.:
Publicar un comentario