KDD y minería.


Es importante discutir sobre la diferencia entre KDD y Minería de Datos, ya que muchos estudios e investigaciones dan por hecho que ambos son sinónimos. Hay muchos casos que no es posible identificar o distinguir claramente la etapa de Minería de Datos dentro del Proceso de Descubrimiento, porque a veces no es necesario realizar todas y cada una de las etapas del mismo, como pre procesamiento, limpieza de datos, etc.

Entonces, la Minería de Datos la podemos definir como una etapa particular en el proceso KDD, donde la Minería de Datos aplica algoritmos específicos o técnicas específicas para la extracción de patrones de los datos, diferenciándolo del proceso KDD que ya antes a sido definido.
Si nos detenemos a pensar cuales serían las diferencias entre estos procesos, deberíamos empezar diciendo que las fuentes de información sobre las que trabajan son diferentes. La Minería de Datos principalmente trabaja sobre grandes almacenes de datos y Bases de datos relacionales, por ejemplo; en cambio la Minería de Texto se centra en documentos y la Minería Web en todo lo que se relaciona con la World Wide Web. El tipo de información que procesan es muy distinta. La información que procesa la Minería de Datos es información estructurada, ya que los datos están almacenados en una base de datos generalmente relacional; sin embargo, la Minería de Texto, trata con complejas estructurasimplícitas del texto, generalmente no estructuradas y por último, la Minería Web procesa tanto información estructurada (procesa información de bases de datos que están relacionadas con las páginas Web), semi estructurada (páginas HTML con texto y Hiperenlaces) y no estructurada (texto libre). Un aspecto a mencionar, es que en la literatura se mencione, a la Minería de Texto como KDT o a la Minería Web como KDW, para hablar sobre el proceso de descubrimiento en esas áreas, que es el mismo caso que ya hemos mencionado sobre el KDD y Minería de Datos.

No hay comentarios.:

Publicar un comentario