La Minería de Datos es la etapa más importante del KDD; es la que integra los procesos
de aprendizaje y métodos
estadísticos para la obtención de hipótesis de patrones y modelos.
Podríamos decir que Minería de datos es el proceso de extracción de información o conocimiento de un conjunto grande de datos. Formalizando un poco más, lo podemos definir como una etapa particular en el proceso KDD, donde la Minería de Datos aplica algoritmos específicos o técnicas específicas para la extracción de patrones de los datos.
Tenemos que tener claro que el
proceso de minería de datos genera muchos tipos de patrones, pero lo más
importante es determinar qué patrones son útiles e interesantes y cuales no. Un
patrón es interesante si cumple con ciertas condiciones, si es fácil comprender lo;
es válido con cierto grado de certeza, para otro conjunto de datos, ya sea
nuevo o de prueba.
Es importante destacar que la
Minería de Datos, en forma muy general, puede procesar
distintos tipos de datos, de
diferentes fuentes como archivos planos (texto, binario,. .. ),
base de datos relacionales, base
de datos heterogéneas, base de datos orientadas a objetos,
datawarehouse, base de datos
transaccionales, base de datos espaciales, base de datos
multimedia y base de datos
temporales, entre otras.
No hay comentarios.:
Publicar un comentario