Técnicas minería de datos.

¿Qué tipo de patrones puede encontrar la Minería de Datos?
Dependiendo del conjunto de datos a analizar y del tipo de patrones que se quiera encontrar en el proceso a utilizar.Las técnicas de Minería de Datos pueden ser descriptivas o predictivas. Las descriptivas caracterizan las propiedades generales de los datos en una base de datos y por el contrario, la predictiva realiza inferencias en los datos para poder realizar predicciones.

Técnicas Descriptivas.

Descripción de clases:Hay tres formas de ver este punto, la primera se denomina
Caracterización de los datos (Data Caracterizatión), el cuál realiza un resumen de las características generales de una clase particular de datos; los resultados suelen representarse en términos de reglas de caracterización. La segunda es la discriminación de datos (Data Discrimination), que es una comparación entre las características generales de los objetos de una clase respecto a las de otro conjunto contrastante. Finalmente, también se puede aplicar una combinación de ambas.

Análisis de asociación: Es el descubrimiento de reglas de asociación que muestran condiciones del tipo atributo-valor que ocurre con frecuencia dentro de un conjunto de datos.
La minería mediante reglas de asociación es el proceso de búsqueda interesante de correlaciones entre un conjunto grande de datos. El descubrimiento de reglas de asociación en grandes volúmenes de transacciones de negocios, puede facilitar el proceso de toma de decisiones.

Análisis de clusters: Aquí se analizan objetos sin consultar clases conocidas.
El proceso trabaja agrupando objetos según el principio de ”maximizar la similitud dentro de una clase y minimizar la similitud entre clases”. Un cluster es una colección de objetos de datos mutuamente similares. Clustering es el proceso de agrupamiento de objetos. El análisis de clustering,tiene una gran variedad de aplicaciones, incluyendo procesos de imágenes,análisis

Técnicas Predictivas.

Clasificación y predicción:Son dos tipos de análisis de datos, aquellos que puedenser usados para clasificar datos y los que se usan para predecir tendencias. Laclasificación de datos predice clases de etiquetas mientras la predicción de datospredice funciones de valores continuos. Aplicaciones típicas incluyen análisis deriesgo para préstamos y predicciones de crecimiento. Algunas técnicas para clasificaciónde datos incluyen: clasificación bayesianas. K-NearestNeighbor, algoritmosgen éticos, entre otros.

Arboles de decisión:Definen un conjunto de clases, asignando a cada dato de entra da una clase y determina la probabilidad de que ese registro pertenezca a la clase.
Podemos distinguir dos tipos de ´arboles, el primero es el árbol de decisión de clasificación, donde cada registro a clasificar fluye por una rama del árbol. La rama a seguir es determinada por una serie de preguntas definidas por los nodos de la rama. Cuando el registro llega a un nodo hoja, se le asigna a la clase del nodo hoja.El segundo es el árbol de decisión de regresión, cuando el registro llega a un nodo hoja, a la variable de salida de ese nodo, se le asigna el promedio de los valores de la variable de salida de los registros que cayeron en ese nodo hoja durante el proceso de entrenamiento.

Redes Neuronales:Son modelos predictivos no lineales que aprenden a través del entrenamiento. Existen diferentes tipos de redes neuronales, las más conocidas son las simples y multicapas. Las tareas básicas de las redes neuronales son reconocer,clasificar, agrupar, asociar, almacenar patrones, aproximación de funciones, sistemas(predicción, control, entre otros) y optimizan. De transacciones comerciales y reconocimiento de patrones.


Técnicas de Minería de Datos

Métodos Descriptivos
Métodos Predictivos
a. Visualización
a. Regresión Estadísticas (interpolación y predicción)
- Regresión Lineal
- Regresión no lineal
- Regresión
-Regresión Adaptativa Lineal Ponderada Localmente
b. Aprendizaje no supervisado
-Clustering
Métodos no jerárquicos (Partición)
Métodos Jerárquicos (N-TREE)
Métodos Paramétricos (Algoritmo EM)
Métodos no Paramétricos (KNN      
K-means Clustering, Centroides, 
Redes Kohonen, Algoritmo CobWeb,
Algoritmo Autoclass)

b. Aprendizaje Supervisado
-Clasificación
Arboles de Decisión, ID3,
C4.5, CART
-Inducción de Reglas
Redes Neuronales (simple, multicapa)
- Aprendizaje Relacional y Recursivo
IFP (Inductive Functional Programming),
IFLP (Inductive Functional Logic Programming),
Aprendizaje de Orden Superior,
Macro Average,Matrices de Coste y Confusión,
Análisis ROC (Receiver Operating Characteristic)
c. Asociación

d. Asociación Secuencial

e. Análisis Estadístico

f. Análisis Estadístico
-Estudio de la Distribución de los Datos
-Detección de Datos Anómalos
-Análisis de Dispersión

g. Correlaciones y Estudios Factoriales

No hay comentarios.:

Publicar un comentario