Algoritmo de agrupamiento


Algoritmo de agrupamiento

Un algoritmo de agrupamiento (en inglés, clustering) es un procedimiento de agrupación de una serie de vectores de acuerdo con un criterio de cercanía. Esta cercanía se define en términos de una determinada función de distancia, como la euclídea, aunque existen otras más robustas o que permiten extenderla a variables discretas.

Generalmente, los vectores de un mismo grupo (o clústers) comparten propiedades comunes. El conocimiento de los grupos puede permitir una descripción sintética de un conjunto de datos multidimensional complejo. De ahí su uso en minería de datos. Esta descripción sintética se consigue sustituyendo la descripción de todos los elementos de un grupo por la de un representante característico del mismo.

En algunos contextos, como el de la minería de datos, se lo considera una técnica de aprendizaje no supervisado puesto que busca encontrar relaciones entre variables descriptivas pero no la que guardan con respecto a una variable objetivo.

Contenido

Aplicaciones

Las técnicas de agrupamiento encuentran aplicación en diversos ámbitos.

  • En teoría de la señal pueden servir para eliminar ruidos.

Algoritmos

Existen diversas técnicas de agrupamiento. Se dividen en dos grandes categorías:

  • Jerárquicas, que construyen una jerarquía de grupos escindiéndolos iterativamente.
  • De particionamiento, en los que el número de grupos se determina de antemano y las observaciones se van asignando a los grupos en función de su cercanía.

Existen diversas implementaciones de algoritmos concretos. Por ejemplo, el de las k-medias, de particionamiento. Es uno de los más antiguos pero uso extendido a pesar de sus carencias y falta de robustez.

El paquete cluster de R-lenguaje [1] implementa una serie de algoritmos de particionamiento como agnes, mona y diana, jerárquicos, y pam, clara y fanny, de particionamiento.

Referencias

  1. Rousseeuw, P.J.; Kaufman, L. (1990). Finding Groups in Data: An Introduction to Cluster Analysis. Wiley. 

Enlaces externos


Wikimedia foundation. 2010.

Mira otros diccionarios:

  • Algoritmo esperanza-maximización — El algoritmo esperanza maximización o algoritmo EM se usa en estadística para encontrar estimadores de máxima verosimilitud de parámetros en modelos probabilísticos que dependen de variables no observables. El algoritmo EM alterna pasos de… …   Wikipedia Español

  • Algoritmo de eliminación de variables — El algoritmo de eliminación de variables es un algoritmo de adquisición de conocimiento probabilístico a partir de una red bayesiana. Dada una red bayesiana y una serie de valores observados para ciertas variables, denominadas de evidencia, se… …   Wikipedia Español

  • Coeficiente de agrupamiento — Ejemplo de coeficiente de agrupamiento en un [[[grafo no dirigido]] en el que se considera el nodo sombreado on an undirected graph for the shaded node i. Los segmentos de líneas negras son enlaces que conectan vecinos de i, y los segmentos… …   Wikipedia Español

  • Segmentación (procesamiento de imágenes) — La segmentación en el campo de la visión artificial es el proceso de dividir una imagen digital en varias partes (grupos de píxeles) u objetos. El objetivo de la segmentación es simplificar y/o cambiar la representación de una imagen en otra más… …   Wikipedia Español

  • Check Wikipedia — Wikiproyecto:Check Wikipedia Saltar a navegación, búsqueda Esta página contiene de forma consciente fallos ortográficos. Los bots no deben intentar corregirlos. Atajo PR:CWPR:CW …   Wikipedia Español

  • JHepWork — Ejemplo de histograma jHepWork y función Desarrollador principalmente, el Dr. S. Chekanov http://jwork.org/jhepwork Información general …   Wikipedia Español

  • Anexo:Episodios de Numb3rs — La siguiente es una lista de episodios de la serie norteamericana NUMB3RS. Contenido 1 Estrenos y Lanzamientos en DVD 2 Primera temporada (2005) 3 Segunda temporada (2005 2006) …   Wikipedia Español

  • Episodios de Numb3rs — Anexo:Episodios de Numb3rs Saltar a navegación, búsqueda La siguiente es una lista de episodios de la serie norteamericana NUMB3RS. Contenido 1 Estrenos y Lanzamientos en DVD 2 Primera temporada (2005) 3 Segunda temporada ( …   Wikipedia Español

  • Agrupación — Agrupación, agrupamiento agrupado y agrupar puede referirse a: Grupo Colectivo (grupo social) Unidad militar Algoritmo de agrupamiento Coeficiente de agrupamiento Colegio Rural Agrupado Junco agrupado Esta …   Wikipedia Español

  • Aprendizaje no supervisado — Saltar a navegación, búsqueda Aprendizaje no supervisado es un método de Aprendizaje Automático donde un modelo es ajustado a las observaciones. Se distingue del Aprendizaje supervisado por el hecho de que no hay un conocimiento a priori. En el… …   Wikipedia Español