Clasificadores (matemático)


Clasificadores (matemático)

Un clasificador es un elemento que proporciona una clase etiquetada como salida a partir de un conjunto de características tomadas como entradas. Una manera de construir un clasificador es coger un conjunto de ejemplos etiquetados y tratar de definir una regla que pueda asignar una etiqueta a cualquier otro dato de entrada.

Contenido

Introducción

Actualmente, debido a los avances tecnológicos y la necesidad de vivir rodeados de la mayor información posible, el número de archivos digitales de contenido multimedia está creciendo muy rápidamente. Esto hace necesaria la búsqueda de métodos eficientes capaces de recuperar con rapidez la información audiovisual de interés.

Aprendizaje y Minería de datos

Tanto la Minería de datos como el Aprendizaje automático son técnicas relacionadas con el tratamiento de grandes cantidades de datos.

La técnica de Minería de datos, intenta obtener patrones o modelos a partir de los datos recopilados.

El Aprendizaje automático es la parte básica que tienen en común los diferentes tipos de clasificadores que existen. La idea básica del aprendizaje consiste en utilizar las percepciones no sólo para actuar, sino también para mejorar la habilidad de un agente para actuar en el futuro.

Existen diferentes tipos de técnicas de aprendizaje:

Aprendizaje supervisado

El aprendizaje supervisado consiste en aprender una función, a partir de ejemplos etiquetados anteriormente, que establezca una correspondencia entre las entradas y las salidas deseadas del sistema. No siempre es posible hacer este tipo de entrenamiento ya que tenemos que disponer de la salida esperada en la función de entrada. El sistema de aprendizaje trata de etiquetar (clasificación) una serie de vectores utilizando una entre varias categorías (clases).

Aprendizaje no supervisado

El aprendizaje no supervisado consiste en aprender a partir de patrones de entradas para los que no se especifiquen los valores de sus salidas. El principal problema de esta técnica es la toma de decisiones a la hora de escoger un patrón entre todos los proporcionados. El sistema trata los objetos de entrada como un conjunto de variables aleatorias, construyendo un modelo de densidad para el conjunto de datos.

Aprendizaje semi-supervisado

Actualmente existen técnicas que combinan las dos anteriores, ya que en algunos casos puede resultar muy costoso asignar etiquetas o clases a todos los datos. La finalidad es combinar datos etiquetados y no etiquetados para mejorar la construcción de modelos. Aunque no siempre es útil y existen varios métodos para llevarlo a cabo.

Aprendizaje por refuerzo

El aprendizaje por refuerzo consiste en aprender observando el mundo que te rodea.

La idea del aprendizaje consiste en construir una función que tenga el comportamiento observado en sus datos de entrada y de salida. Los métodos de aprendizaje se pueden entender como la búsqueda de un espacio de hipótesis para encontrar la función adecuada.

Tipos de clasificadores

Existen diferentes tipos de clasificadores:

Clasificador Bayesiano

Un Clasificador bayesiano es un clasificador de patrones basado en teorías estadísticas de aprendizaje. El aprendizaje bayesiano calcula la probabilidad de cada hipótesis de los datos y realiza predicciones sobre estas bases. Es un aprendizaje casi óptimo, pero requiere grandes cantidades de cálculo debido a que el espacio de hipótesis es normalmente muy grande, o incluso puede ser infinito.

Clasificador Parzen

Se trata de un clasificador basado en la estimación no paramétrica, que a diferencia de la paramétrica, donde se obtiene la función de densidad de probabilidad estimando los parámetros desconocidos de un modelo conocido, no se conoce el modelo. Esta técnica consiste básicamente en variaciones de la aproximación del histograma de una función de densidad de probabilidad desconocida. Este algoritmo se utiliza en la la clasificación de imágenes o para clasificar y aprender simultáneamente. El problema de este clasificador es que tiene un tiempo de ejecución elevado.

Clasificador Backpropagation

En algunos problemas el uso de modelos simples de densidad paramétrica o el uso de modelos de histogramas no dan los resultados deseados. En estos casos se buscan modelos de densidad más sofisticados. Las redes neuronales son una técnica de aproximación paramétrica útil para construir modelos de densidad. El modelo de red neuronal habitual que utiliza este algoritmo consiste en una red con una capa de entrada con tantos nodos como entradas tengan, una capa oculta con un número de nodos variable que dependerá de las características del problema, y una capa de salida con tantos nodos como posibles salidas tenga.

Clasificador con PCA

En este clasificador se utiliza el método PCA (Principal Component Analysis), es una técnica que busca reducir el número de variables, transformando el conjunto original de variables correlacionadas, que tienen información en común, en un conjunto de variables no relacionadas, que no tienen repetición o redundancia entre ellas, llamado conjunto de componentes principales. Las nuevas variables son combinaciones lineales de las anteriores.

Máquinas de vectores de soporte (Support vector machine)

Las Máquinas de vectores de soporte (SVM) son unas técnicas sencillas y de gran aplicación cuando se pretende construir un clasificador utilizando ejemplos. A diferencia de las redes neuronales que intentan construir un modelo a posteriori, las SVM’s tratan de obtener la frontera de decisión. Una de sus ventajas es su facilidad ya que únicamente hay que codificar la geometría de la frontera.

Aplicaciones

Las aplicaciones de los clasificadores son muy amplios. Su uso se extiende en medicina (análisis de prueba de drogas, análisis de datos de resonancia magnética), teléfonos móviles (decodificación de la señal, corrección de errores), la visión por computador (reconocimiento facial, seguimiento de objetivos), reconocimiento de voz, minería de datos (análisis de compras en supermercados, análisis de clientes al por menor) entre otras áreas diferentes.

Un ejemplo es un clasificador que acepta datos de sueldos de una persona, edad, estado civil, dirección e historial de crédito y clasifica a la persona como aceptables o inaceptables para recibir una nueva tarjeta de crédito o préstamo.

Véase también


Wikimedia foundation. 2010.

Mira otros diccionarios:

  • Curva ROC — Saltar a navegación, búsqueda Contenido 1 Curva ROC (Receiver Operating Characteristic) 2 Conceptos Básicos 3 El espacio ROC 4 …   Wikipedia Español