Campo aleatorio condicional

Un campo aleatorio condicional (Conditional Random Field o CRF en inglés) es un modelo estocástico utilizado habitualmente para etiquetar y segmentar secuencias de datos o extraer información de documentos. En algunos contextos también se les denomina campos aleatorios de Márkov (inglés: Markov random Fields,MRF).

Dada una secuencia de datos $O 1,... O N$ este modelo asigna una etiqueta $S i$ para cada elemento $O i$ . Aunque presenta similitudes con los modelos ocultos de Márkov, estos son modelos generativos que modelan connjuntamente la distribución de probabilidad de las etiquetas (o estados) y las observaciones, $P (S, O)$ , mientras que los campos aleatorios condicionales modelan la probabilidad de la secuencia correcta de etiquetas condicionada por las observaciones, $P (S | O)$ , es decir, son modelos discriminativos.

Se puede representar con un grafo no dirigido $G = (V, E) \,$ en el que cada vértice represente una variable aleatoria cuya distribución de probabilidad debe ser deducida, y cada arista indique una dependencia entre las variables de los vértices que conecta. El grafo obedece la propiedad de Márkov extendía a grafos:

$P(S_i|O, S_j ; i \neq j) = P(S_i|O, S_j ; S_i \sim S_j)$

donde $\sim$ significa que los vértices $S i$ y $S j$ están conectados por una arista. En cuanto a los datos $O i$ , también llamados observaciones, lo más frecuente es que sean también una secuencia. Además, es frecuente que cada $O i$ sea un vector, no un valor escalar, en cuyo caso tendríamos observaciones multimensionales.

El grafo puede tener una estructura arbitrariamente compleja, aunque lo más común es que sea una cadena o un "rejilla". En una cadena, cada vértice está únicamente conectado con el vértice predecesor y con sus sucesor (se asume que los vértices están ordenados). En una rejilla, cada vértice está conectado con otros 4, excepto en los extremos; un vértice $S i j$ estará conectado con $S i, j - 1, S i, j + 1, S i - 1, j$ y $S i + 1, j$ . En el caso de la cadena la propiedad de Márkov puede reescribirse de la siguiente forma:

$P(S_i|O, S_j ; i \neq j) = P(S_i|O, S_j ; S_{i-1},S_{i+1})$

Entrenamiento y uso

Estos modelos necesitan ser entrenados con N muestras $(O^{(i)},S^{(i)})^1_N$ ; cada una contiene un conjunto de observaciones así como las etiquetas asociadas a esas observaciones. El modelo extrae un conjunto de características $f (i, S i, S i + 1)$ y $g (i, S i, O)$ que representan las dependencia existentes entre diferentes estados y entre estos y la secuencia de observaciones. Al contrario que en los modelos ocultos de Márkov en donde cada estado $S i$ depende únicamente de la observación $O i$ , aquí cada estado puede depender de varias observaciones al mismo tiempo, incluso de la secuencia completa si fuese necesario. En el entrenamiento del modelo éste asigna unos pesos a cada una de esas características, indicando su relativa importancia según el caso. Puesto que el entrenamiento puede ser muy costoso en tiempo y en espacio, lo habitual es usar algoritmos de optimización numérica, como el denominado L-BFGS. En cuanto al uso, el algoritmo de Viterbi de los modelos ocultos de Márkov puede ser adaptado con facilidad. También se puede usar el algoritmo de propagación de creencias (belief propagation en inglés).

Herramientas

Algunas implementaciones de este modelo son las siguientes:

   * MALLET, en Java
   * CRF++, en C++
   * Implementación de K.Murphy, en Matlab
   * Implementación de S.Sarawagi, en Java

Referencias

Lafferty, J., McCallum, A., Pereira, F.: Conditional random fields: Probabilistic models for segmenting and labeling sequence data. In: Proc. 18th International Conf. on Machine Learning, Morgan Kaufmann, San Francisco, CA (2001) 282–289
McCallum, A.: Efficiently inducing features of conditional random fields. In: Proc. 19th Conference on Uncertainty in Artificial Intelligence. (2003)
Sha, F., Pereira, F.: Shallow parsing with conditional random fields. Technical Report MS-CIS-02-35, University of Pennsylvania (2003)
Wallach, H.M.: Conditional random fields: An introduction. Technical Report MS-CIS-04-21, University of Pennsylvania (2004)
Sutton, C., McCallum, A.: An Introduction to Conditional Random Fields for Relational Learning. In "Introduction to Statistical Relational Learning". Edited by Lise Getoor and Ben Taskar. MIT Press. (2006)
Wang, Y., Loe, K.F., Wu, J.K.: A dynamic conditional random field model for foreground and shadow segmentation. IEEE Trans Pattern Anal Mach Intell. 28(2):279-89 (2006)

Categorías:

Wikimedia foundation. 2010.

Игры ⚽ Поможем сделать НИР

Mira otros diccionarios:

CRF — Saltar a navegación, búsqueda El término CRF puede referirise a: Campo Aleatorio Condicional, un modelo estocástico Concentración Revolucionaria Febrerista, antiguo partido político de Paraguay Obtenido de CRF Categoría: Wikipedia:Desambiguación … Wikipedia Español
Regresión logística — Saltar a navegación, búsqueda En estadística, la regresión logística es un modelo de regresión para variables dependientes o de respuesta binomialmente distribuidas. Es útil para modelar la probabilidad de un evento ocurriendo como función de… … Wikipedia Español
Generador de números pseudo-aleatorios criptográficamente seguro — Un Generador de números pseudo aleatorios criptográficamente seguro (CSPRNG, del inglés «Cryptographically Secure PseudoRandom Number Generator») es un Generador de números pseudo aleatorios (PRNG) con características que lo hacen adecuado para… … Wikipedia Español
IBM 305 RAMAC — IBM 305 en el Army Red River Arsenal de los EEUU Primer plano: Dos unidades de disco 350. Segundo plano: Consola 380 y unidad de proceso 305. El IBM 305 RAMAC fue el primer ordenador comercial que utilizaba disco duro de cabeza móvil (unidad de… … Wikipedia Español

Los diccionarios y las enciclopedias sobre el Académico

Campo aleatorio condicional

Entrenamiento y uso

Herramientas

Referencias

Mira otros diccionarios:

Compartir el artículo y extractos

Los diccionarios y las enciclopedias sobre el Académico

Wikipedia Español

Campo aleatorio condicional

Entrenamiento y uso

Herramientas

Referencias

Mira otros diccionarios:

Compartir el artículo y extractos

Link directo