Extracción de la información

Extracción de la información

Extracción de la información

La Extracción de la información (de sus siglas en inglés IE, Information Extraction) es un tipo de recuperación de la información cuyo objetivo es extraer automáticamente información estructurada o semiestructurada desde documentos legibles por una computadora.

Una aplicación típica de IE es el escaneado de una serie de documentos escritos en una lengua natural y rellenar una base de datos con la información extraída. Las tendencias actuales en relación con la IE utilizan técnicas de procesamiento de lenguaje natural que se centran en áreas muy restringidas. Por ejemplo, la Message Understanding Conference (MUC), o Conferencia para la Comprensión de Mensajes es una competición que se ha centrado en los siguientes aspectos durante los últimos años:

  • MUC-1 1987, MUC-2 1989: Mensajes para operaciones navales.
  • MUC-3 1991: Terrorismo en países latinoamericanos.
  • MUC-5 1993: Microelectrónica.
  • MUC-6 1995: Nuevos artículos a cerca de los cambios en la gerencia.
  • MUC-7 1998: Informes de lanzamiento de satélites.

Táreas típicas de la IE

Reconocimiento de nombres de personas, organizaciones, lugares, expresiones temporales y ciertas expresiones numéricas.

Coreferencialidad: identificar distintos sintagmas nominales que se refieren al mismo objeto. La anáfora es un tipo de coreferencialidad.

Véase también

Enlaces externos

Obtenido de "Extracci%C3%B3n de la informaci%C3%B3n"

Wikimedia foundation. 2010.

Игры ⚽ Поможем решить контрольную работу

Mira otros diccionarios:

  • Extracción de la información — La Extracción de la información (IE) es un tipo de Recuperación de la información cuyo objetivo es extraer automáticamente información estructurada o semiestructurada desde documentos legibles por la máquina. Una aplicación típica de IE es el… …   Enciclopedia Universal

  • Sistema de Información Geográfica — En la imagen capas raster y vectoriales en el SIG de código libre QGIS, usado como interfaz gráfica de usuario de GRASS …   Wikipedia Español

  • Gestión de la Información — La Gestión de la Información, (GI), es un conjunto de procesos por los cuales se controla el ciclo de vida de la información, desde su obtención por creación o captura, hasta su disposición final archivada o eliminada. Los procesos también… …   Wikipedia Español

  • Reconocimiento de patrones — El reconocimiento de patrones es la ciencia que se ocupa de los procesos sobre ingeniería, computación y matemáticas relacionados con objetos físicos o abstractos, con el propósito de extraer información que permita establecer propiedades de… …   Wikipedia Español

  • General Architecture for Text Engineering — GATE ventana principal de GATE Developer v5 Desarrollador GATE research team …   Wikipedia Español

  • Plataforma G — Saltar a navegación, búsqueda G es una tecnología basada en Grid desarrollado por la compañía maat GKnowledge, que gracias a su entorno de desarrollo basado en XML, garantiza su interoperabilidad con otros sistemas de Información preexistentes y… …   Wikipedia Español

  • Procesamiento de lenguajes naturales — Saltar a navegación, búsqueda El Procesamiento de Lenguajes Naturales abreviado PLN, o NLP del idioma inglés Natural Language Processing es una subdisciplina de la Inteligencia Artificial y la rama ingenieril de la lingüística computacional. El… …   Wikipedia Español

  • Documentación — Saltar a navegación, búsqueda En sentido restringido, la documentación como ciencia documental se podría definir (a grandes rasgos) como la ciencia del procesamiento de la información. Integradora y globalizadora, se trata de una ciencia… …   Wikipedia Español

  • Lingüística computacional — La lingüística computacional es un campo multidisciplinar de la lingüística y la informática que utiliza la informática para estudiar y tratar el lenguaje humano. Para lograrlo, intenta modelar de forma lógica el lenguaje natural desde un punto… …   Wikipedia Español

  • Marca de agua digital — Observación de una imagen con la etiqueta Brian Kell 2006 , de manera degradada y visible en la parte central. El watermarking o marca de agua digital es una técnica de ocultación de información que forma parte de las conocidas como… …   Wikipedia Español

Compartir el artículo y extractos

Link directo
Do a right-click on the link above
and select “Copy Link”