Corpus lingüístico

Corpus lingüístico

Un Corpus lingüístico es un conjunto, normalmente muy amplio, de ejemplos reales de uso de una lengua. Estos ejemplos pueden ser textos (típicamente), o muestras orales (normalmente transcritas).

Se llama lingüística de corpus a la subdisciplina de la lingüística que estudia la lengua a través de estas muestras. Este tipo de aproximación choca con el enfoque chomskiano que tiende a estudiar la lengua a través de la intuición lingüística del hablante.

Esta subdisciplina, dado el volumen de datos que se maneja, normalmente se asocia con la lingüística computacional, según esta última se acerca a las aplicaciones de Procesamiento de lenguaje natural.

Esta disciplina se inició en 1967 cuando Henry Kucera y Nelson Francis publicaron el clásico Computational Analysis of Present-Day American English, basándose en el corpus Brown, una compilación de inglés estadounidense de aproximadamente un millón de palabras seleccionadas de una amplia variedad de fuentes.

Véase también


Wikimedia foundation. 2010.

Игры ⚽ Нужно сделать НИР?

Mira otros diccionarios:

  • Corpus lingüístico — Un Corpus lingüístico es un conjunto, normalmente muy amplio, de ejemplos reales de uso de una lengua. Estos ejemplos pueden ser textos (típicamente), o muestras orales (normalmente transcritas). Se llama lingüística de corpus a la subdisciplina… …   Enciclopedia Universal

  • Corpus paralelo — Saltar a navegación, búsqueda El corpus paralelo es un recurso lingüístico consistente en textos de dos lenguas (en algún formato electrónico adecuado) que están alineados a cierto nivel de granularidad; generalmente a nivel de párrafo, aunque… …   Wikipedia Español

  • Corpus — Saltar a navegación, búsqueda El término Corpus puede referirse a: Corpus lingüístico, conjunto de ejemplos reales de uso de una lengua; Corpus, abreviación de la fiesta del Corpus Christi; Corpus, municipio del departamento de San Ignacio… …   Wikipedia Español

  • Corpus — (Voz latina.) ► sustantivo masculino 1 culto Conjunto extenso de datos, textos, frases, etc., que pueden servir de base a una investigación: ■ analizó el corpus con mucho detenimiento. IRREG. plural corpus 2 LINGÜÍSTICA Conjunto finito de… …   Enciclopedia Universal

  • Memoria de traducción — Las memorias de traducción son almacenes compuestos de textos originales en una lengua alineados con su traducción en otra(s). Esta definición de memorias de traducción coincide literalmente con una de las definiciones más aceptadas de corpus… …   Wikipedia Español

  • Traducción automática — Se ha sugerido que Servicios de traducción automática sea fusionado en este artículo o sección (discusión). Una vez que hayas realizado la fusión de artículos, pide la fusión de historiales aquí. La traducción automática (TA), también llamada MT… …   Wikipedia Español

  • Lingüística computacional — La lingüística computacional es un campo multidisciplinar de la lingüística y la informática que utiliza la informática para estudiar y tratar el lenguaje humano. Para lograrlo, intenta modelar de forma lógica el lenguaje natural desde un punto… …   Wikipedia Español

  • Idioma asturiano — «Asturiano» redirige aquí. Para la localidad zamorana, véase Asturianos. Asturiano Asturianu Hablado en  España Región …   Wikipedia Español

  • Criollo palenquero — Hablado en  Colombia Región Palenque de San Basilio Hablantes • Nativos: • Otros …   Wikipedia Español

  • Árbol binario de búsqueda — Un árbol binario de búsqueda es un tipo particular de árbol binario que presenta una estructura de datos en forma de árbol usada en informática. Contenido 1 Descripción 2 Operaciones 2.1 Búsqueda …   Wikipedia Español

Compartir el artículo y extractos

Link directo
Do a right-click on the link above
and select “Copy Link”