Lexicón


Lexicón

El lexicón es el "diccionario mentalmente hablado en el mundo lexico de los llamados lexihablantes" en el que se registran las palabras que conoce un hablante. Este "diccionario" especifica los rasgos característicos de las piezas léxicas (palabras y morfemas), como irregularidades morfológicas, requerimientos sobre alomorfos, información pragmática, etc.

Algunos modelos gramaticales formales basan la generación de oraciones en el procesamiento de los rasgos de las unidades del lexicón. En estos modelos, el lexicón no es parte de la gramática, sino que proyecta sus rasgos a través de mecanismos inherentes a las gramáticas.

Clases de unidades léxicas

Según su naturaleza, las unidades del lexicón pueden distinguirse entre:

  • Categorías léxicas o abiertas: Son aquellas que poseen carácter referencial (es decir, las que designan procesos, propiedades, acciones o entidades). Se caracterizan por formar un inventario abierto (es decir que no existe un número específico y limitado para estas unidades). Los sustantivos, los verbos y los adjetivos son representantes canónicos de este tipo de unidades léxicas.
  • Categorías funcionales o cerradas: Son aquellas que sólo poseen significado gramatical (es decir, que son fundamentales para la generación de una oración pero que, sin embargo, no tienen significado referencial). Se caracterizan por formar un inventario cerrado. Las conjunciones y los artículos son representantes de este tipo de unidad.

Clases de rasgos léxicos

Las unidades léxicas distinguen tres tipos de rasgos (no todos los modelos gramaticales utilizan los mismos rasgos léxicos. Lo que se da a continuación es una generalización):

  • Rasgos formales: Contienen información sobre el tipo de palabra de la que se trata (sustantivo, verbo, preposición), sobre el contexto sintáctico en el que pueden aparecer y sobre el tipo de flexión (regular o irregular) que requieren.
  • Rasgos semánticos: Contienen información sobre la estructura argumental requerida por una unidad léxica (un verbo como "destruir" requiere un agente que destruya y un tema a ser destruido), sobre las propiedades inherentes de cada unidad (un nombre como "niño" tiene rasgos [+humano] [+contable] etc.).
  • Rasgos fonológicos: Contiene la información necesaria para asignarle representación fonética a la unidad.

El lexicón en la Traducción Automática

En un diccionario tradicional típico, las entradas se identifican mediante una forma base o "canónica" de la palabra. Esta forma canónica varía según el idioma: los verbos en inglés se representan mediante la raíz no flexionada, mientras en francés o español se representan con el infinitivo del verbo. Además de la definición estos diccionarios tradicionales incluyen en cada entrada información adicional como la pronunciación, la categoría gramatical o su etimología.

El lexicón, o diccionario, empleado en Traducción Automática posee algunas diferencias con respecto al tradicional. Algunos programas de Traducción Automática cuentan únicamente con diccionarios de formas flexionadas, es decir, listas de palabras con todas las formas e información gramaticales correspondiente. Un lexicón de esta forma contendría las palabras comer, comida, comiendo, comido por separado, como unidades diferenciadas. Esta aproximación no es nada eficiente en lenguas como el español, que posee de una rica y compleja flexión. En estos casos, el lexicón suele proporcionar una raíz a partir de la cual el componente morfológico se encargará de generar las formas apropiadas.

Este lexicón para la Traducción Automática debe suministrar la información necesaria para el análisis sintáctico y semántico:

  • categoría gramatical (nombre, verbo, etc.)
  • rasgos de subcategorización, subcategoría del apartado anterior (verbo transitivo o intransitivo, sustantivo masculino o femenino, etc.)
  • información semántica (nombre animado, verbo que exige un sujeto animado, etc.)

A menudo estos dos últimos tipos de información se emplean conjuntamente a la hora de definir, por ejemplo, una subcategoría en términos de restricciones de selección. Esta información ayuda a determinar el contexto en el que pueden aparecer las palabras. Así, por ejemplo, el verbo amar restringe la selección de su sujeto, de manera que éste debe ser animado.

Además, un lexicón empleado en la Traducción Automática, debe aportar información relativa a la correspondencia entre las unidades léxicas de distintas lenguas. Debido a la complejidad que puede entrañar esta tarea, muchos sistemas optan por establecer una separación entre dos tipos de información: por un lado la información necesaria para el análisis o producción de textos en una lengua particular y, por otro lado, la información relativa a las correspondencias léxicas entre dos pares de lenguas. Estas correspondencias incluyen las condiciones en las que se produce la equivalencia:

  • categorías gramaticales (bote: verbo o nombre)
  • categorías semánticas (banco: asiento o establecimiento que realiza negocios con dinero)
  • contexto sintáctico (tratar una enfermedad o tratar de conseguir algo)

Un ejemplo claro de lexicón es el Wordnet (en inglés) y el EuroWordNet (en otros idiomas).


Wikimedia foundation. 2010.

Mira otros diccionarios:

  • lexicon — LEXICÓN, lexicoane, s.n. Dicţionar. ♦ (Rar) Enciclopedie (a unui domeniu). – Din lat., fr. lexicon. Trimis de LauraGellner, 20.05.2004. Sursa: DEX 98  LEXICÓN s. v. dicţionar. Trimis de siveco, 13.09.2007. Sursa: Sinonime  lexicón s. n …   Dicționar Român

  • lexicon — (n.) c.1600, a dictionary, from M.Fr. lexicon or directly from Mod.L. lexicon, from Gk. lexikon (biblion) word (book), from neuter of lexikos pertaining to words, from lexis word, from legein say (see LECTURE (Cf. lecture) (n.)). Used originally… …   Etymology dictionary

  • lexicón — sustantivo masculino 1. Diccionario de una lengua. 2. Área: linguística En gramática generativa, conjunto no ordenado de entradas léxicas que se definen de acuerdo con sus rasgos fonológicos, sintácticos y semánticos: El lexicón de una lengua es… …   Diccionario Salamanca de la Lengua Española

  • lexicon — [lek′si kän΄] n. [Gr lexikon, neut. of lexikos, of words < lexis, a saying, phrase, word < legein: see LOGIC] 1. a dictionary, esp. of an ancient language 2. the special vocabulary of a particular author, field of study, etc. 3. a record or …   English World dictionary

  • Lexicon — Lex i*con (l[e^]ks [i^]*k[o^]n), n. [Gr. lexiko n (sc. bibli on), neut. of lexiko s of or belonging to words, fr. le xis a speaking, speech, a way of speaking, a single word or phrase, fr. le gein to say, to speak. See {Legend}.] A vocabulary, or …   The Collaborative International Dictionary of English

  • Lexicon — Lexicon, fondée en 1971, est une entreprise qui fabrique du matériel audio à destination du grand public et des professionnels. La société qui est aujourd hui célèbre pour ses réverbérations (480L, PCM 70) a commencé son activité en fabriquant un …   Wikipédia en Français

  • lexicon — [lɛksikɔ̃] n. m. ÉTYM. 1563. → Lexique. ❖ ♦ Vx. Lexique, 1. (cit. 1, 2) …   Encyclopédie Universelle

  • léxicon — s. m. O mesmo que léxico. • [Brasil] Plural: lexícones ou léxicons. • [Portugal] Plural: lexícones.   ‣ Etimologia: grego leksikós, ê, ón, relativo a palavras …   Dicionário da Língua Portuguesa

  • lexicon — [n] collection of word meanings, usage dictionary, glossary, terminology, thesaurus, vocabulary, wordbook, wordlist, word stock; concepts 276,280 …   New thesaurus

  • lexicón — m. diccionario (ǁ libro) …   Diccionario de la lengua española

  • lexicon — ► NOUN 1) the vocabulary of a person, language, or branch of knowledge. 2) a dictionary. ORIGIN from Greek lexikon biblion book of words , from lexis word …   English terms dictionary