Identificador de textos

Identificador de textos

Un identificador de textos es un programa informático desarrollado para identificar el autor o la fuente de un texto anónimo a través del análisis de su estructura gramatical y sintáctica.

Según Jorge Majfud, la idea del identificador de texto se basa en que

"en el mundo digital no tenemos la caligrafía del escritor ni el golpe de tecla de la máquina de escribir, pero tenemos un rastro inequívoco, si se lo analiza a gran escala: la sintaxis y la gramática que, desde un punto de vista radical, es como las huellas dactilares de cada persona.Como el tono de voz y como cualquier expresión humana, la gramática profunda de cada individuo es casi tan particular como su ADN. No hay en el mundo dos personas que escriban exactamente igual. Por supuesto que en el proceso de investigación y prueba, también consideramos y valoramos la autodeformación deliberada: faltas ortográficas realizadas a posteriori o intencionalmente, desplazamientos forzados de adjetivos o de sustantivos, una duplicación pronominal donde no la había, una variación en el dativo, un complemento indirecto redundante, una voz pasiva en lugar de la activa, eliminación de artículos o abuso de gerundios, de leísmos o de tiempos verbales como el pasado perfecto (más propio de España que de Chile, por ejemplo), adopción de estilos de clases sociales que le son ajenas al autor, etc. No obstante, al igual que aquellos que escribían a mano intentaban deformar su propia letra para crear el anonimato, esta deformación es prácticamente imposible ante los ojos de un experto calígrafo. En el mundo digital no tenemos la ventaja del trazo de la mano en el papel pero, en cambio, poseemos un número de ocurrencias que multiplican varias veces las cartas a mano. Por otro lado, con el uso de una computadora especializada de poder mediano, es posible realizar millones de combinaciones sintácticas y gramaticales. Es aquí que, a partir de un determinado número de textos, la identidad se reconoce con una precisión que no deja dudas. Esta idea puede resultar extraña o compleja, pero es fácil de comprender si recurrimos a una metáfora: si una persona se saca una cantidad X de fotografías y en cada una cubre una parte diferente de su rostro haciendo irreconocible su identidad en cada una de las fotografías, evidentemente basta un numero específico de fotos “enmascaradas” para tener el retrato exacto, desenmascarado, del hombre de las múltiples caras. Un experimento semejante se podría hacer con los diferentes personajes representados por un mismo actor. La combinación no arrojaría ninguno de sus personajes particulares sino el retrato del actor."[1]

Referencias

  1. «"El identificador de texto"». Alfa.com (05-02-2011). Consultado el 05-02-201.

Enlaces externos


Wikimedia foundation. 2010.

Игры ⚽ Нужно сделать НИР?

Mira otros diccionarios:

  • Google Docs — y Hojas de cálculo Desarrollador Writely Team, Google Inc. http://docs.google.com/ Información general Género Procesador de texto, hojas de cálculo, prese …   Wikipedia Español

  • Check Wikipedia — Wikiproyecto:Check Wikipedia Saltar a navegación, búsqueda Esta página contiene de forma consciente fallos ortográficos. Los bots no deben intentar corregirlos. Atajo PR:CWPR:CW …   Wikipedia Español

  • Formato FASTA — Saltar a navegación, búsqueda En bioinformática, el formato FASTA es un formato de fichero informático basado en texto, utilizado para representar secuencias bien de ácidos nucleicos, bien de péptido, y en el que los pares de bases o los… …   Wikipedia Español

  • Preprocesador de C — Saltar a navegación, búsqueda El preprocesador de C (cpp) es el preprocesador para el lenguaje de programación C. Es el primer programa invocado por el compilador y procesa directivas como #include, #define y #if. Estas directivas no son… …   Wikipedia Español

  • Here document — Este artículo o sección necesita referencias que aparezcan en una publicación acreditada, como revistas especializadas, monografías, prensa diaria o páginas de Internet fidedignas. Puedes añadirlas así o avisar …   Wikipedia Español

  • Jerga informática — Anexo:Jerga informática Saltar a navegación, búsqueda El lenguaje de la informática está caracterizado por emplear numerosos anglicismos, puesto que el idioma inglés se ha convertido en la lengua franca de la informática. El uso de algunas… …   Wikipedia Español

  • Anexo:Jerga informática — El lenguaje de la informática está caracterizado por emplear numerosos anglicismos, puesto que el idioma inglés se ha convertido en la lengua franca de la informática. El uso de algunas palabras difiere en España e Hispanoamérica. Índice: A B C D …   Wikipedia Español

  • ISMN — Saltar a navegación, búsqueda El ISMN –International Standard Music Number es el número internacional que identifica unívocamente las publicaciones de música escrita, ya sea para su venta, alquiler, difusión gratuita o a efectos de derechos de… …   Wikipedia Español

  • Servidor web — Un servidor web o servidor HTTP es un programa informático que procesa una aplicación del lado del servidor realizando conexiones bidireccionales y/o unidireccionales y síncronas o asíncronas con el cliente generando o cediendo una respuesta en… …   Wikipedia Español

  • Twitter — Información general URL Twitter …   Wikipedia Español

Compartir el artículo y extractos

Link directo
Do a right-click on the link above
and select “Copy Link”