Análisis exploratorio de datos

Análisis exploratorio de datos

Análisis exploratorio de datos

El análisis exploratorio de datos (o, simplemente E.D.A.: Exploratory data analysis) es, básicamente, el tratamiento estadístico al que se somenten las muestras recogidas durante una intervención arqueológica al analizarlas en el laboratorio. Para mayor rapidez y precisón, todo el proceso suele realizarse por medios informáticos, con aplicaciones específicas para el tratamiento estadístico. Aunque es muy común al catalogar informáticamente las piezas recogidas en una excavación, los E.D.A. no necesariamente, se llevan a cabo con una base de datos al uso, ni con una hoja de cálculo convencional; siendo SPSS la aplicación más utilizada, aunque no la única.

De hecho, el análisis técnico de una pieza arqueológica puede ser simultáneo a la introducción de los datos, bien porque las fichas estén directamente informatizadas o, bien, porque se usen formularios en papel cuyos datos sean fáciles de introducir en el ordenador o computadora. Es posible, incluso, usar en la propia excavación, una serie de PDAs conectados en red inalámbrica instalada en el yacimiento arqueológico, que envíen numerosos datos de campo a una base de datos central que luego se usarán con fines diversos, entre ellos éste. Los pasos seguidos en el E. D. A. son básicamente dos:

  • Medición y descripción de los datos tecnológicos —tipológicos— y dimensiones, por medio de la Estadística descriptiva. Aquí tenemos, por un lado, las medidas de tendencia central (promedios que, en una sola cifra, resumen todos los valores de una muestra: media, mediana y moda son las más habituales) y, por otro, las medidas de dispersión (que calculan hasta qué punto la muestra se agrupa o no en torno a esos promedios). Dentro de este apartado, se ha de procurar, además, calibrar la confianza de las muestras a través de tres estadímetros básicos: la desviación estándar de la muestra, la curtosis y la asimetría.
La siguiente es una tabla de ejemplo:
Estadísticos descriptivos
Número de Mediciones
383
383
383
383
Error estándar
1%
0,7%
0,7%
8,6%
Medición máxima
142 mm
127 mm
94 mm
1025 g
Medición mínima
29 mm
27 mm
12 mm
16 g
Recorrido
115 mm
98 mm
82 mm
1009 g
Moda
82 mm
60 mm
38 mm
236 g
Mediana
75 mm
61 mm
39 mm
219 g
Rango intercuartil
25 mm
18 mm
17 mm
207 g
Media aritmética
77 mm
62 mm
39 mm
247 g
Desviación estándar
19 mm
14 mm
13 mm
167 g
Coeficiente de variación
25 %
23 %
33 %
68 %
Varianza
376,84
198,67
170,96
27 838,44
Simetría
0,53
0,53
0,48
1,32
Curtosis
0,47
0,83
0,43
2,44
  • Comparación de los caracteres de una muestra, o de varias muestras diferentes por medio de la Estadística inferencial. Las pruebas más frecuentemente utilizadas comienzan por las más sencillas comparaciones visuales —a través de gráficas como la campana de Gauss, nubes de dispersión o diagramas de caja y arbotantes—, pasando por las socorridas tablas de contingencia (incluido la prueba del χ2), y por los típicos Análisis de Varianza (que no es más que una confrontación muy precisa de los promedios de varias muestras), hasta llegar a los más complejos análisis multivariantes de conglomerados.
Yacimiento 1⎯⎯⎯⎯⎯⎯⎯⎯⎯⎯⎯⎯⎯⎯⎯⎯⎯⎯⎯⎯⎯⎯⎯⎯⎯⎯⎯⎯⎯⎯⎯⎯⎯⎯⎯⎯⎯⎯⎯⎫
Yacimiento 2⎯⎯⎯⎯⎯⎯⎯⎯⎯⎯⎯⎯⎯⎫⎯⎯⎯⎯⎯⎯⎯⎯⎯⎯⎯⎯⎫                      ⎬⎯⎯⎯⎯⎯⎯⎯
Yacimiento 3⎯⎯⎯⎯⎯⎯⎯⎯⎯⎯⎯⎯⎯⎭                      ⎬⎯⎯⎯⎯⎯⎯⎯⎯⎯⎯⎯⎯⎭
Yacimiento 4⎯⎯⎯⎯⎯⎯⎯⎯⎯⎯⎯⎯⎯⎯⎯⎯⎯⎯⎯⎯⎯⎯⎯⎯⎯⎯⎭

Resultados del análisis de mulivariante de conglomerados por el método de Ward efectuado en los ciertos tipos líticos, computando variables tecnológicas. Es un ejemplo real, en él se permite observar la similitud o disparidad de los yacimientos seleccionados en virtud de una serie de parámetros seleccionados por el investigador.

Los cálculos estadísticos orientan sobre la fiabilidad de las muestras usadas, aunque no son infalibles, e indican si los resultados obtenidos al calcular las pruebas inferenciales son aceptables, es lo que llamamos nivel de confianza (se debe procurar que éste nunca sea inferior al 95% = 0,95).

Bibliografía

  • García Barbancho, Alfonso (1973). Estadística elemental moderna. Editorial Ariel SA, Málaga. ISBN 84-334-0121-5.
  • García Pérez, Alfonso (1992). Estadística aplicada: Conceptos básicos. Universidad Nacional de Educación a Distancia, Madrid. ISBN 84-362-2811-1.
  • Martín Tabernero, Francisca y Delgado Álvarez, María del Carmen (1993). Estadística aplicada. Tratamiento informático con Stat View 512+. Publicaciones de la Universidad Pontificia, Salamanca. ISBN 84-7299-308-6.
  • Shennan, Stephen (1992). Arqueología cuantitativa. Editorial Crítica, Barcelona. ISBN 84-7423-529-4.
  • Siegel, Sidney (1985). Estadística no Paramétrica aplicada a las ciencias de la conducta. Editorial Trillas, México DF. ISBN 968-24-0146-1.
Obtenido de "An%C3%A1lisis exploratorio de datos"

Wikimedia foundation. 2010.

Игры ⚽ Нужна курсовая?

Mira otros diccionarios:

  • Análisis de componentes principales — Saltar a navegación, búsqueda En estadística, el análisis de componentes principales (en español ACP, en inglés, PCA) es una técnica utilizada para reducir la dimensionalidad de un conjunto de datos. Intuitivamente la técnica sirve para… …   Wikipedia Español

  • John W. Tukey — Este artículo o sección necesita una revisión de ortografía y gramática. Puedes colaborar editándolo (lee aquí sugerencias para mejorar tu ortografía). Cuando se haya corregido, borra este aviso por favor. John Wilder Tukey (* 16 de junio de 1915 …   Wikipedia Español

  • Bifaz — Saltar a navegación, búsqueda Primer bifaz publicado en la historia de la Arqueolog …   Wikipedia Español

  • Función probit — En probabilidad y estadística se llama función probit a la inversa de la función de distribución o función cuantil asociada con la distribución normal estándar. La función tiene aplicaciones en gráficos estadísticos exploratorios y modelos probit …   Wikipedia Español

  • Significancia estadística — En estadística, un resultado se denomina estadísticamente significativo cuando no es probable que haya sido debido al azar. Una diferencia estadísticamente significativa solamente significa que hay evidencias estadísticas de que hay una… …   Wikipedia Español

  • Proyecto de investigación — Saltar a navegación, búsqueda El proyecto de investigación es un procedimiento científico que usa al método científico para recabar todo tipo de información y formular hipótesis acerca de cierto fenómeno social o científico, empleando las… …   Wikipedia Español

  • Estudio de caso — Saltar a navegación, búsqueda El estudio de caso es una metodología de estudio con origen en la investigación médica y psicológica[1] y que ha sido utilizado en la sociología por autores como Herbert Spencer Max Weber, Robert Merton e Immanuel… …   Wikipedia Español

  • Condroitín sulfato — Estructura química de una unidad de cadena de condroitín sulfato. Condroitín 4 sulfato: R1 = H; R2 = SO3H; R3 = H. Condroitín 6 sulfato: R1 = SO3H; R2, R3 = H. El condroitín sulfato o sulfato de condroitina es un glucosaminoglucano sulfatado… …   Wikipedia Español

  • Navaja de Ockham — La navaja de Ockham (a veces escrito Occam u Ockam), principio de economía o principio de parsimonia (lex parsimonia), es un principio metodológico y filosófico atribuido a Guillermo de Ockham (1280 1349), según el cual cuando dos teorías en… …   Wikipedia Español

  • Especialista en metodología de la investigación científica — Saltar a navegación, búsqueda El especialista en metodología de la investigación científica se ocupa de organizar sistemáticamente la estructura de una investigación, sea del campo de las ciencias naturales, sociales o formales. Para este… …   Wikipedia Español

Compartir el artículo y extractos

Link directo
Do a right-click on the link above
and select “Copy Link”