miércoles, 10 de junio de 2015

Desviación típica para interpretar mejor los promedios

En los talleres que imparto con estudiantes para aprender a utilizar un eye tracker suele surgir una duda en el momento de analizar los datos. Yo les pido que además de calcular el promedio obtengan la desviación típica. Se ve que es un concepto que no han visto antes y siempre improviso ejemplos para tratar de que lo entiendan.

Este es el último que se me ha ocurrido, no tiene nada que ver con el eye tacking, la verdad, pero creo que lo usaré más veces mientras se me ocurre un ejemplo mejor.

Es este:

Nos piden que decidamos cuánto tiempo debe estar el semáforo de los peatones en verde en un determinado cruce; para llegar a la respuesta vamos al cruce en cuestión e instalamos un cronómetro que pueda contar el tiempo que tardan las personas en cruzar; y recogemos los datos en dos momentos distintos del día:
- a las 8:15 de la mañana
- a las 5:15 de la tarde

Obtenemos estos datos de 10 personas en cada sesión, expresados en segundos, y los ordenamos de menor a mayor:
     Por la mañana (8; 9; 9; 9; 9; 9; 10; 10; 10; 11)
     Por la tarde     (4; 5; 5; 6; 8; 10; 11; 12; 15;18)

Si nos quedamos con el dato del tiempo que tardan en promedio tenemos que:
     Por la mañana: 9,4 segundos
     Por la tarde: 9,4 segundos
Ahora bien, si aplicamos la fórmula de la desviación estándar (disponible en Excel, sin ir más lejos) tenemos que en el caso de las mañanas los datos son muy homogéneos, es decir, la desviación de los datos del promedio es pequeña (0,84), mientras que la desviación que hay en el grupo de datos tomados por la tarde es mucho mayor (4,67).
A la hora de describir qué datos tenemos, saber la desviación estándar nos permite ver si los datos recogidos con muy homogéneos entre sí o si no lo son, y podemos buscar una explicación para entenderlos ¿por qué en este ejemplo del semáforo existe una diferencia tan grande en la desviación estándar de los datos de la mañana y de la tarde? Vamos al cruce y observamos a las personas, entonces descubrimos que:

   - A las 8:15 de la mañana el perfil de las personas que cruzan es muy homogéneo: tienen entre 20 y 50 años y se dirigen, sin entrenerse, a sus puestos de trabajo
   - A las 5:15 de la tarde el perfil de personas que cruzan es mucho más variado: niños y adolescentes que salen  del colegio en grupos o con sus madres/padres, personas mayores, personas paseando perros, personas que se detienen a saludarse unos segundos... pero también personas haciendo deporte.

En este ejemplo se puede ver cómo el promedio de tiempo que tardan las personas en cruzar por la mañana y por la tarde es el mismo, en cambio los datos de por la mañana son muy parejos y por la tarde están más dispersos.

2 comentarios:

  1. Buenas Mari-Carmen , pues me ha parecido bastante ilustrativo el ejemplo ,sigue co nel Blog , que me parece muy interesante. un saludo

    ResponderEliminar
  2. Buenas Mari-Carmen , pues me ha parecido bastante ilustrativo el ejemplo ,sigue co nel Blog , que me parece muy interesante. un saludo

    ResponderEliminar