Visualización de la información – Yussef Hassan

Yussef Hassan empieza la clase explicándonos la diferencia entre visualización de datos versus infografías.

Proceso de visualización de datos

  • Análisis de datos
  • Transformación de datos
  • Representación gráfica
  • Interactividad

Siempre que hacemos una visualización, tenemos que pensar quién va a ser el usuario final. La mayor parte de las veces vamos a ser nosotros mismos. Visualización de datos es algo que vamos a tener que hacer profesionales de casi todas las ramas, y en cambio nos han enseñado muy poco. Como mucho, un profesor de estadísticas algo de gráficas, pero no de fundamentos de la percepción visual.

Tres estapas:

Etapa1: Características y propiedades básicas

Vemos más de lo que creemos que estamos viendo. Estamos viendo muchas cosas, pero estamos prestando atención sólo a unas cuantas. Y a la vez, también creemos que estamos viendo mucho más de lo que estamos viendo, gran parte de lo que vemos es una construcción mental. Hasta que no fijamos la atención en algo, no estamos viendo nada (sobre eyetracking).

Percepción atentiva (leyes de la gestalt– sintaxis gráfica
Principles of grouping. Esto es universal, no es cultural ni social

Reconocimiento de objetos – Semántica gráfica

  • Objetos de información
  • Objetos de referencia
  • Objetos decorativos

La utilización de elementos pictóricos es recomendable sólo cuando ayuda a entender qué es lo que se está representantea. Cuando la forma es mínimamente compleja ya no nos permite distinguir tan fáci lmente.

Tipos de relaciones entre representación y representado:

  • Literal
  • Metafórica
  • Arbitraria-convencional
  • Metonímica

Nos ha fascinado una infografía del NYT sobre muertes de soldados en Irak, qué cuando quién y cómo. Y nos hemos dado cuenta de que es importante saber qué variables queremos representar y de qué tipo son.


[Descanso]

Tipos de variables
Respecto de los datos que queremos visualizar, hay que distinguir cuáles son

  • Cualitativas
    • Ordinal (valores alto, medio, bajo)
    • Ciencia ficción, Terror, Drama
  • Cuantitativa
    • Discreta (valores 4, 10, 23)
    • Contínua (3.28, 10.3,35)

Cada tipo de variable tiene unas formas de representaicón gráfica y no otras.

Longitud de las variables:

  • En cualitativas, se refiere a número de valores diferentes que puede tomar
  • En cuantitativas se refiere al rango de valores posibles

Semántica de las variables: Espacial, temporal, …

Transformación de datos

Lo más cómodo es una columna una variable, que es más cómodo visualmente.

Hay una serie de técnicas

  • Descartar variables: No creemos que aporte realmente valor
  • Filtrar: Excluir per ejemplo, trabajadores de Barcelona.
  • Artibutos derivados: La posición geográfica específica (latitud y longitud)
    Agregar:
    ….

Tareas perceptuales que mejor soportan cada tipo de tráfico:

  • Comparaciones simples: Identificar diferencias cuantitativas entre pares de valores -> Diagrama de barras
  • Tendencias o evolución: Identificar cambios, incrementos, descensos o fluctuaciones en series de valores temporales cuantitativas. -> Línea
  • Relaciones de Ranking: Identificar -> Barra horizontal
  • Relaciones parte-todo: Identificar relaciones proporcionales -> Tarta, cuando es tan simple como sí o no.
  • Relaciones de distribución: Identificar las posiciones de los diferentes respecto al rango completo.
  • Correlación: Identificar el grado de relación entre dos variables. -> Puntos

* Las barras pegadas ayudan cuando los datos están agrupados

El poder está en la metáfora.

Representación gráfica

Variables cuantitativas Nominales Ordinales
Posición Muy bien Muy bien Muy bien
Longitud Muy bien Aceptable
Area Bien Bien (pocos valores)
Brillo (intensidad del color) Aceptable (pero menos recomendables) Bien (cuando hay pocos valores)
Matiz (color) Muy bien (pocos valores Bien (pocos valores)
Forma Bien (pocos valores)
Grosor Aceptable Bien (pocos valores)

Todas las gráficas permiten hacer tareas, pero no todas permiten el mismo tipo de tareas.

Yussef nos explica cómo se pueden meter más de dos variables en una gráfica, o cómo poder mostrar mejor la media y la varianza.

La tridimensionalidad está bien cuando es real, si está en dos dimensiones pierde el sentido.

Los diagramas de barras para lo que sirven es para ver la proporción entre dos valores. Si cortamos y empezamos el eje por alguna parte ya no nos sirven. En cambio, en gráfico de líneas sí podemos cortar, es una evolución temporal y lo vemos mejor.

Los diagramas de araña (o radares) por sí solos son muy complicados, pero nos pueden ser útiles al comparar porque es más fácil identificar las formas de dos personas que se parecen o gente que se dale de lo normal.

En los gráficos de área, hay que tener en cuenta que es el área lo que debe ser proporcional, no el radio de un círculo, que da un área mucho más grande.

Hay que ir con cuidado con el tema de colores porque el 1% de las mujeres y 7% de los hombres tienen problemas de visión cromática, daltonismo u otro tipo. En ocasiones no necesitaremos leyenda

Si el color no aporta información, no utilizarlo. Usaremos paleta de colores poco saturados, usaremos el saturado para destacar algo. NO UTILIZAR UN DEGRADADO PORQUE SÍ. «Me ha quedado un gráfico muy soso» ES EL MAL.

Esteética visual y decoración de gráficos.
En ocasiones la representación no demuestra un conocimiento revelador, pero tampoco el objetivo es este, como por ejemplo el mapa de relaciones de facebook:

Recursos:
* No nos recomienda information is beautiful. Es bonito para ojear en casa pero no aprender nada.
* Nor recomienda al autor Stephen Few en general, y especialmente Now You See It: Simple Visualization Techniques for Quantitative Analysis.
* También a Colin Ware.

Recursos extra:
* Recientemente Manuel González me ha recomendado además The Visual Display of Quantitative Information de Edward R. Tufte porque «es el clásico absoluto»: