Una de las 3 C para mejorar los gráficos

Este artículo es el segundo de una serie de tres partes.

  1. El primer artículo define las 3 C y explica cómo garantizar contexto para visualizaciones cuantitativas.
  2. En este artículo se analiza la importancia de eliminar desorden de los gráficos
  3. El siguiente artículo analizará las formas de agregar contraste a sus proyectos de diagramas.

Edward Taft, relación entre datos y tinta y Chartjunk

Edward Tafte es un pionero de la visualización que aboga por una estética de diseño minimalista cuando se trata de presentar datos cuantitativos.

“Los gráficos de datos deben llamar la atención del espectador sobre el significado y el contenido de los datos, no a otra cosa. […]

A veces, el ingenio del diseño hace que un gráfico sea digno de un museo de arte moderno, pero en esencia, los gráficos estadísticos son una herramienta para ayudar a las personas a razonar sobre la información cuantitativa”. —Edward Taft

Tufty analizó la visualización de datos de manera famosa usando su proporción de datos a tinta. (Avanzó esta teoría en los días en que los gráficos estaban destinados a imprimirse en lugar de mostrarse en pantallas digitales, de ahí el uso de la palabra “tinta” para referirse a cualquier cosa que aparece en una visualización). Definió tinta de datos como valor principal de la visualización: elementos que transmiten información y no se pueden eliminar sin cambiar el mensaje de visualización.

Ese proporción de datos a tinta para gráficos, se refiere a la relación entre la tinta de datos y la tinta de gráficos general; en otras palabras, el porcentaje de tinta en un gráfico que transmite información clave. Un gráfico con una alta relación datos-tinta tiene pocos o ningún elemento superfluo o decorativo: el ideal de Taffeta es la visualización que comunica los datos de la manera más eficiente.

Cualquier elemento innecesario que Tufte llame basura en los gráficos: el nombre perfecto para ellos. Chatjunk es lo opuesto a la tinta de datos: cualquier elemento visual que no es realmente necesario y que en realidad resta valor al significado del gráfico.

Esta teoría es una variación de la relación señal-ruido, el concepto de interacción humano-computadora. La señal (en este caso, la tinta de datos) es información relevante y el ruido (ruido) es información irrelevante.

Deshazte de la basura de los gráficos

Para ayudar a sus espectadores a comprender sus datos, asegúrese de que su visualización no contenga información visual que reste valor al punto del gráfico.

Con demasiada frecuencia veo equipos que confían en los gráficos que Excel crea de forma predeterminada. Por favor, no cometas este error. Estos gráficos automáticos serán genéricos y no se adaptarán a su propósito de presentar los datos. (Esto no es culpa de Microsoft: ¡la aplicación no sabe lo que está tratando de mostrar con el gráfico!)

Peor aún, Excel ofrece muchas opciones para los estilos de gráficos, la mayoría de los cuales son perjudiciales para la claridad. A veces la gente me dice que eligieron estos estilos para que el gráfico se vea “interesante”. ¡Tu punto de vista es interesante en sí mismo! No necesitas rayas llamativas o efectos 3D para arreglarlo. Usarlos solo oscurecerá el significado de su diagrama.

Malo: Dos ejemplos de estilos de gráficos de Excel. Los colores elegantes, las fuentes, los efectos 3D, los degradados, las sombras y las texturas no agregan valor a su imagen; de hecho, solo distraen.

A veces, estos estilos pueden incluso crear una ilusión óptica, distorsionando la percepción del usuario de los valores de los datos.

Si bien nadie debería usar diseños 3D en sus visualizaciones de datos, otros elementos de diseño pueden ser informativos o distraer según el contexto.

Puede ser difícil determinar qué elementos son realmente necesarios para su diagrama. Por ejemplo, las divisiones pueden ser absolutamente necesarias para un gráfico y completamente innecesarias para otro. Echemos un vistazo a dos elementos gráficos comunes, ejes y leyendas, para ver cuándo se pueden considerar innecesarios.

hachas

De forma predeterminada, Excel crea gráficos de barras con ejes etiquetados con líneas de cuadrícula. Dependiendo de la situación, puede eliminar estas imágenes y simplemente usar etiquetas de datos.

Por ejemplo, imaginemos que hemos rediseñado la web de un producto corporativo. Hemos aumentado el promedio mensual de envíos de formularios para clientes potenciales de 1232 a 1848. De forma predeterminada, Excel nos proporciona un gráfico con líneas de cuadrícula, un eje Y y etiquetas de líneas de cuadrícula de 0 a 2000.

Excel generalmente proporciona ejes y líneas de cuadrícula en gráficos de barras generados automáticamente. Este es el gráfico de barras general que Excel creó a partir de estos datos. (Hemos cambiado la fuente predeterminada en este gráfico de Excel, solo para que coincida con nuestras propias pautas de diseño de gráficos).

Usando solo los ejes y las líneas de cuadrícula, es un poco difícil determinar los valores exactos. Mirando este diagrama predeterminado, Antes valor 1210? 1215? 1250? Podemos agregar etiquetas de datos al final de cada columna para que sea más fácil para las personas ver el valor exacto.

Al agregar etiquetas de datos a cada banda, es fácil ver los valores exactos.

Sin embargo, con la adición de etiquetas de datos, las líneas de cuadrícula y el eje y se vuelven innecesarios; ya no son necesarios para definir valores. En este caso, ahora son basura y se pueden eliminar.

Bien: Simplemente podemos eliminar el eje y y las líneas de cuadrícula, ya que las etiquetas de datos los hacen redundantes. (Si agregaste intervalos de confianza en este gráfico, como debería, puede decidir mantener el eje y y las líneas de cuadrícula para ayudar a las personas a descubrir los significados de esos intervalos. Sin embargo, puede omitir el eje y si incluye valores de intervalo de confianza en el título o en el informe junto al gráfico).

Los ejes no siempre son chatarra. Tomemos otro ejemplo e imaginemos que estamos trabajando en el sitio web de un hospital. Queremos que el gráfico muestre las siete páginas más visitadas (con la mayor cantidad promedio de páginas vistas únicas al mes).

Podemos decidir dejar los ejes y las líneas de cuadrícula en su lugar si solo queremos darle a nuestro espectador una idea de la escala de las diferencias entre estas páginas. Con líneas de cuadrícula y sin etiquetas de datos, los espectadores aún pueden ver que la página de inicio y Planifica tu visita Las páginas son mucho más visitadas que otras. Los espectadores no sabrán los números exactos (~73 000 en lugar de 72 563), pero ese no era nuestro objetivo en este caso de todos modos.

Dependiendo de lo que queramos comunicar a nuestros espectadores, los ejes y las líneas de la cuadrícula pueden ser útiles o simplemente aumentar el desorden. En este ejemplo, los valores reales son menos importantes, pero su valor total es importante.

No olvide que Excel le da control sobre la representación de cada eje. Podemos cambiar estos ajustes para crear un gráfico más minimalista sin perder información. Por ejemplo, podemos cambiar la unidad del eje de 10 000 a 20 000 para reducir el número de líneas de cuadrícula y etiquetas.

Podemos usar menos líneas de cuadrícula y etiquetas para reducir la cantidad de información visual en el gráfico.

Cuando incluye un eje en un gráfico, no siempre necesita incluir la etiqueta del eje. Cuando el título del gráfico indica claramente la métrica mostrada (y la unidad de medida), es posible que las etiquetas de los ejes no sean necesarias. En este caso, el título del gráfico Paginas mas visitadas es ambiguo: algunas personas pueden inferir correctamente que el eje x representa las páginas vistas, pero otras pueden pensar en una métrica como el tiempo por página y confundirse. Para mayor claridad, vale la pena agregar una etiqueta de eje a este gráfico.

etiqueta de eje, Número promedio de vistas de página únicas por mes, necesarios y útiles para este diagrama.

leyendas

Las leyendas están destinadas a ayudar a las personas a distinguir entre las diferentes series de datos que se muestran en un gráfico. Por ejemplo, imaginemos que hemos estado haciendo pruebas cuantitativas de usabilidad de una aplicación de planificación financiera durante muchos años. Queremos mostrar cuánto han mejorado las tasas de éxito de nuestras tres funciones principales a lo largo de los años.

Por defecto, Excel nos da tres colores diferentes, uno para cada serie de datos. Esto también nos da una leyenda que explica que Calculadora de jubilación se muestra en azul, Herramienta de presupuesto se muestra en naranja y así sucesivamente.

De forma predeterminada, Excel muestra diferentes series de datos en diferentes colores, con una leyenda que explica qué color representa cada característica..

El problema con las leyendas es que requieren que las personas cambien rápidamente entre la visualización de datos y la leyenda. Será más fácil para las personas procesar estas filas si colocamos etiquetas significativas directamente en cada fila.

Este enfoque no solo es más fácil de manejar, sino también más accesible. A las personas con ciertas discapacidades visuales, en particular aquellas con daltonismo, les resulta difícil confiar únicamente en el color para distinguir series de datos. Colocar etiquetas directamente encima de cada línea elimina este problema.

El marcado directo en líneas seriales es más conveniente para las personas.

Para que estas etiquetas rectas sean aún más legibles, podríamos reducir el número de líneas de cuadrícula.

Reducir el número de líneas de cuadrícula ayuda a que las etiquetas de las series sean más fáciles de leer.

Conclusión: menos es más

Recuerde que las visualizaciones de datos a menudo contienen mucha información que sus espectadores intentarán procesar y comprender. Elimine cualquier elemento visual innecesario que reste valor a su significado.

Recursos

Eduardo Taft. 1983. Visualización de información cuantitativa. Prensa Gráfica.

Jonathan Schwabisch. 2021. Visualización de datos mejorada: una guía para científicos, investigadores y profesionales. Prensa de la Universidad de Columbia.

Previous post Cómo utilizar elementos dibujados a mano en el diseño web
Next post (no tan obvio) “punto” de diseño de servicios | Cornelux | febrero 2022

Deja una respuesta