Visualización de datos: elección del gráfico adecuado

13 de diciembre de 2023

Los datos son el nuevo petróleo de las compañías, y la explotación de estos puede marcar un carácter diferencial de una empresa dentro del mismo sector. Gracias a la reducción de los costes de almacenamiento, ahora se dispone de multitud de información. Las compañías disponen de grandes volúmenes de datos y es indispensable darles forma para su rápida y total comprensión.

Es en este contexto donde surge la ciencia de la visualización de datos, que trata de dar solución al problema anteriormente planteado, cuando la capacidad de procesamiento humano no es suficiente para contrastar y analizar cantidad masiva de información.

La visualización permite, de manera clara y directa, observar patrones, valores extremos o distribuciones, entre otras posibilidades, que ayudan a tomar mejores decisiones basadas en datos.

En este artículo recogemos las principales funciones que pueden resolverse mediante una selección adecuada de unos gráficos concretos. Como existen multitud de gráficos y al ser un texto introductorio, nos centraremos en dar respuesta técnica priorizando los gráficos más utilizados.

A la hora de construir un cuadro de mandos o dashboard no hay que olvidar que, además del amplio catálogo de gráficos disponibles, es fundamental tener en cuenta también el contexto y el público al que va dirigido.

Visualizar proporciones

En este apartado se observa aquellos gráficos que responden a la necesidad de realizar una proporción entre valores. Para ello gráficos como el gráfico de burbujas, gráfico de Nightingale Rose, gráfico de áreas proporcional o nube de palabras darían buenos resultados.

En caso de buscar relaciones proporcionales que conformen parte de un total, los gráficos a implementar serían el gráfico de donut o anillo, treemap, gráfico de tarta, y el diagrama de Sankey.

Jerarquía

Los gráficos más usados para mostrar la jerarquía entre un conjunto de variables son el gráfico de diagrama de árbol y el treemap.

Visualizar conceptos

Para permitir mediante visualización el entendimiento de algunas ideas o conceptos, los gráficos a introducir serían algunos como: el diagrama Venn o el diagrama de flujo.

Relaciones

Para observar tanto relaciones como conexiones entre los datos o mostrar correlaciones entre dos o más variables, un ejemplo de los gráficos más comunes serían los siguientes:

En cuanto a correlaciones se refiere, los mejores gráficos son el gráfico de burbujas, mapa de calor o el diagrama de puntos.

A la hora de mostrar solo conexiones entre distintas variables los gráficos más adecuados serían mapa de conexiones, gráfico de redes, diagrama de árbol y el diagrama de cuerdas.

Representar localizaciones

Los siguientes son métodos adecuados para la representación de las regiones geográficas: mapa coroplético, mapa de conexiones y mapa de puntos.

Distribuciones

A continuación, se observan las gráficas que permiten representar la frecuencia de una variable o la distribución de esta, es decir, como se distribuyen en función de unas agrupaciones concretas.

Los gráficos que ayudan a plasmar esa idea son diagrama boxplot o de cajas y bigotes, gráfico de burbujas, histograma, línea de tiempo, o el gráfico de Tally.

Si se desea mostrar la distribución de una variable segmentada por una cualitativa concreta, bien sea sexo, edad o cualquier otra, el gráfico adecuado sería la pirámide. En el caso de la nube de palabras, su uso es óptimo cuando se trata de la distribución de un texto.

Mostrar una comparación

Métodos que permiten mostrar las principales diferencias o similitudes entre valores. Podemos diferenciar todas las posibilidades en función de la necesidad que incorporen eje o no los gráficos.

Si poseen eje los gráficos a aplicar serían tales como el gráfico de barras, diagrama de cajas y bigotes o boxplot, gráfico de burbujas, gráfico de balas, gráfico de líneas, gráfico de columnas apiladas, gráfico de pirámide, o el gráfico de áreas.

Si no incorporan un eje en su estructura, los gráficos para comparar distintas variables serían algunos como el gráfico de anillo o donut, diagrama de cuerdas, mapa de calor, gráfico de tarta, treemap entre otros.

Flujos de movimientos

Los métodos de visualización que permiten representar el movimiento de los datos o los flujos de estos son el mapa de conexiones o el diagrama de Sankey.

Particiones de un total

En este apartado se analizan aquellos métodos de visualización que permiten mostrar partes de un total de una o más variables. Generalmente el gráfico de anillo o donut, gráfico Mekko, gráfico de tarta, gráfico de columnas agrupadas y el treemap daría un resultado correcto.

Rangos

Métodos de visualización que presentan las variaciones entre los valores máximos y mínimos en una escala.

Para esta funcionalidad los gráficos de diagrama de cajas y bigotes o boxplot, gráfico de balas, gráfico de velas, el diagrama de Gantt entre otros serán una muy buena opción a implementar.

Mostrar funcionamiento y procesamiento

Métodos de visualización que permiten mostrar cómo funciona un objeto, un sistema, donde se muestra tanto el output final junto con los procesos que lo originan.

Los gráficos más adecuados para mostrar este tipo de funcionalidad son el diagrama de Sankey o un gráfico de flujos, si lo que se desea es hacer foco en la explicación de procesos o métodos, el gráfico más recomendable sería el diagrama de Gantt.

Observación temporal de los datos

En esta función se presenta la necesidad de mostrar datos durante un periodo de tiempo como un camino para encontrar tendencias o cambios a lo largo del tiempo.

Los gráficos que emplear podrían ser el gráfico de Nightingale Rose, gráfico de áreas apiladas, mapa de calor, gráfico de burbujas, gráfico de velas o el gráfico de líneas entre otros.

En este apartado cuya función principal es observar cómo oscilan los datos durante el tiempo, también destaca por unos gráficos que podrían ser usados para representar la secuencia de eventos a lo largo del tiempo. Gráficos como una tabla de tiempo, una línea temporal o una tabla calendario pueden ayudar a representar este tipo de información.

Encontrar patrones ocultos

Si a la hora de seleccionar el gráfico lo que se busca es encontrar patrones ocultos dentro de los datos, el abanico de posibilidades es muy amplio pudiendo seleccionar uno entre multitud de gráficos.

Para este caso los gráficos más utilizados son el gráfico de áreas, gráfico de barras, diagrama de cajas y bigotes o boxplot, gráfico de burbujas, gráfico de velas, mapa de conexiones, mapa de puntos, mapa de calor, gráfico de líneas, pirámide de población, diagrama de puntos, mapa coroplético, entre otros.

Conclusión

La visualización de datos es una herramienta indispensable para dar forma y estructura a los datos y comprenderlos de manera rápida y efectiva. Los gráficos son una forma clara y directa de visualizar patrones y distribuciones en los datos, lo que ayuda a tomar decisiones basadas en información con mayor precisión

Aunque como hemos visto existen muchos tipos de gráficos, es importante seleccionar aquellos que sean más adecuados para cada situación teniendo en cuenta el contexto y el público al que se dirige. Por tanto, la elección adecuada del gráfico es fundamental para aprovechar al máximo el potencial de los datos y sacar el máximo partido de ellos.

Empieza ya a programar Inteligencia Artificial: lenguajes, herramientas y recomendaciones

Imágenes de Freepik y Figma.