📊 Gráficos de barras en Python: comparar no es lo mismo que apilar📊
- 23 feb
- 2 Min. de lectura
En visualización de datos, el gráfico de barras parece sencillo.Pero es uno de los gráficos donde más errores conceptuales se cometen. En este capítulo de la serie, analizo el mismo dataset utilizando:
🎯 Objetivo de este capítulo
Entender:
¿Cuándo un gráfico de barras es adecuado?
¿Cuándo estamos comparando y cuándo estamos mostrando composición?
¿Cómo cambia la interpretación según el tipo de agrupamiento?
¿Por qué la agregación automática puede alterar la métrica sin que lo notemos?
🧠 Aprendizajes clave
Trabajando el mismo dataset encontré diferencias importantes:
Seaborn
Aplica agregación automática (mean) si existen múltiples valores por categoría.
El parámetro hue introduce una subagrupación (x + hue).
Si no se controla la granularidad, la métrica representada puede no ser la que realmente queremos analizar.
Matplotlib
No agrega datos.
Ofrece control total.
Exige mayor preparación previa del DataFrame.
Plotly
No agrega datos automáticamente.
Permite elegir explícitamente el modo de representación:
barmode="group" → comparación directa.
barmode="stack" → composición.
El tipo de dato del eje categórico influye directamente en la representación visual y en la leyenda.
📊 Ejemplo visual
🖼️ Gráfico de barras en Matplotlib

🖼️ Gráfico de barras en Seaborn (media implícita)

🖼️ Gráfico de barras en Plotly (barras apiladas)

🖼️ Gráfico de barras en Plotly (barras agrupadas)

(Aquí puedes mostrar cómo cambia completamente el insight con el mismo dataset)
🧩 Conclusión
El gráfico de barras no solo compara valores. Puede:
Comparar magnitudes
Mostrar composición
Segmentar por categorías adicionales
Alterar su interpretación según la agregación
La diferencia entre un gráfico correcto y uno confuso no está en la librería, sino en:
El nivel de agregación
El tipo de agrupamiento
La claridad de la pregunta analítica
Este capítulo no enseña a “hacer barras”, sino, moldear la información y que el gráfico satisfaga el requerimiento para un mejor análisis de datos. Para más detalle, revisa el repositorio en GitHub.



Comentarios