Logo Studenta

Clase 12 - Gráficos eficientes

¡Este material tiene más páginas!

Vista previa del material en texto

Clase 12. Gráficos eficientes
Visualización eficiente. 
Concepto
Una visualización eficiente es aquella que permite entender la información de una forma clara y rápida, sin que sea necesaria la explicación de un interlocutor. 
Articulo: VISUAL ANALYTICS: LA VISUALIZACIÓN ANALÍTICA, EFICIENTE E INTELIGENTE DE DATOS, Alex Rayon. 
Antoine de Saint-Exupery, autor de “El principito”, dijo eso de “La perfección se alcanza no cuando no hay nada más que añadir, sino cuando no hay nada más que quitar”. Es decir, un enfoque minimalista. Y es que la visualización de información es una mezcla entre narrativa, diseño y estadística. Estos tres campos tienen que ir inexorablemente unidos para no correr el peligro de perderse con la interpretación de la idea a través de estímulos visuales. Las buenas representaciones gráficas, deben cumplir una serie de características:
1. Señalar relaciones, tendencias o patrones
2. Explorar datos para inferir nuevo conocimiento
3. Facilitar el entendimiento de un concepto, idea o hecho
4. Permitir la observación de una realidad desde diferentes puntos de vista
5. Y permitir recordar una idea.
Estos serán nuestros cinco objetivos cuando representamos algo en una gráfica o representación visual. A partir de hoy, nuestras cinco obsesiones cuando vayamos a representar una idea o relación de manera gráfica. ¿Cumplen estas características tus visualizaciones de datos e información? La puesta en valor del dato, como ven, no es algo trivial. Para prueba, un caso, cogido medianamente al azar:
¿Problemas? En primer lugar, ¿qué quiere señalar? Si es una relación, tendencia o patrón, ¿no debería darnos más idea de si los números son relevantes o no? ¿qué significan? ¿cómo me afectan? No facilita entender un concepto, sino que introduce varias dimensiones (tiempo, cancelaciones de vuelos, variación de la tendencia, etc.). Y, encima, lo hace representándolo sobre el ala de un avión. ¿Quiere transmitir seguridad o inseguridad? Genera dudas. Hubiera sido esto más simple si fuera como una cebolla con una única capa: una idea, una relación, un concepto clave. No hace falta más.
La representación visual es una forma de expresión más. Como las matemáticas, la música o la escritura, tiene una serie de reglas que respetar. Hoy en día, en que la cantidad de datos y la tecnología ya no son un problema, el reto para las empresas recae en conocer los conceptos básicos de representación visual. Es lo que se ha venido a conocer como la ciencia del Visual Analytics, definida como la ciencia del razonamiento analítico facilitado a través de interfaces visuales interactivas. De ahí que hoy en día los medios de comunicación utilicen cada vez estas representaciones gráficas de datos e información con las que podemos interactuar.
El uso de representaciones visuales e interactivas de elementos abstractos permite ampliar y mejorar el procesamiento cognitivo. Por lo tanto, para trasladar ideas y relaciones, ayuda mucho disponer de una gráfica interactiva. Hay muchos teóricos y autores que se han dedicado a generar teoría y práctica en este campo de la representación visual de información. De hecho, la historia de la visualización no es algo realmente nuevo. En el siglo XVII, ya destacaron autores como Joseph Priestley y William Playfair. Más tarde, en el Siglo XIX, podemos citar a John Snow, Charles J. Minard y F. Nightingale como los más relevantes (destacando especialmente el primero, que a través de una representación geográfica logró contener una plaga de cólera en Londres). Ya en el Siglo XX, Jacques Bertin, John Tukey, Edward Tufte y Leland Wilkinson son los autores más citados en lo que a visualización y representación de la información se refiere.
Tufte es quizás el autor más citado. Su libro “The Visual Display of Quantitative Information”, una biblia para los equipos de visualización eficientes y rigurosas. De hecho, los principios de Tufte, los podemos resumir en la integridad gráfica y el diseño estético. Siempre destaca cómo los atributos más importantes el color, el tamaño, la orientación y el lugar de la página donde presentamos una gráfica. Y es que, por mucho que nos sorprenda o por simple que nos parezca, la codificación del valor (datos univariados, bivariados o multivariados) y la codificación de la relación de valores (líneas, mapas, diagramas, etc.), no es un asunto trivial. Un ejemplo de esto sería la siguiente gráfica:
Sí en base a este gráfico se hacen preguntas relacionadas con la identificación del mayor donante o el mayor receptor, serían imposibles de responder. Quizás con un patrón de color esto se hubiera resuelto. Pero ni con esas. Un mapa no es la mejor manera de representar este tipo de datos (y hoy en día se abusa mucho de los mapas). Si quiero responder a las preguntas anteriores, tengo que realizar una búsqueda de las cifras, memorizarlas y luego compararlas. Lo dicho al comienzo; una idea, un patrón, una relación, y luego, búsqueda de la mejor gráfica para ello. Por eso los gráficos de torta… mejor dejarlos para el postre (los humanos no somos especialmente hábiles comparando trozos de un círculo cuando hablamos de áreas… que es lo que propone un gráfico de torta con los trocitos en los que descomponemos un círculo)
Quizás la referencia más importante de todo esto que estamos hablando se encuentre en el artículo que en 1985 escribieron Cleveland y McGill, titulado “Ranking of elementary perceptual tasks”. Dos investigadores de AT&T Bell Labs, William S. Cleveland y Robert McGill, publicaron este artículo central en el Journal of the American Statistical Association. Propone una guía con las representaciones visuales más apropiadas en función del objetivo de cada gráfico, lo cual nos ofrece otro pequeño manual para ayudarnos a representar la información de manera inteligente y eficiente.
“A graphical form that involves elementary perceptual tasks that lead to more accurate judgements than another graphical form (with the same quantitative information) will result in a better organization and increase the chances of a correct perception of patterns and behavior.” (William S. Cleveland y Robert McGill, 1985)
Dicho todo esto, y con la aparición del Big Data, muchos autores comenzaron a trabajar en crear metodologías eficientes para la visualización de información. Lo que hemos denominado al comienzo como Visual Analytics: la visualización analítica, eficiente e inteligente de datos que ayuda a aumentar el entendimiento e interpretación de una idea, una relación, un patrón, etc.
¿Cómo lograr una visualización eficiente?
La visualización de datos es la disciplina de la comunicación e información de forma clara y eficiente utilizando gráficos, diagramas, líneas, barras y otras herramientas. La visualización de datos puede verse como tanto un arte como una ciencia, y en el mundo actual de Internet
y Big Data, pudiendo visualizar sus datos de la forma correcta. El camino es cada vez más importante.
Estructura y diseño.
Diseñe con propósito, ya sea que su tablero sea para usuarios internos o externos (integrados). Cada elección de diseño debe contribuir al objetivo del tablero. Es muy importante identificar,
“Como” podemos contar la historia de nuestros datos, “cuál” es la información relevante que necesitamos presentar y "por qué" es la información que visualizamos relevante para contar esta historia de datos. Todas estas son preguntas clave que deben acompañarnos
al crear un panel para crear un buen mensaje claro y legible.
¿Cuáles son las reglas clave para crear un tablero de este tipo?
Claro
El usuario debe poder comprender el significado de lo que se exhibido sin mucha interpretación.
Fácil de usar
Los usuarios deberían poder ubicar filtros y otras funciones sin ayuda.
Con proposito
Cada objeto debe tener una razón para estar disponible para el usuario, debe agregar atractivo visual, servir para analizar un dato o permitir la exploración y la navegación.
Estéticamente agradable
Acogedor, abstracto y representativo del estilo del diseñador.
Correcta y coherente.Con una herramienta visual, los usuarios tenderán a detenerse en detectar problemas, errores tipográficos, irregularidades o formato incoherente, incluso si los resultados son correctos. Aunque el desarrollador puede saber que los problemas son menores consideraciones, afectarán la percepción del usuario y la adopción del panel y las percepciones.
Consejos básicos de diseño
Mantenlo simple. Elimine líneas, etiquetas, ejes, gráficos y cualquier componente extraño que
no son necesarios para comprender la historia de los datos. Los elementos adicionales desordenan el diseño y distraen al usuario.
Crea una jerarquía visual. Los elementos de texto y gráficos deben usar tamaño, color y otros
opciones de estilo para dar a los elementos esenciales una apariencia "más pesada" para llamar la atención. 
Crea distintas opciones de diseño para resaltar elementos críticos, el diseñador del tablero crea equilibrio y guía al lector a cada punto que sirve al propósito visual.
Para crear un panel de control de fácil lectura, también debe tener en cuenta los conceptos básicos: asegúrese de utilizar la misma paleta de colores, tipo de fuente, colores y tamaño en toda la tablero completo. 
No debe utilizar más de un tipo de fuente y un tamaño de fuente de 2 a 4. 
Utilice métricas significativas. Asegúrese de que la audiencia esté familiarizada con las métricas, para que pueda interpretarlos correctamente dentro del contexto del tablero. Los datos también deben ser verificados para que los usuarios puedan confiar en su validez.
Planifique el mantenimiento. Ya sea que se trate de actualizaciones de datos, actualizaciones de funcionalidad o la adición de los nuevos usuarios, la planificación del mantenimiento debe informar las opciones de diseño de los datos y el tablero.Si es demasiado difícil de mantener, un tablero puede ser demasiado engorroso y no vale la pena la inversión. 
Limitar el alcance: intentar lograr demasiados objetivos en una sola vista puede llevar a la sobrecarga de información cuando hay demasiada información para que la audiencia
proceso de manera efectiva.
Gráficos apropiados.
Indicadores y medidores/velocímetros.
Indicador numérico: valor único 
Los indicadores son valores numéricos o medidores que son buenos para visualizar el rendimiento clave, indicadores (KPI) o información comercial importante. 
Los indicadores visualizan un valor único como los ingresos anuales totales de una empresa hasta la fecha y se puede complementar con un segundo valor y título que mejora los datos, como el porcentaje de un valor objetivo que se ha alcanzado o el mismo valor del año anterior. 
Indicadores que muestran KPI, debe actualizarse con la mayor frecuencia posible.
· Los indicadores se utilizan para mostrar un solo valor significativo.
· Es importante que el valor tenga suficiente contexto para ser significativo para el consumidor del tablero
· A menudo no es necesario agregar un título
Indicador numérico: dos valores
· Los indicadores se utilizan para mostrar dos valores significativos. 
· Los valores deben estar relacionados. 
· Es importante que el valor tenga suficiente contexto para que sea significativo para el consumidor del tablero. 
· A menudo, no es necesario agregar un título.
Mejores prácticas:
· Los indicadores numéricos son la visualización más fácil de leer para los KPI
· Los medidores son útiles para indicar la "salud" de un valor o ver un valor como un porcentaje de un valor objetivo.
· Mejore los indicadores con códigos de colores para indicar los KPI que son buenos, malos o que pueden requieren atención.
· Utilice widgets solo para la información más importante. El uso excesivo desordena los paneles y los hace difíciles de entender o utilizar.
Medidores
· Los indicadores se utilizan para mostrar una o dos métricas importantes.
· La métrica debe estar relacionada.
· Es importante que la métrica tenga suficiente contexto para ser significativo para el consumidor del tablero. Normalmente, podría tener sentido mostrar el indicador para mostrar un porcentaje vs un valor absoluto, ya que minimiza el esfuerzo mental requerido por parte del consumidor para interpretarlo.
· A menudo, no es necesario agregar un título. 
· Considere usar formato condicional, por ejemplo, configure el indicador para que sea del color rojo para un indicador que está por debajo del objetivo
Comparación de valores: gráficos de barras, gráficos de columnas, mapas de árboles, mapas de puntos geográficos, gráficos circulares y de anillos
Gráfico de barras
Los gráficos de barras se utilizan para comparar valores, elementos o datos. Son como columna gráficos con sus ejes invertidos: los valores se representan en el eje X horizontal,
y las categorías están en el eje Y vertical. 
Los gráficos de barras se utilizan comúnmente para comparar diferentes valores, elementos y categorías de datos. Los gráficos de barras no son generalmente usados para mostrar tendencias a lo largo del tiempo.
· Úselo para métricas en dimensiones únicas.
· Generalmente, no requiere un eje.
· Todas las barras deben ser del mismo color.
Gráfico de columnas. 
Los gráficos de columnas se pueden utilizar para comparar elementos y comparar entre
diferentes tipos de productos o marcas (categorías). 
Los gráficos pueden incluir múltiples valores en ambos ejes, así como un desglose por categorías que se muestran en el eje X horizontal. Los datos se representan gráficamente mediante barras verticales una al lado de la otra, alineadas en el eje horizontal. Cada barra representa una categoría diferente, y la altura de la barra se correlaciona con los números en el eje Y vertical.
· Úselo para métricas en dimensiones únicas.
· Considere usar un eje.
· Todas las barras deben ser del mismo color por categoría. 
Mejores prácticas:
· Cuando se muestra un solo elemento durante un período prolongado, los gráficos de líneas son mejores para tendencias reveladoras.
· Agregue un segundo conjunto de elementos para realizar una comparación en paralelo.
· Use un color único para cada valor y agregue colores adicionales a su paleta según sea necesario.
· Utilice gráficos de barras en lugar de gráficos de columnas cuando las categorías tengan nombres largos.
· Mostrar líneas y barras juntas puede brindarle diferentes vistas de los mismos datos.
Mapas de árboles
· Útil para atraer la atención hacia tamaños relativos.
· Se deben utilizar mapas de árbol en lugar de gráficos circulares donde hay más de miembros de dos dimensiones.
· Etiquete los miembros de dimensión y las métricas tanto como sea posible.
Mapas geográficos de puntos
Un mapa de puntos indica que la métrica que se muestra existe solo en un punto singular.
Este formato es mejor para números sin procesar como sumas o recuentos, o cuando los datos
representa una ubicación discreta.
· No intente mostrar tanta información que el usuario empresarial se sienta abrumado (varias métricas, etc.).
· Las regiones geográficas más pequeñas deben ser fácilmente visibles.
· En la información emergente, proporcione detalles adicionales, incluidos los nombres completos de los estados, etc.
Gráfico de torta y dona. 
· Debe usarse con moderación, si es que se usa.
· No lo utilice si hay más de seis miembros en la dimensión del gráfico circular.
· No lo utilice si el usuario empresarial va a utilizar la visualización para hacer distinciones precisas.
Series de tiempo
Gráfico de linea
· Haga un uso adecuado de las escalas de los ejes.
· Los puntos de datos deben estar claramente marcados.
Minigráficos de línea.
· Complementa los indicadores.
· Muestra tendencias en una serie de valores, como aumentos o disminuciones estacionales, ciclos económicos, o para resaltar valores máximos y mínimos.
Indicadores y medidores/velocímetros.
Detalles de indicadores individuales.
Tablas dinámicas
Las tablas dinámicas son una de las formas más útiles de simplificar, resumir y visualizar grandes cantidades de datos en una tabla u hoja de cálculo de Excel que pueden ser difíciles de entender.Por ejemplo, si tiene una tabla con los datos de origen de todos los pedidos de venta en 2017,
puede ser difícil de leer, especialmente si incluye todo lo siguiente: ID del pedido, fecha del pedido, nombre del cliente, dirección, nombre del remitente, hora y fecha de entrega, productos pedidos, cantidad, ingresos, vendedor, tipo de pago, gastos de envío, etc.
Una tabla dinámica podría brindarle información pertinente a partir de esta masa de datos, como comprender cuánto vendió cada vendedor durante el año.
· Todos los datos que deseamos ver deben estar visibles sin usar barra de desplazamiento.
· Se debe llamar la atención sobre valores significativos. En el ejemplo anterior: hay una cantidad manejable de filas.
· Utilizar formato condicional cuando sea posible.
· Usar una barra de datos para mostrar la diferencia entre registros
Mejores prácticas:
· Aumente la comprensión dividiendo los datos en subcategorías, como ventas por trimestre.
· Mejore la tabla con funciones adicionales como formato de color y barras de datos.
· Utilice formato condicional para revelar áreas de éxito o áreas que requieren seguimiento.
· Considere cómo los usuarios finales usan la tabla y prefiltre la tabla dinámica para mostrar solo el datos más importantes. 
· Utilice el color para resaltar los datos críticos y facilitar la comprensión.
Comparaciones de composición/participación 
Barra apilada al 100%
· La barra debe ordenarse con los valores más grandes en la base.
· Etiquete todos los miembros de dimensión.
Comparaciones de composición/participación - Ponderaciones de porcentajes.
Gráfico de resaltado o relieve.
· Es útil para realizar un seguimiento de los cambios en el tiempo.
· El miembro principal que nos interesa rastrear debe ser fácilmente distinguible por color.
· Si bien puede resultar tentador asignar un color diferente a cada miembro del grupo, el número de colores puede resultar confuso. Normalmente tiene más sentido usar el mismo color para todos los miembros secundarios y tener una leyenda seleccionable para destacar miembros individuales.
· Incluya nombre, rango, detalles, etc. en la información sobre herramientas.
Comparaciones de periodo tras periodo (Año tras año, mes tras mes)
Gráfico de barras doble eje.
· La ventaja de usar barras para ambos períodos de tiempo es que está muy claro que estamos mirando la misma métrica.
· Este tipo de gráfico requiere una leyenda clara.
Relaciones entre dos dimensiones o métricas
Estos gráficos son útiles para ver una sección transversal de los datos. El tipo de gráfico debe
reflejan la granularidad.
Los mapas de calor son útiles para dimensiones menos granulares.
Los gráficos de dispersión son útiles para datos más precisos.
Pueden ser útiles proporcionar múltiples opciones en los ejes, pero la lista de opciones disponibles no debe abrumar al usuario empresarial, y las posibles combinaciones deben hacer
sentido desde un punto de vista de negocio.
Gráfico de mapa de calor.
· Etiquete los valores en las celdas tanto como sea posible.
· Proporcione una leyenda para la combinación de colores.
· Proporcione datos adicionales en la información emergente.
Gráfico de dispersión y gráfico de burbujas.
Los gráficos de dispersión muestran la distribución de dos variables en un eje X y un eje Y. 
Los círculos de colores esparcidos por el gráfico representan las categorías que se comparan.
(indicado por el color del círculo). 
Los gráficos de burbujas son variantes de los gráficos de dispersión y muestran volumen numérico de los datos (indicado por el tamaño del círculo). Un gráfico de dispersión puede revelar tendencias, grupos, patrones y correlaciones entre puntos de datos.
· Resalte los puntos de datos importantes (como el uso de un icono para el miembro principal).
· Al decidir si etiquetar, considere si el número de etiquetas desordena la vista.
· El tamaño o el color del punto de datos se pueden utilizar para mostrar dimensiones adicionales.
· Proporcionar datos adicionales en la información emergente.
Mejores prácticas:
· Utilice un color único para cada conjunto de datos.
· Utilice el tamaño de los puntos y colores únicos para mostrar más información.
· Utilice las etiquetas con precaución, ya que pueden saturar el gráfico o crear ruido visual.
· Resalte los puntos de datos importantes (como el uso de un icono para el miembro principal).
Seguimiento de migración. 
Diagrama de sankey
· Normalmente se utiliza cuando se observa un proceso y nos interesa saber dónde termina.
· El ancho del flujo indica su tamaño, por lo que inmediatamente cuenta una historia.
· Proporcione detalles adicionales en información emergente.
Gráfico de embudo.
· Usado típicamente cuando miramos un proceso y estamos interesados en cómo muchos miembros superan cada etapa.
Ingresos y egresos.
Gráfico de cascada.
· Se utiliza para mostrar el efecto de varias categorías de flujos en una métrica, como contribución al beneficio de cada producto.
· Utilice colores para indicar flujos positivos y negativos.
· No restringido a valores monetarios. Útil en otras áreas como recursos humanos. Puede utilizarse para ilustrar el efecto de las contrataciones, los despidos y la jubilación en recuento.
Distribución de indicadores individuales.
Gráfico de caja y/o bigotes.
Un diagrama de cajas y bigotes es una manera conveniente de mostrar visualmente grupos de datos numéricos a través de sus cuartiles.
Aquí están los tipos de observaciones que uno puede hacer al ver un diagrama de cajas y bigotes:
· Cuáles son los valores clave, tales como: el promedio, el percentil 25 medio, etc.
· Si hay valores atípicos y cuáles son sus valores.
· Si los datos son simétricos.
· Cuán estrechamente se agrupan los datos.
· Si los datos están sesgados y si es así, en qué dirección.
· Útil para mostrar valores atípicos en la distribución de valores individuales o diferencias en distribuciones entre productos.
· Incluya un eje como referencia.
· Utilice información sobre herramientas para mostrar detalles.
Distribución de valores agrupados.
Histograma.
· Útil para distribuciones.
· Asegúrese de que la distribución cuente una historia útil.
· Proporcione detalles adicionales como información emergente. 
Frecuencia de instancias de texto.
Gráfico de nube de palabras.
· Útil para el análisis de sentimientos en las redes sociales.
· Haga un uso prudente del texto, los colores y los tamaños.
· No tiene que incluir todos los valores.
· Proporcione detalles adicionales sobre la información sobre herramientas.
Datos geográficos.
Mapa de dispersión.
Los mapas de dispersión son una variante del gráfico de dispersión y le permiten visualizar uno o dos tipos de datos geográficos como puntos de datos en un mapa. Los mapas de dispersión distinguen los datos utilizando diferentes colores y tamaños para los puntos de datos.
Mapa de areas.
Los mapas de área le permiten visualizar datos geográficos como polígonos en un mapa. Es recomendable usar sus datos para afectar el color de las áreas. Cabe destacar que estos son de cuatro dimensiones y no se puede hacer en Excel.
Mejores prácticas:
· Aumente la precisión del mapa ingresando datos geográficos precisos como ambos la ciudad y el país o las coordenadas de latitud y longitud.
· Utilice una variedad de tamaños y colores para mostrar información y métricas adicionales.
Tendencias
Gráfico de línea y gráfico de área
Los gráficos de líneas muestran números sólidos y discretos o puntos de datos a lo largo del tiempo, cada dos puntos unidos por una línea. Los gráficos de líneas le permiten visualizar fácilmente las tendencias y cambios en los datos que están indicados por picos o picos. Casi cualquier tipo de datos a lo largo del tiempo se puede visualizar con gráficos de líneas.
Gráfico de linea. 
Gráfico de area.
Los gráficos de área son muy similares a los gráficos de líneas, pero son mucho más visuales a medida que las áreas debajo de cada línea se rellenan (de color). Los gráficos de área clásicostienen áreas superpuestas mientras los gráficos de áreas apiladas no lo hacen. Se recomiendan gráficos de áreas de apilamiento para mostrar valores absolutos o relativos durante un período de tiempo.
Los gráficos de área son particularmente efectivos para visualizar diferencias o disparidades entre múltiples tendencias. Si tiene una serie de puntos de datos con múltiples tendencias, considere usar un gráfico de dispersión que muestra los puntos de datos sin las líneas de conexión.
Mejores prácticas:
· Los puntos de datos deben estar claramente marcados y conectados por líneas continuas.
· Al representar varios tipos de datos relacionados en un gráfico de una sola línea, utilice un único color para indicar cada categoría.
· No utilice más de cuatro tipos de datos en una sola línea o gráfico de áreas para minimizar el ruido visual.
· Los gráficos de áreas apiladas le permiten comparar visualmente varias tendencias a la vez.
Gráfico de área apilada.

Continuar navegando

Otros materiales