Buscar

Codificação visual cores, formas, tamanhos e escala com Seaborn



Continue navegando


Prévia do material em texto

Segundo Tufte, podem-se classificar os elementos visuais de um gráfico em duas categorias: os que têm valor informativo e os meramente decorativos. Tufte propõe uma forma de medir a relação existente entre essas duas categorias de elementos por meio do cálculo do data-ink ratio do gráfico.
Observe a visualização de dados a seguir e escolha a alternativa que propõe uma medida que aumentará o data-ink ratio desse gráfico.
C. 
Remover os efeitos 3D do gráfico.
Para aumentar o data-ink ratio, é necessário remover os elementos que não trazem nenhum ganho de informação ao gráfico. Dentre as alternativas citadas, a remoção dos efeitos 3D é a única que não causará perda nas informações contidas no gráfico. As demais alternativas têm valor informativo. Por isso, se removidas, ocasionarão perda de informação.
2. 
Os gráficos de dispersão produzidos pela biblioteca Seaborn permitem que se modifiquem diversos elementos como cores, formas e tamanhos. Ao personalizar esses elementos do gráfico, podem-se adicionar novas camadas de dados à visualização, ou seja, esse tipo de gráfico pode ser utilizado para realizar três ou mais variáveis ao mesmo tempo ao invés de somente duas.
Considere a base de dados Iris, que é um dataset padrão da biblioteca Seaborn e pode ser carregado em um dataframe com o seguinte comando: iris = sns.load_dataset("iris").
Qual dos comandos a seguir criará um gráfico de dispersão que relaciona as variáveis sepal_length e sepal_width, colorindo os dados segundo a variável categórica species e regulando o tamanho dos marcadores do gráfico de acordo com a 
E. 
sns.scatterplot(x="sepal_length", y="sepal_width", data=iris, hue="species", size="petal_width")
Para que os dados sejam coloridos segundo a variável species, é preciso configurar a propriedade hue="species" e, para alterar o tamanho dos marcadores de acordo com a variável petal_width, deve-se ajustar a propriedade size="petal_width". Portanto, a resposta correta, que atende a essas duas propriedades, é sns.scatterplot(x="sepal_length", y="sepal_width", data=iris, hue="species", size="petal_width"). Todas as demais têm algum erro no ajuste de alguma dessas propriedades.
3. 
Visualizações de dados efetivas devem contribuir para que o leitor de um gráfico compreenda claramente qual a mensagem que está sendo transmitida por aquela visualização. Além da clareza, é necessário prezar pela verdade ao se elaborar um gráfico, evitando induzir o leitor a ter conclusões errôneas a respeito dos dados que estão sendo expostos.
Qual das práticas contribui para aumentar a efetividade de uma visualização de dados?
B. 
Preservar a ordem temporal dos dados da visualização.
A ordem temporal deve ser mantida. Caso contrário, a interpretação do gráfico torna-se difícil e pode induzir o leitor a erro. A utilização de cores sem um propósito claro e de elementos decorativos desnecessários não melhora a qualidade de uma visualização. A escolha do gráfico não deve ser meramente estética e sua função principal é contribuir para a análise de dados. 
4. 
Produzir visualizações de dados efetivas envolve saber transmitir uma mensagem por meio do gráfico. A maneira mais simples de fazer isso é simplesmente dar destaque à informação mais importante presente naquela visualização.
Analise os gráficos de linha a seguir, criados sobre os mesmos dados e cujo objetivo seja ressaltar os valores da linha “Referral”. Escolha a alternativa que consegue destacar melhor essa linha do gráfico e que, ao mesmo tempo, respeite o princípio de minimizar o chart junk da visualização.
D. 
A alternativa em que a linha "Referral" é ressaltada com uma cor diferente das demais é a resposta correta, pois ela destaca a informação desejada, enquanto não adiciona nenhum elemento novo ao gráfico. As alternativas destacando a linha com uma seta, com um círculo e com quadrados acrescentam mais elementos ao gráfico, enquanto a alternativa que mostra apenas a linha "Referral"  remove elementos informativos da visualização.
As bibliotecas Seaborn e Matplotlib permitem que os diversos elementos de um gráfico sejam personalizados. Na maioria das vezes, essa personalização é feita ao se invocar o construtor do gráfico desejado. É possível alterar, entre outras coisas, cores, formas, tamanhos e escalas dos elementos informativos de um gráfico.
Considere a base de dados Iris, que é um dataset padrão da biblioteca Seaborn e pode ser carregado em um dataframe com o seguinte comando: iris = sns.load_dataset("iris").
Selecione o trecho de código que, quando executado, foi responsável por produzir o gráfico a seguir:
A. 
sns.scatterplot(x="sepal_length", y="sepal_width", data=iris, color = 'red', marker='+')
Para que o gráfico tenha essa formatação, foi necessário configurar sua cor para vermelho (atributo color = 'red') e os marcadores do gráfico para o símbolo de + (atributo marker='+'). Logo, sns.scatterplot(x="sepal_length", y="sepal_width", data=iris, color = 'red', marker='+') satisfaz os dois requisitos.
Em sns.scatterplot(x="sepal_length", y="sepal_width", data=iris, palette= 'red', hue="species", marker='+'), há um erro na configuração da cor do gráfico (foi feito por meio da propriedade pallette ao invés de color).
Nas outras alternativas, há a adição da propriedade hue, que fará com que os datapoints não sejam coloridos com a cor vermelha.
Em sns.scatterplot(x="sepal_length", y="sepal_width", data=iris, hue="species", size='+') também tem um erro na configuração dos marcadores (foi utilizada a propriedade size ao invés de marker).
Por fim, em sns.scatterplot(x="sepal_length", y="sepal_width", data=iris, color = 'red', marker="species"), o parâmetro informado na propriedade marker está incorreto.
image1.png
image2.png
image3.png