Baixe o app para aproveitar ainda mais
Prévia do material em texto
S Estatística Descritiva Descrição de dados: representação gráfica de dados. Démerson André Polli Departamento de Estatística – UnB Introdução S Existem os mais variados tipos de gráficos que podem ser usados para resumir variáveis aleatórias. Dentre os tipos mais comuns destacam-se o gráfico de colunas (ou de barras), o gráfico de setores (ou de pizza), o gráfico de linhas, o diagrama de dispersão e o gráfico do tipo bolha. Estes dois últimos destinados a apresentar variáveis quantitativas e os três primeiros destinados a apresentar a relação entre variáveis quantitativas e qualitativas. Introdução S Alguns formatos gráficos mais especializados para o uso em análise estatística de dados são o histograma (uma variação do gráfico de colunas para variáveis quantitativas), o polígono de frequências e o boxplot. Gráfico de colunas (ou barras) S O gráfico de colunas é uma representação gráfica de uma frequência, geralmente associada à variáveis qualitativas, por colunas verticais cuja altura é proporcional às frequências observadas. Se tal gráfico for representado na posição horizontal este gráfico será chamado de gráfico de barras. Não confunda gráfico de barras com código de barras. Gráfico de colunas (ou barras) Gráfico de barras 0 2 4 6 Categoria A Categoria B Categoria C Categoria D Grupo 3 Grupo 2 Grupo 1 Código de barras Gráfico de colunas (ou barras) S É uma representação gráfica da tabela de frequências; S Cada valor da variável aleatória qualitativa é representada por um retângulo; S A frequência é representada pela altura do retângulo; S A largura do retângulo não tem significado algum; S É possível comparar grupos, apresentando os retângulos lado a lado em cores distintas. Gráfico de colunas (ou barras) O gráfico ao lado mostra a frequência de uma variável qualitativa com 3 classes. 0,0 1,0 2,0 3,0 4,0 5,0 A B C Gráfico de colunas (ou barras) O gráfico ao lado mostra a comparação da frequência de uma variável qualitativa em 3 classes entre 3 grupos. 0,0 1,0 2,0 3,0 4,0 5,0 A B C Grupo 1 Grupo 2 Grupo 3 Gráfico de setores (ou pizza) S O gráfico de setores é uma representação gráfica da proporção de cada classe em uma variável qualitativas. É comum a representação do setor de maior representação separado do gráfico, para destaque. Gráfico de setores (ou pizza) S É uma representação gráfica das proporções de cada classe em uma variável qualitativa; S Cada classe da variável aleatória qualitativa é representada por um arco de circunferência com ângulo proporcional à proporção de tal classe; S Não é um gráfico adequado para comparação entre grupos. Gráfico de setores (ou pizza) O gráfico ao lado mostra a proporção das vendas de um produto X em 4 lojas distintas. Vendas do produto X Loja A Loja B Loja C Loja D Gráfico de setores (ou pizza) O gráfico ao lado mostra novamente a proporção das vendas de um produto X em 4 lojas distintas, mas com o destaque para a loja de maior volume de vendas. Vendas do produto X Loja A Loja B Loja C Loja D Gráfico de linhas S O gráfico de linhas é uma representação gráfica de uma variável quantitativa, comparando até duas outras variáveis qualitativas. No eixo horizontal são representados as classes de uma variável qualitativa enquanto que no eixo vertical é representada a variável quantitativa. Se houver mais que dois grupos para comparação os mesmos são representados em cada linha no gráfico. Gráfico de linhas S É uma representação gráfica de uma variável quantitativa explicada por uma variável qualitativa. S Cada valor associado a cada nível da variável qualitativa é representada como um ponto do gráfico; S É possível representar diversos grupos, um em cada linha do gráfico. S Se a variável quantitativa for uma média, o gráfico é chamado de perfil de médias. S Permite estudar a evolução de uma variável quantitativa por nível da variável qualitativa ordinal. Gráfico de linhas O gráfico ao lado os valores de uma variável quantitativa, para cada um dos valores A, B, C e D de uma variável qualitativa. Estão representados 3 grupos (G1, G2 e G3). 0 1 2 3 4 5 6 A B C D G1 G2 G3 Diagrama de Dispersão S O diagrama de dispersão é uma representação gráfica de duas variáveis quantitativas. Tal diagrama permite identificar relações entre estas variáveis, com o objetivo de ajustar modelos estatísticos. Diagrama de dispersão S É uma representação gráfica de duas variáveis quantitativas. S Cada variável é representada em um eixo, e os pares de valores são representados por um ponto. S Em geral, no eixo vertical, é representada a variável que se deseja explicar em função daquela no eixo horizontal. S Permite identificar relações entre as variáveis. Diagrama de Dispersão O gráfico ao lado mostra duas variáveis com relação linear identificada pela reta y = 99,408 – 4,912 x. y = -4,9123x + 99,408 R² = 0,9895 0 10 20 30 40 50 60 70 80 0 10 20 Diagrama de Dispersão O gráfico ao lado mostra duas variáveis com relação quadrática identificada pela parábola y = 1,0503 x1,9789. y = 1,0503x1,9789 0 100 200 300 400 500 600 700 0 10 20 30 Gráfico de Bolhas S O gráfico de bolhas é uma representação gráfica bidimensional de três variáveis quantitativas. É muito usado para mostrar a evolução das variáveis de acordo com uma quarta variável (geralmente o tempo). Gráfico de bolhas S É uma representação gráfica de três variáveis quantitativas. S Uma das variáveis é representada no eixo horizontal, a outra no eixo vertical e a terceira no tamanho das bolhas. S Permite representar uma quarta variável através de uma animação. S É bastante útil para representar a evolução das variáveis no tempo. Gráfico de bolhas O gráfico ao lado mostra a cotação da ação PETR4 no eixo horizontal, da ação VALE3 no eixo vertical e a razão entre as duas cotações no tamanho da bolha. 29,50 30,00 30,50 31,00 31,50 32,00 32,50 33,00 33,50 34,00 34,50 35,00 16,50 17,00 17,50 18,00 18,50 19,00 19,50 Histograma S O histograma é uma representação gráfica da distribuição de uma variável quantitativa contínua. É muito usado em análises de dados para se identificar qual a distribuição da variável em questão. É semelhante ao gráfico de colunas, mas com as barras “coladas” para representar a continuidade dos valores da variável aleatória. Histograma S É uma representação gráfica da distribuição de variáveis quantitativas contínuas. S No eixo horizontal são representados os intervalos de valores possíveis da variável aleatória; e no eixo vertical a frequência (ou proporção) de cada um dos intervalos. S A figura formada pelo gráfico permite ao analista de dados observar qual a distribuição empírica dos dados; S Permite identificar a distribuição teórica dos dados, por comparação com formatos conhecidos. Histograma
Compartilhar