Buscar

Representação gráfica

Prévia do material em texto

Representação gráfica 
· Busca padrões e relações
· Confirma (ou não) certas expectativas que tinha sobre os dados e suposições sobre os procedimentos estatísticos usados
· Descobre novos fenômenos 
· Apresenta resultados de modo mais rápido e fácil
· Devem ser autossuficientes
O tipo do gráfico irá cariar conforme o tipo de variável:
Variável qualitativa: 
Gráfico de barras: variável qualitativa ou (quantitativa discreta). Eixo x: categorias e eixo y: frequências (absoluta ou relativa ou percentual). Variações: gráfico de barras horizontais.
Gráfico de setores ou pizza: variável nominal desde que o numero de categorias seja pequeno, cada fatia corresponde a porcentagem de ocorrência em cada categoria de resposta. Variações: gráfico de pizza 3D ou rosca.
Variável quantitativa:
Gráfico de barras: variável discreta e com poucas possibilidades de resultados
Gráfico de dispersão: para avaliar duas variáveis quantitativas simultaneamente (x e y), pode ter uma correlação positiva ou negativa ou não ter correlação. 
Gráfico de series: usado para avaliar o padrão e o comportamento dos dados ao longo do tempo. Eixo x: variável continua (expressa em tempo) e eixo y: frequências. 
Histograma: gráfico de barras contiguas (juntas) as bases proporcionais aos intervalos de classes e área de cada retângulo proporcional a respectiva frequência. Área sob a curta é 100% e é preciso categoriza-la 
Boxplot: da ideia de posição, dispersão, assimetria e dados discrepantes, pode ser simétrica ou assimétrica.
Mapas: usado para exibir dados geográficos por valor ou categoria.
Boxplot: da ideia de posição, dispersão, assimetria e dados discrepantes, pode ser simétrica ou assimétrica.
Valores discrepantes: passam do limite superior (formula: LS=q3+(1,5)dq, sendo dq=d3-d1) ou inferior (formula: LI=q1-(1,5)dq). Os valores compreendidos entre dois limites são chamados valores adjacentes. 
· Posição: Em relação à posição dos dados, observa-se a linha central do retângulo (a mediana ou segundo quartil).
· Dispersão: A dispersão dos dados pode ser representada pelo intervalo interquatilico que é a diferença entre o terceiro quartil e o primeiro quartil (tamanho da caixa), ou ainda pela amplitude que é calculada da seguinte maneira: valor máximo – valor mínimo. Embora a amplitude seja de fácil entendimento, o intervalo interqualitico é uma estatística mais robusta para medir variabilidade uma vez que não sofre influência de outliers.
· Simetria: Um conjunto de dados que tem uma distribuição simétrica, terá a linha da mediana no centro do retângulo. Quando a linha da mediana está próxima ao primeiro quartil, os dados são assimétricos positivos e quando a posição da linha da mediana é próxima ao terceiro quartil, os dados são assimétricos negativos. Vale ressaltar que a mediana é a medida de tendência central mais indicada quando os dados possuem distribuição assimétrica, uma vez que a média aritmética é influenciada pelos valores extremos.
· Caudas: As linhas que vão do retângulo até aos outliers podem fornecer o comprimento das caudas da distribuição.
· Outliers: Já os outliers indicam possíveis valores discrepantes. No boxplot, as observações são consideradas outliers quando estão abaixo ou acima do limite de detecção de outliers.

Continue navegando