Buscar

AS2- Apresentação dos dados descritivos

Prévia do material em texto

1) Tabelas 
- Apresentação ordenada de dados em colunas e linhas no sentido de sintetizar os 
resultados de um experimento 
- São mais informativas quando não forem complexas 
- As unidades de medidas devem sempre ser especificadas 
- Componentes: 
 1. Título: Deve anteceder a tabela. Deve-se colocar todas as informações para que o 
leitor tenha consciência da natureza dos dados apresentados 
 2. Legenda: Deve estar abaixo das tabelas, explicando todas as abreviações utilizadas 
na tabela, e o teste estatístico utilizado 
 3. A escolha do tipo de tabela está relacionada com os tipos de variáveis analisadas 
- Exemplo de tabelas com dados estatísticos: 
 
3) Gráficos 
- Forma de apresentação de dados que permite uma leitura rápida e global de um fenômeno 
estudado 
- Devem ser claramente rotulados e com as unidades de medidas indicadas 
1. Gráfico de barras 
 • A cada valor da variável temos uma barra com altura correspondendo à sua frequência 
ou porcentagem 
Apresentação dos dados descritivos 
 • É um gráfico que se adapta bem às variáveis discretas ou qualitativas ordinais ou 
nominais com muitas categorias 
 
 
 
 
 
 
 2. Gráfico de setores (gráfico de pizza) 
 • Consiste num círculo dividido em setores correspondentes às porcentagens ou 
frequências das variáveis representadas 
 • É indicado para representar variáveis qualitativas nominais com poucas categorias 
 
 
3. Histograma 
- É um gráfico de distribuição de frequências em barras justapostas com bases que são 
faixas de valores da variável e cuja área é igual a frequência relativa da respectiva faixa 
- É indicado para variável qualitativa contínua ou discreta 
- Importante indicador da distribuição dos dados → Indica, por exemplo, se os dados 
seguem uma distribuição normal 
 
• Histograma x gráfico de barras: 
 - No gráfico de barras, as barras são 
separadas, no histograma as barras são 
justapostas, sem espaços entre uma barra e 
outra. 
4. Polígonos de frequência 
- É um gráfico de distribuição de frequências que usa dois eixos como o histograma. É 
construído ao se colocar um ponto no centro de cada um dos intervalos de tal forma que a 
altura do ponto seja igual à frequência relativa do intervalo 
- No eixo horizontal são colocados pontos nos valores médios de cada intervalo 
- Os pontos verticais são conectados por uma linha 
- A frequência de observações para um determinado intervalo é representada pela 
área dentro dele 
 
5. Gráfico de pontos 
- Consiste em representar dados por pontos ao longo de uma reta provida de escala 
- Valores repetidos são empilhados um em cima do outro 
 
 
6. Boxplot 
- É um gráfico no formato de “caixa”, cujos limites são primeiro quartil e o terceiro quartil. 
A mediana é representada por um traço no interior da caixa 
- Os segmentos de reta são as observações mais extremas do conjunto de dados que não 
estão a mais de 1,5 vez a altura da caixa além dos quartis 
- As observações discrepantes são marcadas por uma bolinha, o número indicado 
sobescrito à bolinha representa a linha do item na planilha com os dados de origem. 
- Este gráfico fornece informações sobre posição, dispersão, assimetria, caudas e a 
presença de dados discrepantes, sejam atípicos ou outliers (3 ou mais DP da média) 
 
 
 
7. Ramo-e-folhas 
- Consiste me representar dados separando cada valor em duas partes: o ramo e a folha 
(este último, localizada à direita do ramo) 
- É necessário especificar quais serão os ramos e quais serão as folhas. Geralmente, a 
folha contém o último digito do número e o ramo os outros dígitos 
 
8. Dispersão bidimensional 
- É usado para mostrar a relação entre duas medidas contínuas distintas 
- Cada um dos pontos no gráfico representa um par de valores (as quantidades do eixo 
horizontal e do eixo vertical) de um indivíduo da amostra 
 
9. Gráfico de linhas 
- Ilustra a relação entre unidades contínuas, e cada ponto representa um par de valores 
- Neste caso, o valor do eixo x (horizontal) tem uma única medida correspondente no eixo 
y (vertical) 
- Pontos adjacentes são conectados por linhas 
- Normalmente a escala do eixo x representa o tempo 
 
 
 
 
 
 
4) Preparação de banco de dados 
1. Coleta de dados 
2. Construção do banco de dados 
 • Variáveis (colunas) 
 • Informações de cada indivíduo (linhas) 
 • Primeira coluna (identificação do sujeito)→ Geralmente identificado por número 
- Muitas variáveis → cores diferentes 
- Entrada dos dados: Excel 
- Conferência dos dados 
 
- Codificação: 
 • Variáveis categóricas (presente -1, ausente 0) 
 • Variáveis contínuas (dados originais) 
 
- Dados faltantes (missings) 
 • Entre com um valor facilmente identificado 
 - 9 ou 99→ se este valor não for uma resposta possível 
 - Minitab o símbolo é asterisco 
 - Interferem na análise estatística dos dados 
 
- Arredondamento: 
 • Usar sempre o mesmo número de casas decimais 
 • Não arredondar um mesmo número mais de uma vez 
 
- Observações atípicas (outliers) 
 • Erro na elaboração do banco de dados 
 - Anotação ou transcrição incorreta 
 - Erro na medição 
 • Características da variável estudada 
 • Como detectar? 
 - Boxplot ou outro gráfico 
 - Observação se o valor está dentro da faixa de dados esperado 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
5) Testes de normalidade 
- São usados para determinar se um conjunto de dados é bem modelado por uma 
distribuição normal 
 • Técnica gráfica 
 • Teste de Kolmogorov-Smirnov 
 • Teste de Anderson-Darling 
 • Teste de Shapiro-Wilk 
 
1. Teste de Kolmogorov-Smirnov 
 
2. Teste de Shapiro-Wilk 
 
3. Teste de Anderson-Darling 
 
 
 
 
 
 
 
 
 
 
 
- Exemplos: 
 
- Aceita a hipótese alternativa (H1) e rejeita a hipótese nula 
- Quando o valor dá no limite de referência (5%), utiliza-se a comparação com outros 
testes

Continue navegando