Baixe o app para aproveitar ainda mais
Prévia do material em texto
Estatística Teoria e Aplicações, 5a. edição 2008 LTC Cap 2-1 Estatística Teoria e Aplicações 5a. Edição Capítulo 2 Apresentando Dados em Tabelas e Gráficos Estatística Teoria e Aplicações, 5a. edição 2008 LTC Cap 2-2 Objetivos do Aprendizado Neste capítulo, você irá aprender: A desenvolver tabelas e gráficos para dados categóricos A desenvolver tabelas e gráficos para dados numéricos Os princípios para uma apresentação adequada de gráficos Estatística Teoria e Aplicações, 5a. edição 2008 LTC Cap 2-3 Organizando Dados Categóricos: Tabela Resumida Uma tabela resumida indica a frequência, a quantidade, ou a percentagem de itens em um conjunto de categorias de tal forma que você possa verificar diferenças entre as categorias. O que você faz nos feriados? Percentagem Fica em casa com a família 45% Viaja para visitar a família 38% Viaja sem destino 5% Procura atualizar as tarefas do trabalho 5% Outro 7% Estatística Teoria e Aplicações, 5a. edição 2008 LTC Cap 2-4 Organizando Dados Categóricos: O Gráfico de Barras Em um gráfico de barras, uma barra mostra cada uma categorias, cujo comprimento representa a quantidade, frequência ou percentagem dos valores que se posicionam em uma determinada categoria. 45% 38% 5% 5% 7% 0% 5% 10% 15% 20% 25% 30% 35% 40% 45% 50% Fica em casa com a família Viaja para visitar a família Viaja sem destino Procura atualizar as tarefas do trabalho Outro O que você faz nos feriados? Estatística Teoria e Aplicações, 5a. edição 2008 LTC Cap 2-5 Organizando Dados Categóricos: O Gráfico de Pizza O gráfico de pizza é um círculo desmembrado em fatias que representam as categorias. O tamanho de cada fatia da pizza varia de acordo com a percentagem em cada categoria. Estatística Teoria e Aplicações, 5a. edição 2008 LTC Cap 2-6 Organizando Dados Categóricos: O Diagrama de Pareto Usado para retratar dados categóricos Um gráfico de barras, onde as categorias são mostradas em ordem decrescente de freqüência Um polígono cumulativo é mostrado no mesmo gráfico Usado para separar os "poucos vitais" dos "muitos triviais" Estatística Teoria e Aplicações, 5a. edição 2008 LTC Cap 2-7 Organizando Dados Categóricos: O Diagrama de Pareto % in v e s tim e n to a c u m u la d o (lin h a d o g rá fic o ) % i n v e s ti d a e m c a d a c a te g o ri a (g rá fi c o d e b a rr a s ) 0% 10% 20% 30% 40% 50% 60% 70% 80% 90% 100% 0% 5% 10% 15% 20% 25% 30% 35% 40% 45% Stocks Bonds Savings CD Carteira de Investimento Atual Estatística Teoria e Aplicações, 5a. edição 2008 LTC Cap 2-8 Organizando Dados Numéricos: A Disposição Ordenada A disposição ordenada é uma sequência de dados, em ordem de classificação, do menor valor para o maior valor. Idade dos Estudantes Universitários Pesquisados Horário Diurno 16 17 17 18 18 18 19 19 20 20 21 22 22 25 27 32 38 42 Horário Noturno 18 18 19 19 20 21 23 28 32 33 41 45 Estatística Teoria e Aplicações, 5a. edição 2008 LTC Cap 2-9 Organizando Dados Numéricos: A Disposição Ramo e Folha A disposição ramo-e-folha organiza dados em grupos (chamados de ramos) de tal modo que os valores dentro de cada grupo (as folhas) se ramifiquem para a direita de cada linha. Ramo Folha 1 67788899 2 0012257 3 28 4 2 Idade dos Estudantes Universitários Horário Diurno Horário Noturno Ramo Folha 1 8899 2 0138 3 23 4 15 Estatística Teoria e Aplicações, 5a. edição 2008 LTC Cap 2-10 Organizando Dados Numéricos: A Distribuição de Frequência A ditribuição de frequência é uma tabela resumida, no qual os dados são ordenados em grupos de classes ordenados numericamente. Você deve ficar atento na seleção da quantidade do número de grupos de classe para a tabela, determinar uma largura adequada de cada grupo de classe, e o estabelecimneto de limites de cada grupo de classe. Para determinar a largura do intervalo de classe, você divide a amplitude (Maior valor–Menor valor) do conjunto de dados pela quantidade desejada de grupos de classe. Estatística Teoria e Aplicações, 5a. edição 2008 LTC Cap 2-11 Organizando Dados Numéricos: Exemplo da Distribuição de Frequência Exemplo: Um fabricante de isolamento seleciona aleatoriamente 20 dias de Inverno e registra a temperatura diária mais alta 24, 35, 17, 21, 24, 37, 26, 46, 58, 30, 32, 13, 12, 38, 41, 43, 44, 27, 53, 27 Estatística Teoria e Aplicações, 5a. edição 2008 LTC Cap 2-12 Organizando Dados Numéricos: Exemplo da Distribuição de Frequência Classifique os dados brutos em ordem crescente: 12, 13, 17, 21, 24, 24, 26, 27, 27, 30, 32, 35, 37, 38, 41, 43, 44, 46, 53, 58 Determine a amplitude: 58 - 12 = 46 Selecione o número de classes: 5 (usualmente entre 5 e 15) Calcule o intervalo da classe (largura): 10 (46/5 arredonda-se) Determine os limites das classes: 10, 20, 30, 40, 50, 60 Calcule o ponto médio da classe: 15, 25, 35, 45, 55 Contam-se as observações & assinalam-se as classes Estatística Teoria e Aplicações, 5a. edição 2008 LTC Cap 2-13 Organizando Dados Numéricos: Exemplo da Distribuição de Frequência Classe Frequência [10 – 20) 3 0,15 15 [20 – 30) 6 0,30 30 [30 – 40) 5 0,25 25 [40 – 50) 4 0,20 20 [50 – 60) 2 0,10 10 Total 20 1,00 100 Frequência Relativa Percentagem Estatística Teoria e Aplicações, 5a. edição 2008 LTC Cap 2-14 Organizando Dados Numéricos: O Histograma Um gráfico dos dados em uma distribuição de freqüência é chamado de histograma. Os limites das classes (ou ponto médio das classes) são mostrados no eixo horizontal. O eixo vertical pode ser mostrado como frequência, frequência relativa, ou percentagem. Barras com alturas adequadas são usadas para representar o número de observaçãoes dentro de cada classe. Estatística Teoria e Aplicações, 5a. edição 2008 LTC Cap 2-15 Organizando Dados Numéricos: O Histograma Classe Frequência [10 – 20) 3 0,15 15 [20 – 30) 6 0,30 30 [30 – 40) 5 0,25 25 [40 – 50) 4 0,20 20 [50 – 60) 2 0,10 10 Total 20 1,00 100 Frequência Relativa Percentagem 0 1 2 3 4 5 6 7 5 15 25 35 45 55 Maior F re q u ên ci a Histograma: Temperatura diária mais alta Estatística Teoria e Aplicações, 5a. edição 2008 LTC Cap 2-16 Organizando Dados Numéricos: O Histograma no Excel 1. Selecione Ferramentas/Análise de Dados Estatística Teoria e Aplicações, 5a. edição 2008 LTC Cap 2-17 Organizando Dados Numéricos: O Histograma no Excel 2. Escolha Histograma 3. Intervalo de entrada e intervalo do bloco (intervalo do bloco é um intervalo de células contendo o limite superior de cada grupo de classe) 4. Selecione Resultado do Gráfico e clique “OK” Estatística Teoria e Aplicações, 5a. edição 2008 LTC Cap 2-18 Organizando Dados Numéricos: O Polígono Um polígono de percentagens é formado fazendo-se com que o ponto médio de cadaclasse represente os dados naquela classe e, depois, interligando-se a sequência de pontos médios em suas respectivas percentagens de classe. O polígono de percentagens acumuladas, ou ogiva, exibe a variável de interesse ao longo do eixo X, e a percentagem acumulada ao longo do eixo Y. Estatística Teoria e Aplicações, 5a. edição 2008 LTC Cap 2-19 Organizando Dados Numéricos: O Polígono 0 1 2 3 4 5 6 7 5 15 25 35 45 55 Maior Fr qu ên cia Polígono de Frequência: Temperatura alta diária. Classe Frequência [10 – 20) 3 0,15 15 {20 – 30) 6 0,30 30 [30 – 40) 5 0,25 25 [40 – 50) 4 0,20 20 [50 – 60) 2 0,10 10 Total 20 1,00 100 Frequência Relativa Percentagem (No polígono de percentagem, o eixo vertical deve ser definedo para mostrar percentagem de observação por classe) Estatística Teoria e Aplicações, 5a. edição 2008 LTC Cap 2-20 Organizando Dados Numéricos: O Polígono de Percentagens Acumuladas (Ogiva) 0 20 40 60 80 100 10 20 30 40 50 60 Pe rc en ta ge m Cu m ul at iva Ogiva: Temperatura alta diária Classe Limite Inferior % Menor que o Limite Inferior 10<20 10 0 20<30 20 15 30<40 30 45 40<50 40 70 50<60 50 90 60 100 Estatística Teoria e Aplicações, 5a. edição 2008 LTC Cap 2-21 Tabulações Cruzadas: A Tabela de Contingência Uma tabela de contigência (ou tabulações cruzadas) apresenta os resultados de duas variáveis categóricas. As resposras combinadas são classificadas de tal modo que as categorias de uma variável fiquem localizadas em uma linha, enquanto que as categorias da outra variável fiquem localizadas nas colunas. A célula é a interseção entre linhas e colunas e o valor na célula representa o dado correspondente a esse emparelhamento específico das categorias. Uma maneira útil para visualizar os resultados das tabulações cruzadas é construir o gráfico das barras paralelas. Estatística Teoria e Aplicações, 5a. edição 2008 LTC Cap 2-22 Tabulações Cruzadas: A Tabela de Contingência Importância do Nome da Marca Masculino Feminino Total Maior 450 300 750 Igual ou Menor 3300 3450 6750 Total 3750 3750 7500 Uma pesquisa foi conduzida para estudar a importância do nome da marca para os consumidores e comparada com alguns anos atrás. Os resultados foram classificados pelo sexo: Estatística Teoria e Aplicações, 5a. edição 2008 LTC Cap 2-23 Tabulações Cruzadas: O Gráfico de Barras Paralelas 0 500 1000 1500 2000 2500 3000 3500 4000 Maior Menor ou igual Número de respostas Re sp on se Importância do nome da marca Mulher Homem Estatística Teoria e Aplicações, 5a. edição 2008 LTC Cap 2-24 O Gráfico de Dispersão Gráficos de dispersão são utilizados para dados numéricos e consistem de observações pareadas tomadas de duas variáveis numéricas. Uma variável medida é inserida no eixo vertical e a outra variável medida é inserida no eixo horizontal. Estatística Teoria e Aplicações, 5a. edição 2008 LTC Cap 2-25 Exemplo de Gráfico de Dispersão Volume por dia Custo diário 23 125 26 140 29 146 33 160 38 167 42 170 50 188 55 195 60 200 0 50 100 150 200 250 20 30 40 50 60 70 Cu sto po r d ia Volume por dia Custo por dia vs. Volume de produção Estatística Teoria e Aplicações, 5a. edição 2008 LTC Cap 2-26 Gráfico de Dispersão no Excel (97-2003) 1. Selecione o Assistente de gráfico 2. Selecione a opção XY(dispersão), depois clique “Proximo” 3. Quando solicitado, digite o conjunto de dados, depois clique “Próximo”. 4. Digite o Título, Rótulo dos Eixos e Legenda, depois clique “Finalizar” Estatística Teoria e Aplicações, 5a. edição 2008 LTC Cap 2-27 Séries Temporais Um gráfico de séries temporais é utilizado para estudar padrões nos valores de uma variável numérica ao longo do tempo. Cada valor é inserido no gráfico como um ponto em duas dimensões, com o período de tempo no eixo horizontal, X e a variável de interesse no eixo Y. Estatística Teoria e Aplicações, 5a. edição 2008 LTC Cap 2-28 Exemplo de Séries Temporais Atendimento (em milhões) nos EUA em parques de diversões / temáticos 2000-2005 Ano Número do Ano Atendimento (milhões de pessoas) 2000 0 317 2001 1 319 2002 2 324 2003 3 322 2004 4 328 2005 5 335 Estatística Teoria e Aplicações, 5a. edição 2008 LTC Cap 2-29 Exemplo de Séries Temporais 316 320 324 328 332 336 0 1 2 3 4 5 6 At en di m en to Ano (Desde 2000) Atendimento (em milhões) em parques temáticos - EUA Estatística Teoria e Aplicações, 5a. edição 2008 LTC Cap 2-30 Princípios dos Gráficos Excelentes O gráfico não deve distorcer os dados O gráfico não deve conter adornos desnecessários (por vezes referido como gráfico lixo). A escala no eixo vertical deve começar no zero. Todos os eixos devem ser devidamente rotulados. O gráfico deve conter um título. O gráfico mais simples possível deve ser usado para um determinado conjunto de dados. Estatística Teoria e Aplicações, 5a. edição 2008 LTC Cap 2-31 Erro no Gráfico: Gráfico Lixo 1960: $1.00 1970: $1.60 1980: $3.10 1990: $3.80 Salário Mínimo Apresentação Ruim Salário Mínimo 0 2 4 1960 1970 1980 1990 $ Apresentação Boa Estatística Teoria e Aplicações, 5a. edição 2008 LTC Cap 2-32 Erro no Gráfico: Sem Base Relativa Estudantes com conceito A. Estudantes com conceito A. Apresentação Ruim 0 200 300 FR SO JR SR Freq. 10% 30% FR SO JR SR FR = Freshmen, SO = Sophomore, JR = Junior, SR = Senior 100 20% 0% % Apresentação Boa Estatística Teoria e Aplicações, 5a. edição 2008 LTC Cap 2-33 Erro no Gráfico: Compressão do Eixo Vertical Apresentação Boa Venda Trimestral Venda Trimestral Apresentação Ruim 0 25 50 Q1 Q2 Q3 Q4 $ 0 100 200 Q1 Q2 Q3 Q4 $ Estatística Teoria e Aplicações, 5a. edição 2008 LTC Cap 2-34 Erro do Gráfico: Não mostra o Ponto Zero no Eixo Vertical Venda Mensal 36 39 42 45 J F M A M J $ Mostrando o desempenho nos seis primeiros meses de venda Venda Mensal 0 39 42 45 J F M A M J $ 36 Apresentação BoaApresentação Ruim Estatística Teoria e Aplicações, 5a. edição 2008 LTC Cap 2-35 Sumário do Capítulo Dados categóricos organizados usando a tabela resumida, gráfico de barras, gráfico de pizza e diagrama de Pareto. Dados numéricos organizados usando a disposição ordenada, disposição ramo-e-folha, distribuição de frequência, histograma, polígono e ogiva. Tabulações cruzadas de dados usando a tabela de contigência e gráfico de barras paralelas. Gráficos de dispersão e gráfico de séries temporais. Como fazer e como não fazer gráficos. Neste capítulo, temos
Compartilhar