Baixe o app para aproveitar ainda mais
Prévia do material em texto
PROBABILIDADE E ESTATÍSTICA Prof.ª Kellen Lima AULA 03 Apresentação de Dados em Tabelas e Gráficos Aulas baseadas no livro: Levine et al., 2011 Cap. 02 3.1 Objetivos da Aula A desenvolver tabelas e gráficos para: dados categóricos e numéricos; Sobre os princípios da apresentação adequada de gráficos. Nesta aula, vocês irão aprender: 3.2 Organizando Dados Categóricos 3.2.1 Tabela Resumida CATEGORIAS PERCENTUAL Em casa com a família 45% Viajando para visitar a família 38% Turismo 5% Colocando o trabalho em dia 5% Outros 7% Exemplo: Como você vai passar as festas de final de ano? É usada para registrar e analisar a relação entre duas ou mais variáveis, normalmente de escala nominal; Uma forma interessante de exibir resultados de tabulações cruzadas é através de gráficos de barras paralelas. 3.2.2 Tabulações Cruzadas 3.2.2.1 A Tabela de Contingência QUALIDADE DA PLACA Sem Partículas Partículas TOTAIS Perfeita 450 300 750 Defeituosa 3300 3450 6750 TOTAIS 3750 3750 7500 Os resultados de um estudo realizado como parte de um esforço para otimizar a produção em uma fábrica de semicondutores forneceram dados sobre defeitos para uma amostra de 450 placas. Abaixo, a Tabela 1 apresenta um resumo das respostas a duas perguntas: Foi encontrada alguma partícula na matriz que produziu a placa? A placa é perfeita ou defeituosa? Exemplo Tabela 1 - Condição da matriz. Exemplo Resposta Q u a n ti d a d e d e r e s p o s ta s 45% 38% 5% 5% 7% 0% 10% 20% 30% 40% 50% Em casa com a familia Viajando para visitar a familia Turismo Colocando o trabalho em dia Outras Como você vai passar as festas de final de ano? 3.2.3 Gráfico de Barras Exemplo 3.2.4 Gráfico de Pizza Exemplo 45% 38% 162° 3.2.5 O Diagrama de Pareto Exemplo: Defeitos em teclados para o período de 3 meses. DEFEITOS FREQUÊNCIA PORCENTAGEM PORCENTAGEM ACUMULADA Deformidades 1987 1987/6324=0,31=31% 31% Avarias 1039 16% 31+16=47% Marcas de pino 834 13% 60% Arranhões 442 7% 67% Pontos negros 413 7% 74% Riscos 413 7% 81% Marcas de afundamento 371 6% 87% Marcas de tinta 292 5% 92% Marcas de moldagem 275 4% 96% Manchas 258 4% 100% Total 6324 100% 3.2.6 O Diagrama de Pareto 0% 10% 20% 30% 40% 50% 60% 70% 80% 90% 100% 0% 5% 10% 15% 20% 25% 30% 35% DEFEITOS Diagrama de Pareto P o rc e n ta g e m P o rc e n ta g e m A c u m u la d a Exemplo: Defeitos em teclados para o período de 3 meses. 3.3 Organizando Dados Numéricos 3.3.1 Rol Exemplo: Pesquisa com idade de estudantes universitários. TURMA DIURNA 16 17 17 18 18 18 19 19 20 20 21 22 22 25 27 32 38 42 TURMA NOTURNA 45 41 33 32 30 29 25 24 24 23 23 22 21 20 19 19 18 18 3.3.2 Distribuição de Frequência É uma tabela resumida na qual os dados são dispostos em grupos de classe ordenados numericamente. Escolher a amplitude e os limites adequados para cada grupo de classe, assim evitando sobreposições. Para determinar a amplitude de um intervalo de classe, tem- se que dividir a amplitude (Maior valor – Menor valor) dos dados pelo n° de grupos de classes desejadas. Um fabricante de isolante térmico selecionou aleatoriamente 20 dias no inverno e registrou a temperatura máxima (em F) 24, 35, 17, 21, 24, 37, 26, 46, 58, 30, 32, 13, 12, 38, 41, 43, 44, 27, 53, 27 Exemplo 1) Reorganizar os dados em ordem crescente: 12, 13, 17, 21, 24, 24, 26, 27, 27, 30, 32, 35, 37, 38, 41, 43, 44, 46, 53, 58 2) Encontrar a amplitude a = 58 - 12 = 46 3) Estimar o n° de intervalos k = 1+3,22 log n (Sturges) ~ 5 (o resultado sempre deverá ser um número inteiro) 4) Estimar a amplitude dos intervalos h = a/k = 46/5 = 9,2 (utilizar sempre uma casa decimal) 5) Determinar os limites das classes: 12 + 9,2 = 21,2 6) Designar as classes (deve conter entre 5 e 15 grupos de classe). n=20 CLASSE FREQ. ABSOLUTA FREQ. RELATIVA PORCENTAGEM 12,0 |-- 21,2 4 4/20 = 0,2 20% 21,2 |-- 30,4 6 6/20 = 0,3 30% 30,4 |-- 39,6 4 0,2 20% 39,6 |-- 48,8 4 0,2 20% 48,8 |-- 58,0 2 0,1 10% TOTAL 20 1 100% Conclusão: Dados organizados em classes a |-- b para o intervalo de números contendo o extremo a, mas não contendo o extremo b 12, 13, 17, 21, 24, 24, 26, 27, 27, 30, 32, 35, 37, 38, 41, 43, 44, 46, 53, 58 3.3.3 Histograma É um gráfico com a distribuição de frequência; Os limites de classe (ou pontos médios de classes) são mostrados no eixo horizontal; O eixo vertical representa a frequência ou porcentagens. Exemplo: Colesterol 3.3.4 Polígono de Porcentagem É formado fazendo-se com que o ponto médio de cada classe represente os dados naquela classe; E, depois, interligando-se a sequência de pontos médios em suas respectivas porcentagens de classe. Temperatura Máxima Diária (F) P o rc e n ta g e m ( % ) Exemplo: Temperatura Máxima Diária 3.3.5 Polígono de Porcentagens Acumuladas OGIVAS Polígono de Porcentagens Acumuladas Exibe a variável de interesse ao longo do eixo X E, a percentagem acumulada ao longo do eixo Y. Temperatura Máxima Diária (F) P o rc e n ta g e m A c u m u la d a (% ) Exemplo: Temperatura Máxima Diária 3.3.6 Gráfico de Dispersão Volume por dia Custo por dia 23 125 26 140 29 146 33 160 38 167 42 170 50 188 55 195 60 200 Exemplo Volume por dia (unidades) C u s to p o r d ia ( re a is ) 3.3.7 Séries Temporais É usado para estudar padrões nos valores de uma variável numérica ao longo do tempo. Cada valor é inserido no gráfico como um ponto de duas dimensões com o período de tempo no eixo X e a variável de interesse no eixo Y. Exemplo: Distribuição anual de descargas elétricas atmosféricas nos anos de 2002 e 2003 no Paraná. 3.7 Princípios de Gráficos Excelentes O gráfico não deve distorcer os dados; O gráfico não deve conter adornos desnecessários (também conhecidos como sucata de gráficos); A escala do eixo vertical deve sempre começar no zero; Todos os eixos devem ser nomeados; Um gráfico deve conter um título; O gráfico mais simples possível deve ser utilizado para um dado conjunto de dados. 3.8 Erros Gráficos 3.8.1 Sucatas Salário Mínimo 1960: $1.00 1970: $1.60 1980: $3.10 1990: $3.80 MÁ APRESENTAÇÃO BOA APRESENTAÇÃO Estudantes com nota superior a 9,0 0 200 300 1°ano 2° ano 3°ano 4°ano F re q u ê n c ia 100 10% 30% 1°ano 2°ano 3°ano 4°ano 20% 0% P o rc e n ta g e m 3.8.2 Medidas não são relativas MÁ APRESENTAÇÃO BOA APRESENTAÇÃO Vendas Trimestrais 0 25 50 T1 T2 T3 T4 $ 0 100 200 T1 T2 T3 T4 $ 3.8.3 Eixo Vertical Comprimido MÁ APRESENTAÇÃO BOA APRESENTAÇÃO 36 39 42 45 J F M A M J $ Vendas Mensais 0 39 42 45 J F M A M J $ 36 3.8.4 Eixo vertical iniciando com o zero MÁ APRESENTAÇÃO BOA APRESENTAÇÃO Resumo da aula Como organizar dados categóricos usando tabela resumida, gráficos de barras, de pizza e o digarama de Pareto; Como organizar dados numéricos usando rol, distribuição de frequências, histograma, polígono de frequência e ogiva; Como examinar tabulações cruzadas usando tabela de contigência e gráficos de barras paralelas; Como utilizar gráfico de dispersão e gráfico de séries temporais; Procedimentos adequados para ter gráficos com boa apresentação. Nesta aula vimos: • Classifique os tipos de gráficos: EXERCÍCIO 01 (a) (b) (c) (d) EXERCÍCIO 02 As investigações de resistência de materiais fornecem um campo fértil para a aplicação de métodos estatísticos. Um artigo relatou um estudo de propriedades de resistência de concreto de alto desempenho obtidas pela utilização de superplásticos e determinadosadesivos. A partir dos dados mostrados na tabela abaixo; a) Determine a DISTRIBUIÇÃO DE FREQUÊNCIAS (frequências absoluta e relativa, porcentagem e porcentagem acumulada). b) Construa um gráfico de OGIVA. 5,8 6,1 6,6 7,0 7,1 7,2 7,4 7,8 7,8 8,1 8,3 8,3 8,5 8,9 9,2 9,7 9,8 11,2 12,6 14,1 GABARITO 5) Determinar os limites das classes = 5,8+1,7=7,5 4) Estimar a amplitude dos intervalos ~ 1,7 3) Estimar o n° de intervalos = 5 2) Calcular a amplitude = 8,3 1) Organizar os dados de maneira crescente; EXERCÍCIO 02: EXERCÍCIO 01: a) Pizza; b) Histograma; c) Dispersão d) Série temporal CLASSES FREQUÊNCIA ABSOLUTA FREQUENCIA RELATIVA PORCENTAGEM PORCENTAGEM ACUMULADA 5,8 - 7,5 7 0,35 35% 35% 7,5 - 9,2 7 0,35 35% 70% 9,2 - 10,9 10,9 - 12,6 12,6 - 14,3 100% TOTAL 20 1 100%
Compartilhar