Baixe o app para aproveitar ainda mais
Prévia do material em texto
08/08/2012 1 1 ESTATÍSTICA E PROBABILIDADE 2º/2012 ENGENHARIA AMBIENTAL ENGENHARIA DE CONTROLE E AUTOMAÇÃO rluisbarbosa@uol.com.br 2 Objetivos Aplicar as ferramentas da estatística na análise de dados Usar os métodos estatísticos para auxiliar a tomada de decisões 08/08/2012 2 3 Conteúdo Introdução Síntese de dados: gráficos Medidas de tendência central Medidas de dispersão Noções de Probabilidade Variáveis aleatórias Modelos de probabilidade Distribuição amostral Inferência estatística Introdução aos testes de hipóteses Regressão linear simples e múltipla Análise de variância 4 Avaliação Trabalhos Práticos (TP) Avaliação individual (P) Nota Bimestral (NB) = 0,8P + 0,2MTP Nota Final (NF): (NB1 + NB2)/2 MTP: média dos trabalhos práticos P1: 19/09/2012 P2: 31/10/2012 EXAME(P3): 21/11/2012 08/08/2012 3 5 Bibliografia MONTGOMERY, D. C., RUNGER, G. C. Estatística aplicada e probabilidade para engenheiros. LTC, 2009. MORETTIN, L. G. Estatística básica. Pearson, 2005. LAPPONI, J. C. Estatística usando Excel. Campus, 2005. LANDIM, P. M. B. Análise estatística de dados geológicos. Unesp, 2003. MONTGOMERY, D. C., Design and analysis of experiments. John Wiley, 2001. DEVORE, J. L. Probabilidade e estatística para engenharia e ciências. Thomson, 2006. FÁVERO, L. P. et al. Análise de dados: modelagem multivariada para tomada de decisões. Elsevier, 2009. LATTIN, J. M., CARROL, J. D., GREE, P. E. Análise de dados multivariados. Cengage Learning, 2011. 6 História da estatística MLODINOW, L. O andar do bêbado: como o acaso determina nossas vidas. Zahar, 2009. SALSBURG, D. Uma senhora toma chá: como a estatística revolucionou a a ciência no século XX. Zahar, 2009. 08/08/2012 4 7 Estatística Área da matemática que trata da coleta, classificação, organização, análise e interpretação de dados Palavra derivada do latim: status – estado Análise de dados sobre o estado 8 Classificação Estatística descritiva Inferência estatística 08/08/2012 5 9 Estatística descritiva Organização dos dados em tabelas e/ou gráficos Distribuições de frequências Medidas de tendência central Medidas de dispersão 10 Inferência estatística Distribuições de probabilidade Distribuições amostrais Intervalos de confiança Testes de hipóteses Análise de variância Análise de regressão Estatística não-paramétrica Análise de séries temporais Técnicas de controle de qualidade 08/08/2012 6 11 Descrição dos dados Variáveis Tabelas Gráficos Distribuição de frequência Medidas de tendência central Medidas de dispersão 12 Variáveis Variável é uma característica, propriedade ou atributo de uma unidade da população, cujo valor pode variar entre as unidades da população 08/08/2012 7 13 Tipos de variáveis Qualitativas ou categóricas: atributos ou qualidades, como por exemplo: sexo, cor, escolaridade, marca, tipo de defeito etc. Quantitativas ou de medidas: expressas em números: altura, peso, número de filhos, tempo de processamento etc. 14 Variáveis qualitativas Ordinais: o atributo tem uma ordenação natural, indicando intensidade crescente de realização. Ex: grau de escolaridade, classe social, intensidade do defeito, estado clínico etc. Nominais: quando o atributo não se estabelece ordem. Ex: sexo, cor etc. 08/08/2012 8 15 Quantitativas Discretas: resultantes de contagens, assumindo assim, em geral valores inteiros. Ex: número de filhos, número de peças defeituosas etc. Contínuas: assumem valores em intervalos de números reais e geralmente, são provenientes de uma mensuração. Ex: peso, altura, tempo de processamento etc.. 16 Resumo 08/08/2012 9 17 Gráficos Muitas vezes as informações contidas em tabelas podem ser melhor compreendidas se acompanhadas de um gráfico O tipo de gráfico depende da variável em questão Variáveis qualitativas: gráfico de setores/pizza, barras, diagrama de pareto Variáveis quantitativas: histograma, gráficos de linha, diagrama de dispersão 18 Gráfico de setores/pizza • Usado para representar variáveis qualitativas, quando os dados apresentam poucas características 08/08/2012 10 19 Gráfico de setores 42% 58% Pessoas que acessam internet - Brasil SIM NÃO 20 Gráfico de barras Usado com variáveis qualitativas e quantitativas discretas Várias classes de categorias 08/08/2012 11 21 Gráfico de barras 5085 5215 5685 6710 7015 6840 6879 6934 6874 7004 6944 0 1000 2000 3000 4000 5000 6000 7000 8000 2000 2001 2002 2003 2004 2005 2006 2007 2008 2009 2010 Q ua nt ita de Ano QUANTIDADE DE VAGAS DISPONÍVEIS - UNESP VAGAS 22 Diagrama de Pareto Usado em controle de qualidade É um gráfico de barras ordenado Focaliza sobre as categorias mais importantes 08/08/2012 12 23 Diagrama de Pareto 4500 3600 3500 2578 2435 0 500 1000 1500 2000 2500 3000 3500 4000 4500 5000 1 2 3 4 5 Q ua nt id ad e (u ni da de s) Produto PRODUTOS EM ESTOQUE 24 Histograma • Para variáveis quantitativas contínuas • Mostra a forma da distribuição da variável • É fundamental na aplicação dos conceitos de inferência estatística 08/08/2012 13 25 Histograma 0 5 10 15 20 25 30 750|--1000 1000|--1250 1250|--1500 1500|--1750 >1750 Q ua nt id ad e Faixa de preço Histrograma do preço de computadores 26 Gráfico de linhas • Para estudos relacionados com a variação de certa característica em função do tempo 08/08/2012 14 27 Gráfico de linha -série temporal 0 5 10 15 20 25 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 Te m pe ra tu ca (o C ) dias do mês TEMPERATURA MÉDIA DIÁRIA DA CIDADE - JULHO/2011 28 Diagrama de dispersão Análise preliminar Auxiliar na verificação de associação entre duas variáveis 08/08/2012 15 29 Diagrama de dispersão 0,8 0,9 1 1,1 1,2 1,3 1,4 1,5 1,6 80 85 90 95 100 105 Dispersão Nível de hidrocarboneto P ur ez a do o xi gê ni o (% ) 30 Tabelas de frequência Uma maneira de sintetizar Distribuição de frequências: consiste na construção de uma tabela a partir dos dados brutos em que se leva em conta a frequência com que cada observação ocorre A interpretação dos resultados pode ser auxiliada pela análise de gráficos 08/08/2012 16 31 Amostra de 100 operações de venda em um supermercado 267,80 92,86 34,33 427,93 42,35 105,89 410,73 341,22 31,81 209,03 313,82 226,26 250,91 209,11 267,88 123,91 367,58 306,93 83,39 427,49 269,06 130,57 257,23 224,81 158,75 58,07 307,21 245,41 381,38 228,89 22,88 285,11 381,86 325,11 70,46 364,26 271,30 216,47 241,32 322,69 373,85 416,81 79,48 236,36 121,76 220,57 362,28 169,49 229,22 32,85 366,84 421,32 124,76 333,13 320,81 176,11 382,41 152,28 165,09 23,29 71,30 34,11 218,02 274,82 351,56 76,71 5,75 326,95 374,00 32,97 84,32 61,51 250,05 29,05 238,34 22,28 208,63 22,58 346,53 135,19 371,74 341,88 229,03 280,35 28,95 208,63 386,98 76,03 336,97 336,65 427,65 116,76 192,99 401,90 190,86 145,30 425,86 78,93 407,59 79,34 32 Etapas Encontrar os valores máximo e o mínimo do conjunto de dados Escolher um número de subintervalos ou classes, em geral de mesma amplitude, que englobem todos os dados sem haver superposição dos intervalos Contar o número de elementos que pertencem a cada classe (freqüência absoluta) 08/08/2012 17 33 Regras práticas Número de classes entre 5 e 15 Tamanho de cada classe é escolhido como o quociente entre a amplitude (diferença entre o maior e o menor números) do conjunto e o número de classes escolhido O limite inferior e o limite superior da última classe deve ser um pouco maior que a maior observação34 Resultado Mínimo 5,75 Máximo 427,93 Amplitude 422,19 Classes 5 Ampl. Classe 84,44 Ampl. Classe 85 08/08/2012 18 35 Tabela de frequência Classes de venda Freq. Abs Fre. Rel. Freq.Abs. Acum.Freq.Rel.Acum 5,00 |----- 90,00 24 0,24 24 0,24 90,00 |----- 175,00 13 0,13 37 0,37 175,00 |----- 260,00 22 0,22 59 0,59 260,00 |----- 345,00 19 0,19 78 0,78 345,00 |----- 430,00 22 0,22 100 1 Total 100 1 36 Medidas de centralidade Média aritmética: n x x n i i 1 08/08/2012 19 37 Exemplo Os valores em reais referentes ao preço de um notebook cotado em algumas lojas da cidade foram: 2500, 2350, 2400, 2380, 2650, 2410 e 2510. Assim o preço médio cotado é calculado como: 14,2457 7 17200 7 2510...23502500 x 38 Medidas de centralidade Se os dados apresentam observações extremas, a média pode não ser a medida mais indicada para centralidade, pois sofre influência direta de observações extremas. Em uma pesquisa sobre salários de analistas ambientais observamos os seguintes valores: 1000,00; 1200,00; 1800,00; 2500,00; 2700,00; 3200,00 e 15000,00 08/08/2012 20 39 … A média é: R$ 3.914,28 Essa medida é representativa do conjunto de dados? Solução: o uso da mediana Mediana (Me) é o valor que divide a amostra ou população em duas partes iguais Para o exemplo, Me = R$ 2.500,00 40 Gráfico – Salários, média e mediana -1000 1000 3000 5000 7000 9000 11000 13000 15000 1 2 3 4 5 6 7 Funcionários R $ Salários Mediana Média 08/08/2012 21 41 Cálculo da mediana Se a quantidade de observações for ímpar: 2 1nxMe 42 Cálculo da mediana Se a quantidade de observações for par: 2 1 22 nn xx Me 08/08/2012 22 43 Moda É o valor que aparece com a maior freqüência Exemplo: A relação da idade de alunos de uma turma: 21, 20, 18, 20, 19, 21, 26, 20, 18 e 20. Moda = 20 44 Medidas de dispersão Percentis Amplitude Variância Desvio padrão 08/08/2012 23 45 Separatrizes Mediana Quartis Decis Percentis 46 Percentil %100* 1 1 n xP 1 100 *)1( Pnx 08/08/2012 24 47 Problema Grupos\Erros 1 2 3 4 5 6 7 Média 1 15 61 48 16 72 17 16 35 2 35 35 36 34 33 35 37 35 Erro x tempo 0 10 20 30 40 50 60 70 80 0 1 2 3 4 5 6 7 8 Tipo de erro Te m po (m in ) 48 Amplitude A = máximo – mínimo Grupo 1: A1 = 72 – 15 = 57 Grupo 2: A2 = 37 – 33 = 4 Dá uma idéia da dispersão Depende dos valores externos Não avalia a dispersão interna 08/08/2012 25 49 Dispersão em relação à média Tempo desvio 15 -20 61 26 48 13 16 -19 72 37 17 -18 16 -19 Soma 0 Grupo 1 Tempo desvio 35 0 35 0 36 1 34 -1 33 -2 35 0 37 2 Soma 0 Grupo 2 50 Variância 1 )( 1 2 2 n xx s n i i 08/08/2012 26 51 Variância dos grupos Tempo desvio d^2 Tempo desvio d^2 15 -20 400 35 0 0 61 26 676 35 0 0 48 13 169 36 1 1 16 -19 361 34 -1 1 72 37 1369 33 -2 4 17 -18 324 35 0 0 16 -19 361 37 2 4 Soma 0 3660 Soma 0 10 610 6 36602 s 67,1 6 102 s 52 Observações A variância é sempre positiva Se todas as observações são iguais, a variância é zero A unidade da variância é diferente da unidade das observações 08/08/2012 27 53 Desvio padrão 2ss 29,1 70,24 2 1 s s 54 Coeficiente de variação x scv
Compartilhar