Baixe o app para aproveitar ainda mais
Prévia do material em texto
Unidade II ESTATÍSTICAAPLICADAESTATÍSTICA APLICADA Prof. Mauricio Fanno AmostragemAmostragem Amostra é um subconjunto finito da população. Quando pesquisamos toda a população, temos um censo. Quando pesquisamos parte da população, temos uma pesquisa por amostragem. Amostragem, fundamentalmente, é o processo de colher amostras, estudá-las, determinando suas medidas estatísticas e, com base nesse estudo, induzir osestatísticas e, com base nesse estudo, induzir os parâmetros populacionais. EstimaçãoEstimação Uma grandeza calculada com base em uma amostra é chamada de estatística. Essa mesma grandeza, calculada sobre toda a população, é um parâmetro. O processo de estimação consiste em calcular estatísticas em O processo de estimação consiste em calcular estatísticas em uma amostra para estimar os parâmetros populacionais correspondentes. Essa estimação sempre estará sujeita a um erro ou a uma margem de erro. Quanto maior for a amostra, menor será a margem de erro. Estatísticas e parâmetrosEstatísticas e parâmetros Duas grandezas são particularmente importantes nesse processo de inferência: a média aritmética e o desvio padrão. A média aritmética da amostra é indicada por , enquanto a média da população será indicada por . O desvio padrão da amostra será indicado por S x O desvio padrão da amostra será indicado por S, enquanto o desvio padrão da população será indicado por . A média da amostra é um estimadorA média da amostra é um estimador imparcial e eficiente da média populacional. Distribuição amostralDistribuição amostral Admita que vamos retirar de uma população todas as amostras possíveis de tamanho N. Para cada amostra, vamos calcular a sua média aritmética. Temos, então, uma distribuição amostral das médias. A média aritmética da distribuição amostral das médias é igual à média da população. Distribuição amostral - exemploDistribuição amostral - exemplo Já o desvio padrão da distribuição amostral das médias é dado por: Nx Exemplo 1: Sabemos que a altura média de 5.000 estudantes do sexo masculino é de 1,728 m com desvio padrão de 0,067 m. Desse grupo, retiramos 100 amostras de 300,067 m. Desse grupo, retiramos 100 amostras de 30 estudantes cada uma, com reposição. Qual é a média da distribuição amostral das médias e qual é o desvio padrão da distrib ição amostral das médias?distribuição amostral das médias? SoluçãoSolução A média da distribuição amostral das médias é igual à média da população, ou seja, 1,728 m. O desvio padrão da distribuição amostral das médias será: 067,0 012,0 30 067,0 x Obs.: embora não estejamos considerando todas as amostras possíveis, o número de amostras é elevado, o que torna o resultado confiável.o resultado confiável. População finitaPopulação finita Para populações finitas e amostragens sem reposição, o cálculo do desvio padrão tem de conter um fator de correção: 1 px N NN N Sendo Np o número de elementos da população e N o número de elementos da amostra 1pNN de elementos da amostra. O desvio padrão da distribuição amostral de uma grandeza estatística é frequentemente denominadoestatística é frequentemente denominado seu erro padrão. Exemplo 2Exemplo 2 Uma empresa com 4.000 funcionários paga um salário médio de R$ 1.500,00 com desvio padrão de R$ 300,00. Foram obtidas 80 amostras de 30 funcionários e verificados os seusobtidas 80 amostras de 30 funcionários e verificados os seus salários. Calcule a média da distribuição amostral das médias e o desvio padrão da distribuição amostral das médias, sabendo que as amostras foram obtidas sem reposição. Solução: a média da distribuição amostral das médias é igual à édi d l ã j R$ 1 500 00média da população, ou seja, R$ 1.500,00. Exemplo 2Exemplo 2 O desvio padrão da distribuição amostral das médias será dado por: 300004300 23,5499,077,54 1000.4 30000.4 30 300 x Observe que usamos o fator de correção do desvio padrão para amostras sem reposição. RespostaResposta c) 15 A média da distribuição amostral das médias é igual à média da população, logo: 1575212014128 15 55x Distribuição amostral de proporçõesDistribuição amostral de proporções Admita-se que uma população é infinita e que a probabilidade da ocorrência de um evento (sucesso) é p, enquanto a de sua não ocorrência é q (q = 1 p)não ocorrência é q (q = 1 – p). Considerem-se todas as amostras possíveis de tamanho N extraídas de uma população e, para cada amostra,extraídas de uma população e, para cada amostra, determinemos a proporção P de sucessos. Então, obtém-se uma distribuição amostral das proporções, cuja média e desvio padrão são dados por: Distribuição amostral de proporçõesDistribuição amostral de proporções Média: p = N.p Desvio Padrão: N qp p . Essas equações são válidas para populações infinitas N e para populações finitas, cuja amostragem seja tomada com reposição. Para populações finitas e amostragem sem reposição temos Para populações finitas e amostragem sem reposição, temos um fator de correção igual ao visto para distribuição amostral das médias. Exemplo 1Exemplo 1 Considere a população constituída de todos os resultados possíveis do lançamento de um dado. A probabilidade de ocorrência do evento ‘número 3’ é dada por p = 1/6 e aocorrência do evento ‘número 3’ é dada por p = 1/6 e a probabilidade de sua não ocorrência é dada por q = 5/6. Quantas ocorrências do número 3 são esperadas em 120Quantas ocorrências do número 3 são esperadas em 120 lançamentos? Solução: p = N.p = 120.1/6 = 20 ocorrências 034,000116,0 120 1389,0 120 6 5 6 1 p 120120p Distribuição normalDistribuição normal Note-se que, se o tamanho da amostra N for suficientemente grande, as distribuições amostrais serão normais ou aproximadamente normaisaproximadamente normais. Note-se também que a população é distribuída binomialmente. Por essa razão os métodos são conhecidos como métodos Por essa razão, os métodos são conhecidos como métodos das grandes amostras. Para ajustar a distribuição binomial à normal, usamos um fatorPara ajustar a distribuição binomial à normal, usamos um fator de correção: fc = ½.N Exemplo 2Exemplo 2 Em determinado processo produtivo, 4% dos itens produzidos são defeituosos. Em dado momento, retira-se da produção 500 itens produzidositens produzidos. a) Qual é a média da distribuição amostral dessa proporção? b) Qual é o desvio padrão dessa distribuição amostralb) Qual é o desvio padrão dessa distribuição amostral das proporções? c) Qual é a probabilidade de que desses 500 itensc) Qual é a probabilidade de que desses 500 itens inspecionados 3% ou mais sejam defeituosos? Exemplo 2Exemplo 2 Solução: a) p = 500.0,04 = 20, que é 4% da amostrap b) Desvio padrão: 009,096,004,0 c) Para esse cálculo, precisamos inserir o fator de correção 009,0 500p para variáveis discretas: 00101 f 001,0 5002 cf Exemplo 2Exemplo 2 Agora fazemos o cálculo da mesma forma que o fizemos quando estudamos a distribuição normal: 22,1 009,0 011,0 009,0 04,0001,003,0 S xxz i Na tabela da curva normal, esse valor corresponde a 11,12%. Como a pergunta é 3% ou mais, vamos subtrair o resultado de 100%:100%: P = 100,00%-11,12%= 88,88% Exemplo 2Exemplo 2 Distribuição amostral das diferençasDistribuição amostral das diferenças Dadas duas populações, das quais são retiradas amostras de NA da população A e NB elementos da população B, a distribuição amostral das diferenças (dasmédias ou dasdistribuição amostral das diferenças (das médias ou das proporções) é caracterizada pela diferença dos valores centrais e pela raiz quadrada da soma dos quadrados dos desvios padrões, dividida pelo tamanho da amostra: BABA xxxx BABA xx BA 22 BA xx NNBA Exemplo 3Exemplo 3 Os amortecedores do fabricante A rodam, em média, 65.000 km, com desvio padrão de 4.500 km, normalmente distribuídos Já os amortecedores do fabricante B duram emdistribuídos. Já os amortecedores do fabricante B duram, em média, 60.000 km, com desvio padrão de 3.500 km. Suponha que foram testados 36 amortecedores da marca A e 49 amortecedores da marca B. Calcule a média e o desvio padrão da distribuição amostral da diferença entre as vidas úteis. SoluçãoSolução A média das diferenças é: 000.5000.60000.65 BA xx O desvio padrão é: 4901500.3500.4 2222 xx BA 4,901 4936 BA xx NN BA BA InteratividadeInteratividade Em um lote de 1.000 peças, sabe-se que 40 são defeituosas. Retirando-se uma amostra de 50 peças, espera-se que a quantidade de peças defeituosas seja igual a:quantidade de peças defeituosas seja igual a: a) 2 b) 3b) 3 c) 4 d) 5d) 5 e) mais de 5 Teoria estatística da estimaçãoTeoria estatística da estimação Um problema importante da inferência estatística é a estimação de parâmetros populacionais, ou simplesmente parâmetros tais como a média a variância etc deduzidosparâmetros, tais como a média, a variância etc., deduzidos da estatística amostral correspondente. A estimativa de um parâmetro populacional, dada porA estimativa de um parâmetro populacional, dada por um número único, é denominada estimativa por pontos. A estimativa de um parâmetro populacional, dada por dois ú t i d id l t jnúmeros, entre os quais pode-se considerar que ele esteja situado, é denominada estimativa por intervalos. Teoria estatística da estimaçãoTeoria estatística da estimação As estimativas por intervalos indicam sua precisão ou exatidão e são, portanto, preferíveis às estimativas por pontos A declaração do erro ou precisão de uma estimativa épontos. A declaração do erro ou precisão de uma estimativa é denominada sua fidedignidade. Exemplo: Dizendo-se que uma grandeza tem sua medida dadaExemplo: Dizendo se que uma grandeza tem sua medida dada por 5,28 m está se apresentando uma estimativa por pontos. Se disser que a grandeza mede 5,28 0,03 m, isto é, está did t 5 25 5 31 tcompreendida entre 5,25 e 5,31 m, apresenta-se uma estimativa por intervalos. Intervalo de confiança das médiasIntervalo de confiança das médias Se a estatística é a média amostral, então os seus limites de confiança são dados por: N zx c Para o caso de amostragem de uma população infinita, ou tirada com reposição de uma população finita. Com população finita e amostragem sem reposição temos:Com população finita e amostragem sem reposição, temos: p NN 1 p p c NN zx Intervalo de confiança das médiasIntervalo de confiança das médias Com base na tabela da curva normal, temos: Limite de confiança (%) 100 99 98 95 90 80 68,26 50 Exemplo: Uma amostra de 45 contas pagas por uma empresa Valores críticos (zc) 3,90 2,58 2,33 1,96 1,64 1,28 1,00 0,68 apresentou um valor médio de R$ 14.900,00, com desvio padrão de R$ 3.600. Qual é o valor estimado para a média populacional, com 95% de confiabilidade?populacional, com 95% de confiabilidade? SoluçãoSolução O cálculo do intervalo de confiança da média populacional, considerando a população infinita é: 45 360096,1900.14 N zx c 45N 052.1900.14 Baseado nesse cálculo e nessa amostra, pode-se dizer que se estima que as contas dessa empresa têm um valor médio entre R$ 13.848 e R$ 15.952 com 95% de certeza.entre R$ 13.848 e R$ 15.952 com 95% de certeza. Intervalo de confiança das proporçõesIntervalo de confiança das proporções A proporção p de sucessos de uma amostra de tamanho N, retirada de uma população binomial, na qual P é sua probabilidade é dada por:probabilidade, é dada por: pczPp Se a população for finita e sem reposição, a fórmula acima terá o fator de correção. pc terá o fator de correção. p NN 1pN ExemploExemplo Em 40 lances de uma moeda, foram obtidas 24 caras. Determinar os limites de confiança de 95% para a proporção de caras que seria obtida em um número ilimitado de lancesde caras que seria obtida em um número ilimitado de lances da moeda. Solução: no nível de 95%, zc = 1,96. Temos também N = 40;Solução: no nível de 95%, zc 1,96. Temos também N 40; p = 0,5 e q = 0,5. Assim: 079,096,16,0 40 5,05,096,1 40 24 p P = 0,60,15 ou 60 15% InteratividadeInteratividade Uma amostra aleatória de 400 salários escolhidos de uma população considerada infinita, revelou média de R$ 2.000,00 e desvio padrão de R$ 500 00 Qual é o intervalo de confiança dedesvio padrão de R$ 500,00. Qual é o intervalo de confiança de 95% dessa estatística? a) 2.000 140a) 2.000 140 b) 2.000 120 c) 2.000 80c) 2.000 80 d) 2.000 79 e) 2.000 49e) 2.000 49 CorrelaçãoCorrelação Surge quando se pergunta se há uma relação entre, pelo menos, 2 variáveis quantitativas, uma independente (X) e outra dependente (Y)outra dependente (Y). Exemplo: alunos que estudaram + horas obterão melhor desempenho na prova.desempenho na prova. Variável Dependente nota (Y). Variável Independente no de horas de estudo (X).Variável Independente no de horas de estudo (X). Correlação linearCorrelação linear Correlação Linear: mede a relação entre as variáveis X e Y por meio da disposição dos pontos (X,Y) em torno de uma reta. O seu instrumento de medida é dado pelo coeficiente de correlação de Pearson, calculado pelo método dos mínimos quadrados:mínimos quadrados: 2222 . YYnXXn YXXYnr XY YYnXXn Correlação linearCorrelação linear O valor de r pode ser negativo ou positivo. Se r = 1, temos uma correlação perfeita positiva. Se r = -1, temos uma correlação perfeita negativa. Quanto mais próximo de 0 for o valor de r, mais fraca é a correlação. Se r = 0, a correlação é nula. ExemploExemplo Uma empresa de confecções quer avaliar se suas despesas com publicidade estão repercutindo favoravelmente em suas vendas Para tanto levantou os gastos de publicidadesuas vendas. Para tanto, levantou os gastos de publicidade e as vendas em cinco meses diferentes, os quais estão relacionados na tabela abaixo. Calcule o coeficiente de correlação linear. Gastos 3 4 8 12 14 vendas 7 14 15 28 32vendas 7 14 15 28 32 SoluçãoSolução Construímos primeiramente uma tabela para calcular os somatórios: X Y X² Y² X.Y 3 7 9 49 21 4 14 16 196 56 8 15 64 225 1208 15 64 225 120 12 28 144 784 336 14 32 196 1024 44814 32 196 1024 448 41 96 429 2278 981 SoluçãoSolução Calculando o valor de r, temos: 96,039364095 r Constatamos, então, uma forte correlação positiva entre , 2174464 as variáveis. Regressão linearRegressão linear É o processo de traduzir o comportamento conjunto de duas variáveis na forma de uma lei matemática denominada equação de regressão Assim sendo os conceitos deequação de regressão. Assim sendo, os conceitos de correlação e regressão são indissociáveis. A regressão é linear quando essa lei matemática mencionadaA regressão é linear quando essa lei matemática mencionada é uma reta, portanto, uma função de 1º grau. Regressão linearRegressão linear Como na prática trabalha-se com diversos pontos experimentais, existem inúmeras retas possíveis para umdeterminado conjunto de dadosdeterminado conjunto de dados. No entanto, o critério, normalmente, utilizado para a definição da melhor reta é o chamado método dos mínimos quadrados.da melhor reta é o chamado método dos mínimos quadrados. É sabido que a equação de uma reta é dada pela fórmula geral: y = a.x + b Em que a e b são os chamados coeficientes da reta. Regressão linearRegressão linear O cálculo dos coeficientes a e b podem ser feitos por meio das seguintes fórmulas: 22 XXn YXXYna n XaYb ExemploExemplo A tabela abaixo mostra a evolução de duas variáveis possivelmente correlacionadas. Determine a equação de regressão linear decorrenteregressão linear decorrente. x 3 5 7 9 10 14 16 Solução: vamos construir a tabela com os somatórios x 3 5 7 9 10 14 16 y 1 2 3 5 7 10 13 Solução: vamos construir a tabela com os somatórios, sabendo que n = 7. SoluçãoSolução x y x² x.y 3 1 9 3 5 2 25 105 2 25 10 7 3 49 21 9 5 81 45 10 7 100 7010 7 100 70 14 10 196 140 16 13 256 208 64 41 716 49764 41 716 497 933,0 916 855 40965012 26243479 ²647167 41644977 a 91640965012647167 68,2 7 74,18 7 74,5941 7 64933,041 b Resposta: y = 0,933.x – 2,68 777 RegressãoRegressão Com a equação de regressão pronta, podemos estimar valores para y dados alguns valores para x. Essa capacidade de previsão é tão mais confiável quanto melhor for o coeficiente de correlação entre as variáveis. Existem muitas aplicações para as regressões especialmente Existem muitas aplicações para as regressões, especialmente utilizando variáveis socioeconômicas. InteratividadeInteratividade A quantidade demandada de energia elétrica (y) é função da tarifa (x) e a equação de regressão é: y = - 0,56x + 158,8 Sendo assim, a estimação da quantidade demandada para uma tarifa de 100 é igual a:tarifa de 100 é igual a: a) 102,8 b) 214 8b) 214,8 c) 560,0 d) 401 2d) 401,2 e) 105,0 ATÉ A PRÓXIMA!
Compartilhar