Baixe o app para aproveitar ainda mais
Prévia do material em texto
19/05/2022 1 Inferência estatística e distribuições amostrais Estatística - NID Prof. Nilmar de Souza Estatística – Prof. Nilmar de Souza 1. Introdução 2. Erros amostrais 3. Distribuições amostrais • Distribuição amostral da média • Distribuição amostral da proporção 4. Referências SumárioSumárioSumárioSumário Estatística – Prof. Nilmar de Souza • aprendemos como resumir, descrever, variáveis associadas a um ou mais conjunto de dados. • depois, tomamos conhecimento de alguns modelos probabilísticos que, determinados por seus parâmetros, são capazes de representar adequadamente o comportamento de algumas variáveis aleatórias. Em aulas anteriores, ....Em aulas anteriores, ....Em aulas anteriores, ....Em aulas anteriores, .... Estatística – Prof. Nilmar de Souza • Na prática, frequentemente o pesquisador tem alguma ideia sobre a forma como algumas variáveis se distribuem, mas não dos valores exatos dos parâmetros que as especificam. • EXEMPLO: podemos supor que a distribuição das alturas de uma certa população pode ser representada por um modelo normal, mas qual distribuição, porque precisaríamos conhecer os parâmetros média e desvio padrão para que ela ficasse completamente especificada. Introdução a Inferência EstatísticaIntrodução a Inferência EstatísticaIntrodução a Inferência EstatísticaIntrodução a Inferência Estatística Estatística – Prof. Nilmar de Souza • Dessa forma, o propósito do pesquisador passa a ser então, descobrir (estimar) os parâmetros da distribuição para sua posterior utilização. • Se pudéssemos medir as alturas de todos os indivíduos dessa população, descobriríamos sua distribuição exata e seus parâmetros, mas ai não teríamos necessidade de usar a inferência estatística. • Como isso raramente acontece, por razões que já discutimos, é caro, demorado, testes destrutivo, temos que selecionar parte dos elementos (amostra), analisá-las e inferir propriedades para o todo (população). Introdução a Inferência EstatísticaIntrodução a Inferência EstatísticaIntrodução a Inferência EstatísticaIntrodução a Inferência Estatística Estatística – Prof. Nilmar de Souza • Agora nós vamos estudar sobre os aspectos básicos da inferência estatística, para aprender como fazer afirmações sobre as características de uma população, com base em informações dadas por amostras. • o uso de informações de uma amostra para concluir sobre o todo faz parte da atividade de um número elevado de pessoas. • Podemos usar uma analogia com a maneira como uma cozinheira “testa” o preparo de alimentos, ou ... • Como uma simples amostra de alguns ��� de sangue pode dar um diagnostico preciso e confiável sobre a saúde de uma pessoa. Introdução a Inferência EstatísticaIntrodução a Inferência EstatísticaIntrodução a Inferência EstatísticaIntrodução a Inferência Estatística 19/05/2022 2 Estatística – Prof. Nilmar de Souza • Alguns estudos estatísticos analisam amostras com o objetivo de generalização para o todo ou universo. Tais estudos são chamados de indutivos ou inferenciais. • Quando o processo de amostragem é probabilístico e bem conduzido, os resultados podem ser generalizados. • Mais precisamente, denomina-se inferência estatística o problema que consiste em especificar um ou mais valores em que � é um parâmetro desconhecido. Inferência EstatísticaInferência EstatísticaInferência EstatísticaInferência Estatística Estatística – Prof. Nilmar de Souza • Um experimentador usa as informações em uma amostra aleatória ��; , … , � para se fazer inferências sobre �. • Normalmente � é grande e fica inviável tirar conclusões baseadas em uma longa lista de números. • Por isso, um dos objetivos da inferência estatística é resumir as informações de uma amostra, da maneira mais compacta possível, mas que ao mesmo tempo seja também informativa. • Normalmente esse resumo é feito por meio de estatísticas, por exemplo, a média amostral e a variância amostral. Redução de dadosRedução de dadosRedução de dadosRedução de dados Estatística – Prof. Nilmar de Souza • População: conjunto de valores de uma característica associada a uma coleção de indivíduos ou objetos de interesse é dito ser uma população. • Amostra: é qualquer subconjunto da população, mais precisamente, uma função probabilidade ou função densidade de probabilidade de uma . �. (�), modelando a característica de interesse. População e AmostraPopulação e AmostraPopulação e AmostraPopulação e Amostra Estatística – Prof. Nilmar de Souza • O objetivo da inferência estatística é produzir afirmações sobre dada característica da população, na qual estamos interessados, a partir de informações colhidas de uma parte dessa população. • Essa característica pode ser representada por uma variável aleatória. • Raramente dispomos de informação sobre a variável de interesse, ou ela é parcial. • De qualquer forma, o uso de uma amostra ajudaria a formar uma opinião sobre o comportamento da variável (população). Problemas de InferênciaProblemas de InferênciaProblemas de InferênciaProblemas de Inferência Estatística – Prof. Nilmar de Souza • Portanto, na maioria das vezes, nos referíamos à “população �”, significando que a variável de interesse �, definida sobre a população alvo, segue uma distribuição �(�). • Por exemplo: • �~��������(50, �) → ���â�����: �, � • �~!����� 500,20# → ���â�����: $, %² • � '������(λ) → ���â�����: λ Problemas de InferênciaProblemas de InferênciaProblemas de InferênciaProblemas de Inferência Estatística – Prof. Nilmar de Souza Parâmetros e EstatísticasParâmetros e EstatísticasParâmetros e EstatísticasParâmetros e Estatísticas média amostral proporção amostral 19/05/2022 3 Estatística – Prof. Nilmar de Souza • Parâmetro: uma medida numérica que descreve alguma característica da população, usualmente representada por letras gregas: �, µ, %. • Estatística: uma medida numérica que descreve alguma característica da amostra, usualmente denotada pela letra grega do respectivo parâmetro com um acento circunflexo: �*, µ+, %+, ou por letras do alfabeto comum: �̅, �,... BRUNI, Adriano Leal – Estatística aplicada à gestão empresarial. Atlas, 2007. Parâmetros e EstatísticasParâmetros e EstatísticasParâmetros e EstatísticasParâmetros e Estatísticas Estatística – Prof. Nilmar de Souza Parâmetros e EstatísticasParâmetros e EstatísticasParâmetros e EstatísticasParâmetros e Estatísticas Estatística – Prof. Nilmar de Souza Parâmetros e Estimador BRUNI, Adriano Leal – Estatística aplicada à gestão empresarial. Atlas, 2007. Estatística Parâmetro populacional Estimador Média $ �̅ Proporção ' �̂ Desvio padrão % � Estatística – Prof. Nilmar de Souza • A Inferência Estatística consiste em fazer afirmações probabilísticas sobre as características do modelo probabilístico, que se supõe representar uma população, a partir dos dados de uma amostra aleatória (probabilística) desta mesma população. • Fazer uma afirmação probabilística sobre uma característica qualquer é associar à declaração feita uma probabilidade de que tal declaração esteja correta (e, portanto, a probabilidade complementar de que esteja errada). • Quando se usa uma amostra da população SEMPRE haverá uma probabilidade de estar cometendo um erro (justamente por ser usada uma amostra): a diferença entre os métodos estatísticos e os outros reside no fato de que os métodos estatísticos permitem calcular essa probabilidade de erro. • E para que isso seja possível a amostra da população precisa ser aleatória. Inferência EstatísticaInferência EstatísticaInferência EstatísticaInferência Estatística Erros amostrais Estatística – Prof. Nilmar de Souza Erros amostraisErros amostraisErros amostraisErros amostrais • Erros amostrais: • Diferença entre o resultado da amostra e o verdadeiro valor da população. Ocorre pois as amostras são aleatórias! Exemplo: a diferença entre a média amostral �. e a média populacional $. � = �. − $ → é chamado de erro amostral da média. • Errosnão amostrais: • Ocorre quando os dados amostrais são coletados incorretamente, devido a uma amostra tendenciosa, instrumento de medida defeituoso, anotações erradas, . . . Atenção! •Os erros não amostrais não devem existir, ou devem ser minimizados. 19/05/2022 4 Estatística – Prof. Nilmar de Souza • Não importa quão bem a amostra seja coletada, os erros amostrais sempre irão ocorrer. • Cada vez que uma amostra aleatória for retirada de uma população, um resultado diferente será observado • Selecione uma amostra de tamanho n = 5 das idades dos estudantes de uma sala: • Repita 5 vezes (tente ser o mais aleatório possível!), calcule a média de cada amostra, e compare com a média populacional µ = 22,5. Erros amostraisErros amostraisErros amostraisErros amostrais 22 21 24 23 20 22 21 25 24 24 23 19 25 24 23 23 20 21 23 20 23 22 23 23 25 25 20 23 24 20 Estatística – Prof. Nilmar de Souza • O que isso nos diz a respeito das médias amostrais? • O que isso nos diz a respeito da variabilidade das médias amostrais? • E se fizemos uma “média das médias” de todas as amostras? Erros amostraisErros amostraisErros amostraisErros amostrais Amostra �̅ ∈= �̅ − $ 23 23 23 24 23 23,2 0,7 24 22 20 20 20 21,2 -1,3 21 20 19 22 25 21,4 -1,1 22 23 25 20 22 22,4 -0,1 21 20 22 24 20 21,4 -1,1 Distribuições amostrais Estatística – Prof. Nilmar de Souza • Como a estatística é um resumo das informações sobre um parâmetro obtido a partir da amostra, o valor de uma estatística depende da amostra particular que foi extraída da população. • Os seus valores mudam aleatoriamente a partir de uma amostra aleatória para a seguinte, por conseguinte, uma estatística é uma variável aleatória. • A distribuição de probabilidade desta variável aleatória é chamada distribuição amostral. • A distribuição amostral de uma estatística é importante porque nos permite tirar conclusões sobre o parâmetro de população correspondente com base em uma amostra aleatória. Distribuições amostraisDistribuições amostraisDistribuições amostraisDistribuições amostrais Estatística – Prof. Nilmar de Souza • É possível tirar várias amostras aleatórias de � elementos de uma população. • Será que as médias amostrais (�̅�, �̅#, �̅2, �̅ ) seguem alguma distribuição de probabilidade. Distribuição amostral das médiasDistribuição amostral das médiasDistribuição amostral das médiasDistribuição amostral das médias Amostra Aleatória 1 Amostra Aleatória 2 Amostra Aleatória 3 Amostra Aleatória 3População Parâmetros populacionais 4=média=média=média=média :# =variância=variância=variância=variância ... Amostra 1 Amostra 2 Amostra 3 Amostra 3 3 = ?; @AB 3 = ?; @AC 3 = ?; @AD 3 = ?; @A3 Estatística – Prof. Nilmar de Souza • População com ! = 5 elementos: a) Determine a média e a variância populacional. b) Suponha a retirada de uma amostra de tamanho 2, com reposição, quantas e quais são as possíveis amostras retiradas da população e qual a probabilidade associada a cada uma. c) Determine a média e a variância da distribuição amostral da média. Distribuição amostral das médiasDistribuição amostral das médiasDistribuição amostral das médiasDistribuição amostral das médias Individuo 1 2 3 4 5 Peso 50kg 60kg 70kg 70kg 80kg 19/05/2022 5 Estatística – Prof. Nilmar de Souza • População com ! = 5 elementos: a) Determine a média e a variância populacional. → $ = 66FG e %² = 104FG b) Suponha a retirada de uma amostra de tamanho 2, com reposição, quantas e quais são as possíveis amostras retiradas da população e qual a probabilidade associada a cada uma. → F = ! = 5# = 25 c) Determine a média e a variância da distribuição amostral da média. Distribuição amostral das médiasDistribuição amostral das médiasDistribuição amostral das médiasDistribuição amostral das médias Individuo 1 2 3 4 5 Peso 50kg 60kg 70kg 70kg 80kg Estatística – Prof. Nilmar de Souza Distribuição amostral das médiasDistribuição amostral das médiasDistribuição amostral das médiasDistribuição amostral das médias Individuo Peso Individuo 1 50 Individuo 2 60 Individuo 3 70 Individuo 4 70 Individuo 5 80 ! = 5 $ = 66FG %² = 104FG Amostra Individuos Pesos Média 1 (1;1) (50;50) 50,00 2 (1;2) (50;60) 55,00 3 (1;3) (50;70) 60,00 4 (1;4) (50;70) 60,00 5 (1;5) (50;80) 65,00 6 (2;1) (60;50) 55,00 7 (2;2) (60;60) 60,00 8 (2;3) (60;70) 65,00 9 (2;4) (60;70) 65,00 10 (2;5) (60;80) 70,00 11 (3;1) (70;50) 60,00 12 (3;2) (70;60) 65,00 13 (3;3) (70;70) 70,00 14 (3;4) (70;70) 70,00 15 (3;5) (70;80) 75,00 16 (4;1) (70;50) 60,00 17 (4;2) (70;60) 65,00 18 (4;3) (70;70) 70,00 19 (4;4) (70;70) 70,00 20 (4;5) (70;80) 75,00 21 (5;1) (80;50) 65,00 22 (5;2) (80;60) 70,00 23 (5;3) (80;70) 75,00 24 (5;4) (80;70) 75,00 25 (5;5) (80;80) 80,00 Formação de amostras aleatórias simples de 2 indivíduos (� = 2): �éJ�� J�� �éJ��� ��������� = 66 FG. ���â�K�� J�� �éJ��� ��������� = 52 FG. Estatística – Prof. Nilmar de Souza • Seja � uma . �. com média $ e variância %² , e seja (��, … , � ) uma amostra aleatória, então: • L �. = $�̅ = $ • M�� �. = %�̅ 2 = %2/� • %�̅ = M�� �. = %2/� = %/ � Distribuição amostral das médiasDistribuição amostral das médiasDistribuição amostral das médiasDistribuição amostral das médias erro padrão da média Estatística – Prof. Nilmar de Souza • Portanto, se: • mas, como • então, a distribuição amostral da média amostral �. é: Distribuição amostral das médiasDistribuição amostral das médiasDistribuição amostral das médiasDistribuição amostral das médias Estatística – Prof. Nilmar de Souza Distribuição amostral das médiasDistribuição amostral das médiasDistribuição amostral das médiasDistribuição amostral das médias Pesos Freq. % 50 1 4% 55 2 8% 60 5 20% 65 6 24% 70 6 24% 75 4 16% 80 1 4% Total 25 100,0 Estatística – Prof. Nilmar de Souza Distribuição amostral das médiasDistribuição amostral das médiasDistribuição amostral das médiasDistribuição amostral das médias 19/05/2022 6 Estatística – Prof. Nilmar de Souza Distribuição amostral das médiasDistribuição amostral das médiasDistribuição amostral das médiasDistribuição amostral das médias Estatística – Prof. Nilmar de Souza Distribuição amostral das médiasDistribuição amostral das médiasDistribuição amostral das médiasDistribuição amostral das médias Teorema (Teorema Central do Limite (TCL)) • Para amostras aleatórias simples (��, �#, … . . , � ), retiradas de uma população normal com média $ e variância %#, a distribuição amostral da média �., terá forma dada por: • no limite quando � → ∞, que é a distribuição normal padrão: P ~ !(0; 1). • Se a população for normal, então �. terá distribuição exata normal. • A rapidez da convergência para a normal depende da distribuição da população da qual as amostras foram geradas. P = �. − $ %/ � Estatística – Prof. Nilmar de Souza Distribuição amostral das médiasDistribuição amostral das médiasDistribuição amostral das médiasDistribuição amostral das médias • Este teorema nos mostra que, para amostras suficientemente grandes (� > 30), a média amostral �. converge para o verdadeiro valor da média populacional $ (é um estimador não viesado de $) • Além disso, a variância das médias amostrais %S̅ # tende a diminuir conforme � → ∞ (é um estimador consistente) • Estes resultados sugerem que, quando o tamanho da amostra aumenta, independente do formato da distribuição da população original, • a distribuição amostral de �. aproxima-se cada vez mais de uma distribuição normal, um resultado fundamental na teoria de probabilidade conhecido como Teorema Central do Limite. Estatística – Prof. Nilmar de Souza Distribuição amostral das médiasDistribuição amostral das médiasDistribuição amostral das médiasDistribuição amostral das médias • Em palavras, o teorema garante que que para � grande, a distribuição da média amostral, devidamente padronizada, se comporta segundo um modelo normal com média 0 e variância 1. • Peloteorema, temos que quanto maior o tamanho da amostra, melhor é a aproximação. • Estudos envolvendo simulações mostram que, em muitos casos valores de � ao redor de 30 fornecem aproximações bastante boas para as aplicações práticas. Estatística – Prof. Nilmar de Souza Distribuição amostral das médiasDistribuição amostral das médiasDistribuição amostral das médiasDistribuição amostral das médias • Quando calculamos a probabilidade de um valor estar em um determinado intervalo de valores, podemos usar o modelo Normal, como vimos anteriormente. • No entanto, quando temos uma amostra, e queremos calcular probabilidades associadas à média amostral (a probabilidade da média amostral estar em um determinado intervalo de valores), precisamos necessariamente usar os resultados do TCL. Estatística – Prof. Nilmar de Souza Distribuição amostral das médias e erros amostraisDistribuição amostral das médias e erros amostraisDistribuição amostral das médias e erros amostraisDistribuição amostral das médias e erros amostrais • Já vimos que o erro amostral da média é dado pela diferença entre �. e $, ou seja, e = �. − $ • Dessa forma, se P = �. − $ %/ � ~!(0,1) • então a distribuição de e também será normal padrão, pois e � % • Esse resultado será fundamental na construção de estimativas intervalares. 19/05/2022 7 Estatística – Prof. Nilmar de Souza Distribuição amostral das médiasDistribuição amostral das médiasDistribuição amostral das médiasDistribuição amostral das médias • Exemplo: Uma máquina de empacotamento que abastece pacotes de feijão apresenta distribuição normal com média de 500 g e desvio-padrão de 22 g. De acordo com as normas de defesa do consumidor, os pacotes de feijão não podem ter peso inferior a 2% do estabelecido na embalagem. a) Determine a probabilidade de um pacote selecionado aleatoriamente ter a peso inferior a 490 g. b) Determine a probabilidade de 20 pacotes selecionados aleatoriamente terem peso médio inferior a 490 g. Estatística – Prof. Nilmar de Souza Distribuição amostral das médiasDistribuição amostral das médiasDistribuição amostral das médiasDistribuição amostral das médias • Exemplo: Uma máquina de empacotamento que abastece pacotes de feijão apresenta distribuição normal com média de 500 g e desvio-padrão de 22 g. De acordo com as normas de defesa do consumidor, os pacotes de feijão não podem ter peso inferior a 2% do estabelecido na embalagem. a) Determine a probabilidade de um pacote selecionado aleatoriamente ter a peso inferior a 490 g. Como X é uma N(500,22²) vem: P(X < 490) = P( -0,45 < Z) = 0,1736 = 0,5 – 0,1736 = 0,3264 (32,64%) Estatística – Prof. Nilmar de Souza Distribuição amostral das médiasDistribuição amostral das médiasDistribuição amostral das médiasDistribuição amostral das médias • Exemplo: Uma máquina de empacotamento que abastece pacotes de feijão apresenta distribuição normal com média de 500 g e desvio-padrão de 22 g. De acordo com as normas de defesa do consumidor, os pacotes de feijão não podem ter peso inferior a 2% do estabelecido na embalagem. b) Determine a probabilidade de 20 pacotes selecionados aleatoriamente terem peso médio inferior a 490 g. Neste caso é uma N(500, 4,92²) vem: P(�. < 490) = P( -2,03 < Z) = 0,4788 = 0,5 – 0,4788 = 0,0212 (2,12%) Distribuição amostral da proporção Estatística – Prof. Nilmar de Souza Distribuição amostral da proporçãoDistribuição amostral da proporçãoDistribuição amostral da proporçãoDistribuição amostral da proporção • Muitas vezes, o interesse é conhecer uma proporção, e não a média de uma população. • Suponha que uma amostra de tamanho � foi obtida de uma população, e que � ≤ � observações nessa amostra pertençam a uma classe de interesse (ex: pessoas do sexo masculino). • Dessa forma, a proporção amostral �̂ = � � = �ú���� J� �WK����� ����� J� ������� �� • é o “melhor estimador” para a proporção populacional �. • Note que � e � são os parâmetros de uma distribuição binomial. Estatística – Prof. Nilmar de Souza Distribuição amostral da proporçãoDistribuição amostral da proporçãoDistribuição amostral da proporçãoDistribuição amostral da proporção • Exemplo: em 5 lançamentos de uma moeda considere que o evento “cara” (C) seja o sucesso (“sucesso” = 1; “fracasso” = 0). Um possível resultado seria o conjunto {C, C, R, R, C}. A proporção amostral seria. �̂ = � � = �ú���� J� �WK����� ����� J� ������� �� = 3 5 = 0,6 • Exemplo: em uma amostra de 2500 eleitores de uma cidade, 1784 deles eram favoráveis à reeleição do atual prefeito. A proporção amostral é então. �̂ = � � = �ú���� J� �WK����� ����� J� ������� �� = 1784 2500 = 0,7136 19/05/2022 8 Estatística – Prof. Nilmar de Souza Distribuição amostral da proporçãoDistribuição amostral da proporçãoDistribuição amostral da proporçãoDistribuição amostral da proporção • A distribuição amostral de uma proporção é a distribuição das proporções de todas as possíveis amostras de tamanho � retiradas de uma população. • Vamos analisar diferentes distribuições amostrais para proporção: • Uma moeda é lançada � = 10 vezes, e a proporção de caras é registrada. • Esse processo é repetido � = 10; 30; 100; 1000; 10000 vezes. • Com isso, concluímos que: • A média das proporções para � → ∞ tende para a verdadeira proporção populacional � = 0,5. • A distribuição amostral das proporções segue aproximadamente uma distribuição normal. Estatística – Prof. Nilmar de Souza Distribuição amostral da proporçãoDistribuição amostral da proporçãoDistribuição amostral da proporçãoDistribuição amostral da proporção Estatística – Prof. Nilmar de Souza Distribuição amostral da proporçãoDistribuição amostral da proporçãoDistribuição amostral da proporçãoDistribuição amostral da proporção • Através do estudo da distribuição amostral da proporção, chegamos aos seguintes resultados: L �̂ = $Z+ = � M�� �̂ = %Z+ # = �(1 − �) � • Ou seja, �̂ é um estimador não viciado e consistente para �. • Assim, a distribuição amostral de �̂ será: Estatística – Prof. Nilmar de Souza Distribuição amostral da proporçãoDistribuição amostral da proporçãoDistribuição amostral da proporçãoDistribuição amostral da proporção • Note que o erro padrão de �̂ será: • Assim, usando o TCL, podemos mostrar que a quantidade. • segue uma distribuição normal padrão com média 0 e variância 1. • Quando não conhecemos �, usamos �̂ = �/� como estimativa para calcular o erro padrão. Estatística – Prof. Nilmar de Souza Referências BibliográficasReferências BibliográficasReferências BibliográficasReferências Bibliográficas • BARBETTA, Pedro Alberto; REIS, Marcelo Menezes; BORNIA, Antonio Cezar. Estatística para cursos de engenharia e informática. São Paulo: Atlas, 2010. • BRUNI, Adriano Leal. Estatística aplicada à gestão empresarial. 2. ed. São Paulo, SP: Atlas, 2008. • DEVORE, Jay L. Probabilidade e estatística para engenharia e ciências / 2014 São Paulo, SP: Cengage Learning, 2014. • MONTGOMERY, Douglas C; RUNGER, George C. Estatística aplicada e probabilidade para engenheiros - 5. ed. / 2012 Rio de Janeiro, RJ: Livros Técnicos e Científicos, 2012. • TRIOLA, Mario F. Introdução à estatística: atualização da tecnologia. 11. ed. Rio de Janeiro, RJ: Livros Técnicos e Científicos, c2013. • WALPOLE, Ronald E. Probabilidade & estatística para engenharia e ciências. São Paulo, SP: Pearson Prentice Hall, 2009.
Compartilhar