Baixe o app para aproveitar ainda mais
Prévia do material em texto
Profs. Berssaneti, Fleury, Moraes e Patah PRO 3200 – Estatística Profs. Berssaneti, Fleury, Moraes e Patah PRO 3200 – Estatística Aulas 05 e 06 Distribuições Amostrais Profs. Fernando Tobal Berssaneti André Leme Fleury Renato de Oliveira Moraes Leandro Alves Patah Profs. Berssaneti, Fleury, Moraes e Patah PRO 3200 – Estatística Distribuições Amostrais Estatística Descritiva Estatística Indutiva Profs. Berssaneti, Fleury, Moraes e Patah PRO 3200 – Estatística Profs. Berssaneti, Fleury, Moraes e Patah PRO 3200 – Estatística Estimativa de parâmetros populacionais Construção de intervalos de confiança Distribuições Amostrais Profs. Berssaneti, Fleury, Moraes e Patah PRO 3200 – Estatística Distribuição populacional Distribuição amostral Distribuições Amostrais Profs. Berssaneti, Fleury, Moraes e Patah PRO 3200 – Estatística Profs. Berssaneti, Fleury, Moraes e Patah PRO 3200 – Estatística Caracterizada por uma distribuição de probabilidades com parâmetros A mesma distribuição pode ser usada para qualquer elemento da população População Profs. Berssaneti, Fleury, Moraes e Patah PRO 3200 – Estatística Altura média dos alunos = 1,70m Um aluno escolhido ao acaso terá altura em torno de 1,70m Exemplo Profs. Berssaneti, Fleury, Moraes e Patah PRO 3200 – Estatística Profs. Berssaneti, Fleury, Moraes e Patah PRO 3200 – Estatística Amostra Supõe-se que as amostras são representativas das populações, que foram obtidas por processos probabilísticos por amostragem casual simples Se a amostra é aleatória, todos os seus elementos fornecerão valores aleatórios da variável de interesse Profs. Berssaneti, Fleury, Moraes e Patah PRO 3200 – Estatística Constituída por n = valores aleatoriamente obtidos de alguma variável Qualquer parâmetro amostral será sempre uma variável aleatória Amostra Profs. Berssaneti, Fleury, Moraes e Patah PRO 3200 – Estatística Profs. Berssaneti, Fleury, Moraes e Patah PRO 3200 – Estatística Estatísticas são os valores calculados em função dos elementos da amostra Distribuição Amostral Distribuição amostral = distribuição de probabilidade de uma estatística As estatísticas, sendo variáveis aleatórias, terão alguma distribuição de probabilidade, com uma média, uma variância, etc. Profs. Berssaneti, Fleury, Moraes e Patah PRO 3200 – Estatística Distribuição Amostral de X-barra Quando o tamanho da amostra aumenta, independendo da distribuição da população original, a distribuição amostral de 𝑋 aproxima-se cada vez mais de uma distribuição normal. Esse resultado, fundamental na teoria da Inferência Estatística, é conhecido como: Teorema Central do Limite ou Teorema do Limite Central Profs. Berssaneti, Fleury, Moraes e Patah PRO 3200 – Estatística Profs. Berssaneti, Fleury, Moraes e Patah PRO 3200 – Estatística Teorema do Limite Central Teorema que afirma, em essência, que, sob condições bastante gerais, uma variável aleatória, resultante de uma soma de n variáveis aleatórias independentes, no limite, quando n tende ao infinito, tem distribuição normal. Profs. Berssaneti, Fleury, Moraes e Patah PRO 3200 – Estatística Teorema do Limite Central Se a população tem distribuição normal, a distribuição das suas médias amostrais será normal para qualquer tamanho da amostra, isto é, quando a população é normal N(µ, σ2), a média amostral X-barra de amostras de tamanho “n” tem distribuição também normal com média µ e variância σ2/n. Se a população tem distribuição não normal, a distribuição das suas médias amostrais será normal para amostras grandes, isto é, para uma população não normal com média µ e variância σ2, a distribuição da média amostral X-barra para amostras de tamanho n suficientemente grande é aproximadamente normal com média µ e variância σ2/n. Profs. Berssaneti, Fleury, Moraes e Patah PRO 3200 – Estatística Profs. Berssaneti, Fleury, Moraes e Patah PRO 3200 – Estatística Distribuição Amostral de X-barra ( 𝑋) Determinaremos as principais características da distribuição amostral da estatística 𝑋 , média de uma amostra de n elementos Sendo a população infinita ou a amostragem feita com reposição, do teorema do limite central resulta que os diversos valores da amostra podem ser considerados valores de variáveis aleatórias independentes, com a mesma distribuição de probabilidade da população, portanto com a mesma média e a mesma variância da população 2 Profs. Berssaneti, Fleury, Moraes e Patah PRO 3200 – Estatística Propriedades da média )(.)( XkkX )(...)()()...( 2121 nn xxxxxx Distribuição Amostral de X-barra ( 𝑋) Profs. Berssaneti, Fleury, Moraes e Patah PRO 3200 – Estatística Profs. Berssaneti, Fleury, Moraes e Patah PRO 3200 – Estatística n n n xxx n x n 1 )...( 1 )](...)()([ 1 )( 21 _ )...( 1 21 1 _ n n i i xxx nn x x Média de X-barra - 𝑋 Portanto, a média em torno da qual devem variar os possíveis valores da estatística X-barra é a própria média µ da população. Profs. Berssaneti, Fleury, Moraes e Patah PRO 3200 – Estatística )(.)( 222 XkkX )(...)()( )...( 2 2 2 1 2 21 2 n n xxx xxx Propriedades da Variância Profs. Berssaneti, Fleury, Moraes e Patah PRO 3200 – Estatística Profs. Berssaneti, Fleury, Moraes e Patah PRO 3200 – Estatística n n n n xxx n x n 2 2 2 222 2 2 2 2 1 22 _ 2 1 )...( 1 )]()...()([) 1 ()( n x x 2 _ 2 )( Variância de X-barra - 𝑋 Profs. Berssaneti, Fleury, Moraes e Patah PRO 3200 – Estatística n xx )()( _ 2 _ Desvio padrão de X-barra - 𝑋 Profs. Berssaneti, Fleury, Moraes e Patah PRO 3200 – Estatística Profs. Berssaneti, Fleury, Moraes e Patah PRO 3200 – Estatística n x x )( )( )()( xx )(xx 𝑋 Distribuição Amostral de X-barra - 𝑋 - População Normal Distribuição da população Distribuição amostral de Profs. Berssaneti, Fleury, Moraes e Patah PRO 3200 – Estatística Exemplo Digamos que X represente o peso real de pacotes de açúcar, enchidos automaticamente. Sabe-se que X tem distribuição normal N(500,100). Sorteamos 100 pacotes e medimos seus pesos. Se a máquina estiver regulada, qual a probabilidade de encontrarmos a média de 100 pacotes diferindo de 500g com menos de 2 gramas? Profs. Berssaneti, Fleury, Moraes e Patah PRO 3200 – Estatística Profs. Berssaneti, Fleury, Moraes e Patah PRO 3200 – Estatística Resposta A variável de interesse é X, peso de cada pacote. A população será o conjunto de todos os pacotes enchidos ou que virão a ser enchidos pela máquina, e que obedece a um modelo normal. A amostra será formada pelas 100 medidas obtidas dos pacotes selecionados. Pelo Teorema Central do Limite, X terá distribuição normal, com média 500 e variância 100/100 = 1g2. P( | X- 500 | < 2) = P(498 < X < 502) = P(-2,00 < Z < 2,00) ≅ 95% Profs. Berssaneti, Fleury, Moraes e Patah PRO 3200 – Estatística Distribuição de frequência relativa ou proporção amostral A frequência representa alguma característica na amostra, que pode ser uma classificação de uma variável qualitativa, valores de uma variável quantitativa discreta ou o fato de um valor de uma variável quantitativa contínua estar dentro de um dado intervalo. Com isso, a frequência é uma estatística, pois é determinada em funçãodos elementos da amostra. f f Profs. Berssaneti, Fleury, Moraes e Patah PRO 3200 – Estatística Profs. Berssaneti, Fleury, Moraes e Patah PRO 3200 – Estatística Distribuição de frequência relativa ou proporção amostral Pode-se considerar a ocorrência de um sucesso, caso a característica desejada se verifique, ou de um fracasso, caso contrário. Seja (ou ) a probabilidade de ocorrência de sucesso para cada elemento da amostra. Se a população é infinita ou a amostragem é feita com reposição, é constante para todos os elementos da amostra. Nesse caso, a distribuição amostral de frequência será uma distribuição binomial de parâmetros e f n p Profs. Berssaneti, Fleury, Moraes e Patah PRO 3200 – Estatística n f p ' p’ = frequência relativa ou proporção f = frequência absoluta n = tamanho da amostra Distribuição de frequência relativa ou proporção amostral Profs. Berssaneti, Fleury, Moraes e Patah PRO 3200 – Estatística Profs. Berssaneti, Fleury, Moraes e Patah PRO 3200 – Estatística Probabilidade de ocorrer um sucesso é constante. Distribuição binomial. Sucesso Fracasso Profs. Berssaneti, Fleury, Moraes e Patah PRO 3200 – Estatística Sendo p’ a proporção procurada da população (f/n) Frequência absoluta (f) Média de p’ )1()( )( 2 nf nf 𝜇 𝑝′ = 𝜇 𝑓 𝑛 = 1 𝑛 𝜇 𝑓 = 1 𝑛 𝑛𝜋 = 𝜋 Profs. Berssaneti, Fleury, Moraes e Patah PRO 3200 – Estatística Profs. Berssaneti, Fleury, Moraes e Patah PRO 3200 – Estatística Variância de p’ n n n f nn f p )1( )1( 1 )( 1 )'( 2 2 2 22 Profs. Berssaneti, Fleury, Moraes e Patah PRO 3200 – Estatística 5)1( 5 n n Amostra: Suficientemente Grande: Aproximação pela Normal Profs. Berssaneti, Fleury, Moraes e Patah PRO 3200 – Estatística Profs. Berssaneti, Fleury, Moraes e Patah PRO 3200 – Estatística n p )1( )'( )'(p p Profs. Berssaneti, Fleury, Moraes e Patah PRO 3200 – Estatística Exercício O volume de comercialização na Bolsa de Valores de Nova Iorque cresceu nos últimos anos. Contudo observamos que nos últimos seis meses o volume tem permanecido estável com um volume médio diário de 700 milhões de ações. A distribuição de probabilidade do volume diário é aproximadamente normal, com desvio padrão de 100 milhões de ações. Nesta condição pede-se: A probabilidade de que o volume diário de comercialização será superior a 800 milhões de ações? Determine a probabilidade de que nos próximos quatro meses (90 dias uteis) ocorram mais de vinte dias com volume diário de comercialização excedendo os 800 milhões de ações. Profs. Berssaneti, Fleury, Moraes e Patah PRO 3200 – Estatística Profs. Berssaneti, Fleury, Moraes e Patah PRO 3200 – Estatística Graus de liberdade de uma estatística • A razão pela qual usa-se n-1 ao invés de n na equação abaixo é porque o calculo dessa estatística pressupõe que anteriormente já se tenha calculado 𝑋. • Em outras palavras, GL significa contar quantos parâmetros já foram estimados, descontar isso do número total de observações, para depois calcular uma outra estimativa. 𝑆𝑥 2 = 𝑖=1 𝑛 𝑋𝑖 − 𝑋 2 𝑛 − 1 Profs. Berssaneti, Fleury, Moraes e Patah PRO 3200 – Estatística Variância Distribuição da Variância Amostral 𝑆𝑥 2 = 𝑖=1 𝑛 𝑋𝑖 − 𝑋 2 𝑛 − 1 Profs. Berssaneti, Fleury, Moraes e Patah PRO 3200 – Estatística Profs. Berssaneti, Fleury, Moraes e Patah PRO 3200 – Estatística Distribuição da Variância Amostral A distribuição amostral da estatística está relacionada com uma família de distribuições de probabilidade de grande importância em diversos problemas de estatística indutiva, que são as distribuições do tipo (qui quadrado) 𝑆𝑥 2 2 Profs. Berssaneti, Fleury, Moraes e Patah PRO 3200 – Estatística Distribuições 2 2 Distribuição da Variância Amostral Podemos considerar a distribuição da variável 𝜒2com ν (𝑛 − 1) graus de liberdade como sendo a soma dos quadrados de ν valores independentes da variável normal reduzida, com média e desvio- padrão . Profs. Berssaneti, Fleury, Moraes e Patah PRO 3200 – Estatística Profs. Berssaneti, Fleury, Moraes e Patah PRO 3200 – Estatística v i i v i i v Z x 1 2 2 1 2 1)(1)( 2 zz vzvz i v i iv 2 1 22 )( vv 2)( 22 Distribuição Qui-quadrado Profs. Berssaneti, Fleury, Moraes e Patah PRO 3200 – Estatística Distribuição Qui-quadrado Profs. Berssaneti, Fleury, Moraes e Patah PRO 3200 – Estatística Profs. Berssaneti, Fleury, Moraes e Patah PRO 3200 – Estatística Distribuição Qui-quadrado A tabela A6.2 fornece valores das variáveis para v = 1, 2, ..., 30, em função de valores de probabilidade correspondentes à cauda à direita na respectiva distribuição 2 v Profs. Berssaneti, Fleury, Moraes e Patah PRO 3200 – Estatística Tabela Qui-quadrado Profs. Berssaneti, Fleury, Moraes e Patah PRO 3200 – Estatística Profs. Berssaneti, Fleury, Moraes e Patah PRO 3200 – Estatística Exemplo Distribuição Qui-quadrado Assim, por exemplo, se entrarmos na tabela com P = 10% e v = 3, encontramos = 6,251 Isso significa que a probabilidade de um valor aleatório da variável ser maior do que 6,251 é de 10% 2 32 3 Profs. Berssaneti, Fleury, Moraes e Patah PRO 3200 – Estatística Média Variância 𝜇 𝑆𝑥 2 = 𝜎2 𝑛 − 1 𝜇 𝜒𝑛−1 2 = 𝜎2 𝑛 − 1 𝑛 − 1 = 𝜎2 𝜎2 𝑆𝑥 2 = 𝜎4 (𝑛 − 1)2 𝜎2 𝜒𝑛−1 2 = 𝜎4 (𝑛 − 1)2 2 𝑛 − 1 = 2𝜎4 𝑛 − 1 Distribuição da Variância Amostral Profs. Berssaneti, Fleury, Moraes e Patah PRO 3200 – Estatística Profs. Berssaneti, Fleury, Moraes e Patah PRO 3200 – Estatística )1(2)( 22 n 1)( 2 n 2 2 2 2 1 )1( xn Sn Distribuição Amostral de 𝑆𝑥 2 𝑆𝑥 2 𝜇 𝑆𝑥 2 = 𝜎2 𝜎2 𝑆𝑥 2 = 2𝜎4 𝑛 − 1 Profs. Berssaneti, Fleury, Moraes e Patah PRO 3200 – Estatística Exercício • Foi proposto um estudo para se avaliar as notas obtidas nas 2 provas da disciplina de Estatística dos alunos da Poli no ano de 2014. Os valores somados poderiam variar entre 0,00 e 20,00 • Foi obtida uma população normal com média 10,00 e variância 4,00 • Foram retiradas 15 amostras de tamanho 20 dessa população, levando-se em conta todas as turmas conduzidas neste ano • Seguem as amostras obtidas: . Profs. Berssaneti, Fleury, Moraes e Patah PRO 3200 – Estatística Profs. Berssaneti, Fleury, Moraes e Patah PRO 3200 – Estatística Exercício Profs. Berssaneti, Fleury, Moraes e Patah PRO 3200 – Estatística Exercício • Também foram calculadas as médias e as variâncias das 15 amostras: Profs. Berssaneti, Fleury, Moraes e Patah PRO 3200 – Estatística Profs. Berssaneti, Fleury, Moraes e Patah PRO 3200 – Estatística Exercício • Com isso foi possível desenhar o histograma das médias amostrais: Profs. Berssaneti, Fleury, Moraes e Patah PRO 3200 – Estatística Exercício • E o histograma das variâncias das 15 amostras: Profs. Berssaneti, Fleury, Moraes e Patah PRO 3200 – Estatística Profs. Berssaneti, Fleury, Moraes e Patah PRO 3200 – Estatística Exercício • Pede-se estimar os valores de: • Média das médias ou de X-barra • Desvio-padrão das médias ou de X-barra • Média da variância amostral • Variância da variânciaamostral 𝑆𝑥 2 𝑆𝑥 2 _ x _ x Profs. Berssaneti, Fleury, Moraes e Patah PRO 3200 – Estatística Exercício • Os valores calculados, com base nas 15 amostras, para a média das médias e para o desvio-padrão das médias foram: • E os valores calculados para a média das variâncias e a variância das variâncias foram: 03,10)( _ x 44,0)( _ x 𝜇 𝑆𝑥 2 = 3,864 𝜎2 𝑆𝑥 2 = 1,817 Profs. Berssaneti, Fleury, Moraes e Patah PRO 3200 – Estatística Profs. Berssaneti, Fleury, Moraes e Patah PRO 3200 – Estatística Exercício • Simulação com 200 amostras – Média: Profs. Berssaneti, Fleury, Moraes e Patah PRO 3200 – Estatística Exercício • Simulação com 200 amostras – Variância: Profs. Berssaneti, Fleury, Moraes e Patah PRO 3200 – Estatística Profs. Berssaneti, Fleury, Moraes e Patah PRO 3200 – Estatística Exercício • Simulação com 200 amostras: 02,10)( _ x 48,0)( _ x 𝜇 𝑆𝑥 2 = 4,006 𝜎2 𝑆𝑥 2 = 1,694 Profs. Berssaneti, Fleury, Moraes e Patah PRO 3200 – Estatística Exercício • Simulação com 10.000 amostras – Média: Profs. Berssaneti, Fleury, Moraes e Patah PRO 3200 – Estatística Profs. Berssaneti, Fleury, Moraes e Patah PRO 3200 – Estatística Exercício • Simulação com 10.000 amostras – Variância: Profs. Berssaneti, Fleury, Moraes e Patah PRO 3200 – Estatística Exercício • Simulação com 10.000 amostras: 9993,9)( _ x 4500,0)( _ x 𝜇 𝑆𝑥 2 = 4,026 𝜎2 𝑆𝑥 2 = 1,673 Profs. Berssaneti, Fleury, Moraes e Patah PRO 3200 – Estatística Profs. Berssaneti, Fleury, Moraes e Patah PRO 3200 – Estatística Distribuição t de Student • A distribuição t de Student é uma distribuição de probabilidade estatística, desenvolvida por um autor que se auto-denominou Student, pseudônimo de William Sealy Gosset, que não podia usar seu nome verdadeiro para publicar trabalhos enquanto trabalhasse para a cervejaria Guinnes • A distribuição t é uma distribuição de probabilidade teórica, simétrica e semelhante à curva normal padrão, porém com caudas mais longas, ou seja, uma simulação t de Student pode gerar valores mais extremos que uma normal • O único parâmetro v que a define e caracteriza a sua forma é o número de graus de liberdade • Quanto maior for esse parâmetro, mais próxima da normal ela será Profs. Berssaneti, Fleury, Moraes e Patah PRO 3200 – Estatística t Z t apresenta n-1 graus de liberdade e tem denotação tn-1 Distribuição t de Student Profs. Berssaneti, Fleury, Moraes e Patah PRO 3200 – Estatística Profs. Berssaneti, Fleury, Moraes e Patah PRO 3200 – Estatística n X Z n S X t x n 1 Distribuição t de Student • A partir de uma amostra de “n” valores retirados de uma população normal de média e variância 2 temos: • Entretanto, se usarmos na expressão acima o desvio padrão da amostra (raiz quadrada da variância da amostra calculada com n-1 no denominador), obteremos uma estatística cuja distribuição não mais é normal. Conforme demonstrou Student, a estatística distribui-se simetricamente, com média 0, porém não normalmente: Profs. Berssaneti, Fleury, Moraes e Patah PRO 3200 – Estatística Distribuição t de Student A tabela A6.3 fornece valores de t em função do número de graus de liberdade e de probabilidades correspondentes à cauda à direita na respectiva distribuição Profs. Berssaneti, Fleury, Moraes e Patah PRO 3200 – Estatística Profs. Berssaneti, Fleury, Moraes e Patah PRO 3200 – Estatística Tabela t de Student Profs. Berssaneti, Fleury, Moraes e Patah PRO 3200 – Estatística Exemplo Distribuição t de Student Assim, por exemplo, se entrarmos na tabela com P = 0,025 e v = 50, encontramos = 2,009 Isso significa que a P( > 2,009) = P( < -2,009) = 0,025, ou 2,5% Nota-se que esse valor de já é muito próximo do correspondente valor para = Z = 1,960 50t 50tt 50t 50t Profs. Berssaneti, Fleury, Moraes e Patah PRO 3200 – Estatística Profs. Berssaneti, Fleury, Moraes e Patah PRO 3200 – Estatística Distribuição F de Snedecor • Suponhamos que duas amostras independentes retiradas de populações normais forneçam variâncias amostrais 𝑆1 2 𝑒 𝑆2 2, e que desejamos conhecer a distribuição amostral do quociente 𝑆1 2 𝑆2 2 . Isso será possível através do conhecimento das distribuições F de Snedecor. 𝐹𝜈1𝜈2= 𝜒𝜈1 2 𝜈1 𝜒𝜈2 2 𝜈2 Profs. Berssaneti, Fleury, Moraes e Patah PRO 3200 – Estatística Distribuição F de Snedecor 𝑆1 2 𝑆2 2 = 𝐹𝑛1−1, 𝑛2−1 De duas populações normais com mesma variância 𝜎2 (ou, o que seria equivalente, de uma mesma população normal), são extraídas duas amostras independentes com, respectivamente, n1 e n2 elementos e toma-se o quociente 𝑆1 2 𝑆2 2 das variâncias dessas amostras Utilizando a seguinte expressão pode-se concluir que a distribuição desse quociente será uma distribuição 𝐹𝑛1−1, 𝑛2−1 Profs. Berssaneti, Fleury, Moraes e Patah PRO 3200 – Estatística Profs. Berssaneti, Fleury, Moraes e Patah PRO 3200 – Estatística Distribuição F de Snedecor A tabela A6.4 fornece valores da variável F que determinam caudas à direita com probabilidades 0,5; 1; 2,5; 5 e 10%, fornecidos para diversos pares de valores de v1 e v2 Profs. Berssaneti, Fleury, Moraes e Patah PRO 3200 – Estatística Tabela F (P=5%) Profs. Berssaneti, Fleury, Moraes e Patah PRO 3200 – Estatística Profs. Berssaneti, Fleury, Moraes e Patah PRO 3200 – Estatística Exemplo Distribuição F de Snedecor Assim, por exemplo, se entrarmos na tabela com P = 5%, v1 = 5 e v2 = 20, encontramos F = 2,71 Isso significa que, na distribuição F com 5 graus de liberdade no numerador e 20 graus de liberdade no denominador, a probabilidade de se obter um valor aleatório superior a 2,71 é igual a 5%
Compartilhar