Baixe o app para aproveitar ainda mais
Prévia do material em texto
1 Anifo Nelito Bonifácio Gaulane Faruk Milange Habiba Ramos dos Santos Hélio Manuel Ermenegilda Rumia Alberto Humberto Arlindo Irontino Arlindo Jamal Nacir Tagir Jessica da Vanda Abel Muhol Manuel Antônio Manuel Momade Sorte Nelsa Vasco Sujai Abdala Saide Estimação por Intervalo de Confiança (Licenciatura em Estatística e Gestão de Informação) Universidade Rovuma Nampula 2022 2 Anifo Nelito Bonifacio Gaulane Faruk Milange Habiba Ramos dos Santos Hélio Manuel Hermenegilda Rumia Humberto Alberto Humberto Arlindo Irontino Arlindo Jamal Nacir Tagir Jessica da Vanda Abel Muhol Manuel Antônio Manuel Momade Sorte Nelsa Vasco Sujai Abdala Saide Estimação por Intervalo de Confiança (Licenciatura em Estatística e Gestão de Informação) Trabalho de Pesquisa para efeitos avaliativos da cadeira de Estatística Matemática II, Curso de Estatística e Gestão de Informação (EGI). 2º Ano – Laboral. Docente: Profra. Dra. Elisa da C. José Maria Universidade Rovuma Nampula 2022 3 Índice Introdução .............................................................................................................................. 4 1. Estimação Intervalos de confiança ............................................................................... 5 1.1. Procedimento Geral para construção de Intervalos de Confiança ............................... 5 1.2. Intervalos de confiança para média e variância. ...................................................... 6 1.3. Intervalos de confiança para a média: 𝜇 conhecido ..................................................... 8 1.4. Intervalo de Confiança para Variância ...................................................................... 10 1.5. Intervalo de Confiança para a diferença Entre duas Médias: .................................... 12 1.6. Intervalo de Confiança para a Diferença entre duas Proporções ............................... 14 1.7. Exercícios de Intervalos de Confiança para media, variância e proporção ................... 15 Conclusão .............................................................................................................................. 23 Referências bibliográficas ..................................................................................................... 24 iii 4 Introdução Um intervalo de confiança para um parâmetro populacional é um intervalo com uma proporção associada p gerada por uma amostra aleatória de uma população subjacente, de tal forma que se o experimento for repetido várias vezes e o intervalo de confiança for recalculado para cada experimento com mesmo procedimento, uma proporção p dos intervalos de confiança conteria o parâmetro estatístico em questão. Os intervalos de confiança são usados para indicar a confiabilidade de uma estimativa. Um intervalo de confiança (IC) para uma característica da população (parâmetro) é um intervalo de valores plausíveis para esta característica. É construído de modo que, com um grau de confiança escolhido, o valor da característica será capturado entre as extremidades inferior e superior do intervalo. 5 1. Estimação Intervalos de confiança É uma maneira de calcularmos uma estimativa de um parâmetro desconhecido. Muitas vezes também funciona como um teste de hipóteses. A idéia é construir um intervalo de confiança para o parâmetro com uma probabilidade de 1−α (nível de confiança) de que o intervalo contenha o verdadeiro parâmetro. Obs: α é o nível de significância, isto é, o erro que estaremos cometendo ao afirmar -mos que, por exemplo, 95% das vezes o intervalo 1 e 2 θ < θ < θ contém θ. Nesse caso, o erro seria de 5%. Nesse capítulo veremos apenas a “fórmula” final para se obter um intervalo de confiança. No entanto, pode-se demonstrar facilmente que intervalos de confiança são obtidos com base na teoria discutida no capítulo sobre testes de hipóteses. 1.1. Procedimento Geral para construção de Intervalos de Confiança O procedimento geral para construção de intervalos de confiança consiste nos seguintes passos, 1. Obter uma estatística que depende de 𝜃, 𝑈 = 𝐺(𝑋, 𝜃), mas cuja distribuição não depende de 𝜃. 2. Usando a distribuição de 𝑈, encontrar as constantes 𝑎 e 𝑏 tais que 𝑃(𝑎 ≤ 𝑈 ≤ 𝑏) ≥ −1𝛼. 3. Definir{𝜃: 𝑎 ≤ 𝐺 ∗ 𝑥, 𝜃) ≤ 𝑏} como o intervalo (ou região) de confiança 100(1- 𝛼)% para 𝜃. A exigência de que a probabilidade no item 2 acima possa ser maior do que o nível de confiança é essencialmente técnica pois queremos que o intervalo seja o menor possível, o que em geral implica em usar uma igualdade. A desigualdade será útil principalmente no caso de distribuições discretas onde nem sempre é possível satisfazer a igualdade. 6 Note que a variável aleatória 𝑈, comumente denominada quantidade pivotal ou pivot, é fundamental para o funcionamento do método. Idealmente ela deve depender da amostra através de estatísticas suficientes minimais e ter distribuição conhecida. É importante notar também que este intervalo não pode ser interpretado como um intervalo de probabilidade para 𝜃 já que a aleatoriedade presente é devida a amostra 𝑋. Ou seja, o procedimento leva a construção de um intervalo probabilístico para 𝑈 e não para 𝜃. Tecnicamente, dizemos que 100(1- 𝛼)% de todos os intervalos de confiança que construirmos conterão o verdadeiro valor do parâmetro (dado que todas as suposições envolvidas estejam corretas). Por exemplo se 1 − 𝛼 = 0,95 então, em média, somente 5 a cada 100 intervalos não conterão 𝜃. A probabilidade 1- 𝛼 é denominada nível de confiança e sua escolha depende da precisão com que queremos estimar o parâmetro, sendo que 0,90, 0,95 e 0,99 são os valores mais comuns na prática. 1.2. Intervalos de confiança para média e variância. 1.2.1. Intervalo de confiança para média Será visto apenas o intervalo de confiança para a média populacional (μ) quando a variância (σ2) populacional é desconhecida. I. C. (1 − α): X̅ − tα 2 s √n ≤ μ ≤ X̅ + tα 2 s √n Exemplo: A seguinte amostra: 9, 8, 12, 7, 9, 6, 11, 6, 10, 9 foi extraída de uma população normal. Construir o intervalo de confiança, de 95%, para µ. Solução: X̅ = 8,7 S2 = 793 − (87)2 10 10 − 1 ≅ 4,0 ⇒ s ≅ 2 ∴ I. C. (95%): 8,7 − 2,262 2 √10 ≤ μ ≤ 8,7 + 2,262 2 √10 = 7,27 ≤ μ ≤ 10,13 pelo fato de µ se um parâmetro e não uma v.a. o intervalo acima deve ser interpretado da seguinte maneira: 95% dos intervalos assim construídos conterão a verdadeira média. 7 1.2.2. Intervalo de confiança para proporção Sendo �̂� o estimador 𝜋, onde �̂� segue uma distribuição normal, logo: p̂~N(p̂; p̂ ∗ q̂ n ) (Pop. infinta) p̂~N [p̂; p̂ ∗ q̂ n ( N − n N − 1 )] (Pop. finita) Logo: Z = p̂ − π σp Onde: σp = √ p̂ ∗ q̂ n P = X n = Carateristica numero de elemetos da amostra P [− zα 2 σp√ N− n N − 1 ≤ π ≤ p̂ + zα 2 σp√ N − n N − 1 ] = 1 − α (pop. finita) Exemplo: Uma amostra aleatória de 100 eleitores do Município de Nampula dá 55% como favoráveis a um certo candidato. Determine os limites de confiança para a proporção global de eleitores favoráveis ao candidato assumindo 95% de confiança. p̂ = 0,55 ⟹ q̂ = 1 − 0,55 = 0,45 1 − α = 0,95 ⟹ α = 0,05 ⟹ α 2 = 0,025 ⟹ 1 − α 2 = 0,975 Z 1− α 2 = Z0,975 = 1,96 P(p̂ − z√ p(1 − p) n < p < p̂ + z√ p(1 − p) n = 1 − α) 8 P(0,55 − 1,96√ 0,25 ∗ 0,75 100 < p < 0,55 − 1,96√ 0,25 ∗ 0,75 100 = 0,95) ⟹ 0,55 − 1,96√ 0,25 ∗ 0,75 100 < p < 0,55 − 1,96√ 0,25 ∗ 0,75 100 ⟺ 0,57 < p < 0,53 1.3. Intervalos de confiança para a média: 𝝁 conhecido 1.3.1. IC para a média: 𝝈 conhecido A amostra é uma amostra aleatória simples. (Todas as amostrasde mesmo tamanho tem a mesma probabilidade de serem selecionadas) O valor do desvio padrão populacional 𝜎, é conhecido Uma ou ambas das seguintes condições são satisfeitas: A população é normalmente distribuída A amostra possui n > 30 Quando coletamos uma amostra aleatória e calculamos uma média, sabemos que o valor da média possui um desvio natural, em relação ao verdadeiro valor da média populacional (erro amostral), ou seja e = X̅ − μ ⟹ X̅ = μ + e Sabemos que a distribuição amostral da média é uma distribuição normal, com média 𝜇 e variância 𝜎2 𝑛 X̅~N(μ, 𝜎2 𝑛 ) Usando a transformação Z = X̅ − μ 𝜎 𝑛 = e 𝜎 𝑛 ~N (0,1) podemos determinar o erro máximo provável que assumimos para a média amostral que estamos calculando. 9 O erro máximo provável ou margem de erro da média é definido por e = zγ 2 ∗ 𝜎 √𝑛 onde zγ 2 é chamado de valor crítico. Fixando um valor 𝛾 tal que 0 < 𝛾 < 1, podemos encontrar um valor zγ 2 tal que: P [|Z| < zγ 2 ] = γ P [− zγ 2 < Z < zγ 2 ] = γ P [− zγ 2 < X̅ − μ 𝜎 𝑛 < zγ 2 ] = γ P [− zγ 2 ∗ ( 𝜎 √𝑛 ) < μ < X̅ + zγ 2 ∗ ( 𝜎 √𝑛 )] = γ P[X̅ − e < μ < X̅ + e] = γ O valor crítico zγ 2 é o valor de 𝛾 dividido por 2, uma vez que a “massa” 𝛾 deve ser distribuída igualmente em torno de 0. A área 𝛾 determina o coeficiente de confiança associado ao intervalo de confiança que estamos construindo. O valor zγ 2 pode ser obtido da tabela da Normal padrão, localizando o valor de 𝛾 2 no corpo da tabela e obtendo o valor zγ 2 nas margens correspondentes. Exemplo: 𝛾 = 0; 95: Temos que 𝛾 2 = 0; 475 é a área que devemos procurar no corpo da tabela O valor de zγ 2 será determinado pelos valores correspondentes nas margens da tabela. Nesse caso, zγ 2 = 1; 96 é o valor crítico procurado. 10 Com estas definições, podemos construir um intervalo de confiança para 𝜇, com coeficiente de confiança 𝛾: I. C. (μ, γ) = [X̅ − zγ 2 ∗ ( 𝜎 √𝑛 ) < μ < X̅ + zγ 2 ∗ ( 𝜎 √𝑛 )] Outras notações: X̅ − e < μ < X̅ + e X̅ ± e [X̅ − e; X̅ + e ] 1.4. Intervalo de Confiança para Variância Como o estimador de 𝜎2 𝑒 𝑆2 pode-se considerar que (𝑛−1)𝑆2 𝜎2 tem distribuição Qui - quadrado, ou seja: �̅�𝑛−1 2 ~𝑍 𝑆2 𝜎2 logo o intervalo será: Assim temos: P [ (𝑛 − 1)𝑆2 χsup2 ≤ σ2 ≤ (𝑛 − 1)𝑆2 χinf 2 ] = 1 − α χinf 2 = χ 1− α 2 ; φ 2 χsup 2 = χα 2 ; φ 2 11 Exemplo: Considerando a mesma amostra do exemplo anterior, calcule o I.C. para σ2 ao nível de 90% de confiança (ou seja, α =10% ). Solução: Temos: n = 10, S2 = 4, 𝔤. ℓ = ν = 9; α = 10% então: I.C.(90%) será: 9.4 16,4 ≤ σ2 ≤ 9.4 16,4 ou 2,13 ≤ σ2 ≤ 10,81 1.4.1. Intervalo de confiança para uma variância se a média é conhecida Para o caso da variância, se conhecemos a média, podemos determinar a probabilidade como sendo 𝑝( ∑ (𝑋𝑖 − 𝜇) 2𝑛 𝑖=1 𝜒 1− 𝛼 2 2 < 𝜎 2 < ∑ (𝑋𝑖 − 𝜇) 2𝑛 𝑖=1 𝜒 1− 𝛼 2 2 ) = 1 − 𝛼 Onde 1 − 𝛼 é o nível de confiança. O respectivo intervalo de confiança será: ∑ (𝑋𝑖 − 𝜇) 2𝑛 𝑖=1 𝜒 1− 𝛼 2 2 < 𝜎 2 < ∑ (𝑋𝑖 − 𝜇) 2𝑛 𝑖=1 𝜒 1− 𝛼 2 2 em que o 𝜒 1− 𝛼 2 2 tem n – 1 graus de liberdade. 1.4.2. Intervalo de confiança para uma variância se a média é desconhecida Para o caso da variância, se não conhecemos a média, podemos determinar a probabilidade a partir da seguinte expressão: 𝑝( (𝑛 − 1)𝑆2 𝜒 1− 𝛼 2 2 < 𝜎 2 < (𝑛 − 1)𝑆2 𝜒𝛼 2 2 ) = 1 − 𝛼 Onde 1 − 𝛼 é o nível de confiança. O respectivo intervalo de confiança será: (𝑛 − 1)𝑆2 𝜒 1− 𝛼 2 2 < 𝜎 2 < (𝑛 − 1)𝑆2 𝜒 1− 𝛼 2 2 12 em que o 𝜒𝛼 2 2 tem n – 1 graus de liberdade. E que 𝑋2 = (𝑛 − 1) 𝑆2 𝜎2 ~𝜒𝑛−1 2 , o que equivale a dizer que estamos em presença da distribuição qui-quadrático. Exemplo: Suponha-se em presença de uma população normal, com parâmetros desconhecidos. Com base numa amostra casual, com 16 observações, foi construído o seguinte intervalo de confiança para a média da população: ]7,398; 12,602[. Sabendo que, com a informação da amostra, se obteve s = 4 . Com base na mesma amostra construa um intervalo de confiança a 95% para a variância da população Resolução 1 − 𝛼 = 0,95 ⟹ 1 − 𝛼 2 = 0,957 ⟹ 𝜒(15;0,957) 2 = 27,5 ⟹= 𝜒(15;0,25) 2 = 6,26 𝜒2 ∈ ] 15 ∗ 16 27,5 ; 15 ∗ 16 6,26 [ ⟺ 𝜒2 ∈ ]8,2723; 38,3387[ 1.5. Intervalo de Confiança para a diferença Entre duas Médias: Usualmente comparamos as médias de duas populações formando sua diferença: 𝜇1 − 𝜇2 Uma estimativa pontual desta diferença correspondente: X̅1 − X̅2 a) Variâncias Conhecidas 𝜇1 − 𝜇2 = (�̅�1 − �̅�2) ± zγ 2 ∗ (erro padrão) Erro padrão? 𝑉𝐴𝑅(�̅�1 − �̅�2) = (−1) 2𝑉𝐴𝑅 �̅�1 + (−1) 2𝑉𝐴𝑅 �̅�2 = 𝜎1 2 𝑛1 + 𝜎2 2 𝑛2 logo o erro padrão = √ 𝜎1 2 𝑛1 + 𝜎2 2 𝑛2 13 P [(�̅�1 − �̅�2) − zα 2 ∗ √ 𝜎1 2 𝑛1 + 𝜎2 2 𝑛2 ≤ (𝜇1 − 𝜇2) ≤ (�̅�1 − �̅�2) + zα 2 ∗ √ 𝜎1 2 𝑛1 + 𝜎2 2 𝑛2 ] = 1 − α Obs.: se 𝜎1 e 𝜎2 são conhecidas e tem um valor em comum, logo: Erro Padrão: 𝜎√ 1 𝑛1 + 1 𝑛2 Exemplo: Seja duas classes muito grande com desvios padrões 𝜎1 = 1,21 𝑒 𝜎2 = 2,13. Extraída uma amostra de 25 alunos da classe 1 obteve-se uma nota média de 7,8, e da classe 2 foi extraída uma amostra de 20 alunos obteve-se uma nota média de 6,0. Construir um intervalo de 95% de confiança para a verdadeira diferença das médias populacionais. R = (LI=0,753; LS=2,847) b) Variâncias Desconhecidas Em geral conhecemos duas variâncias populacionais (𝜎2 1 𝑒 𝜎2 2). Se as mesmas são desconhecidas o melhor que podemos fazer é estimá-las por meio de variâncias amostrais 𝑆2 1 𝑒 𝑆2 2. Como as amostras serão pequenas, introduziremos uma fonte de erro compensada pela distribuição "t": P [(�̅�1 − �̅�2) − tα 2 ∗ √ 𝑆1 2 𝑛1 + 𝑆2 2 𝑛2 ≤ (𝜇1 − 𝜇2) ≤ (�̅�1 − �̅�2) + tα 2 ∗ √ 𝑆1 2 𝑛1 + 𝑆2 2 𝑛2 ] onde φ = n1 + n2 − 2 Obs.: Se as variâncias populacionais são desconhecidas mas as estimativas são iguais, poderemos usar para o Erro Padrão o seguinte critério: Erro padrão: 𝑆𝑐 = √ 1 𝑛1 + 1 𝑛2 onde: 𝑆𝑐 é o desvio padrão conjunto. 14 𝑆𝑐 = √ (𝑛1 − 1)𝑆1 2 + (𝑛1 − 1)𝑆2 2 𝑛1 + 𝑛2 − 2 Exemplo 1.: De uma turma (1) foi extraída uma amostra de 6 alunos com as seguintes alturas: 150, 152, 153, 160, 161, 163. De uma segunda turma foi extraída uma amostra de 8 alunos com as seguintes alturas: 165, 166, 167, 172, 178, 180, 182, 190. Construir um intervalo de 95% de confiança para a verdadeira diferença entre as médias populacionais. Exemplo 2.: De uma máquina foi extraída uma amostra de 8 peças, com os seguintes diâmetros: 54, 56, 58, 60, 60, 62, 63, 65. De uma segunda máquina foi extraída uma amostra de 10 peças, com os seguintes diâmetros: 75, 75, 76, 77, 78, 78, 79, 80, 80, 82. Construir um intervalo de 99% de confiança para a diferença entre as médias populacionais, supondo que as máquinas foram construídas pelo mesmo fabricante. 1.6. Intervalo de Confiança para a Diferença entre duas Proporções P [(�̂�1 − �̂�2) − Zα 2 ∗ √ p̂1q̂1 𝑛1 + p̂2q̂2 𝑛2 ≤ (𝜋1 − 𝜋2) ≤ (�̂�1 − �̂�2) + Zα 2 ∗ √ p̂1q̂1 𝑛1 + p̂2q̂2 𝑛2 ] = 1 − α Um intervalo de confiança para uma proporção populacional é dado por: �̂�1 − �̂�2 − z√ p̂1(1 − �̂�1) 𝑛1 + p̂2(1 − �̂�2) 𝑛2 < p1 − p2 < �̂�1 − �̂�2 < +z√ p̂1(1 − �̂�1) 𝑛1 + p̂2(1 − �̂�2) 𝑛2 onde: �̂�1 − �̂�2 é a diferença de proporção amostral Z é o valor da variável normal padrão para o grau de confiança 1 − α. n1 e 𝑛2 são os tamanhos das respectivas amostras. O valor de Z que é tabelado, deverá ser consultado para Z1−α 2 . Exemplo 15 Uma amostra aleatória de 100 eleitores do Município de Nampula, para certos bairros, dá 55% como favoráveis a um certo candidato, e outra de 100 eleitores para outro bairro, dá 52% ao mesmo candidato. Determine os limites de confiança para adiferença de proporções de eleitores favoráveis ao candidato assumindo 95% de confiança. Resolução: p̂1 = 0,55 ⟹ q1 = 1 − p1 = 1 − 0,55 = 0,45 p̂2 = 0,52 ⟹ q2 = 1 − p2 = 1 − 0,52 = 0,48 1 − α = 0,95 ⟹ α = 0,05 ⟹ α 2 = 0,025 ⟹ 1 − α 2 = 0,957 Z1−α 2 = Z0,975 = 1,96 P(0,55 − 0,52 − 1,96√ 0,55 ∗ 0,45 100 + 0,52 ∗ 0,48 𝑛2 < 𝑝1 − p2 < 0,55 − 0,52 + 1,96√ 0,55 ∗ 0,45 100 + 0,52 ∗ 0,48 𝑛2 ) = 0,95 0,55 − 0,52 − 1,96√ 0,55 ∗ 0,45 100 + 0,52 ∗ 0,48 𝑛2 < p1 − p2 < 0,55 − 0,52 + 1,96√ 0,55 ∗ 0,45 100 + 0,52 ∗ 0,48 𝑛2 1.7. Exercícios de Intervalos de Confiança para media, variância e proporção 1. Se uma amostra aleatória n=25, tem uma média amostral de 51,3 e uma desvio padrão populacional de σ=2. Construa o intervalo com 95% de confiança para a média populacional 𝜇. O Intervalo de Confiança é: [x̅ − zα 2 ∗ 𝜎 √𝑛 ; +zα 2 ∗ 𝜎 √𝑛 ] �̅� = média da amostra = 51,3 Probabilidade do I.C. conter o valor da média populacional =1− 𝛼 = 95% ⇒ α = 5% zα 2 = Z2,5% = valor para o qual 𝑃(0 ≤ 𝑍 ≤ 𝑍2,5%) = 0,5 − α 2 ⇒ 𝑃(0 ≤ 𝑍 ≤ 𝑍2,5% ) = 0,5 − 0,052 = 0,475 ⇒ 𝑍2,5% = 1,96 16 n = tamanho da amostra = 25 σ = desvio padrão da população = 2 Assim: I.C.= [51,3−1,96· 2 √25 ;51,3+1,96· 2 √25 ]=[51,3−0,78;51,3+0,78]=[50,52;52,08] I.C. = 51,3 ± 0,78 2. Sabe-se que a vida em horas de um bulbo de lâmpada de 75W é distribuída de forma aproximadamente normal com desvio padrão de σ=25. Uma amostra aleatória de 20 bulbos tem uma vida media de 1.014 horas. Construa um intervalo de confiança de 95% para a vida média. O Intervalo de Confiança é: [x̅ − zα 2 ∗ 𝜎 √𝑛 ; +zα 2 ∗ 𝜎 √𝑛 ] �̅� = média da amostra = 1014 Probabilidade do I.C. conter o valor da média populacional =1− 𝛼 = 95% ⇒ α = 5% zα 2 = Z2,5% = valor para o qual 𝑃(0 ≤ 𝑍 ≤ 𝑍2,5%) = 0,5 − α 2 ⇒ 𝑃(0 ≤ 𝑍 ≤ 𝑍2,5% ) = 0,5 − 0,052 = 0,475 ⇒ 𝑍2,5% = 1,96 𝑛 = tamanho da amostra = 20 𝜎 = desvio padrão da população = 25 Assim: I.C.= [1014−1,96· 25 √20 ;;1014+1,96· 25 √20 ]=[1014−11;1014+11]=[1003;1025] I.C. = 1014 ± 11 3. Qual deve ser o tamanho da amostra para que o intervalo com 99,5% de confiança para a média populacional tenha uma semi amplitude não superior a 1,5? Sabe-se que a variância populacional é de 23. O Intervalo de Confiança é: [x̅ − zα 2 ∗ 𝜎 √𝑛 ; x̅ + zα 2 ∗ 𝜎 √𝑛 ] Semi amplitude menor que 1,5 ⟹ zα 2 * 𝜎 √𝑛 < 1,5 Probabilidade do I.C. conter o valor da média populacional = 1 − 𝛼 = 99,5% ⇒ 𝛼 = 0,5% zα 2 = Z2,5% = valor para o qual 𝑃(0 ≤ 𝑍 ≤ 𝑍2,5%) = 0,5 − α 2 ⇒ 17 𝑃(0 ≤ 𝑍 ≤ 𝑍2,5% ) = 0,5 − 0,005 2 = 0,475 ⇒ 𝑍2,5% = 2,81 𝜎2= variância da população = 23 ⇒ σ = 4,8 Assim: 2,81· 4,8 √𝑛 <1,5 ⇒ n = 80,85 ≈ 81 elementos Outra maneira de determinar o tamanho da amostra é simplesmente aplicar a fórmula quando 𝜎 é conhecido: 𝑛 = ( zα 2 ∗ σ e0 ) 2 𝑒0 = semi amplitude do Intervalo de Confiança ≤ 1,5. Analisaremos o caso limite em que 𝑒0 vale 1,5. ⟹ 𝑛 = ( 2,48∗4,8 1,5 ) 2 = 80,85≈81 elementos. 4. Calcular o intervalo de confiança de 95% para a seguinte amostra, com variância populacional desconhecida: 19,8 18,5 17,6 16,7 15,8 15,4 14,1 13,6 11,9 11,4 11,4 8,8 7,5 15,4 15,4 19,5 14,9 12,7 11,9 11,4 10,1 7,9 Como não temos a variância (e o desvio padrão) populacional, devemos calcular o Intervalo de Confiança com base no desvio padrão amostral. O Intervalo de Confiança é: [x̅ − tn−1,α 2 ∗ 𝑆 √𝑛 ; x̅ + tn−1 α 2 ∗ 𝑆 √𝑛 ] Probabilidade do I.C. conter o valor da média populacional = 1 − 𝛼 = 95% ⇒ 𝛼 = 5% S =desvio padrão da amostra = √ ∑ (𝑥𝑖−�̅�) 2𝑛 𝑖=1 𝑛−1 x̅ =média da amostra = 13,71 ⟹ S = 3,55 18 t n−1, α 2 = t21,2,5% = 2,080 Assim: I.C.= [13,71−2,08· 3,55 √22 ;13,71+2,08· 3,55 √22 ]=[13,71−1,57;13,71+1,57] I.C. = [12,14;15,28] I.C. = 13,71 ± 1,57 5. Uma amostra piloto com 12 elementos tece média de 6,7 e desvio padrão de 1,7. Qual deve ser o tamanho da amostra para que a semi amplitude do intervalo de 99,5% de confiança da média populacional não seja superior a 0,8 Como não temos o desvio padrão populacional, devemos utilizar o desvio padrão amostral. O problema é que não temos como calcular 𝑆 para a amostra que desejamos saber o número de elementos. Assim, utilizaremos os valores da amostra piloto, que possui n’ elementos, para calcular o tamanho da amostra (n): 𝑛 = ( t n−1, α 2 ∗ S e0 ) 2 Probabilidade do I.C. conter o valor da média populacional = 1 − 𝛼 = 99,5% ⇒ 𝛼 = 0,5% tn−1,α 2 = t21,2,5% = 3,497 (valor retirado da tabela) S =desvio padrão da amostra piloto = 1,7 𝑒0 = semi amplitude do Intervalo de Confiança ≤ 0,8. Analisaremos o caso limite em que 𝑒0 vale 0,8. ⟹ 𝑛 = ( 3,497∗1,7 0,8 ) 2 = 55,2≈56 elementos 6. Há um movimento em Moçambique para que sejam criadas normas regulatórias a todos os processos produtivos. Os produtos hortigranjeiros não fogem à regra. Foram criadas diversas normas para regular esses produtos, que incluem todo tipo de informação para classificação dos produtos e maneiras corretas sobre como manuseá-los. Uma das iniciativas, por exemplo, é o Programa Moçambicano para Modernização da Horticultura. Esse programa de adesão 19 voluntária se baseia em uma autorregulamentação nacional do setor. O Centro de Qualidade em Horticultura da CEAGESP é o responsável pela operacionalização do programa desde o seu início. Vamos considerar uma amostra de 10 mil itens de horticultura, que passaram por uma fiscalização do programa. O número de não conformidades por item está registrado na tabela a seguir. Número de não conformidades 0 1 2 3 4 Quantidade 6.000 3.000 600 350 50 a) Qual o intervalo de confiança para a proporção de itens não conformes, considerando um nível de confiança de 98%? b) Qual o intervalo de confiança para o número médio de não conformidades nos itens, considerando um nível de confiança de 98%? Resoluções a) Conforme os dados do problema, temos: �̂� = 𝑛𝑜𝑑𝑒 𝑑𝑒𝑓𝑒𝑖𝑡𝑢𝑜𝑠𝑜𝑠 𝑛𝑜 𝑡𝑜𝑡𝑎𝑙 𝑑𝑒 𝑖𝑡𝑒𝑛𝑠 = 4000 10000 = 0,4 Zα 2 = Z0,49 = 2,33 Agora, facilmente calculamos o intervalo solicitado, aplicando o que aprendemos: 𝐼. 𝐶 → �̂� ± Zα 2 √ p̂(1 − p̂) n = 0,4 ± 2,33√ 0,4 ∗ 0,6 10000 𝐼. 𝐶 → 0,4 ± 0,0114 𝐼. 𝐶 → [0,3886; 0,4114] b) Vamos agora calcular �̅� e 𝑠2 S necessários para o cálculo do I.C.: �̅� = 1 ∗ 3000 + 2 ∗ 600 + 3 ∗ 350 + 4 ∗ 50 10000 �̅� = 5450 10000 = 0,545 𝑆2 = ∑ (𝑥𝑖 − �̅�) 2𝑛 𝑖=1 𝑛 − 1 20 𝑆2 = 6000(0 − 0,545)2 + 3000(1 − 0,545)2 + 600(2 − 0,545)2 + 350(3 − 0,545)2 + 50(4 − 0,545)2 9999 𝑆2 = 6379,75 9999 = 0,638 𝑆 = √𝑆2 = 0,799 Vamos calcular I.C. 𝐼. 𝐶 → �̅� ± t n−1, α 2 ∗ S √n t n−1, α 2 = t→∞;0,01 = 2,326 𝐼. 𝐶 → 0,545 ± 2,326 ∗ (0,799) √10000 𝐼. 𝐶 → 0,545 ± 0,019 𝐼. 𝐶 → [0,526; 0,564] 7. Kefir é uma colônia de micro-organismos simbióticos. É formada por lactobacilos e leveduras que fermentam em ambiente propício e conhecida por supostamente trazer diversos benefícios ao organismo humano. A bebida produzida com o kefir baseia-se na fermentação realizada com cultivos de ácidos láticos elaborados com seus grãos. Para que esse produto traga benefícios para a saúde humana, é necessário que se ingira a mistura levemente alcoólica em que ele está contido. Foi realizado um estudo para avaliar o efeito da bebida de kefir com 100 voluntários. Dos pesquisados, 60 afirmaram reconhecer uma melhora em sua qualidade de vida. a) Determine um I.C. de 80% para a proporção de voluntários que afirmaram sentir os efeitos do kefir. b) Determine o tamanho da amostra para que o erro cometido seja de no máximo 0,01, com probabilidade de 80%. 21 Solução a) Vamos organizaros dados do problema. �̂� = 0,6 𝑛 = 100 Z α 2 = 1,28 Para calcular o intervalo de confiança, temos: 𝐼. 𝐶 → �̂� ± Zα 2 √ p̂(1 − p̂) n = 0,6 ± 1,28√ 0,6 ∗ 0,4 100 = [0,55; 0,65] b) Vamos representar em linguagem numérica o que se pede nesse item: 80% = 𝑝(|�̂� − 𝑝| ≤ 0,01) Isso quer dizer que queremos um valor para n tal que a probabilidade de que o módulo da diferença entre a proporção amostral e a proporção real (desconhecida) seja menor que 1%. Sabemos que segue uma distribuição aproximadamente normal com os seguintes parâmetros: �̂�~𝑁 (𝑝, 𝑝(1 − 𝑝) 𝑛 ) Criaremos a variável aleatória. Como W é combinação linear de uma variável aleatória com distribuição normal e uma constante, W também terá distribuição normal, com os seguintes parâmetros: 𝐸(W) = E(�̂� − 𝑝) = 𝐸(�̂�) − 𝐸(𝑝) = 𝑝 − 𝑝 = 0 𝑉𝑎𝑟(𝑊) = 𝑉𝑎𝑟(�̂� − 𝑝) = 𝑉𝑎𝑟(�̂�) = 𝑝(1 − 𝑝) 𝑛 Vamos desenvolver melhor a probabilidade buscada. 80% = 𝑝(|�̂� − 𝑝| ≤ 0,01) 80% = 𝑃 ( |�̂� − 𝑝| √𝑝(1 − 𝑝) 𝑛 ≤ 0,01 √𝑝(1 − 𝑝) 𝑛 ) 22 80% ≈ 𝑃 ( |𝑍| ≤ 0,01 √𝑝(1 − 𝑝) 𝑛 ) Da tabela da distribuição normal, temos que Zα 2 = Z0,10 = 1,28 Ou seja, 0,01 √𝑝(1 − 𝑝) 𝑛 = 1,28 Como não conhecemos o verdadeiro valor de p, utilizaremos o valor estimado por . Assim, ficamos com 0,01 √0,6(1 − 0,6) 100 = 1,28 → 𝑛 = 0,6 ∗ 0,4 ∗ ( 1,28 0,01 ) 2 = 3932 Um comentário adicional é importante. E se não houvesse uma amostra piloto? Bem, nesse caso, escolheríamos um tamanho de amostra para a pior situação possível. Essa situação acontece quando p = q = 0,5. Esse valor maximiza n. No caso desse exercício, teríamos → 𝑛 = 0,5 ∗ 0,5 ∗ ( 1,28 0,01 ) 2 = 4096 23 Conclusão Após a leitura minuciosa do trabalho transcrito nos últimos parágrafos, importa salientar que a principal restrição da estimação de intervalos por confiança é que quando estimamos um parâmetro através de um único valor numérico toda a informação presente nos dados é resumida através deste número. É importante encontrar também um intervalo de valores plausíveis para o parâmetro. A idéia é construir um intervalo em torno da estimativa pontual de modo que ele tenha uma probabilidade conhecida de conter o verdadeiro valor do parâmetro. Tipicamente as distribuições amostrais de estimadores dos parâmetros desconhecidos serão utilizadas. 24 Referências bibliográficas LOPES, Luis Filipe Dias Apostila Estatística, D E - UFSM, 2003 GUIMARÃES, Paulo Ricardo Bittencourt Apostila Da Disciplina Inferência Estatística I, Universidade Federal do Paraná, 2003 MARTINS, Maria Eugenia Graça, Introdução à Probabilidade e à Estatística com complementos de Excel, Universidade de Portugal, 2005 PETERNELLI, Luiz A., Intervalos de Confiança, INF-162, Portugal, 2008
Compartilhar