Baixe o app para aproveitar ainda mais
Prévia do material em texto
Luana de Melo Pereira Disciplina: Estatística Básica Universidade Federal de Pelotas Centro das Engenharias - Ceng 4.2. ESTIMAÇÃO DE PARÂMETROS 2 Estimação de parâmetros Conceitos iniciais Estimação por ponto e por intervalo Intervalos de confiança para a média de uma população (Estatística Z e T) Para a diferença entre duas médias (Estatística T) 3 2 X 2S P Estimadores Variável aleatória Parâmetros Variáveis aleatórias Constantes População Amostra θ θˆ O estimador é uma variável aleatória; portanto, pode assumir diferentes valores Estimativa é um valor particular que o estimador assume 4 Parâmetros Constantes que caracterizam uma população; Geralmente são valores desconhecidos; São representados pela letra grega theta (θ). Estimadores Valores calculados na amostra com o objetivo de fornecer informações sobre os parâmetros; São representados pela letra grega theta com um acento circunflexo . Exemplos: média da população () variância da população (2) Exemplos: média da amostra ( ) variância da amostra ( ) θˆ X 2S 5 Podem existir vários estimadores para um mesmo parâmetro. n X X i i ii p p pX X Exemplos: estimadores de 1n )X(X S 2 i2 n )X(X S 2 i2 n estimadores de 2 Melhor estimador Melhor estimador imparcial e mais eficiente imparcial 6 Processo de estimação Estimação por ponto É o processo através do qual obtemos um único ponto, ou seja, um único valor para estimar o parâmetro. 2 3 231 n x x i 1 13 2)(22)(32)(1 1n )x(x s 2222 i2 estimativa por ponto de estimativa por ponto de 2 Exemplo: Amostra (1, 3, 2) 7 Processo de estimação Estimação por intervalo É um processo que permite obter os limites de um intervalo onde, com uma determinada probabilidade (nível de confiança), podemos esperar encontrar o verdadeiro valor do parâmetro. Li < < Ls Limite inferior Limite superior dois valores Intervalo de confiança As estimativas por intervalo são preferíveis àquelas por ponto porque indicam a precisão, estabelecendo limites entre os quais, com uma determinada probabilidade, o parâmetro deverá estar. 8 INTERVALOS DE CONFIANÇA PARA MÉDIA - 9 1. Intervalo de confiança para a média de uma população () Duas situações Não conhecemos o valor de σ2 ou (e n ≤ 30) 2. Intervalo de confiança para a diferença entre médias de duas populações (1-2 ) Como construir intervalos de confiança para ? Distribuição Normal Padrão (variável Z) Distribuição t de Student Distribuição t de Student 10 =0 -z/2 z/2 /2 /2 1- Nível de confiança IC (; 1): : é o estimador de n : é o tamanho da amostra; : é desvio padrão da população (parâmetro) z/2 : é o valor de Z que delimita a área /2 onde: 1) n σ zXμ n σ zXP( /2/2 n σ zX /2 X 1- é a probabilidade de que os limites contenham (ou cubram) o verdadeiro valor de . Nível de confiança Limite superior Limite inferior 1. Intervalo de confiança para a média de uma população () 11 Em geral, não conhecemos o parâmetro . Por isso usamos uma estimativa desse parâmetro que é o s (desvio padrão obtido de uma amostra). 12 Os teores (%) de matéria orgânica medidos em 100 amostras de sedimentos retirados do canal São Gonçalo nos meses de janeiro e fevereiro de 2010 apresentaram média de 65,5% e desvio padrão de 4,8 %. Obtenha o intervalo de confiança ao nível de 95%, para o verdadeiro teor médio de matéria orgânica e redija a conclusão. Exemplo 1 Resolução: 13 Estimativas: Conclusão: concluímos que o intervalo de confiança, ao nível de 95%, para o verdadeiro teor médio de matéria orgânica presente nos sedimentos do canal São Gonçalo nos meses de janeiro e fevereiro de 2010 é de 64,56 a 66,44 %. Construção do intervalo: x = 65,5% s = 4,8% n = 100 amostras 0,025 0 0,025 0,95 -1,96 +1,96 IC (; 0,95): 65,5 0,941 Limite inferior = 65,5 – 0,941 = 64,56 Limite superior = 65,5 + 0,941 = 66,44 P(64,56 < < 66,44) = 0,95 IC (; 0,95): 65,5 1,96 100 4,8 IC (; 1): z/2 n σX 14 1. Intervalo de confiança para a média de uma população () Situação 2: Quando não conhecemos o valor de e n< 30 Quando não conhecemos o desvio padrão populacional () e a amostra é pequena, não podemos supor que o desvio padrão da amostra (s) seja uma estimativa suficientemente aproximada do parâmetro . Portanto, não podemos utilizar a estatística Z, para construir o intervalo de confiança para : Nesse caso, em vez de Z, utilizamos a distribuição t de Student, com parâmetro . desconhecido IC (; 1): n σ zX /2 15 A distribuição t de Student - + A distribuição t tem formato de sino, é simétrica em torno da média ( = 0), localizada no centro da distribuição, e varia de - a +. Se assemelha à curva normal padrão, sendo um pouco mais achatada no centro. O parâmetro é o número de graus de liberdade () associado à variância. n 30 graus de liberdade – t e z são aproximadamente iguais 120 graus de liberdade - t e z são exatamente iguais =0 -t/2 t/2 1- Nível de confiança É o valor da estatística T que delimita a área /2. É obtido da tabela de limites da distribuição t de Student sabendo-se o valor de (ní) e o valor de α (nível de significância). 16 17 18 1. Intervalo de confiança para a média de uma população () IC (; 1): t/2 n SX A variável em estudo tem distribuição normal X ~ N (,2) Pressuposição 1) n S tX n S tXP( /2/2 Situação 2: Quando não conhecemos o valor de e n< 30 : é o estimador de n : é o tamanho da amostra; S : é desvio padrão da amostra t/2 : é o valor da estatística T que delimita a área /2 onde: X 19 Através da amostra de tamanho 15 que segue, procura-se estimar a verdadeira potência média de aparelhos eletrônicos de alta sensibilidade medida em microwatts, através de um intervalo de confiança de 95%: 26,7; 25,8; 24,0; 24,9; 26,4; 25,9; 24,4; 21,7; 24,1; 25,9; 27,3; 26,9; 27,3; 24,8; 23,6 Variável em estudo: X = potência de aparelhos eletrônicos (microwatts) Pressuposição: A variável em estudo tem distribuição normal. IC (; 1): t/2 n SX Exemplo 2 Resolução: 20 0,025 0 0,025 0,95 =25,31 s=1,579 n=15 =0,01 x =15 – 1=14 IC (; 0,99): 25,31 0,874 Limite inferior: 25,31 – 0,874 = 24,44 Limite superior: 25,31 + 0,874 = 26,18 P(24,44 < < 26,18) = 0,95 IC (; 0,99): 25,31 2,145 Estimativas: t0,025;14 = 2,145 15 1,58 Conclusão: A probabilidade de que o intervalo de 24,44 a 26,18 microwatts contenha a verdadeira potência média dos aparelhos eletrônicos é de 0,95. n S tX:);1(IC /2 Construção do intervalo: -2,145 +2,145 21 Um engenheiro de desenvolvimento de um fabricante de pneus está investigando a vida do pneu em relação a umnovo componente de borracha. Ele fabricou 25 pneus e testou-os até o fim da vida em um teste na estrada. A média e o desvio padrão da amostra são 61.492 e 6.085 km, respectivamente. O engenheiro acredita que a vida média desse novo pneu é maior em relação a 60.000 km, que é a vida média do pneu antigo. Obtenha o intervalo de confiança, ao nível de 99%, para a vida média do pneu e conclua a respeito da suposição do engenheiro. Variável em estudo: X = vida do pneu (km) Pressuposições: A variável em estudo tem distribuição normal. Exercício proposto: Resolução: 22 0,005 0 0,005 0,99 Estimativas: x = 61.492 km s = 6.085 km n = 25 pneus IC (; 0,99): 61.492 3404 Limite inferior: 61.492 – 3404 = 58.088 Limite superior: 61.492 + 3404 = 64.896 P(58.088 < < 64.896) = 0,99 IC (; 0,99): 61.492 2,797 25 6.085 Construção do intervalo: n tX:)1 ;(IC α/2 Conclusão: O intervalo de confiança, ao nível de 99%, para a verdadeira vida média do novo pneu é de 58.088 a 64.896 km. Como o valor 60.000 km está coberto pelo intervalo, a vida média do novo pneu não diferiu significativamente em relação a do pneu antigo, contrariando a suposição do engenheiro. -2,797 +2,797 23 Há três pressuposições que devem ser atendidas para o uso desse procedimento: 1. A variável em estudo tem distribuição normal: X ~ N (,2) 3. As amostras retiradas das populações são independentes 2. As variâncias das populações são iguais σ)σ(σ 22 2 1 2. Intervalo de confiança para a diferença entre médias de duas populações (1-2 ) 1 2 [X11, X12, ..., X1n1 ] [X21, X22, ..., X2n2 ] Amostra 1 Amostra 2 População 1 População 2 2 24 Atendidas as pressuposições, desejamos comparar as médias das populações, estimando por intervalo, a diferença 1 - 2. Utilizamos, a seguinte expressão 1n1n 21 Grau de liberdade combinado IC ( ; 1): t/2 2 21 S n 1 n 1 21 XX 21 μμ 1n1n 1nS1nS S 21 2 2 21 2 12 Variância combinada 25 Cinco cobaias adultas criadas em laboratório, foram separadas, aleatoriamente, em dois grupos: um foi tratado com ração normalmente usada no laboratório (padrão) e o outro grupo foi submetido a uma nova ração (experimental). As cobaias foram pesadas no início e no final do período de duração do experimento. Os ganhos de peso (em gramas) observados foram os seguintes: Construa o intervalo de confiança, ao nível de 99%, para a diferença entre as médias das duas populações. Ração experimental 220 200 210 220 210 Ração padrão 200 180 190 190 180 Exemplo 3 26 0,005 0 0,005 0,99 Variável em estudo: X = ganho de peso (g) Pressuposições: 1. A variável em estudo tem distribuição normal. 2. As variâncias das populações são iguais ( ). 3. As amostras retiradas das populações são independentes. 22 2 2 1 σσσ 2x = 188 = 70 Experimental 2 1s n1 = 5 Estimativas: = 212 = 70 Padrão n2 = 5 1x 2 2s =0,01 =(5 – 1) + (5 – 1) = 8 t0,005;8 = 3,355 70 1515 157015702s 2 21 2121 S n 1 n 1 tXX:);1μ(μIC /2 -3,355 +3,355 Resolução: 27 IC (; 0,99): 24 17,75 Limite inferior: 24 – 17,75 = 6,25g Limite superior: 24 + 17,75 = 41,75g P(6,25 < < 41,75) = 0,99 IC (; 0,99): 212-188 3,355 Construção do intervalo: Conclusão: O intervalo de confiança, ao nível de 99%, para a verdadeira diferença média de ganho de peso entre a ração experimental e a padrão é de 6,25 a 41,75 gramas. Como o valor zero não está coberto pelo intervalo, significa que o ganho médio de peso entre as duas rações diferiu significativamente. A ração experimental confere um ganho de peso maior que a ração padrão. IC ( ; 1): t/2 2 21 S n 1 n 1 21 XX 21 μμ 07 5 1 5 1 21 μμ 28 Próxima aula - 4.3. Testes de Hipóteses Para média Para variância
Compartilhar