Prévia do material em texto
Estimação pontual e por intervalo Inferência estatística Tirar conclusões sobre a população a partir de uma amostra. Se a amostra for bem representativa, os resultados poderão ser generalizados para toda população. Inferência estatística Pode ser dividida em: Estimação de parâmetros (pontual ou intervalar) Testes de hipóteses. Palavras - significados Inferir – Deduzir, concluir por inferência ou por dedução, geralmente partindo de indícios, de fatos ou de raciocínios: com esse aparelho é possível inferir a velocidade da chuva; o juiz inferiu a culpa dos réus. Sinônimos: deduzir, supor, alcançar, compreender, depreender, entender, perceber, saber, concluir Palavras - significados Estimar Ter estima, ter apreço, afeição, amizade; gostar de; apreciar: estimo meu filho; não sabe se estimar. Determinar o valor de uma coisa, avaliar, calcular (o preço, a quantidade): estima-se em 155 milhões a população do Brasil. Ter em consideração; inserir num cálculo; calcular: estimar o número de sobreviventes. [Estatística] Realizar uma estimação, um processo que parte de um parâmetro para analisar uma parte e determinar o valor do todo. Julgar algo ou alguém partindo de evidências; achar, crer: estimar o sentimento do outro. Sinônimos: Estimar é sinônimo de: prezar, avaliar, calcular, achar, crer, querer, desejar, apreciar, gostar Estimação de parâmetros Há dois tipos fundamentais de estimação: por ponto e por intervalo. Na estimação por ponto, a partir das observações, calcula-se uma estimativa, usando o estimador ou “estatística”. Utiliza os dados da amostra para se chegar a um único número que representa um valor plausível para a característica de interesse. Estimação intervalar: reporta um conjunto de valores plausíveis para a característica de interesse. Estimativa pontual A estimativa pontual é obtida selecionando-se, primeiro, uma estatística adequada. A estimativa é, em seguida, o valor da estatística para a amostra dada. Qualquer função da amostra que não depende de parâmetros desconhecidos é denominada uma estatística (exemplo: média amostral, variância amostral) Exemplo 1 O valor calculado da média da amostra 𝑥ҧ fornece uma estimativa pontual de uma média populacional (μ). Seja X uma variável aleatória normalmente distribuída. Suponha que a média μ de X não seja conhecida. Depois da amostra ter sido observada, o valor numérico de 𝑥ҧ é uma estimativa pontual de μ. Suponha que a amostra observada foi 𝑥1 = 25, 𝑥2 = 30, 𝑥3 = 29, 𝑥4 = 31. A estimativa de μ é 𝑥ҧ = 25 + 30 + 29 + 31 4 = 28,75 Intervalo de confiança A partir das condições em que se realiza um experimento ou teste estatístico, podemos esperar um resultado ou outro. Se estivermos preparando um teste de controle de qualidade na produção de um componente eletrônico à base de um único material e fabricado com máquinas de alta precisão, poderemos esperar que algo como 99% deles saiam em perfeitas condições e 1% não seja aprovado no controle. Em outros casos, como na fabricação de um tipo de biscoito com cobertura e recheio, por exemplo, a existência de diversos ingredientes, desde a farinha até o chocolate da cobertura, causará maior variação no produto final, de modo que, se estivermos controlando o peso, dificilmente conseguiremos mais de 95% dos pacotes com peso dentro do limite estipulado por lei, que é de 1% acima ou abaixo do valor marcado na embalagem. Cabe ao estatístico prever os percentuais de erros possíveis no teste ou na estimativa de fenômenos quantitativos que ele estiver preparando, tentado, é claro, diminuí-los e, assim, aumentar a certeza das previsões. Intervalo de confiança Devido à existência desse erro na estimação, surge a ideia de se construir um intervalo em torno da estimativa por ponto, de modo que esse intervalo tenha uma probabilidade conhecida de conter o verdadeiro valor do parâmetro. Um intervalo de confiança (IC) é o intervalo que, com probabilidade conhecida, deverá conter o valor real do parâmetro. Os percentuais fixados para o controle da variável são chamados níveis de confiança e, em geral, espera-se que sejam maiores que 90%. IC para média 𝜇 A fórmula geral para um intervalo de confiança para uma média populacional 𝜇 quando 𝑥ഥ é a média amostral de uma amostra aleatória, e O tamanho da amostra 𝑛 é grande (𝑛 ≥ 30), e 𝜎, o desvio padrão da população (ou da amostra), é conhecido é dada por 𝑰𝑪 = 𝒙ഥ − 𝒛 , 𝒙ഥ + 𝒛 𝝈 𝝈 𝒏 𝒏 Observação: Se 𝑛 é pequena (geralmente 𝑛 < 30), mas é razoável pensar que a distribuição dos valores na população é normal, um intervalo de confiança para 𝜇 (quando 𝜎 é conhecido) é o mesmo mostrado acima. Os níveis de confiança variam de acordo com o experimento que estiver sendo realizado, mas os mais comuns são 90%, 95% e 99%, que correspondem, segundo a tabela normal padrão, a 𝑧 = 1,65, 𝑧 = 1,96 e 𝑧 = 2,58 , respectivamente. Exemplo 2 – Observando-se o teor de gordura fecal de 43 crianças que não eram amamentadas, obteve-se uma média de 2,303 e um desvio padrão de 0,872. Estabeleça um intervalo de confiança para 𝜇 com 95% de nível de confiança. 𝒙ഥ − 𝒛 𝝈 , 𝒙ഥ + 𝒛 𝝈 𝒏 𝒏 2,303 − 1,96 0,872 ; 2,303 + 1,96 0,872 43 43 𝑰𝑪 𝝁, 𝟗𝟓% = 𝐼𝐶 𝜇, 95% = 𝐼𝐶 𝜇, 95% = 2,042 ; 2,564 Exemplo 3 – Suponha que os comprimentos de jacarés adultos de uma certa raça siga o modelo Normal com média μ desconhecida e variância igual a 0,01 m2. Uma amostra de 10 animais foi sorteada e forneceu média 1,69 m. Desejamos uma estimativa para o parâmetro μ. 𝒙ഥ − 𝒛 𝝈 , 𝒙ഥ + 𝒛 𝝈 𝒏 𝒏 𝑰𝑪 𝝁, 𝟗𝟓% = 𝐼𝐶 𝜇, 95% = 10 1,69 − 1,96 0,01 ; 1,69 + 1,96 0,01 10 𝐼𝐶(𝜇, 95%) = 1,63; 1,75 Exemplo 4 Um provedor de acesso à internet está monitorando a duração do tempo das conexões de seus clientes, com o objetivo de dimensionar seus equipamentos. São desconhecidas a média e a distribuição de probabilidade desse tempo, mas o desvio padrão, por analogia a outros serviços, é considerado igual a 50 minutos. Uma amostra de 500 conexões resultou num valor médio observado de 25 minutos. O que dizer da verdadeira média, com confiança de 92%? 𝑰𝑪(𝝁, 𝟗𝟐%) = 𝒙ഥ − 𝒛𝜸 𝟐 𝒏 , 𝒙ഥ + 𝒛𝜸 𝟐 𝝈 𝝈 𝒏 𝐼𝐶(𝜇, 92%) = 25 − 1,75 500 50 ; 25 + 1,75 50 500 𝐼𝐶(𝜇, 92%) = 24,45; 25,55 Intervalos de confiança para média Na figura temos o significado de um IC para μ, com nível de confiança 95% (0,95) e variância conhecida. Se pudéssemos construir uma quantidade grande de intervalos aleatórios da forma , todos baseados em amostras de tamanho n, 95% deles conteriam o parâmetro μ. image1.png image2.jpeg image3.png image4.png image5.png image6.png image7.png image8.png image9.jpeg