Prévia do material em texto
BIOESTATÍSTICA Estimação Pontual São estimadores que fornecem, para uma amostra, uma única estimativa do parâmetro de interesse. Por exemplo: ത𝑋 = σ𝑖=1 𝑛 𝑥𝑖 𝑛 é o estimador pontual da média (𝜇). 𝑆2 = σ𝑖=1 𝑛 𝑥𝑖− ത𝑋 2 𝑛−1 é o estimador pontual da variância 𝜎2 . Ƹ𝑝 = 𝑓𝑎𝑣𝑜𝑟á𝑣𝑒𝑖𝑠 𝑝𝑜𝑠𝑠í𝑣𝑒𝑖𝑠 é o estimador pontual da proporção (p). Distribuição amostral da média Será que as médias amostrais vão seguir alguma distribuição? ത𝑋1, ത𝑋2 , ത𝑋3, ത𝑋4, … Quando trabalhamos com amostra com reposição temos: A média amostra ത𝑋~𝑁 𝜇, 𝜎2 𝑛 𝐸 ത𝑋 = 𝜇 𝑒 𝑉𝐴𝑅 ത𝑋 = 𝜎2 𝑛 Já quando trabalhamos com amostra sem reposição temos: A média amostra ത𝑋~𝑁 𝜇, 𝜎2 𝑛 × 𝑁−𝑛 𝑛−1 𝐸 ത𝑋 = 𝜇 𝑒 𝑉𝐴𝑅 ത𝑋 = 𝜎2 𝑛 × 𝑁 − 𝑛 𝑛 − 1 Seja x o número de sucessos em uma amostra de tamanho n. O estimador da proporção de sucessos é: Ƹ𝑝 = 𝑓𝑎𝑣𝑜𝑟á𝑣𝑒𝑖𝑠 𝑝𝑜𝑠𝑠í𝑣𝑒𝑖𝑠 = 𝑥 𝑛 Se atribuirmos 1 para sucesso e 0 para fracasso, podemos reescrever o estimador pela seguinte expressão: Ƹ𝑝 = σ𝑖=1 𝑛 𝑋𝑖 𝑛 Ou seja, a proporção é uma média de zeros e uns, logo a proporção é um caso especial da média. Então, Ƹ𝑝 têm distribuição aproximadamente 𝑁 𝑝, 𝑝(1−𝑝) 𝑛 Distribuição amostral da proporção Estimação Intervalar A estimação intervalar consiste na criação de um intervalo de valores possíveis, o qual admite-se que pode conter o parâmetro com certa probabilidade. Esta probabilidade é denominada “nível de confiança” e é simbolizada por 1 − 𝛼. O valor de pode ser entendido como a probabilidade de o verdadeiro valor do parâmetro não pertencer ao intervalo. Em geral, o valor de é fixado pelo pesquisador em 1% ou 5%, gerando intervalos de 99% ou 95% de confiança respectivamente. A obtenção dos limites dos intervalos de confiança (IC) é feita com base na distribuição amostral do estimador do parâmetro em questão. A ideia de um IC é: (estimativa pontual erro). Naturalmente este erro depende de quê? Intervalo de Confiança (IC) para a média (𝜇) Seja ത𝑋 a estimativa pontual de 𝜇, obtida a partir de uma amostra aleatória de tamanho n, de uma população com variância conhecida 𝜎2. Temos pelo Teorema Central do Limite que: 𝑍𝑛 = ത𝑋 − 𝜇 𝜎 𝑛 ≈ 𝑁(0,1) ±𝑍 = ത𝑋 − 𝜇 𝜎 𝑛 ⇒ ±𝑍 × 𝜎 𝑛 = ത𝑋 − 𝜇 ⇒ 𝜇: ത𝑋 ± 𝑍 × 𝜎 𝑛 Assim um intervalo de confiança de 100(1 − 𝛼)% para é dado por: 𝐼𝐶1−𝛼 𝜇 : ത𝑋 ± 𝑍𝛼 2 × 𝜎 𝑛 ou 𝑃 ത𝑋 − 𝑍𝛼 2 × 𝜎 𝑛 < 𝜇 < ത𝑋 + 𝑍𝛼 2 × 𝜎 𝑛 ≤ 1 − 𝛼 Naturalmente, o que varia de amostra para amostra é o valor do intervalo e não o parâmetro. Assim a interpretação de um intervalo de confiança de 95% por exemplo é que ao realizar um certo número de amostras 95% dos intervalos obtidos conterão o verdadeiro valor do parâmetro. Veja na figura abaixo a ideia do intervalo de confiança para a média. Exemplo: A concentração média de volume globular (VG) em 36 amostras de sangue de equinos foi de 2,6g/Kg. Sabendo que o desvio padrão da concentração de VG é 𝜎 = 0,3 g/Kg, obtenha um intervalo de confiança de 95% para a concentração média de VG nestes exames de sangue. 𝑛 = 36 ത𝑋 = 2,6 𝜎 = 0,3 𝛼 = 0,05 𝑍0,025 = 1,96 𝐼𝐶95% 𝜇 : 2,6 ± 1,96 × 0,3 36 ⇒ 𝐼𝐶95% 𝜇 : 2,6 ± 0,1 ⇒ 𝐼𝐶95% 𝜇 : [2,5; 2,7] Que significa que 95% dos intervalos obtidos em amostras de tamanho 36 conterão o verdadeiro valor da concentração média de volume globular (𝜇). IC para a proporção (p) O intervalos de confiança para o parâmetro proporção (p) são obtidos de maneira similar aos intervalos para a média (𝜇). Seja x o número de sucessos em uma amostra de tamanho n. O estimador da proporção de sucessos é: Ƹ𝑝 = 𝑓𝑎𝑣𝑜𝑟á𝑣𝑒𝑖𝑠 𝑝𝑜𝑠𝑠í𝑣𝑒𝑖𝑠 = 𝑥 𝑛 Se atribuirmos 1 para sucesso e 0 para fracasso, podemos reescrever o estimador pela seguinte expressão: Ƹ𝑝 = σ𝑖=1 𝑛 𝑋𝑖 𝑛 Se n for suficientemente grande (n > 30), podemos utilizar o Teorema Central do Limite e afirmar que Ƹ𝑝 tem distribuição aproximadamente normal com média p e variância 𝑝(1−𝑝) 𝑛 . Consequentemente podemos obter a variável Z, por: 𝑍 = Ƹ𝑝 − 𝑝 𝑝(1 − 𝑝) 𝑛 ⇒ 𝑍~𝑁(0,1) Assim, para uma amostra suficientemente grande, um intervalo de confiança de 100(1 − 𝛼)% para é dado por: 𝐼𝐶1−𝛼 𝑝 : Ƹ𝑝 ± 𝑍𝛼 2 ො𝑝(1− ො𝑝) 𝑛 ou 𝑃 Ƹ𝑝 − 𝑍𝛼 2 ො𝑝(1− ො𝑝) 𝑛 < 𝑝 < Ƹ𝑝 + 𝑍𝛼 2 ො𝑝(1− ො𝑝) 𝑛 ≤ 1 − 𝛼 Exemplo: Uma amostra aleatória de 487 pacotes de ração para gatos foi selecionada e analisado se possuíam todos os atributos sensoriais esperados. Um total de 35 pacotes destes não possuíam as características esperadas. Calcule o intervalo de confiança de 95% para a proporção de pacotes não possuem todos os atributos sensoriais esperados. Ƹ𝑝 = 35 487 = 0,0719; 𝑛 = 487; 𝛼 = 5%; 𝑍0,025 = 1,96 𝐼𝐶95% 𝑝 : Ƹ𝑝 ± 𝑍𝛼 2 Ƹ𝑝(1 − Ƹ𝑝) 𝑛 ⇒ 𝐼𝐶95% 𝑝 : 0,0719 ± 1,96 0,0719 (1 − 0,0719) 487 𝐼𝐶95% 𝑝 : 0,0719 ± 0,0229 ⇒ 𝐼𝐶95% 𝑝 : (0,049; 0,0948) O intervalo de confiança da proporção com 95% de confiança foi 𝐼𝐶95% 𝑝 : (0,049; 0,0948)