Baixe o app para aproveitar ainda mais
Prévia do material em texto
14/09/2023 1 Estatística aplicada a pesca Aula 9 – Estatística inferencial- população, amostra e inferência Prof. Luiza Prestes Universidade do Estado do Amapá – UEAP Curso de Engenharia de pesca Grupo de pesquisa EMOA The twin problem of sampling (Snedecor e Cochran, 1967) 14/09/2023 2 • Parâmetro populacional: constante (em geral desconhecida) que descreve uma população. É representado por uma letra grega minúscula; • Estimador: é representado por uma letra minúscula latina • Estimativa: valor numérico particular, calculado a partir de uma amostra • População: é o conjunto das medidas e da(s) característica(s) de interesse de todos os elementos que a(s) representa(m). • As amostras devem ser aleatórias e se possível, serem representativas da população de onde provém. Só a simples aleatorização NÃO garante a representatividade da amostra!!! Uma amostra é representativa se ela reflete as características da população inerentes ao estudo. • A inferência estatística consiste em fazer afirmações probabilísticas sobre as características da população, através da estimação de parâmetros e testes de hipóteses. Delineamento experimental Principio da repetição Principio da casualização Principio do controle local Estimação de parâmetros • Consiste em fazer afirmação sobre os possíveis valores dos parâmetros do modelo a partir dos dados de uma amostra aleatória e representativa da população. Por exemplo: • Estimar a média e a variância de um modelo normal. • Estimar a probabilidade de sucesso de um modelo binomial. Testes de hipóteses • Consistem em testar hipóteses sobre as características do modelo a partir dos dados de uma amostra aleatória da população. Por exemplo: • o valor da média de uma variável é maior do que um certo valor? • o modelo probabilístico da população é o normal? 14/09/2023 3 Distribuição amostral • O modelo probabilístico de uma estatística é chamado de Distribuição Amostral. • Seja um parâmetro e T um estimador (ou estatística). • Amostras aleatórias são retiradas da população e são calculados os valores t da Estatística T. • Valores de t formam a distribuição amostral de T. TLC - Teorema do Limite Central 14/09/2023 4 14/09/2023 5 Distribuição não-normal 14/09/2023 6 • É um importante resultado da estatística e a demonstração de muitos outros teoremas estatísticos dependem dele. Em teoria das probabilidades, esse teorema afirma que quando o tamanho da amostra aumenta, a distribuição amostral da sua média aproxima-se cada vez mais de uma distribuição normal. Este resultado é fundamental na teoria da inferência estatística; • Na inferência estatística a utilidade do teorema central do limite vai desde estimar os parâmetros como a média populacional ou o desvio padrão da média populacional, a partir de uma amostra aleatória dessa população, ou seja, da média amostral e do desvio padrão da média amostral até calcular a probabilidade de um parâmetro ocorrer dado um intervalo, sua média amostral e o desvio padrão da média amostral. Teorema central do limite (ou "teorema do limite central") 14/09/2023 7 Desvio padrão e erro padrão da média • Como já aprendemos, o desvio padrão (s) é a raiz quadrada positiva da variância (s2) e tem a mesma unidade da média aritmética 𝑋 . • O erro padrão da média s𝑋 ̅ = s/√n, importante devido ao T.L.C, também tem a mesma unidade da média aritmética e tende a zero a medida que n, o tamanho da amostra aumenta. Ele é empregado para construir intervalos de confiança para μ, a média populacional. Desvio padrão e erro padrão da média • Assim, quando você escrever um relatório ou um artigo explique direitinho qual das duas você está usando (você pode escolher uma das duas, mas tem que INFORMAR!) quando escreve 𝑋 +- algum número. • Se você estiver usando s ou s𝑋 ̅ , SEMPRE informe n, SEMPRE!!! Se você não fizer isso, nenhum pesquisador irá conseguir comparar os resultados dele com os seus. E NUNCA informe a média sozinha desacompanhada de s ou s𝑋 ̅ e n. Isso denota ingenuidade ou ignorância estatística. Portanto, uma estimativa deve SEMPRE ser expressa acompanhada de alguma medida de dispersão (s ou s𝑿 ) e do tamanho (n) da amostra a partir da qual foi calculada. Desvio padrão e erro padrão da média • Contrastes entre s e s𝑿 • O desvio padrão quantifica o espalhamento (scattering) dos dados. Ele não varia de modo previsível à medida que n aumenta, e o aumento de n não afeta o espalhamento e assim s pode aumentar ou diminuir ligeiramente. • O erro padrão da média quantifica o quão acuradamente você sabe sobre a média populacional. • Por definição s𝑿 < s. • À medida que n aumenta, s𝑿 diminui. Exemplo: Desejamos comprar um rifle e, após algumas seleções, restaram quatro alternativas, que chamaremos de rifles A, B, C e D. Foi feito um teste com cada rifle, que consistiu em fixá-lo num cavalete, mirar o centro de um alvo e disparar 15 tiros. Os resultados estão ilustrados na Figura 11.1. Para analisar qual a melhor arma, podemos fixar critérios. Por exemplo, segundo o critério de “em média acertar o alvo”, escolheríamos as armas A e C. Segundo o critério de “não ser muito dispersivo” (variância pequena), a escolha recairia nas armas C e D. A arma C é aquela que reúne as duas propriedades e, segundo esses critérios, seria a melhor arma. Mas, se outro critério fosse introduzido (por exemplo, menor preço), talvez não fosse a arma escolhida. Muitas vezes, a solução deve ser um compromisso entre as propriedades. Esse exemplo também nos permite introduzir os conceitos de acurácia e precisão. • A acurácia mede a proximidade de cada observação do valor alvo que se procura atingir; • A precisão mede a proximidade de cada observação da média de todas as observações. 14/09/2023 8 Desse modo, podemos descrever cada arma da seguinte maneira: Arma A: não-viesada, pouco acurada e baixa precisão. Arma B: viesada, pouco acurada e baixa precisão. Arma C: não-viesada, muito acurada e boa precisão. Arma D: viesada, pouco acurada e alta precisão. Viés, Acurácia, Precisão: A) B) C) D) Propriedades dos estimadores (medidas de tendência central e dispersão) • Os estimadores podem gozar de quatro propriedades: suficiência, não viesado ou não viciado, consistência e eficiência. • Alunos que aprenderam Estatística não devem usar a palavra viés de modo inapropriado!!! • Um estimador que não apresentar tais características, não pode ser considerado um bom estimador. Suficiência • O princípio da suficiência diz que uma estatística T(X) será suficiente se toda a informação contida na amostra {X1, X2, X3, · · · Xn} consegue assimilar toda a informação possível sobre o parâmetro desconhecido θ, que é uma propriedade da população; • Qualquer outra inserção de informação além daquela contida na estatística suficiente T(X) não contribuirá em nada para melhorar as informações contidas na estatística T(X) sobre o parâmetro θ. Suficiência • Por exemplo, suponha que a média populacional µ de uma distribuição Gaussiana seja desconhecida, digamos X ∼ N(µ, σ2 ). A estatística T(X) que consegue captar toda a informação sobre a média populacional será a média amostral �̅� ou seja, uma outra estatística como a média geométrica ou harmônica não irá contribuir com novas informações sobre µ, além do que a média aritmética já contribui. 14/09/2023 9 Não viesado ou não viciado • Espera-se que o erro de medida seja nulo, isto é E(e) = 0. De fato, se o erro for descrito pela diferença da estimativa em relação ao valor real, temos e = 𝛳 − θ Portanto, definiremos o viés b(𝛳 ) como sendo o valor esperado do erro: b(𝛳 ) = E(e) = E(𝛳 − θ ) Quando não há viés, b(𝛳 ) = E(𝛳 − θ ) = 0 = E(𝛳 ) − E(θ) = 0 =⇒ E(𝛳 ) = E(θ) = θ. Neste caso o estimador é não viesado (ENV) ou não viciado. • Teorema - Seja X1, X2, X3, ..., Xn uma amostra aleatória independente (isto é Xi e Xj (i≠j)são mutuamente exclusivos) de uma população com média μ e σ2 <∞, então E(𝑋) = μ • Demonstração: • E(𝑋)= E[(∑X)/n] = (1/n) E[(∑X)] = (1/n)[(∑E(X)] = (1/n) ((∑μ) = • = (1/n)n μ = μ E(𝑋) = μ, cqd • Portanto, a média aritmética �̅� é um estimador não viciado de μ: • b(�̅� )= E(�̅� - μ) = E(�̅�) – E(μ) = μ – μ = 0. Consistência e Eficiência • A consistência significa que o aumento do tamanho da amostra implicará na convergência das estimativas para o valor desconhecido de θ. • Um estimador θ será mais eficiente se o seu EQM(𝛳 ) for o menor possível. • Definição de EQM – Erro Quadrático Médio. • EQM(𝛳 ) = Var(e) = Var[( 𝛳 − θ)2] = Var (𝛳 ) + E(b(𝛳 )2 • Se o estimador for ENV, então: EQM(𝛳 ) = Var (𝛳 ) • Nas figuras a seguir esses conceitos ficam mais fácil de entender. Estimador não viciado ou exato ViciadoNão viciado P(X) X Não-viesado Viesado Preciso Impreciso 14/09/2023 10 Vemos, portanto, que um estimador preciso tem variância pequena, mas pode ter EQM grande. Eficiência Sampling Distribution of Median Sampling Distribution of Mean X P(X) Erro padrão da média s𝑿 = s/√n Erro padrão da mediana = (1.2533)s𝑿 Assim a mediana é um estimador MENOS EFICIENTE que a média aritmética, embora seja um estimador resistente, pois como vimos na aula anterior a mediana não é afetada por valores extremos, como ocorre com a média.
Compartilhar