Prévia do material em texto
Introdução: A natureza da inferência estatística Prof. Armando Castelar Caracterização Esquemática Problema Informação Metodologia Resposta • Estimação pontual • Estimação por intervalos • Teste de Hipótese Modelo Estatístico Modelo Estatístico • Modelo Amostral: – Características da amostra – Amostra: subconjunto de elementos da população – Amostra pode ser gerada pelo próprio pesquisador (informações primárias) ou por um outro pesquisador (informações secundárias) • Modelo probabilístico: – Conjunto de todas as possíveis distribuições da amostra – Na prática, o pesquisador tem alguma ideia sobre a forma da distribuição População x amostra População. Ex.: população de todos os alunos da UFRJ Amostra: subconjunto de elementos da população. Ex.: subconjunto de 30 alunos sorteados dentre todos os alunos da UFRJ A amostra é um vetor de variáveis aleatórias: ! = !!, !!,⋯ !! Modelo probabilístico • Modelo probabilístico: conjunto de todas as possíveis distribuições da amostra (i.e., do vetor X) • Modelo probabilístico paramétrico: A amostra é um vetor de variáveis aleatórias: ! = !!, !!,⋯ !! Φ = ! !,! ; ! ! Θ • No modelo paramétrico: – f(.) é conhecida, – x é um vetor com n elementos – ! é um número real que representa uma característica da população (p.ex., a altura média de todos os alunos e alunas da UFRJ) – Θ, o espaço paramétrico, é conhecido – ! é desconhecido ! ! ! . Problemas de Inferência • Estimação pontual: – Problema é “saber” o verdadeiro valor de 𝜃 • Estimação por intervalos – Problema é determinar um intervalo que tenha uma probabilidade conhecida, em geral elevada, de conter o verdadeiro valor de 𝜃 • Teste de Hipótese – Tem-se uma conjectura sobre qual o verdadeiro valor de 𝜃 e se deseja avaliar se a informação de que se dispõe sobre o problema indica se essa conjectura está certa ou errada Estimação pontual Rx= Conjunto de todos os possíveis valores que a amostra pode assumir. Ex.: todos os possíveis conjuntos de 30 alunos da UFRJ Espaço paramétrico x A amostra é um vetor de variáveis aleatórias: ! = !!, !!,⋯ !! Φ = ! !,! ; ! ! Θ • No modelo paramétrico: – f(.) é conhecida, – x é um vetor com n elementos – Θ, o espaço paramétrico, é conhecido – θ é desconhecido ! ! ! . A amostra é um vetor de variáveis aleatórias: ! = !!, !!,⋯ !! Φ = ! !,! ; ! ! Θ • No modelo paramétrico: – f(.) é conhecida, – x é um vetor com n elementos – Θ, o espaço paramétrico, é conhecido – θ é desconhecido ! ! ! . A amostra é um vetor de variáveis aleatórias: ! = !!, !!,⋯ !! Φ = ! !,! ; ! ! Θ • No modelo paramétrico: – f(.) é conhecida, – x é um vetor com n elementos – ! é um número real que representa uma característica da população (p.ex., a altura média de todos os alunos e alunas da UFRJ) – Θ, o espaço paramétrico, é conhecido – ! é desconhecido ! ! ! . Rx A amostra é um vetor de variáveis aleatórias: ! = !!, !!,⋯ !! Φ = ! !,! ; ! ! Θ • No modelo paramétrico: – f(.) é conhecida, – x é um vetor com n elementos – ! é um número real que representa uma característica da população (p.ex., a altura média de todos os alunos e alunas da UFRJ) – Θ , o espaço paramétrico, é conhecido – ! é desconhecido ! ! ! . !! . ,!! . !! ! ,!! ! Θ! Θ! !! !! ! ! é um estimador de ! Intervalo de confiança x A amostra é um vetor de variáveis aleatórias: ! = !!, !!,⋯ !! Φ = ! !,! ; ! ! Θ • No modelo paramétrico: – f(.) é conhecida, – x é um vetor com n elementos – ! é um número real que representa uma característica da população (p.ex., a altura média de todos os alunos e alunas da UFRJ) – Θ, o espaço paramétrico, é conhecido – ! é desconhecido ! ! ! . Rx A amostra é um vetor de variáveis aleatórias: ! = !!, !!,⋯ !! Φ = ! !,! ; ! ! Θ • No modelo paramétrico: – f(.) é conhecida, – x é um vetor com n elementos – ! é um número real que representa uma característica da população (p.ex., a altura média de todos os alunos e alunas da UFRJ) – Θ, o espaço paramétrico, é conhecido – ! é desconhecido ! ! ! . !! . ,!! . !! ! ,!! ! A amostra é um vetor de variáveis aleatórias: ! = !!, !!,⋯ !! Φ = ! !,! ; ! ! Θ • No modelo paramétrico: – f(.) é conhecida, – x é um vetor com n elementos – ! é um número real que representa uma característica da população (p.ex., a altura média de todos os alunos e alunas da UFRJ) – Θ, o espaço paramétrico, é conhecido – ! é desconhecido ! ! ! . !! . ,!! . !! ! ,!! ! Teste de Hipótese Rx A amostra é um vetor de variáveis aleatórias: ! = !!, !!,⋯ !! Φ = ! !,! ; ! ! Θ • No modelo paramétrico: – f(.) é conhecida, – x é um vetor com n elementos – ! é um número real que representa uma característica da população (p.ex., a altura média de todos os alunos e alunas da UFRJ) – Θ , o espaço paramétrico, é conhecido – ! é desconhecido ! ! ! . !! . ,!! . !! ! ,!! ! Θ! Θ! A amostra é um vetor de variáveis aleatórias: ! = !!, !!,⋯ !! Φ = ! !,! ; ! ! Θ • No modelo paramétrico: – f(.) é conhecida, – x é um vetor com n elementos – ! é um número real que representa uma característica da população (p.ex., a altura média de todos os alunos e alunas da UFRJ) – Θ , o espaço paramétrico, é conhecido – ! é desconhecido ! ! ! . !! . ,!! . !! ! ,!! ! Θ! Θ! A amostra é um vetor de variáveis aleatórias: ! = !!, !!,⋯ !! Φ = ! !,! ; ! ! Θ • No modelo paramétrico: – f(.) é conhecida, – x é um vetor com n elementos – ! é um número real que representa uma característica da população (p.ex., a altura média de todos os alunos e alunas da UFRJ) – Θ , o espaço paramétrico, é conhecido – ! é desconhecido ! ! ! . !! . ,!! . !! ! ,!! ! Θ! Θ! A amostra é um vetor de variáveis aleatórias: ! = !!, !!,⋯ !! Φ = ! !,! ; ! ! Θ • No modelo paramétrico: – f(.) é conhecida, – x é um vetor com n elementos – ! é um número real que representa uma característica da população (p.ex., a altura média de todos os alunos e alunas da UFRJ) – Θ , o espaço paramétrico, é conhecido – ! é desconhecido ! ! ! . !! . ,!! . !! ! ,!! ! Θ! Θ! !! !! A amostra é um vetor de variáveis aleatórias: ! = !!, !!,⋯ !! Φ = ! !,! ; ! ! Θ • No modelo paramétrico: – f(.) é conhecida, – x é um vetor com n elementos – ! é um número real que representa uma característica da população (p.ex., a altura média de todos os alunos e alunas da UFRJ) – Θ , o espaço paramétrico, é conhecido – ! é desconhecido ! ! ! . !! . ,!! . !! ! ,!! ! Θ! Θ! !! !! Regra de decisão Exemplo • Suponha que a população de interesse é o conjunto de todos os alunos da UFRJ e que o parâmetro de interesse (𝜃) é a altura média dessa população – Vamos chamar 𝜃 de altura média populacional, ou simplesmente média populacional – Para fazer inferências a respeito de 𝜃 vamos selecionar uma amostra, um subconjunto composto por alguns alunos da UFRJ • Estimação pontual: – Obter uma estimativa, um ‘chute educado” de qual o valor de 𝜃 – Um bom estimador seria a altura média dos alunos na amostra – Nós chamamos essa média de média amostral – Vamos supor que para a amostra que observamos, essa média assumiu o valor de 1,7 m Exemplo (cont.) • Estimação por intervalos – Vamos achar um intervalo que tenha uma probabilidade elevada de conter a altura média populacional (𝜃) – Por exemplo, podemos concluir que há uma probabilidade de 95% de que o intervalo[1,6 m, 1,8 m] contenha o valor da média populacional • Teste de Hipótese – Podemos fazer uma conjectura de que a média populacional é menor do que 1,75 m – Podemos definir como regra que se nossa média amostral der 1,78 m ou mais nós vamos rejeitar nossa conjectura e se der menor vamos aceitá-la Pontos Gerais • Objetivo do curso: – Apresentar os métodos estatísticos que permitem tirar conclusões sobre as características de uma população com base em informações sobre uma amostra. Caracterização Esquemática Problema Informação Metodologia Resposta • Estimação pontual • Estimação por intervalos • Teste de Hipótese Modelo Estatístico OBRIGADO