Baixe o app para aproveitar ainda mais
Prévia do material em texto
ESTATÍSTICA APLICADA (115011) LUÍS GUSTAVO VINHA Estatística é a ciência que tem por objetivo orientar a coleta, o resumo, a apresentação, a análise e a interpretação de dados. Estatística Descritiva: é o ramo da estatística voltada para a organização, o resumo e a descrição de conjuntos de dados. Inferência Estatística: é o ramo da estatística que utiliza dados obtidos de uma amostra para fazer estimativas ou testar hipóteses sobre características de interesse de uma população. INTRODUÇÃO Censo (todas as unidades amostrais da população são pesquisadas) Estatística descritiva Todas as características pesquisadas serão conhecidas Amostra Características conhecidas Técnicas de amostragem Estatística descritiva Amostra Características conhecidas Técnicas de amostragem Inferência Estatística PLANEJAMENTO DE UMA PESQUISA PLANEJAMENTO DE UMA PESQUISA ➢ Problema de pesquisa - questão que desperta interesse ➢ Definição de objetivos - Objetivo geral, objetivos específicos ➢ População – Amostra - Seleção ➢ Instrumentos ➢ Procedimentos de coleta de dados AMOSTRAGEM DEFINIÇÕES População: é a coleção de todos os elementos de interesse num estudo. Amostra: é qualquer subconjunto da população DEFINIÇÕES Parâmetro: é uma medida usada para descrever uma característica da população. Características, ou variáveis: X: proficiência Y: intenção de ingresso no ensino superior Z: idade dos estudantes W: renda familiar ... DEFINIÇÕES Parâmetro: é uma medida usada para descrever uma característica da população. Exemplos de parâmetros 1. Proficiência média dos estudantes do 3º ano do EM do país X é a proficiência e µ é a proficiência média 2. Proporção de estudantes do 3º ano do EM do país que pretendem ingressar no ensino superior Y é a intenção de ingresso (Sim/Não) e P é a proporção de estudantes que pretendem ingressar no ensino superior 3. Variância das idades dos estudantes que ingressam nos cursos noturnos de ensino superior Z é a idade dos estudantes e 𝝈𝟐 é a variância das idades DEFINIÇÕES Estatística: é uma característica da amostra, ou seja, é uma função dos resultados amostrais. Quando a estatística irá “estimar” o parâmetro populacional é chamada de estimador. Estimador መ𝜃 é qualquer função das observações da amostra (um estatística) usada para estimar o parâmetro 𝜃. Seja X a característica de interesse (a proficiência, por exemplo), n é tamanho da amostra e N é o tamanho da população: Média amostral: ത𝑋 = 1 𝑛 σ𝑖=1 𝑛 𝑋𝑖 é o estimador da média populacional: 𝜇 = 1 𝑁 σ𝑖=1 𝑁 𝑋𝑖 DEFINIÇÕES Estimativa é o valor que um estimador assume para uma particular amostra. Amostra Proficiência 258 235 288 300 275 290 254 278 Média = 272,25 ത𝑋 = 1 𝑛 𝑖=1 𝑛 𝑋𝑖 𝜇 = 1 𝑁 𝑖=1 𝑁 𝑋𝑖Parâmetro: Estimador: Estimativa: 272,25 INFERÊNCIA ESTATÍSTICA Com base no resultado amostral podemos fazer uma afirmação sobre o parâmetro populacional. Essa afirmação pode ser por meio de intervalos de confiança ou testes de hipóteses. 𝐼𝐶 𝜇 = ത𝑋 ± 𝑡𝛼/2. 𝑆 𝑛 𝐼𝐶 𝜇 = 272,25 ± 2,36. 21,70 8 = 254,10; 290,40 95% de confiança de que a proficiência média populacional está no intervalo calculado. INFERÊNCIA ESTATÍSTICA Com base no resultado amostral podemos fazer uma afirmação sobre o parâmetro populacional. Essa afirmação pode ser por meio de intervalos de confiança ou testes de hipóteses. 𝐻0: 𝜇 ≥ 300 𝐻𝐴: 𝜇 < 300 𝑡𝑜𝑏𝑠 = ത𝑋 − 𝜇 𝑆/ 𝑛 Estatística do teste: que, sob H0 tem distribuição t com n-1 graus de liberdade. Para a particular amostra: p-valor = 0,004 𝑡𝑜𝑏𝑠 = 272,25 − 300 21,70/ 8 = −3,62 Conclusão: H0 deve ser rejeitada. Existe evidência de que a proficiência média populacional é menor de 300 pontos. Hipóteses: SELEÇÃO DE AMOSTRAS A coleta de dados pode ser classificada, inicialmente de acordo com a abrangência: Censo: todas as unidades amostrais da população são pesquisadas (amostra = população). Amostragem: é selecionada uma parcela da população (amostra) para realizar o estudo. CENSO OU AMOSTRA? As situações em que o Censo é interessante: - Quando a população é pequena - Os resultados devem ser precisos - Não temos limitações para a coleta dos dados de todas as unidades da população. Vantagem: é possível conhecer com exatidão todas as características da população (não há erro amostral). Desvantagens: • pode ser caro e demorado (trabalhoso). • em algumas situações não é factível, pois o processo de observação das variáveis leva à destruição das unidades amostrais. CENSO OU AMOSTRA? As situações em que o Amostragem é apropriada: - Quando a população é grande - Temos limitações para a coleta dos dados As limitações estão relacionadas com custo e tempo de obtenção dos valores. Em alguns casos, a coleta de dados de toda a população demanda um tempo muito longo, neste período a característica de interesse estudada pode mudar. Vantagem: além da economia de tempo e dinheiro, os dados obtidos podem ser mais confiáveis quando se pesquisa um número menor de elementos. Desvantagem: não é possível conhecer com exatidão as características da população (há erro amostral). TÉCNICAS DE AMOSTRAGEM A probabilidade de uma unidade amostral ser sorteada é conhecida A probabilidade de uma unidade amostral ser sorteada é desconhecida Amostras Não probabilísticas Probabilísticas TÉCNICAS DE AMOSTRAGEM Amostras Não probabilísticas Probabilísticas Vantagem: os resultados podem ser extrapolados para a população (permite a utilização de técnicas de Inferência Estatística). Vantagem: podem ser obtidas mais facilmente, mais econômicas. Desvantagem: maior custo e complexidade Desvantagem: os resultados não podem ser extrapolados para a população. TÉCNICAS DE AMOSTRAGEM Esquemas de Amostragem Probabilística: - Amostragem Aleatória Simples - Amostragem Aleatória Sistemática - Amostragem Aleatória Estratificada - Amostragem por Conglomerados Esquemas de Amostragem Não Probabilística: - Amostragem por julgamento ou conveniência ESQUEMAS AMOSTRAIS PROBABILISTICOS AMOSTRAGEM ALEATÓRIA SIMPLES O sistema de referência é numerado de 1 até N (tamanho da população) e sorteia- se ao acaso n unidades amostrais para compor a amostra. O sorteio pode ser com ou sem reposição. AMOSTRAGEM ALEATÓRIA SISTEMÁTICA Supõe-se que não temos uma listagem das unidades populacionais, mas que essas podem ser acessadas de modo sequencial. Para um k fixado, inicialmente selecionamos um elemento entre 1 e k. A partir da primeira observação, selecionamos sistematicamente individuos separados por k unidades. k=10 AMOSTRAGEM ALEATÓRIA ESTRATIFICADA Estrato: segmento homogêneo da população Neste tipo de amostragem a população é divida em estratos. Em cada estrato é sorteada uma amostra aleatória simples. Observação: as unidades (ou indivíduos) dentro de cada estrato devem ser homogêneas com relação à variável de interesse. AMOSTRAGEM ALEATÓRIA POR CONGLOMERADOS Conglomerado: agrupamento de unidades elementares da população. Na Amostragem Aleatória por Conglomerados a população é dividida em conglomerados. Sorteia-se uma amostra aleatória simples de conglomerados. Em cada conglomerado pode-se avaliar todas as unidades amostrais ou apenas uma amostra aleatória. FONTES DE ERROS Todo levantamento amostral está sujeito a produzir diferenças entre o parâmetro populacional de interesse e o valor da amostra usado para estimá-lo. Tipos de erros: -Não aleatórios (ou sistemáticos): Gerados por algum descuido no processo de amostragem (pode ocorrer quando o censo é realizado) -Aleatórios (não sistemáticos): Resultado do processo de amostragem, não pode ser evitados Erro = Erro aleatório + Erro não aleatório FONTES DE ERROS Erros não aleatórios: -Unidades amostrais perdidas: -falta de contato com a unidade escolhida -recusa/abandonodurante a pesquisa -incapacidade de responder -perda do documento/ incompreensão -recusa em questões sensíveis -inconsistências -Falha na definição e administração: -sistema de referência com unidades ausentes -sistema de referência com unidades de outras populações -efeito entrevistador -insuficiência do questionário -erros de codificação e digitação -Avaliação das consequências: -comparação com outras pesquisas -programas de consistências/ análise das não-respostas TAMANHO DA AMOSTRA Do que depende o tamanho da amostra? • Tamanho do erro cometido • Nível de confiança • Variabilidade da variável em estudo
Compartilhar