Prévia do material em texto
Bioestatística WEBCONFERÊNCIA II Temas: Unidade II Modalidade: EAD Professora: Marcela Pinto Moura Levantamento de dados A importância da coleta de dados Bom questionário Perguntas abertas e fechadas Cuidado na hora de coletar informações Não pode haver influência do entrevistador perante o entrevistado As pessoas que são contratadas para fazer as entrevistas devem passar por um bom treinamento. 2 Levantamento de dados • Problemas usuais – Fidedignidade • Relacionada à precisão ou qualidade dos dados. • Motivos da falta de precisão: • Falhas nos instrumentos de aferição; • Problemas nos questionários empregados na obtenção dos dados; • Falha humana. 3 Levantamento de dados • Problemas usuais - Representatividade • Fator associado à forma de amostragem. Na seleção da amostra procura-se reproduzir as características observáveis da população - uso do critério de proporcionalidade. Em caso de desconhecimento da composição da população deve-se utilizar algum critério de aleatoriedade (sorteio). Amostra tendenciosa – conclusões sem consistência. 4 Amostragem • A aleatoriedade comumente desempenha papel crucial na determinação de quais dados coletar. • Vantagens do levantamento por amostragem: custo menor, menor tempo e objetivos mais amplos. • Situações para trabalho com amostras: população muito grande, dificuldade de acesso, grande número de variáveis. 5 • Métodos probabilísticos • Exige que cada elemento da população possua determinada probabilidade de ser selecionado (mesma probabilidade). • Assim, se N for o tamanho da população, a probabilidade de cada elemento ser selecionado será 1/N. • Trata-se do método que garante cientificamente a aplicação das técnicas estatísticas de inferências. • É uma técnica especial para recolher amostras, que garantem, tanto quanto possível, o acaso na escolha. 6 Amostragem • Métodos probabilísticos • Amostragem casual • Amostragem proporcional estratificada • Amostragem sistemática • Amostragem por conglomerados 7 Amostragem • Amostragem casual ou Aleatória simples • É o processo mais elementar e frequentemente utilizado. • É equivalente a um sorteio lotérico. • Pode ser realizada numerando-se a população de 1 a n e sorteando-se, a seguir, por meio de um dispositivo aleatório qualquer, x números dessa sequência, os quais corresponderão aos elementos pertencentes à amostra. • Todos os elementos da população têm a mesma probabilidade de ser escolhido como elemento da amostra. 8 Amostragem • EXEMPLO: • Vamos obter uma amostra, de 10%, representativa para a pesquisa da estatura de 90 alunos de uma escola. • 1º - numeramos os alunos de 1 a 90. • 2º - escrevemos os números dos alunos, de 1 a 90, em pedaços iguais de papel, colocamos na urna e após mistura retiramos, um a um, nove números que formarão a amostra. • Quando o número de elementos da amostra é muito grande, esse tipo de sorteio torna-se muito trabalhoso. • Tabela de números aleatórios 9 Amostragem casual 10 Tabela de números aleatórios http://professordiovani.com.br/estatisticaADM/NumerosAleatorios.jpg • Amostragem proporcional estratificada • Os estratos são subdivisões da população em agrupamentos homogêneos, por exemplo, sexo, raça, idade, escolaridade, etc. • O sorteio dos elementos da amostra deve levar em consideração tais estratos. • Elementos da amostra são proporcionais aos elementos dos estratos. 11 Amostragem • EXEMPLO: • Obter uma amostra proporcional estratificada de 10%, supondo que dos 90 alunos, 54 sejam meninos e 36 sejam meninas. • São portanto dois estratos (sexo masculino e sexo feminino). Logo, temos: • Numeramos então os alunos de 01 a 90, sendo 01 a 54 meninos e 55 a 90, meninas e procedemos o sorteio casual com urna ou tabela de números aleatórios. 12 Amostragem proporcional estratificada SEXO POPULAÇÃO 10% AMOSTRA Masculino 54 5,4 5 Feminino 36 3,6 4 Total 90 9,0 9 • Amostragem sistemática • Os elementos que constituirão a amostra são escolhidos segundo um fator de repetição (um intervalo fixo). • Sua aplicação requer que a população esteja ordenada seguindo um determinado critério. • O fator de repetição é determinado dividindo-se o tamanho da população (N) pelo tamanho da amostra (n). O primeiro elemento é escolhido por sorteio. 13 Amostragem • EXEMPLO: • Suponhamos uma rua com 900 casas, das quais desejamos obter uma amostra formada por 50 casas para uma pesquisa de opinião. • Podemos, neste caso, usar o seguinte procedimento: como 900/50 = 18 (fator de repetição). • Escolhemos por sorteio casual um número de 01 a 18, o qual indicaria o primeiro elemento sorteado para a amostra. Os demais elementos seriam periodicamente considerados de 18 em 18. • Assim, suponhamos que o número sorteado fosse 4 a amostra seria: 4ª casa, 22ª casa, 40ª casa, 58ª casa, 76ª casa, etc. 14 Amostragem sistemática • Amostragem por conglomerado • Consiste em subdividir a população que se vai investigar em grupos fisicamente próximos, independentemente de eles serem homogêneos ou não. • Em tais conglomerados, são agregados os elementos populacionais com estreito contato físico. • Exemplos: casas, quarteirões, bairros, cidades, regiões, etc. 15 Amostragem • EXEMPLO: • Num levantamento da população de determinada cidade, podemos dispor do mapa indicando cada quarteirão e não dispor de uma relação atualizada dos seus moradores. • Pode-se, então, colher uma amostra dos quarteirões e fazer a contagem completa de todos os que residem naqueles quarteirões sorteados. 16 Amostragem por conglomerado • Métodos não probabilísticos • São amostragens em que há uma escolha deliberada dos elementos da amostra. • Assim, se N for o tamanho da população, a probabilidade de cada elemento ser selecionado será 1/N. • Não é possível generalizar os resultados das pesquisas para a população, pois as amostras não-probabilísticas não garantem a representatividade da população. 17 Amostragem • Amostragem acidental • Trata-se de uma amostra formada por aqueles elementos que vão aparecendo, que são possíveis de se obter até completar o número de elementos da amostra. • Geralmente utilizada em pesquisas de opinião, em que os entrevistados são acidentalmente escolhidos. • EXEMPLOS: • Pesquisas de opinião em praças públicas, ruas de grandes cidades. 18 Amostragem • Amostragem intencional • De acordo com determinado critério, é escolhido intencionalmente um grupo de elementos que irão compor a amostra. • O investigador se dirige intencionalmente a grupos de elementos dos quais deseja saber a opinião. • EXEMPLO: • Numa pesquisa sobre preferência por determinado cosmético, o pesquisador se dirige a um grande salão de beleza e entrevista as pessoas que ali se encontram. 19 Amostragem • Amostragem por quotas • Um dos métodos de amostragem mais comumente usados em levantamentos de mercado e em prévias eleitorais. • Ele abrange 3 fases: • 1ª fase - classificação da população em termos de propriedades que se sabe, ou presume, serem relevantes para a característica a ser estudada; • 2ª fase - determinação da proporção da população para cada característica, com base na constituição conhecida, presumida ou estimada, da população; • 3ª fase - fixação de quotas para cada entrevistador a quem tocará a responsabilidade de selecionar entrevistados, de modo que a amostra total observada ou entrevistada contenha a proporção e cada classe tal como determinada na 2ª fase. 20 Amostragem • EXEMPLO: • Numa pesquisa sobre o "trabalho das mulheres na atualidade", provavelmente se terá interesse em considerar:a divisão cidade e campo, a habitação, o número de filhos, a idade dos filhos, a renda média, as faixas etárias etc. • A primeira tarefa é descobrir as proporções (porcentagens) dessas características na população. • Imagina-se que haja 47% de homens e 53% de mulheres na população. Logo, uma amostra de 50 pessoas deverá ter 23 homens e 27 mulheres. Então o pesquisador receberá uma "quota" para entrevistar 27 mulheres. • A consideração de várias categorias exigirá uma composição amostral que atenda ao n determinado e às proporções populacionais estipuladas. 21 Amostragem por quotas Apresentação de dados (Tabelas) •Componentes: Representação tabular • Elementos fundamentais Título – indica o estudo, época e local de ocorrência. Compreende um conjunto de informações, as mais completas possíveis, respondendo às perguntas: O quê? Quando? Onde? Cabeçalho – explica o conteúdo das colunas. Coluna Indicadora – detalha a linhas ou o conteúdo das linhas. Corpo – conjunto de linhas e colunas que contém informações sobre a variável em estudo, ou seja, demonstra os dados. 23 Representação tabular Linhas – são retângulos imaginários que facilitam a leitura, no sentido horizontal, de dados que se inscrevem nos seus cruzamentos com a coluna. Casa ou Célula – espaço destinado a um só dado. Fonte – cita o informante. Notas – esclarecem o conteúdo e indicam a metodologia adotada na obtenção dos dados. Chamadas – clarificam pontos específicos da tabela. 24 Elementos fundamentais de uma tabela 25 Representação tabular •Apresentação de tabelas (Regras) • A tabela deve ser simples, claras e objetivas. • Grandes volumes de dados devem ser divididos em várias tabelas. • A tabela deve ser auto explicativa e enumeradas em ordem crescente. • Nenhuma casa da tabela deve ficar em branco, apresentando sempre um número ou um símbolo. 26 Representação tabular •Apresentação de tabelas (Regras) – cont. • As tabelas, excluídos os títulos, serão delimitadas, no alto e em baixo, por traços horizontais grossos, preferencialmente. • Não se deve delimitar as tabelas à direita e à esquerda, por traços verticais. • Será facultativo o emprego de traços verticais para a separação de colunas no corpo da tabela. 27 •Apresentação de tabelas (Regras) – cont. • Deve-se manter a uniformidade quanto ao número de casas decimais. • Os totais e subtotais devem ser destacados. 28 Representação tabular 29 • Variáveis quantitativas Organizar os dados brutos (ROL) em ordem crescente ou decrescente. Identificar maiores e menores valores. Concentração de valores. • Variáveis qualitativas Organizar os dados brutos (ROL) em ordem temporal ou alfabética. Distribuições de Frequências 30 • Exemplo: VARIÁVEL QUANTITATIVA Distribuições de Frequências Distribuições de Frequências • Relacionam-se categorias ou classes de valores, juntamente com contagens (ou frequência) do número de valores que se enquadram em cada categoria. • Exemplo: VARIÁVEL QUALITATIVA 31 Distribuição dos pacientes por tipo sanguíneo Tipo sanguíneo Frequência A 29 B 13 AB 3 O 51 Total 96 • Tipos de frequência 1) Frequência simples absoluta (Fi) • É o número de vezes que o elemento aparece na amostra, ou o número de elementos pertencentes a uma classe. 2) Frequência absoluta acumulada (Fac) • É a soma da frequência absoluta da classe anterior com a frequência absoluta das classes seguintes. 32 Distribuições de Frequências Distribuições de Frequências • Tipos de frequência 3) Frequência simples relativa (fr) • É o valor da frequência absoluta dividido pelo número total de observações. 4) Frequência relativa acumulada (fra) • É o valor da frequência acumulada dividido pelo número total de observações. 33 • Tabela de distribuição de frequência 1) Considere o seguinte conjunto de dados: 21, 21, 21, 22, 22, 23, 23, 24, 25, 25, 25, 25, 26, 26, 26, 28, 30. 2) Construa uma distribuição com todas as frequências. Frequência absoluta Frequência relativa Frequência acumulada Frequência acumulada relativa 34 Distribuições de Frequências 35 Distribuições de Frequências • Para a construção de tabelas de frequências para variáveis contínuas, os dados devem ser agrupados em intervalos de classes. • Para a construção das classes algumas definições são necessárias: • Amplitude total • Intervalos de classe • Limites de classe 36 Distribuições de Frequências • Amplitude Total ou “Range” (R): É a diferença entre o maior e o menor valor observado. • Ponto médio do intervalo de classes (Xi): É a média aritmética entre os limites das classes. 37 Distribuições de Frequências Xi = (Limite Superior) + (Limite Inferior) 2 38 Distribuições de Frequências • Intervalos de Classe (h): • Conjunto de observações apresentadas na forma contínua, sem superposição de intervalos. • Cada valor do conjunto de observação possa ser em apenas um dos intervalos. 39 Distribuições de Frequências • Intervalos de Classe (h) O número k de intervalos para cada conjunto de observações com n valores pode ser calculado como: k = 1 + 3,322(log10 n) (fórmula de Sturges) EXEMPLO Para um conjunto com 50 observações obtemos log10(50) ≈ 1,699; k = 1 + 3,322 x 1,699 ≈ 6,6 ≈ 7 intervalos • Etapas para a construção de tabelas de frequência para dados agrupados: 1) Organizar os dados em ordem crescente (ROL); 2) Determinar a Amplitude total (AT) da amostragem; 3) Determinar o número de classes (K) - Sturges; 4) Determinar o intervalo de classes (h). 40 Distribuições de Frequências AT = (maior valor)x – (menor valor)x h = AT K • Exemplo: • O conjunto de dados abaixo representa as idades de mulheres responsáveis pelos domicílios. Construa intervalos de classes para o mesmo. 19 19 20 21 23 23 23 23 24 24 25 25 26 26 26 27 27 27 29 29 29 29 30 31 31 31 33 33 33 34 37 37 37 37 40 40 40 40 43 43 44 44 47 48 48 48 51 52 52 53 41 Distribuições de Frequências SOLUÇÃO: • Se utilizar a fórmula de Sturges –AT = 53 – 19 = 34 e n = 50 • Então: –K = 1 + 3,322 x 1,699 ≈ 7 intervalos –h = (53-19)/7 ≈ 5 idades em cada Intervalo de classe Frequência 19 |------- 24 8 24 |------- 29 10 29 |------- 34 11 34 |------- 39 5 39 |------- 44 6 44 |------- 49 6 49 |------- 54 4 42 Distribuições de Frequências Ou construir intervalos empiricamente: Intervalo de classe Frequência 10 |------- 20 2 20 |------- 30 20 30 |------- 40 12 40 |------- 50 12 50 |------- 60 4 43 • Intervalos de classe: Ao resumir os dados referentes a uma variável contínua perde-se informações. Distribuições de Frequências Conjugando duas séries em uma única tabela, obtém-se uma tabela de dupla entrada. 44 Tabelas de contingência 45