Baixe o app para aproveitar ainda mais
Prévia do material em texto
Epidemiologia Aula 1 e 2 @brunagsaboia Amostragem e População: · População ou universo é o conjunto de unidades sobre o qual desejamos informação. · Amostra é todo subconjunto de unidade retiradas da população para obter a informação desejada. Importante saber distinguir entre os dados observados (amostra) e a vasta quantidade de dados que poderiam ter sido observados (população). Uso de amostra permite obter respostas para questões estudadas, com margens de erro conhecidas. O termo população ou universo serve para qualquer conjunto grande de unidades que têm algo em comum. Parâmetro é um valor em geral desconhecido (que precisa ser estimado) que representa determinada característica da população. O parâmetro não varia, é um valor fixo. Estatística é um quantidade calculada com os dados de uma amostra. É usada para estimar o parâmetro correspondente, na população de onde foi retirada. AMOSTRAGEM PROBABILÍSTICA: 1) Todos os indivíduos da população têm a mesma probabilidade de serem selecionados para fazerem parte da amostra. 2) A seleção dos indivíduos é randômica/aleatória. · Esta é a forma ideal de preparar a amostra, pois é a forma de amostragem com maior chance de escolher uma amostra representativa (sem bias) da população como um todo. · A amostragem probabilística é capaz de equilibrar tanto os fatores conhecidos quanto os fatores desconhecidos que poderiam influenciar o resultado do estudo. · Quando a amostragem é feita totalmente aleatória, é possível atribuir toda diferença observada nas variáveis de desfecho, como um resultado da diferença nas variáveis preditoras. · Entretanto, na maior parte dos estudos populacionais, esta forma de amostragem é muito difícil, pois nunca é verdade que todos os indivíduos em uma população têm a mesma chance de serem selecionados. • Amostra casual simples: O sorteio é feito na população inteira. • Amostra estratificada: Antes do sorteio a população é separada em grupos\estratos. O sorteio pode ser proporcional ao tamanho do estrato. AMOSTRAGEM SEMI-PROBABILÍSTICA: • Amostra sistemática: O sorteio na população segue um critério pré-estabelecido. Amostras retiradas da população seguindo um sistema preestabelecido. Ordenar as unidades, numera-las e retirar para a amostra a k-ésima unidade. O número k é obtido por sorteio. • Amostra por conglomerado: Unidades que já existem na população (ex. asilos, academias, escolas). • Amostra por quota: Esse tipo de seleção não é aleatória. Seleção das pessoas para a amostra por uma característica bem específica. Semelhante à ideia do estrato, mas sem a aleatorização. É relativamente barata. Muita utilizada em levantamentos de opinião e pesquisa de mercado. AMOSTRAGEM NÃO-PROBABILÍSTICA: · Nem todo indivíduo da população têm chance de ser selecionado para fazer parte da amostra · Pode inserir um bias na amostra, pois ela pode ser não representativa da população como um todo. · Não é o ideal AMOSTRAGEM NÃO-PROBABILÍSTICA - POR CONVENIÊNCIA. As amostras de conveniência ou de voluntários são as feitas nos estudos de pesquisa clínica: É constituída por unidades reunidas em uma amostra simplesmente porque o pesquisador tem fácil acesso a essas unidades. I. Por definição, apenas voluntários podem participar de um estudo de pesquisa clínica, sendo assim a amostragem não é representativa de toda a população. II. Também acontece quando são selecionados pacientes de apenas uma localidade. III. Por exemplo: “Selecionar X voluntários dentre os pacientes com pressão alta do hospital Y”. Avaliação das técnicas de Amostragem: • Amostra por quotas: exige conhecimento da população. Mas as unidades não precisam estar enumeradas ou identificadas (basta saber proporção). • Atenção 1: Amostra probabilística são preferíveis do ponto de vista estatístico, mas não são possíveis algumas vezes. • Atenção 2: Amostra de conveniência não invalida à pesquisa mas precisa ser bem descrita a forma como a amostra foi selecionada. • Atenção 3: Ensaios clínicos participantes são escolhidos por critérios de elegibilidade. Noções sobre o tamanho das amostras: • A “qualidade" de uma estimativa depende, em muito, do número de unidades que compõem a amostra (tamanho da amostra). • As amostras não devem ser grandes pois é perda de recurso e muito pequenas o resultado tem pouca utilidade I. Existe um tamanho ideal de amostras para um estudo. II. Amostras muito pequenas podem resultar em dados não estatisticamente relevante/significativos. Isso pode invalidar o estudo. III. Amostras muito grandes levantam problemas éticos (indivíduos sujeitos ao risco desnecessário) e podem encontrar diferenças estatisticamente significativas, mas que são clinicamente não significativas. Como determinar o tamanho da amostra? O que é necessário para fazer o cálculo amostral? • Determinar o nível de significância (valor α), que é a probabilidade de cometer um erro tipo 1 (falso positivo). Normalmente α = 0,05. • Determinar o poder do estudo (valor β), que é a probabilidade de não cometer um erro tipo 2 (falso negativo). Normalmente β = 0,2 a 0,15. • Conhecer a magnitude de efeito (diferença esperada entre os grupos ou entre pré e pós). • Tipo de estudo, Tipo de variável, Razão de alocação. Compondo a amostra: Qualidade depende do número de unidades que compõe a amostra (Tamanho da Amostra). Regra para cálculo do tamanho de uma amostra: Há diversas formas de calcular o tamanho amostral, a seguir apresentamos uma delas. 1. Precisamos conhecer a margem de erro. Exemplo: Se assumimos que a margem de erro é de ±5%. E imaginando que em uma população 43% apresenta o tipo sanguíneo O, isso quer dizer que a média estará entre 38 e 48%. 2. Agora suponha que a amostra aceita 1 erro para cada 20 unidades, ou seja, probabilidade é de 19/20=0,95. 3. Aceitando que o tipo O está entre 30 e 60%, assumimos que seja 50%. 4. Aplicamos a seguinte fórmula: • n=tamanho da amostra • z=valor dado em tabela e associado ao nível de confiança • p=porcentagem • d=margem de erro Variáveis e gráficos: · Variável é uma condição ou característica das unidades da população, que assumem valores diferentes em diferentes unidades. · Dado estatístico é toda informação (relacionada a uma determinada variável), a qual foi coletada e devidamente registrada. Categorizadas (Qualitativas): Dados são distribuídos em categorias mutuamente exclusivas. EX: Sexo (Masculino/Feminino) 1. Nominal: Dados são distribuídos em categorias mutuamente exclusivas. Nomeado em qualquer ordem. EX: tipo de sangue (O, A, B, AB). 2. Ordinais: Dados são distribuídos em categorias mutuamente exclusivas. Que apresenta ordem natural. EX: Escolaridade (Primeiro grau, segundo grau, terceiro grau) Numericas (Quantitativas): Variável expressa por números. EX: idade (em anos) 1. Discretas : Variáveis discretas só podem assumir alguns valores em dado intervalo. EX: Número de filhos (0, 1, 2, 3, 4, 5 ou mais). 2. Continuas: Variável expressa por números, contínua pode assumir qualquer valor em um dado intervalo.. EX: idade (em anos). Apuração de dados: • Variável qualitativa = apuração se resume a uma contagem. • Variável quantitativa = é preciso anotar, na apuração, cada valor observado. • Base de dados, são coletas já realizadas diretamente em meios eletrônicos, por exemplo, computadores. Normas para construção de tabelas: 1. O título deve explicar o tipo de dado que a tabela contém. Deve-se colocá-lo acima dos dados. 2. O cabeçalho especifica o conteúdo de cada coluna. 3. O indicador de linha é um conjunto de termos. 4. Cada termo descreve o conteúdo de uma linha. 5. A célula resulta do cruzamento de uma linha com uma coluna e deve conter um dado numérico. Nenhuma célula da tabela deve ficar em branco. Deve apresentar ou número, ou se o dado não existir, coloca-se um traço (-). Normas para construção de tabelas 2: 1. As tabelas devem ser delimitadas, no alto e embaixo, por traços horizontais. Esses traços podem ser mais fortes do que os traços feitos no interior da tabela; as tabelas não devem ser delimitadas,à direita e à esquerda, por traços verticais; 2. O cabeçalho deve ser delimitado por traços horizontais; 3. É possível fazer traços verticais no interior da tabela, separando as colunas; 4. São comuns os traços verticais no interior do cabeçalho, para separar as especificações; 5. As tabelas podem ainda conter fonte e notas; Tabelas de distribuição de frequência para dados qualitativos: • Quando observamos dados qualitativos, classificamos cada observação em determinada categoria. Depois, contamos o número de observações em cada categoria. • A ideia é resumir as informações na forma de uma tabela que mostrasse essas contagens (frequências) por categoria. Frequência Relativa/ Porcentagem: Frequência relativa = Frequência/Tamanho da amostra • São expressas em percentuais, porque as pessoas entendem mais facilmente proporções dadas em porcentagens. • Para obter o percentual de determinada categoria, multiplique a frequência relativa por 100. • Convém exibir sempre o total (tamanho da amostra), que é o indicador da credibilidade da informação. Tabelas de contingência: • Os elementos da amostra são classificados de acordo com duas variáveis qualitativas. • Tabelas de contingência são tabelas de dupla entrada, sendo cada entrada relativa a uma das variáveis. Apresentação de dados quantitativos: • Os dados quantitativos são apresentados na ordem em que foram coletados. • Os pesquisadores podem identificar a unidade que forneceu o dado por um número. • No caso de pesquisas em seres humanos, alguns pesquisadores identificam os participantes pelas iniciais de seus nomes e apresentam os dados obedecendo à ordem alfabética das iniciais. Tabelas de distribuição de frequência para dados quantitativos: Se os dados forem discretos: 1. Escreva os dados em ordem crescente; 2. Conte quantas vezes cada valor se repete; 3. Organize a tabela apresentando os valores numéricos em ordem natural. Para construir uma tabela de frequência com dados contínuos: 1. Ache o valor máximo e o valor mínimo do conjunto de dados; 2. Calcule a amplitude, que é a diferença entre o valor máximo e o valor mínimo; 3. Divida a amplitude dos dados pelo número de faixas que pretende organizar. Essas faixas recebem o nome de classes; 4. O resultado da divisão é o intervalo de classe. Sempre é melhor arredondar o valor obtido para o intervalo de classes para um valor mais alto, o que facilita o trabalho; 5. Organize as classes, de maneira que a primeira contenha o menor valor observado. 6. Normalmente se escolhe de 5 a 20 classes Construção da tabela de distribuição de frequências (dados contínuos): • Localizar o menor valor (1,570 kg) e o maior valor (4,600kg) • Calcular a amplitude 4,600-1,570 = 3,030 • Para organizar as classes (nesse caso, 7 classes) 3,030/7 = 0,433 • Arredonde o valor para 0,500 e construa a primeira classe, que será de 1,5kg a 2,0 kg. Regra geral para Gráficos: • Ajudam a visualizar a distribuição das variáveis. • Todo gráfico apresenta título e escala. • O título deve ser colocado abaixo do gráfico. • As escalas devem crescer da esquerda para a direita e de baixo para cima. • As legendas explicativas devem ser colocadas, de preferência, à direita do gráfico. Apresentação de dados qualitativos: • Gráfico de barras é usado para variáveis qualitativas, sejam elas nominais ou ordinais. 1. Desenhe o eixo cartesiano; 2. Anote as categorias das variáveis estudadas no eixo das abscissas (eixo horizontal); 3. Escreva as frequências ou as frequências relativas no eixo das ordenadas (eixo vertical), obedecendo a uma escala; 4. Desenhe barras verticais de mesma largura para representar as categorias da variável em estudo. A altura de cada barra deve ser dada pela frequência ou frequência relativa (em geral, em porcentagem) da categoria; 5. Coloque legendas nos dois eixos e título na figura; Gráfico de barras para variáveis ordinais: • Deve-se obedecer à ordem das categorias da variável, mas devem ser colocadas, no final, as categorias “não sabe”, “não respondeu” etc. • Excel denomina de gráfico de barras aqueles que ficam na horizontal; • Gráficos de colunas aqueles que ficam na vertical; • Porém em ambos os casos, tecnicamente é gráficos de barras. Gráfico de setores: Indicado para variáveis nominais, desde que o número de categorias seja pequeno. 1. Trace uma circunferência (360º). Ela representará o total, ou seja, 100%. 2. Divida a circunferência em tantos setores quantas sejam as categorias da variável em estudo, mas é preciso calcular o ângulo de cada setor: é igual à proporção de respostas na categoria, multiplicada por 360º. 3. Marque, na circunferência, os ângulos calculados; separe com o traçado dos raios; 4. Escreva a legenda e coloque título na figura. Diagrama de Linhas: Dados discretos organizados em uma tabela de distribuição de frequências. 1. Escreva os valores assumidos pela variável no eixo das abscissas (horizontal); 2. Escreva as frequências ou as frequências relativas (porcentagens) no eixo das ordenadas (vertical); 3. Desenhe barras verticais com pequena largura (para evidenciar que os dados são discretos) a partir dos pontos marcados no eixo das abscissas. Os comprimentos das barras são dados pelas frequências; 4. Coloque legendas nos dois eixos e título na figura; Gráfico de pontos: Dados contínuos em pequeno número podem ser apresentados por meio de um gráfico de pontos. 1. Desenhe uma linha (na verdade, o eixo das abscissas) com escala, de maneira que nela caibam todos os dados; 2. Desenhada a linha, ponha sobre ela pontos que representem os dados, obedecendo à escala; 3. Coloque legenda no eixo e título na figura; Histograma: • Dados contínuos são grandes em número, não se pode fazer um gráfico de pontos. Organizar os dados em uma tabela de distribuição de frequências, e desenhar o histograma. 1. Eixos cartesianos; 2. Apresente as classes no eixo das abscissas. Se os intervalos de classe forem iguais, trace barras retangulares com base iguais que correspondam aos intervalos de classe; 3. Desenhe as barras com alturas iguais às frequências das respectivas classes. As barras devem ser justapostas, a fim de evidenciar a natureza contínua da variável; 4. Coloque legendas nos dois eixos e título na figura. Polígono de frequências: • Dados contínuos apresentados em uma tabela de distribuição de frequência também podem ser apresentados em polígonos de frequência. 1. Eixo cartesiano; 2. Marque, no eixo das abscissas, pontos exatamente no meio dos extremos de classe; 3. Marque, no eixo das ordenadas, as frequências de classe; 4. Una os pontos por segmentos de reta; 5. Feche o polígono unindo os extremos da figura com o eixo horizontal; 6. Coloque legendas nos dois eixos e título na figura.
Compartilhar