Prévia do material em texto
P3 Estatística #papel da estatística: estudar padrões de variação (permite compor testes diagnósticos) · Pode ser descritiva respondendo perguntas – qual a prevalência de doenças na população? Que proporção da população faz tal coisa? Qual o valor normal de tal substância? · Descreve o comportamento das características (agravos, fatores de risco, fatores protetores) · Pode ser analítica, testando formalmente diferenças e associações, respondendo perguntas - isso está associado com aquilo? Isso é bom para aquilo? Isso cura aquilo? Isso previne aquilo? #padrões de variação: · distribuição de frequência – descrevem o comportamento da característica, permitem avaliação da normalidade e avaliação probabilística #por que amostra? Quer-se conhecer um atributo de uma população-alvo, então escolhe-se um grupo para estudar, desse grupo, tira-se uma amostra · Cada amostra vai fornecer uma média diferente POP. ALVO POP. EM ESTUDO AMOSTRA · Desvio padrão – é o erro padrão #intervalo de confiança: o nível de certeza de que o parâmetro de interesse pertence ao intervalo é conhecido – em geral, 95% (95% de certeza de que o intervalo de confiança inclui o resultado real) · Amostras com menor variabilidade amostral tem menor chance de erro aleatório · Em que caso a probabilidade de tirar um resultado perto do valor real é maior? Sem que disperdice recursos · Quando maior o intervalo de confiança, menor a certeza (para reduzir o intervalo de confiança aumenta-se o número de participantes da amostra) #teste de hipóteses: comparação de médias H0 (hipótese de igualdade) – não existe diferença] hipótese nula H1 (hipótese alternativa) – existe diferença Rejeito ou não a hipótese nula? · Significância Supondo que H0 é verdade, faz-se a probabilidade relacionada com o resultado obtido e vê se pode rejeitá-la - Probabilidade maior que 5%, não rejeita H0 - Probabilidade menor que 5%, rejeitamos H0 #valor p: indica a probabilidade de encontrar um valor tão ou mais extremo que o observado, sendo que não existe diferença real – 5% é geralmente o ponto de corte #organização de dados: Estatística descritiva – descreve, resume e apresenta dados Estatística analítica – compara grupos, ajuda a concluir resultados de amostras e usa testes estatísticos · Termos importantes Observações – indivíduos avaliados Dados – informações obtidas a partir das observações, podendo ser numéricas ou não e podendo ser primárias (dados coletados para o objetivo daquele estudo ou secundárias (utilização de dados já obtidos previamente) Amostra – parte de um conjunto de dados (população) Variáveis – características estudadas Frequência absoluta – contagem de ocorrências Frequência relativa – proporção de ocorrências em relação ao todo · Relação entre variáveis Exposição – variável explanatória, independente Desfecho – variável resposta, dependente · Tipos de variáveis - CATEGÓRICAS OU QUALITATIVAS Nominais (não ordenadas) – sexo, estado civil, tipo sanguíneo, raça.... Ordinais (ordenadas) – classe social, avaliações.... - NUMÉRICAS OU QUANTITATIVAS Contínuas (números reais) – peso, altura, PA, T.... Discretas (números inteiros) – número de filhos, cigarros... · Podem ser dicotômicas ou politômicas · Tabelas Apresentação de informações de forma clara e concisa Resultados mais importantes Autoexplicativa, sem linhas verticais ou horizontais Um titulo deve informar o que, onde, em quem, quando e N (número de indivíduos avaliados) · Figuras Ideais para apresentar resultados que são difíceis de interpretar ou visualizar em tabelas Uma figura equivale a 10 tabelas Deve conter título explicativo, assim como tabelas · Tipos de figuras: - Gráfico de barras ou colunas] distribuição de frequência de variável categórica, barras não se encostam e a escala sempre inicia do zero - Histogramas] distribuição de frequência de variável contínua, barras encostam, um começa onde o outro termina e a área total sob a curva soma 100% - Colunas empilhadas - Gráfico de linhas · Gráficos Precisam apresentar título que responda o que, onde e quando, além de fonte e escala #testes de hipóteses: Quando há valores muito discrepantes, usa-se mediana ao invés de média · Valor de Stewness = quanto mais próximo de zero, mais simétrico · Valor de Kurtsis = quanto mais próximo de 3, mais simétrico · Intervalo interquartil é a medida de variabilidade que acompanha a mediana Teste T de Student Usado para variáveis quantitativas continuas com desfecho de disposição normal e exposição dicotômica H0: m1=m2 HÁ:m1 diferente de M2 - Diferença entre duas médias - Distribuição do desfecho próximo da normalidade - Observações independentes - Variâncias iguais entre os grupos ANOVA – análise de variância Usado para variáveis quantitativas continuas com desfecho de disposição normal - Dois ou mais grupos na exposição (compara várias médias) - Variância total dividida · Dentro dos grupos] variabilidade entre as observações, dentro de cada categoria · Entre grupos] variabilidade decorrente da diferença entre as médias H0: M1=M2=M3 HA: pelo menos um par diferente Teste qui-quadrado Compara os números observados em cada uma das quatro categorias da tabela de contingência com os números esperados se não houvesse diferença entre os grupos de acordo com a exposição · Examina associação entre variáveis – o valor p associado à estatística #comparação de duas proporções: A relação entre duas variáveis categóricas pode ser examinada por tabulação cruzada em uma tabela de contingência, onde convencionalmente as linhas da tabela correspondem à exposição e as colunas aos desfechos