Baixe o app para aproveitar ainda mais
Prévia do material em texto
Levantamento e Análise de Dados Ambientais Aula 2. Exploração de dados brutos e apresentação de resultados Professora Fernanda A. Casares Email: fcasares00@hotmail.com UERJ – ZO | 2023.1 Tópicos de Hoje Exploração de dados brutos e apresentação de resultados: gráficos e tabelas (tipos, formatos, descrição e interpretação). Prática: Organização de planilhas excel. Elaboração de gráficos e tabelas usando excel e word. Identificação e interpretação de resultados apresentados em artigos selecionados. Depois da fase de levantamento de dados: Organização e Análise de dados • Estatística descritiva: análise exploratória – inserção e organização dos dados em planilhas (excel), cálculo de descritores e elaboração de gráficos e tabelas descritivos • Teste de Hipóteses Inserção dos dados em planilhas • Planilhas mais simples ou complexas dependendo do tipo de estudo e do tipo de dado coletado • Forma de organizar depende do tipo de pacote estatístico • Exemplo do ouriço e algas filamentosas ✓Variável resposta: quantitativa contínua ✓Variável preditora (fator): categórica com 2 níveis Ouriço % cobertura de algas Com 10 Com 5 Com 7.5 Com 6 Com 5 Sem 75 Sem 84 Sem 90 Sem 71 Sem 80 Outra forma de organizar Ouriço UE Com Sem 1 10 75 2 5 84 3 7.5 90 4 6 71 5 5 80 UE Ouriço % cobertura de algas 1 Com 10 2 Com 5 3 Com 7.5 4 Com 6 5 Com 5 6 Sem 75 7 Sem 84 8 Sem 90 9 Sem 71 10 Sem 80 Porcentagem de cobertura de algas em função da presença ou ausência de ouriços UE = Unidade Experimental Inserção dos dados em planilhas • Estudo para avaliar fatores associados à mortalidade de bebês neonatos Ind Ig_parto crib Fio2_max Peso nasc óbito 1 232 2 NA 1185 Não 3 235 NA NA 1500 Não 4 200 1 NA 1100 Não 5 218 NA 21 1315 Não 6 248 NA 21 1390 Não 7 205 10 100 980 Não 9 219 NA 30 1060 Não 10 221 1 60 1095 Sim 11 186 16 100 500 Sim 12 211 1 60 1255 Sim Variável resposta: categórica binária Variáveis preditoras: quantitativas Variáveis: idade gestacional, crib (Clinical Risk Index for Babies), fração inspirada de O2 máxima (fiO2_maximo), peso ao nascimento e óbito de 10 recém-nascidos tratados em uma UTI neonatal Estatística descritiva Categórica (ou qualitativa) VARIÁVEL RESPOSTA Numérica (ou quantitativa) Medidas de ocorrência: - FREQUÊNCIA OU PORCENTAGEM • Prevalência • Incidência • Odds (razão de chances) Medidas de tendência central: - MODA - MÉDIA - MEDIANA Medidas de dispersão: - AMPLITUDE - VARIÂNCIA - DESVIO PADRÃO - ERRO PADRÃO Para variáveis categóricas • Cálculo de frequências (absoluta e relativa) • 𝐹𝑎𝑏𝑠 = número de vezes que a resposta ocorreu • 𝐹𝑟𝑒𝑙 = 𝐹 𝑎𝑏𝑠 𝑛 • Exemplo: Teste de covid-19 (positivo/negativo) Em 100 pessoas, 20 testaram positivo : 20/100 = 0,20 ou 20% Covid-19 Fabs Frel Positivo 20 20/100 = 20% Negativo 80 80/100 = 80% Total 100 Paciente Covid-19 1 Positivo 2 Negativo 3 Negativo 4 Negativo 5 Positivo 6 Negativo 7 Negativo ... ... Para variáveis quantitativas Distribuição de frequências Paciente Idade 1 23 5 33 7 36 10 18 22 54 25 29 26 66 ... ... Distribuição etária dos pacientes que testaram positivo para Covid-19 em um determinado hospital Idade Frequência < 7 0,5 % 7-12 2 % 13-18 5% 19-30 40 % ... ... Cálculo de frequências por intervalos de idades Para variáveis quantitativas Medidas de tendência central • As medidas de tendência central são aquelas que buscam refletir o ponto de equilíbrio dos dados: ▪Média ▪Mediana ▪Moda Média • Média populacional: 𝜇 • Média amostral: 𝓍 • Fórmula da média amostral (aritmética): 𝑥 = σ𝑖=1 𝑛 𝑥 𝑖 𝑛 * A média é muito sensível a valores extremos Exemplo média 10, 9, 8, 12, 11, 7, 10, 8.5, 9.5, 6, 14, 13, 11, 12 e 9 1) Conjunto de dados: Média = 150/15 = 10 100, 9, 8, 12, 11, 7, 10, 8.5, 9.5, 6, 14, 13, 11, 12 e 9 2) Conjunto de dados: Média = 240/15 = 16 Mediana • A mediana é definida como o valor tal que 50% dos valores da variável estão acima da mediana e 50% estão abaixo. A obtenção da mediana é feita ordenando-se os dados e escolhendo-se o valor do meio. • No caso de o número N de dados ser par, computamos a média dos dois valores “centrais” (com 10 valores, a mediana será a média do 5o e 6o valor). * A mediana não é sensível a valores extremos Exemplo mediana Moda • A moda é a medida de maior frequência em um conjunto de dados. • Os passos para se obter a moda são: 1) encontrar todos os valores distintos da variável; 2) obter a frequência de cada valor distinto; 3) selecionar o valor (ou valores) com a maior frequência para obter a moda. Exemplo: Idade de participantes de uma turma de natação para crianças pequenas (pais e filhos) 1, 1, 1, 2, 2, 2, 2, 3, 3, 31, 31, 32, 32, 32, 32, 33, 33, 33 Resposta: 2 modas - 2 e 32 Influência da dispersão dos dados • 3 distribuições com médias, modas e medianas iguais e diferentes amplitudes de dispersão Cálculo de medidas de dispersão • Amplitude: valor menor e valor maior • Amplitude interquartil : percentil 25 e 75 Amplitude Amplitude interquartil Cálculo de medidas de dispersão • Variância populacional: 𝜎2 • Variância amostral: 𝑠2= σ𝑖=1 𝑛 𝑥𝑖−𝑥 2 𝑛−1 • Desvio padrão populacional: 𝜎 • Desvio padrão amostral: s = σ𝑖=1 𝑛 𝑥𝑖−𝑥 2 𝑛−1 Tipos de gráficos – Colunas ou Barras - Variável dependente: quantitativa - Variável independente (preditora, fator): categórica Tipos de gráficos – Colunas ou Barras Tipos de gráficos – Colunas ou Barras 0 20 40 60 80 100 2016 2000 2016 2000 2016 2000 2016 2000 2016 2000 2016 2000 2016 2000 2016 2000 2016 2000 2016 2000 2016 2000 2016 2000 2016 2000 2016 2000 2016 2000 2016 2000 2016 2000 2016 2000 2016 2000 2016 2000 2016 2000 2016 2000 2016 2000 2016 2 -3 m 1 -2 m 0 -1 m 2 -3 m 1 -2 m 0 -1 m 2 -3 m 1 -2 m 2 -3 m 1 -2 m 2 -3 m 1 -2 m 0 -1 m 2 -3 m 1 -2 m 2 -3 m 1 -2 m 0 -1 m 1 -2 m 0 -1 m 1 -2 m 0 -1 m 1 -2 m 0 -1 m C A JF I TL JF A Z O R TC O L IC TR Cover (%) R ee f / D ep th / Y ea r Tipos de gráficos – Boxplots • Variável dependente: quantitativa • Variável independente (preditora, fator): categórica Valores discrepantes (outliers) Tipos de gráficos – Box plots Tipos de gráficos – Violinplots Tipos de gráficos – Dispersão Fig 5. Multilevel evolution of plasticity in response to environmental predictability. The degree of plasticity of populations, as measured by the Euclidean distance between low and high salinities for (A) DNA methylation patterns at CpG context, (B) gene expression levels, and (C) cell morphology, is plotted against the predictability ρ2 of the environmental fluctuations that these populations have experienced during experimental evolution. The dashed line is the regression slope, and the gray area represents the 95% confidence interval of the linear regression. * Podem ter uma reta ou uma curva associada Tipos de gráficos – Linhas * Dados seguem uma sequência Tipos de gráficos – Histogramas - Distribuição de frequência de uma variável quantitativa em intervalos determinados Tipos de gráficos - Histogramas Tipos de gráficos - Pizzas - Frequências relativas de classes de uma variável discreta Tipos de gráficos - Pizzas Tipos de gráficos - representações de dados multivariados PRÁTICA 1- Dados ouriços e algas • Ver organização da planilha (2 formas) • Calcular média e desvio padrão para cada nível do fator (com e sem ouriço) a mão e depois comparar com a fórmula no excel. • Fazer gráfico no excel: a) Caixa (boxplot) b) Barras (com média e desvio padrão) • Fazer gráfico no Past • Observar resultados • Organizar a planilha • Fazer gráfico no excel: dispersão • Fazer gráfico no Past • Observar resultados 2- Dados tamanho e biomassa de uma espécie de peixe de água doce • Fazer histogramaspara distância de dispersão para cada espécie de planta • Observar resultados 3- Dados distância de dispersão de sementes para duas espécies com diferentes dispersores 4 – Dados de densidade populacional de 2 espécies de insetos ao longo do tempo • Organizar dados • Fazer um gráfico de linhas com as 2 espécies representadas • Observar resultados Slide 1 Slide 2: Tópicos de Hoje Slide 3 Slide 4: Inserção dos dados em planilhas Slide 5: Outra forma de organizar Slide 6: Inserção dos dados em planilhas Slide 7: Estatística descritiva Slide 8: Para variáveis categóricas Slide 9: Para variáveis quantitativas Distribuição de frequências Slide 10: Para variáveis quantitativas Medidas de tendência central Slide 11: Média Slide 12: Exemplo média Slide 13: Mediana Slide 14: Exemplo mediana Slide 15: Moda Slide 16: Influência da dispersão dos dados Slide 17: Cálculo de medidas de dispersão Slide 18: Cálculo de medidas de dispersão Slide 19: Tipos de gráficos – Colunas ou Barras Slide 20: Tipos de gráficos – Colunas ou Barras Slide 21: Tipos de gráficos – Colunas ou Barras Slide 22: Tipos de gráficos – Boxplots Slide 23: Tipos de gráficos – Box plots Slide 24: Tipos de gráficos – Violinplots Slide 25: Tipos de gráficos – Dispersão Slide 26: Tipos de gráficos – Linhas Slide 27: Tipos de gráficos – Histogramas Slide 28: Tipos de gráficos - Histogramas Slide 29: Tipos de gráficos - Pizzas Slide 30: Tipos de gráficos - Pizzas Slide 31: Tipos de gráficos - representações de dados multivariados Slide 32: PRÁTICA Slide 33: 1- Dados ouriços e algas Slide 34: 2- Dados tamanho e biomassa de uma espécie de peixe de água doce Slide 35: 3- Dados distância de dispersão de sementes para duas espécies com diferentes dispersores Slide 36: 4 – Dados de densidade populacional de 2 espécies de insetos ao longo do tempo
Compartilhar