Baixe o app para aproveitar ainda mais
Prévia do material em texto
10/11/2014 1 APRESENTAÇÃO DE DADOS NUMÉRICOS medidas de tendência central medidas de dispersão ESTATÍSTICA DESCRITIVA MEDIDAS DE TENDÊNCIA CENTRAL MEDIDAS DE DISPERSÃO APRESENTAÇÃO DE DADOS NUMÉRICOS 11/11/2014 Roteiro da aula Calcular as medidas (medidas de tendência central) para resumir dados numéricos quantitativos Calcular as medidas de variação (medidas de dispersão) para dados numéricos quantitativos Conhecer os procedimentos para organizar dados (tabelas e gráficos) OBJETIVOS DA AULA 10/11/2014 2 Roteiro da aula Medidas de tendência central Medidas de dispersão Apresentação de dados numéricos - Tabelas - Gráficos ROTEIRO DA AULA Roteiro da aula MOTIVAÇÃO !!! Prêmios da Academy Awards Pensamento crítico: - Há diferença entre as idades das Melhores Atrizes e as idades dos Melhores Atores? - Os atores e atrizes são julgados apenas por suas habilidades artísticas? - Há discriminação com base nas idades? 10/11/2014 3 Medidas de tendência central Também chamadas de medidas de localização ou de posição Média (média aritmética) Mediana Moda 1. MEDIDAS DE TENDÊNCIA CENTRAL São valores que trazem a informação sobre a região em torno da qual os dados estão posicionados Média aritmética Medida de tendência central mais utilizada Soma de todos os valores e divisão pelo número de observações Desvantagem: é influenciada por valores discrepantes (outliers) Apropriada quando a distribuição dos dados é simétrica n x x i MÉDIA ARITMÉTICA indivíduos de totalNúmero Média indivíduo cada deValor n x xi 10/11/2014 4 Média aritmética 4,75 7 528 n x x i Indivíduo No. Peso 1 76 2 80 3 81 4 75 5 72 6 69 7 75 Soma 528 Média 75,4 Peso dos funcionários do HV/UFCG MÉDIA ARITMÉTICA MEDIANA É o valor que divide uma série de observações, ordenadas de forma crescente, em duas partes, cada qual com 50% delas Não é afetada por valores discrepantes (outliers) Se o no. de observações é ímpar, a mediana é o valor central Se o no. de observações é par, a mediana é a média aritmética dos valores centrais MEDIANA 10/11/2014 5 mediana Indivíduo No. Peso 1 69 2 72 3 75 4 75 5 76 6 80 7 81 Mediana 75 Peso dos funcionários do HV/UFCG MEDIANA mediana Indivíduo No. Peso 1 69 2 72 3 75 4 75 5 76 6 80 7 81 8 82 Mediana 75,5 Peso dos funcionários do HV/UFCG MEDIANA 54 eposiçõesdasvaloresdosaritméticaMédia 10/11/2014 6 Média aritmética MODA Medida pouco utilizada É o valor que, na série de observações, apresenta a freqüência mais alta Há distribuições com mais de uma moda Média aritmética MODA Observações 9 10 11 12 12 14 16 18 Média = 12,75 Mediana = 12 Moda = 12 Observações 9 10 11 12 12 14 14 16 Média = 12,25 Mediana = 12 Moda = 12 e 14 10/11/2014 7 Média aritmética a. Distribuição amodal X = {1, 2, 3}; Moda = ∄ b. Distribuição unimodal X = {1, 2, 2, 3, 4}; Moda = 2 c. Distribuição bimodal X = {2, 3, 1, 3, 0, 2}; Moda = 2 e 3 d. Distribuição multimodal X = {2, 3, 1, 0, 4, 2, 0, 1, 3, 5}; Moda = 0, 1, 2 e 3 Média ou mediana ? Observações 9 10 11 12 12 14 16 18 Média = 12,75 Mediana = 12 Observações 9 10 11 12 12 14 16 110 Média = 24,25 Mediana = 12 MÉDIA OU MEDIANA ? 10/11/2014 8 Medidas de dispersão 2. MEDIDAS DE DISPERSÃO Banco 1 Banco 2 Banco 3 Medidas de dispersão Aluno A: 6, 6, 6, 6, 6 Total de pontos: 30; média: 6 Aluno B: 7, 5, 6, 4, 8 Total de pontos: 30; média: 6 2. MEDIDAS DE DISPERSÃO OBJETIVO: complementar as medidas de tendência central, trazendo informação sobre a dispersão existente no conjunto de dados. 10/11/2014 9 Medidas de dispersão Também chamadas de medidas de variabilidade Amplitude total (range) Variância Desvio padrão Intervalo (amplitude) interquartil MEDIDAS DE DISPERSÃO Amplitude total É a diferença entre a maior e a menor observação Simples de calcular, pouco utilizada Não é uma boa medida de dispersão, pois seu cálculo leva em consideração apenas os dados extremos e não todos os dados AMPLITUDE TOTAL Indivíduo No. Variável 1 2,30 2 2,15 3 3,50 4 2,60 5 2,75 6 2,82 7 4,05 Amplitude = 4,05 – 2,15 = 1,90 Indivíduo No. Variável 1 2,30 2 2,15 3 3,50 4 2,60 5 2,75 6 2,82 7 40,2 Amplitude = 40,2 – 2,15 = 38,05 10/11/2014 10 variância Determinada por meio do cálculo do desvio de cada observação em relação à média Quantifica a dispersão dos dados em torno da média Utiliza todas as observações Medida sensível de dispersão 1 2 2 N xx s i VARIÂNCIA indivíduos de totalNúmero Média indivíduo cada deValor N x xi variância 1 2 2 N xx s i Indivíduo No. 1 2,30 - 0,65 0,4225 2 2,15 - 0,80 0,6400 3 3,50 0,55 0,3025 4 2,60 - 0,35 0,1225 5 2,75 - 0,20 0,0400 6 2,82 - 0,13 0,0169 7 4,05 1,10 1,2100 8 2,25 - 0,70 0,4900 9 2,68 - 0,27 0,0729 10 3,00 0,05 0,0025 11 4,02 1,07 1,1449 12 2,85 - 0,10 0,0100 13 3,38 0,43 0,1849 Total 38,35 0,00 4,6596 xxi ix OBS: média = 2,95 2xxi 39,0 12 6596,42 s VARIÂNCIA 10/11/2014 11 Desvio padrão Raiz quadrada da variância Apresenta a mesma dimensão dos dados originais, ou seja, corrige o problema de unidade que ocorre na variância Útil para distribuições simétricas 1 2 N xx s i DESVIO-PADRÃO Desvio padrão 1 2 2 N xx s i Indivíduo No. 1 2,30 - 0,65 0,4225 2 2,15 - 0,80 0,6400 3 3,50 0,55 0,3025 4 2,60 - 0,35 0,1225 5 2,75 - 0,20 0,0400 6 2,82 - 0,13 0,0169 7 4,05 1,10 1,2100 8 2,25 - 0,70 0,4900 9 2,68 - 0,27 0,0729 10 3,00 0,05 0,0025 11 4,02 1,07 1,1449 12 2,85 - 0,10 0,0100 13 3,38 0,43 0,1849 Total 38,35 0,00 4,6596 xxi ix OBS: média = 2,95 2xxi 39,0 12 6596,42 s 62,039,0 s DESVIO-PADRÃO 10/11/2014 12 Desvio padrão Indivíduo No. FEV1 1 2,30 2 2,15 3 3,50 4 2,60 5 2,75 6 2,82 7 4,05 8 2,25 9 2,68 10 3,00 11 4,02 12 2,85 13 3,38 Média = 2,95 Desvio padrão = 0,62 Indivíduo No. FEV1 1 2,30 2 2,15 3 3,50 4 2,60 5 2,75 6 2,82 7 4,05 8 2,25 9 2,68 10 3,00 11 40,20 12 2,85 13 3,38 Média = 5,73 Desvio padrão = 10,37 MAIOR DISPERSÃO DESVIO-PADRÃO Intervalo interquartil (Q) Quantifica a amplitude de valores que abrange os dados centrais (50%) Diferença entre o terceiro e o primeiro quartil - Q = Q3 – Q1 Não é influenciada pela presença de dados discrepantes 2 1mediana da posição quartil1 do posição1 oN 1º quartil 3º quartil INTERVALO INTERQUARTIL (Q) 10/11/2014 13 Intervalo interquartil Indivíduo No. FEV1 1 2,15 2 2,25 3 2,30 4 2,60 5 2,68 6 2,75 7 2,82 8 2,85 9 3,00 10 3,38 11 3,50 12 4,02 13 4,05 Mediana = 2,82 1º quartil 4ª posição = 2,60 3º quartil 10ª posição = 3,38 Intervalo interquartil = 3,38 – 2,60 = 0,78 4 2 17 104113 INTERVALO INTERQUARTIL (Q) APRESENTAÇÃO DE DADOS NUMÉRICOS Procedimentos para a organização e o resumo de grandes quantidades de dados Descrição das variáveis => imprescindível paraa adequada interpretação dos resultados de uma pesquisa Os dados podem ser organizados em: Tabelas Gráficos 3. APRESENTAÇÃO DE DADOS NUMÉRICOS 10/11/2014 14 APRESENTAÇÃO TABULAR (TABELAS) Exemplo. suponha que, ao estudar a quantidade de albumina no plasma de pessoas com determinada doença, um pesquisador obteve os seguintes resultados: 5,1 4,9 4,9 5,1 4,7 5,0 5,0 5,0 5,1 5,4 5,2 5,2 4,9 5,3 5,0 4,5 5,4 5,1 4,7 5,5 4,8 5,1 5,3 5,3 5,0 TABELAS Albumina (g/100 mL) Freqüência N (absoluta) % (relativa) 4,5 1 4,0 4,6 0 0,0 4,7 2 8,0 4,8 1 4,0 4,9 3 12,0 5,0 5 20,0 5,1 5 20,0 5,2 2 8,0 5,3 3 12,0 5,4 2 8,0 5,5 1 4,0 Total 25 100,0 APRESENTAÇÃO TABULAR (TABELAS) ELEMENTOS DE UMA TABELA Essenciais - Título - Cabeçalho - Coluna indicadora - Corpo Complementares - Fontes - Notas e chamadas 10/11/2014 15 Dicas para construção de uma tabela ELEMENTOS DE UMA TABELA Tipo de captura Espécies Manual a Armadilha tipo New Jersey Total N º % N º % N º Aedes scapularis 108 6.8 1 1.2 109 Anopheles evansae 191 12.1 12 14.8 203 Anopheles triannulatus 48 3.0 - - 48 Culex pipiens quinquefasciatus 105 6.6 21 25.9 126 Culex (Culex) sp. 61 3.9 5 6.2 66 Culex (Melanoconion) sp. 160 10.1 5 6.2 165 Mansonia chrysonotum 139 8.8 13 16.0 152 Mansonia titillans 689 43.7 19 23.5 708 Psorophora confinnis 51* 3.2 - - 51 Outras espécies2 29 1.8 5 6.2 34 Total 1581 100 81 100 1662 Tabela 1. Frequência de insetos capturados em domicílio na Escola Agrícola de Iguape, São Paulo, segundo espécie e tipo de captura. Fonte: Forattini, O.P. et. Al., Ëestudos ecológicos sobre mosquitos Culicidae no sistema da Serra do Mar, Brasil, 2 – Observações no ambiente domiciliar”, Rev. Saúde Públ., São Paulo, 12: 476:96, 1978. a Colocadas no final da tarde Título Coluna Indicadora CabeçalhoFonte Corpo Nota APRESENTAÇÃO TABULAR – variáveis qualitativas Causa do atendimento Freqüência Frequência absoluta (n) Frequência relativa (%) Infecção 26 7,8 Hipervolemia 90 27,0 AVC 8 2,4 Problemas coronarianos 24 7,2 Hipertensão 35 10,5 Uremia 150 45,0 Total 333 100,0 Tabela 1. Causas do primeiro atendimento hospitalar de pacientes com Insuficiência Renal Crônica (IRC) Fonte: Massad et al. Métodos quantitativos em medicina. Barueri: Manole, 2004. 561p. TABELAS SIMPLES DE FREQÜÊNCIA (ENTRADA SIMPLES) TABELA – variáveis qualitativas 10/11/2014 16 APRESENTAÇÃO TABULAR – variáveis quantitativas Nível de colesterol (mg/100 mL) Freqüência Fr. Absoluta (n) Fr. relativa (%) 80├─ 119 13 1,2 119├─ 159 150 14,1 159├─ 199 442 41,4 199├─ 239 299 28,0 239├─ 279 115 10,8 279├─ 319 34 3,2 319├─ 359 9 0,8 359├─ 399 5 0,5 Total 1067 100,0 Tabela 3. Níveis séricos de colesterol em 1067 homens nos EUA, 1876-1980 Fonte: Pagano e Gauvreau. Princípios de bioestatística. São Paulo: Thomson Learning, 2006. 506p. TABELAS DE AGRUPAMENTOS POR INTERVALO DE CLASSE TABELA – variáveis quantitativas APRESENTAÇÃO GRÁFICA (GRÁFICOS) TIPOS DE GRÁFICOS (VARIÁVEIS QUALITATIVAS) Diagrama de setores circulares (pizza) Diagrama de barras GRÁFICOS OBJETIVO: apresentar dados de maneira clara, rápida e objetiva. TIPOS DE GRÁFICOS (VARIÁVEIS QUANTITATIVAS) Histograma Diagrama de dispersão Diagrama de blocos (Box Plot) 10/11/2014 17 DIAGRAMA DE setores circulares (pizza) Figura 1. População do Brasil por região geográfica DIAGRAMA DE SETORES CIRCULARES 8% 28% 42% 15% 7% Norte Nordeste Sudeste Sul Centro-Oeste DIAGRAMA DE BARRAS Centro-Oeste Nordeste Norte Sudeste Sul Regiões 0 10 20 30 40 % d a Po pu la çã o Figura 2. Distribuição percentual da população segundo regiões, Brasil, 1970 Fonte: IBGE,Censo demográfico, Rio de Janeiro, 1973. DIAGRAMA DE BARRAS 10/11/2014 18 histograma HISTOGRAMA Figura 4. Nível sérico de colesterol em indivíduos sedentários Diagrama de dispersão DIAGRAMA DE DISPERSÃO Figura 5. Diagrama de dispersão para comprimento e peso de 48 cães 10/11/2014 19 Diagrama de blocos DIAGRAMA DE BLOCOS Diagrama de blocos Figura 1 Número de vacas em lactação em propriedades rurais no Estado do Espírito Santo Figura 6. Idades de cães segundo o sexo, obtidas em levantamento realizado em uma escola (Shimozako, 2002) DIAGRAMA DE BLOCOS 10/11/2014 20 Medidas de dispersão EXEMPLO Equipe A Equipe B Equipe C 120 117 87 120 118 88 120 120 89 120 121 91 120 124 97 Medições da pressão arterial sistólica (mmHg) em três equipes de vôlei, compostas por cinco indivíduos cada. Calcule média, mediana, variância, desvio-padrão e intervalo interquartil Medidas de dispersão EXEMPLO Média ± desvio-padrão do exemplo anterior 10/11/2014 21 Medidas de dispersão EXEMPLO Diagramas de blocos do exemplo anterior Medidas de dispersão RESUMINDO ... QUANDO OS DADOS SÃO SIMÉTRICOS (DISTRIBUIÇÃO NORMAL) Utiliza-se a média ± desvio-padrão QUANDO OS DADOS SÃO ASSIMÉTRICOS (DISTRIBUIÇÃO NÃO-NORMAL) Utiliza-se mediana ± intervalo interquartil
Compartilhar