Baixe o app para aproveitar ainda mais
Prévia do material em texto
Organização de dados: Tabelas Reforçando... • População x Amostra • Tipos de variável VARIÁVEL QUALITATIVA QUANTITATIVA NOMINAL ORDINAL DISCRETA CONTÍNUA Exemplo: questionário estudantil • ID: identificação do aluno • Turma: turma em que o aluno foi alocado – A ou B • Sexo: feminino (1) ou masculino (2) • Idade: idade em anos • Altura: altura em metros • Peso: peso em quilogramas • Fuma: hábito de fumar – Sim ou Não • Toler. Cig.: tolerância ao cigarro – Indiferente (I), Incomoda pouco (P) ou Incomoda muito (M) • Exerc.: horas de atividade física por semana • TV: horas gastas assistindo TV por semana • Op. TV: opinião a respeito da qualidade da programação na TV – Ruim (R), Média (M) ou Boa (B) Informações de questionário estudantil – dados brutos ID Turma Sexo Idade Altura Peso Fuma Toler. Cig. Exerc. TV Op. TV 1 A 1 17 1,60 60,5 Não P 0 16 R 2 A 1 18 1,69 55,0 Não P 10 7 R 3 A 2 18 1,85 80,9 Não M 2 15 R 4 A 1 25 1,58 55,0 Sim I 0 20 M 5 B 2 19 1,76 71,0 Não P 0 5 R 6 B 2 20 1,70 73,4 Sim I 3 2 B 7 B 1 19 1,64 58,0 Não M 5 7 B 8 B 2 17 1,71 72,2 Não M 4 10 M 9 B 1 18 1,62 53,6 não M 7 12 M Introdução à apresentação de dados • Criação de procedimentos para a organização, resumo e descrição de grandes quantidades de dados. • Imprescindível para a adequada interpretação dos resultados. DADOS BRUTOS RESULTADOS Manipulação inteligente Estatística descritiva Organização de dados • Os dados podem ser organizados em tabelas ou gráficos. • Embora um certo volume de informação seja perdido quando os dados são resumidos, um grande volume pode também ser ganho. • Conceitos básicos para montagem e apresentação de dados. Tabelas • Distribuição de frequências • Frequência relativa • Frequência acumulada Distribuição de frequências • Consiste de um conjunto de classes ou de categorias junto com contagens numéricas (frequências) que correspondam a cada conjunto de dados. Sarcoma de Kaposi Número de Indivíduos Sim 246 Não 2314 Total 2560 Tabela 1.1 Casos de Sarcoma de Kaposi para os primeiros 2.560 pacientes de AIDS registrados nos Centros de Controle de Doenças em Atlanta, Geórgia. Distribuição de frequências para dados sobre variáveis qualitativas Variável “Cor dos olhos” em 20 alunos de uma turma: Castanhos, Pretos, Castanhos, Azuis, Castanhos, Castanhos, Pretos, Castanhos, Verdes, Castanhos, Pretos, Castanhos, Azuis, Castanhos, Castanhos, Pretos, Pretos, Castanhos, Pretos, Pretos Distribuição de frequências para dados sobre variáveis quantitativas discretas Variável “Número de Irmãos” em 20 alunos de uma turma: 1, 2, 1, 0, 1, 1, 0, 2, 3, 1, 1, 1, 0, 2, 3, 1, 0, 0, 2, 2. Distribuição de frequências para dados sobre variáveis quantitativas contínuas • Necessário dividir as classes (ou seja, os valores das observações) em uma série de intervalos não-sobrepostos distintos. • Frequentemente, os intervalos apresentam largura igual. • Com os limites inferior e superior selecionados, o nº. de observações cujos valores estejam dentro da faixa determinada é contado, e os resultados são arranjados na forma de tabela. Tabela 1.3 Frequências absolutas dos níveis séricos de colesterol para 1.067 homens dos Estados Unidos, com idades entre 25 e 34 anos, 1976-1980. Nível de Colesterol (mg/100ml) Número de Homens 80 - 119 13 120 - 159 150 160 - 199 442 200 - 239 299 240 - 279 115 280 - 319 34 320 - 359 9 360 - 399 5 Total 1.067 Distribuição de frequências para dados sobre variáveis quantitativas contínuas Pode-se afirmar que, no conjunto A, a proporção de bolas vermelhas é maior que no conjunto B? Conjunto A Conjunto B Frequência relativa • A frequência relativa para um intervalo é a proporção do número de observações que nele aparece em relação à frequência total de valores. • Divide-se o número de valores dentro do intervalo pelo número total de valores na tabela (somatório). • A proporção pode se transformar em Frequência Relativa Percentual (fr% ou frp) se multiplicarmos os valores da frequência relativa por 100. • Úteis para se comparar conjuntos de dados que contenham número desiguais de observações. Tabela 1.3 Frequências absolutas dos níveis séricos de colesterol para 1.067 homens dos Estados Unidos, com idades entre 25 e 34 anos, 1976-1980. Nível de Colesterol (mg/100ml) Número de Homens 80 - 119 13 120 - 159 150 160 - 199 442 200 - 239 299 240 - 279 115 280 - 319 34 320 - 359 9 360 - 399 5 Total 1.067 FR ? ? ? ? ? ? ? ? ? FR% 1,2 14,1 41,4 28 10,8 3,2 0,8 0,5 100 Frequência relativa acumulada • Valor relativo (ou relativo percentual) do número total de observações que apresentam um valor menor ou igual ao limite superior do intervalo. • É calculada pela soma das frequências relativas para o intervalo especificado e todos os outros anteriores. Frequências relativas e acumuladas dos níveis séricos de colesterol para 2.294 homens dos Estados Unidos, 1976 - 1980. Idades 25 - 34 anos Idades 55 - 64 anos Nível de Colesterol (mg/100 ml) Frequência Relativa Percentual Frequência Relativa Percentual Acumulada Frequência Relativa Percentual Frequência Relativa Percentual Acumulada 80 - 119 1,2 1,2 0,4 0,4 120 - 159 14,1 15,3 3,9 4,3 160 - 199 41,4 56,7 21,6 25,9 200 - 239 28 84,7 37,3 63,2 240 - 279 10,8 95,5 22,9 86,1 280 - 319 3,2 98,7 10,4 96,5 320 - 359 0,8 99,5 2,9 99,4 360 - 399 0,5 100 0,6 100 Total 100 100 Pontos importantes • As abreviaturas e símbolos devem estar no rodapé da tabela. • A fonte de dados deve ser indicada. • A tabela deve conter um título claro e que seja descritivo. Deve indicar a região e o período de tempo, caso seja aplicável.
Compartilhar