Baixe o app para aproveitar ainda mais
Prévia do material em texto
ESTATÍSTICA BÁSICA MÓDULO I: COLETA E ORGANIZAÇÃO DOS DADOS A estatística pode ser considerada a ciência que se preocupa com a coleta, organização, descrição, análise e interpretação de dados experimentais. Conceitos fundamentais: População ou Universo: quaisquer conjuntos de informações que tenham entre si uma característica comum que delimite quais elementos pertencem a ela. Ex: uma população de pesos de todos os habitantes de uma cidade. �A = População B = Amostra Média populacional = Média amostral = Desvio Padrão populacional = Desvio padrão amostral = s Amostras: são subconjuntos representativos de uma dada população da qual foi extraída, devendo ser parecida com ela (qualitativa e quantitativamente), suficientemente grande, além de seus constituintes serem selecionados ao acaso. Na maioria das situações trabalha-se com amostras pela impossibilidade da obtenção dos dados de toda a população. Exemplo: Peso dos alunos de uma escola pública de São Paulo (população) e peso dos alunos da mesma escola do primeiro ano (amostra). Elemento: é cada uma das unidades observadas no estudo e corresponde a cada indivíduo ou objeto estudado. Exemplo: paciente RN de Maria. Variável: é uma característica de interesse que se pode medir. Por exemplo: idade, sexo, peso, pressão arterial. Observação: é a informação sobre a variável para um elemento específico. Exemplo: peso de 1500 para o Elemento RN de Maria. Caso: é o conjunto de observações de um elemento determinado. Exempo: peso de 1550g, sexo masculino, idade 3 dias para o RN de Maria. Parâmetros: São valores singulares que existem na população e que servem para caracterizá-la. Para definirmos um parâmetro devemos examinar toda a população. Ex: Os alunos de Estatística do Brasil têm em média 1,70 metros de estatura. Estimativa: é um valor aproximado do parâmetro e é calculado com o uso da amostra. Atributo: quando os dados estatísticos apresentam um caráter qualitativo, o levantamento e os estudos necessários ao tratamento desses dados são designados genericamente de estatística de atributo Dado estatístico: é um dado numérico e é considerado a matéria-prima sobre a qual iremos aplicar os métodos estatísticos. Variável Dependente: é aquela que mede o fenômeno que se estuda. Ex: Produção mensal de peças (quantitativa discreta: número de peças que cada funcionário da empresa produz por mês; qualitativa ordinal: menos que 300, entre 300 e 500, mais que 500). Variável Independente: é aquela candidata a explicar a dependente. Ex: Sexo (se a maioria das funcionárias produz mais que 500 peças por mês e a maioria dos funcionários produz menos que 300 peças por mês pode-se “suspeitar” que sexo e produção estão intimamente relacionados, ou seja, que mulheres são mais competentes/rápidas que homens na mesma função). Escalas de Medição (Tipos de Dados ou Variáveis): Dados nominais ou categóricos: são aqueles distribuídos em categorias nominais, sem qualquer ordem que descrevem atributos ou qualidades dos dados. Ex: sexo, raça, evolução. Podem ser codificados. Exemplo: sexo feminino 0 e masculino 1. Descrição: em geral através de nº. absoluto, porcentagens e proporções. Apresentação: gráficos de barras, pizzas e tabelas de contingência. Exemplos: Cor Raça Tamanho Dados ordinais: são aqueles que se distribuem por categoria e que tem uma ordem. Cada observação faz a associação do indivíduo medido a uma determinada classe, sem no entanto quantificar a magnitude da diferença face aos outros indivíduos. Exemplo: Escalão social, escalão salarial, escalas usadas na medida de opiniões, Escala de Apgar, de Glasgow, graus de retinopatia. Podem ser codificados. Exemplo: HIV grau I, HIV grau II, HIC grau III e HIC grau IV; Pressão arterial normal (0), Hipertensão leve (1), Hipertensão moderada (2) e Hipertensão grave (3). Descrição: em geral através de nº. absoluto, porcentagens e proporções e permitem operações que envolvem ordenação (menor/maior). Apresentação: gráficos de barras, pizzas e tabelas de contingência. Exemplos: Classe social Escala métrica - Para além de ser possível ordenar os indivíduos, é também feita uma quantificação das diferenças entre eles. As escalas métricas dividem-se em dois subtipos: A) Escala intervalar: Um caso particular (e não muito frequente) das escalas métricas em que é possível quantificar as distâncias entre as medições mas onde não há um ponto nulo natural e uma unidade natural. Exemplo clássico são as escalas das temperaturas, onde o valor nulo não corresponde à ausência da característica medida, existe um zero arbitrário. Ex: o 0º grau não significa ausência de temperatura, mas o valor 0º grau da escala Celsius (ponto de nulidade) e não se pode dizer que a temperatura X é o dobro da temperatura Y. B) Escala de razão: A escala onde não só é possível quantificar as diferenças entre as medições como também estão garantidas certas condições matemáticas vantajosas, como um ponto de nulidade. Isto permite o quociente de duas medições, independentemente da unidade de medida. É possível fazer diferenças e quocientes e logo a conversão (de kms em milhas, por exemplo). Exemplos de escalas de razão são a idade, salário, preço, volume de vendas, distâncias. O zero corresponde à ausência da característica medida. Ex: massa corporal, idade, tempo, pressão arterial. Nesta escala é válido dizer que uma pessoa de 70 kg possui duas vezes o peso de outra de 35 kg. Variáveis Quantitativas Discretas e Contínuas Dados quantitativos discretos: apresentam somente valores inteiros. Ex: nº. de leitos, nº. de casos de determinadas doenças, nº. de filhos. Exemplos: Nº. de gatos Nº. de pássaros Nº. de cães Dados quantitativos contínuos: são aqueles em que os números são significantes, podendo existir valores intermediários. Ex: peso, estatura, perímetro cefálico. Descrição: em geral através de média, mediana, moda, valores mínimos e máximos, amplitude, quartis. Apresentação: gráficos de barras, Boxplot e tabelas de contingência. Exemplos: Peso Altura Normas para apresentação de Tabelas: Devem ser auto-explicativas; Fechadas no alto e em baixo por linhas horizontais, não sendo fechadas à direita nem à esquerda por linhas verticais; Enumerar as tabelas conforme a ordem de aparecimento; O título deve conter a descrição básica do conteúdo, local e época da coleta dos dados; Manter a uniformidade quanto ao nº. de casas decimais (duas). Tabela 1: Dados de 8 recém-nascidos do Hospital X no período de 01/01/2010 a 31/01/2010 N Pré-natal Peso Sexo Permanência Tipo de Alta 1 1 1500 0 30 0 2 1 2000 0 7 0 3 1 3000 1 4 0 4 0 1200 1 40 1 5 0 1600 0 15 0 6 1 2000 0 9 0 7 1 1800 1 12 0 8 0 2000 1 6 0 Códigos: Pré-natal: 0=não; 1=sim Sexo: 0= fem; 1= masculino Tipo de alta: 0= vivo; 1= óbito EXERCÍCIOS Explique seis conceitos fundamentais que devem reger o início da coleta e organização dos dados. 1) 2) 3) 4) 5) 6) O que são dados nominais e dados quantitativos 1) 2) Encontre a correspondência entre as variáveis e o seu grupo classificatório, preencha a coluna. Dados Tipos de dados 1 Sexo Variável categórica ordinal 2 Peso Variável numérica discreta 3 Raça Variável categórica ordinal 4 Idade Variável categórica não ordinal 5 Nº filhos Variável categórica não ordinal 6 Classe social Variável numérica contínua 7 EscolaridadeVariável numérica contínua Cite as normas para a tabulação de dados. 1) 2) 3) 4) 5) Dê dois exemplos de cada variável: Variável quantitativa numérica : ___________________ ___________________ Variável quantitativa contínua: ___________________ ___________________ Variável categórica (não ordinal) : _________________ ___________________ Variável categórica ordinal: ___________________ ___________________ Você está realizando um estudo e precisa elaborar uma tabela, construa abaixo conforme as normas aprendidas. Escolha cinco variáveis Codifique conforme a sua classificação. N 1 2 3 4 5 6 7 8 ANÁLISE DESCRITIVA OU EXPLORATÓRIA DOS DADOS Variáveis categóricas nominais: Distribuição de freqüências, freqüência acumulada representação gráfica nº. classes. Frequência absoluta simples (n): é a quantidade de observações encontradas em uma dada categoria. É uma simples contagem. A soma das freqüências absolutas é igual ao número total de observações de cada variável. Frequência relativa simples (fr): indica a proporção de elementos do conjunto total que pertence a uma dada categoria. A soma das freqüências relativas de todas as categorias é igual a 1. �� EMBED Equation.3 Frequência percentual simples (fp): indica o percentual de observações que pertence a uma dada categoria. De modo análogo, a soma das freqüências relativas de todas as categorias é igual a 100%. Frequência percentual acumulada (Fp): indica a soma da freqüência percentual de uma classe com as freqüências percentuais das classes anteriores. A última freqüência acumulada deve ser igual a 100%. Distribuição das freqüências em classes É apropriada para apresentar dados quantitativos contínuos ou discretos com um número elevado de possíveis valores. Na construção da tabela não são apresentados valores individualizados, mas agrupados em um determinado número de classes. Regras básicas: As classes devem abranger todas as observações; O extremo superior de uma classe é o extremo inferior da classe seguinte; Cada valor deve enquadrar-se em apenas uma classe; A quantidade de classes, em geral, não deve ser inferior a 5 ou superior a 25. Exemplo: Supondo que o peso máximo de um RN seja 2000g e o menor seja de 500g. Regras práticas: A amplitude total (máximo – mínimo) seria de 1500g. Pode-se escolher o número de classes igual a 5 (divisor de 1500g) para que os intervalos de classe apresentem valores inteiros e sejam mais facilmente analisados. Assim, a amplitude da classe seria a amplitude total dividida pelo nº. de classes. Neste caso, 1500/5 que é igual a 300g. Teríamos os intervalos: 500 a 800g; 800 a 1100g; 1100 a 1400g; 1400 a 1700g e 1700 a 2000g. Para não incluir o mesmo valor em duas classes, convencionou-se organizar os limites de classe de modo que um valor seja incluído numa classe caso ele seja maior ou igual ao limite inferior e menor que o limite superior desta classe. Utilizando-se o símbolo |--- entre os limites das classes, significando a barra vertical que o limite inferior está incluído no intervalo e o superior, não. O ponto médio de cada classe é o valor do limite superior somado ao limite inferior dividido por dois. Exemplos:1) Distribuição do sexo dos colaboradores de acordo com o setor de trabalho. 2) Distribuição da idade materna dos pacientes internados em janeiro de 2009. Idade mães N fp (%) Fpa (%) 10 |-------- 17 3 2,50 2,50 17 |-------- 25 7 5,83 8,33 25 |-------- 33 70 58,33 66,67 33 |-------- 41 25 20,83 87,50 41 |--------- 50 15 12,50 100,00 Total 120 100,00 3) Distribuição dos pesos de nascimento dos pacientes internados em janeiro de 2009. Classes de pesos ponto médio (pm) ni fpi Fpi 500 |---- 800g 650 20 2,22 2,22 800 |---- 1100g 950 30 3,33 5,55 1100 |---- 1400g 1250 100 11,11 16,66 1400 |---- 1700g 1550 300 33,33 50,00 1700 |---- 2000g 1850 450 50,00 100 Total 900 100 Medidas de Tendência Central Média aritmética: definida como a soma dos valores observados dividida pelo número de observações. Exemplo: n=7 X = x1 + x2 + x3 + x4 + x5 + x6 + x7 = 50+70+80+80+90+100+800 = 181,42 7 7 Mediana: é aquele valor que, uma vez ordenados todos os resultados, deixa igual o número de resultados de cada lado. ordenar os dados em ordem crescente: 50, 70, 80, 80, 90, 100, 200 se o n = ímpar, a mediana será o valor da posição central, caso seja par, some os dois centrais e divida o resultado por dois. Exemplo: n = 7 (ímpar) 50 70 80 80 90 100 200 50% 100% assim, a mediana = 80, ou seja, metade dos valores estão abaixo e metade acima deste valor central. n = 6 (par) 50 70 70 80 90 100 Sendo n=6 (par) somar os valores centrais (70 + 80) e dividir por dois= 75. 50, 70, 70, 80, 90, 100, assim, a mediana = 75, ou seja, metade dos valores estão abaixo e metade acima deste valor central. Moda: é definida como o valor mais freqüente e é usada primariamente para descrever distribuições bimodais. Exemplo: 50, 70, 80, 80, 90, 100, 800 A moda é 80! Medidas de Dispersão ou Variabilidade Grande variabilidade ... Pouca variabilidade ... Variância: quanto mais próximos da média estiverem os valores, mais homogêneo será o conjunto, assim, é interessante conhecer o quanto os valores obtidos se afastam da média. Obtendo-se a diferença de cada valor em relação à média, elevando-se estes valores ao quadrado, somando os quadrados obtidos e dividindo pelo total da população, temos a variância. n= 10-1 = 9 Exemplo 1: Altura da equipe de neonatologia n= 10 -1 = 9 Soma da diferença entre os valores individuais e a média elevada ao quadrado = 750. Variância = 750 = 83,33 9 Desvio-padrão: raiz quadrada da variância. É um modo de representar a dispersão dos dados ao redor da média. Se os dados obedecerem a uma distribuição normal, todos estarão compreendidos por uma curva em forma de sino. Desvio-padrão = raiz da variância = 9,129 Exemplo 2: Altura da equipe de neonatologia da Promatre O desvio-padrão pequeno é desejado, por exemplo, nas fábricas de peças para automóveis onde os tamanhos devem variar o mínimo possível. Um exemplo de grande desvio-padrão é encontrado em uma amostra de salários dos colaboradores de uma empresa, que divergem de acordo com as diferentes funções. Coeficiente de variação (CV): O desvio-padrão reflete o valor da sua unidade de medida, assim, uma medida de peso em gramas terá um desvio-padrão menor do que a medida do peso em kilogramas. O CV expressa o desvio-padrão como porcentagem da média eliminando a unidade de medida. Um CV igual a 100% indica que o desvio-padrão é igual à média; quanto menor ele for, mais homogênea será a amostra. Coeficiente de variação = Desvio-padrão x 100 |média| EXEMPLO: PESO (A) X IDADE GESTACIONAL (B) 20 RN : PESO ENTRE 2000 E 2500GIG ENTRE 25 E 35 SEMANAS MÉDIA A = 2236 DP= 503 CV A = 22 MEDIA B = 29 DP= 7 CV B = 25 Interpretação: O Desvio Padrão da variável peso é maior que o da IG pela diferença da grandeza da variável (unidade de medida gramas é maior que a semana), mas o coeficiente de variação é maior na IG, mostrando que existe maior variabilidade nesta variável. Amplitude total ou intervalo de variação: É a diferença entre o valor máximo e o mínimo =180-150= 30. Percentil: é obtido dividindo-se a população, organizada em ordem crescente, em 100 partes iguais. Indica a porcentagem do total de observações que são iguais ou se situam abaixo de um determinado valor. Por exemplo: Uma escola quer conhecer o percentil das notas de 50 alunos. Qual nota corresponde aos percentis 10, 50 70 e 100? Para encontrar o percentil 10: Multiplique o 10 por 50 e divida por 100 = 5. O 5º elemento corresponde à nota 6. Para encontrar o percentil 50: Multiplique o 50 por 50 e divida por 100 = 25. O 25º elemento corresponde à nota 8. Para encontrar o percentil 70: Multiplique o 70 por 50 e divida por 100 = 35. O 35º elemento corresponde à nota 9. Para encontrar o percentil 100: Multiplique o 100 por 50 e divida por 100 = 50. O 50º elemento corresponde à nota 10. Exemplo 3: Notas de 50 alunos de uma Escola Pública Quartil: é obtido dividindo-se a população, organizada em ordem crescente, em quatro partes iguais. O primeiro quartil inclui 25% dos valores mais baixos e o segundo quartil corresponde ao percentil 50 e à mediana, já o terceiro quartil exclui 25% dos valores mais altos. EXERCÍCIOS Dê exemplos de como você faria a descrição dos dados qualitativos e quantitativos. Quatlitativos: 1) 2) 3) 4) Quantitativos 1) 2) 3) 4) O peso dos RN da UTINeonatal foi verificado, agrupe e calcule a freqüência absoluta simples, percentual e acumulada. Pesos: 1500;1510;1560;1600;1800;1830;1860;1900;1920;1940;2000;2010;2035; 2100;2200;2240;2300;2360;2450;2499;2550;2570;2700;2700;2700;2780; 2999. Classes de pesos ponto médio (pm) fi fpi Fpi |---- g |---- g |---- g |---- g |---- g Total Encontre a correspondência entre as medidas e os seus respectivos valores, preencha a coluna. Dados Tipos de dados 1 Media 178.764,90 2 Mediana 1.860 3 Desvio Padrão 2.550 4 2ºQuartil 2.170,85 5 3ºQuartil 2.700 6 1ºQuartil 2.100 7 Variância 422,81 8 Moda 2.100 Analise o gráfico seguinte e encontre os valores da mediana, 1º quartil, 3º quartil, valores mínimos e máximos. 1) Mínimo 2) Máximo 3) 1ºQuartil 4) 3ºQuartil 5) Mediana A B variável elemento caso obs 2º Quartil Valor mínimo Valor máximo 1º Quartil 3º Quartil Dra Filomena B Mello – CFE: 9262-A Page � PAGE \* MERGEFORMAT �21� _1328978770.unknown _1361633880.unknown _1361633934.unknown _1328979305.unknown _1328981858.unknown _1327650514.unknown _1328978260.unknown _1328532487.unknown _1327650276.unknown
Compartilhar