Baixe o app para aproveitar ainda mais
Prévia do material em texto
Bioestatística - Material de apoio – Unidade 2 Organização de dados quantitativos Quando os dados coletados são de natureza quantitativa, não há categorias pré-definidas para eles, pois podem assumir quaisquer valores numéricos. Assim, é preciso categorizá-los, ou seja, criar intervalos de valores (em geral de mesmo tamanho) ou classes que contenham todos os valores assumidos pela variável observada. Exemplo: estatura de 21 alunos do 2º período do curso de nutrição da UFTM: 1,63 1,76 1,70 1,67 1,70 1,76 1,61 1,61 1,77 1,55 1,59 1,62 1,59 1,64 1,63 1,56 1,63 1,60 1,75 1,61 1,65 Categorias ou intervalos de valores para a estatura do indivíduos: 1,55m a 1,60m 1,60m a 1,65m 1,65m a 1,70m 1,70m a 1,75m 1,75m a 1,80m É importante considerar que um intervalo deve começar onde o anterior termina, e que o valor correspondente ao limitante superior de um intervalo não pertence a ele, mas ao próximo intervalo, do qual ele será o limitante inferior. Assim, o intervalo 1,55 a 1,60 contém, na verdade os indivíduos cuja estatura varia entre 1,55m e 1,599m. Distribuições de frequências Frequência Absoluta (n ou f): número de vezes que se observam indivíduos de cada classe ou nível da variável estudada. É a contagem, em números brutos, de indivíduos, unidades populacionais ou amostrais que apresentam uma dada característica. A soma das frequências absolutas das classes ou categorias é igual ao número total de indivíduos em estudo. Exemplo: dos dados acerca da estatura das alunas do exemplo anterior, temos : 4 : 9 : 2 : 2 : 4 Frequência Relativa (fr): proporção de cada classe com relação ao total. Reflete a proporção do total representada por cada classe ou nível da variável considerada. A soma das frequências relativas das classes ou categorias é igual a 1, que representa, em termos de proporções, o todo. em que: ni é a frequência absoluta da classe ou nível representado e n é o total de observações na amostra. fri: é a frequência relativa da classe i Continuando do exemplo anterior: Procedendo-se da mesma forma com os demais intervalos ou classes, obtém-se: = 0,43 = 0,10 = 0,10 = 0,19 frequência percentual (%): reflete a porcentagem (ou percentagem) do total representada por cada classe da variável estudada. É obtida multiplicando-se por 100 a frequência relativa. A soma das frequências percentuais das classes ou categorias é igual a 100%, que representa, em termos de porcentagem, o todo. Assim, para os dados das estaturas das alunas de nutrição, tem-se: Procedendo-se da mesma forma para as demais classes ou intervalos de valores, obtém-se: = 43% = 10% = 10% = 19% Frequência acumulada (F): reflete a frequência do intervalo de classe considerado acumulada (ou somada) às frequências dos intervalos anteriores. Em geral, trabalha-se com a frequência absoluta acumulada, mas podem- se acumular quaisquer delas. Para os dados de estatura dos alunos do curso de nutrição, tem-se: = 4 = 13 = 15 = 17 = 21 Tabelas de distribuições de frequências A finalidade de construir tabelas é resumir, ou sumarizar os dados. É mais fácil e simples observar uma tabela que resume os dados do que o banco de dados brutos. Ela permite conhecer aspectos da distribuição dos dados. Estrutura básica de uma tabela: Em primeiro lugar, uma tabela JAMAIS deve conter linhas verticais, quer seja em seu corpo, ou nas laterais. Linhas horizontais devem se colocadas na tabela somente em torno do cabeçalho e do total, ao final da mesma. Em outras palavras, em geral, uma tabela simples (no caso da tabela cruzada pode-se fazer concessões) tem apenas 4 linhas horizontais: uma abaixo e uma acima do cabeçalho e uma abaixo e uma acima do total. Uma tabela é formada pelos seguintes componentes: 1) TÍTULO: explica que informações a tabela contém (quem, o quê, onde, etc) 2) CABEÇALHO: indica o que contém cada coluna da tabela 3) COLUNA INDICADORA: indica o que cada linha da tabela contém 4) CORPO: contém os números e quantidades que sumarizam os dados 5) TOTAL: as tabelas podem exibir o total, entre dois traços horizontais, no final 6) FONTE: sempre que os dados citados em uma tabela já tiverem sido publicados, deve-se citar a fonte no rodapé da tabela. 7) NOTAS: são explicações sobre os dados, descritas do rodapé da tabela, abaixo da fonte, caso haja necessidade. Uma tabela deve ter o seguinte formato: Exemplo: para os dados das estaturas das alunas de nutrição, tem-se: Tabela 1 - Alunas do 2º período do curso de Nutrição da UFTM, segundo a estatura. Estatura n fr % 1,55m a 1,60m 4 0,19 19 1,60m a 1,65m 9 0,43 43 1,65m a 1,70m 2 0,10 10 1,70m a 1,75m 2 0,10 10 1,75m a 1,80m 4 0,19 19 Total 21 1,00 100 Fonte: dados coletados na aula de bioestatística de 23/03/2013. Gráficos A representação gráfica da distribuição de uma variável permite informar rapidamente sobre sua variabilidade ou seu comportamento. Todo gráfico deve apresentar: TÍTULO: abaixo do gráfico ESCALA: deve crescer da esquerda para a direita e de baixo para cima LEGENDA: à direita ou abaixo do gráfico FONTE: abaixo do gráfico Histograma Para se construir um histograma, basta seguir os seguintes passos: a) Traçar o sistema de eixos cartesianos b) Os intervalos de classes da variável estudada são colocados no eixo das abscissas (X). c) A frequência absoluta deve ser colocada no eixo da ordenadas (Y). d) Traçar colunas com bases no eixo da das abscissas, de larguras iguais ao comprimento dos intervalos de classes da variável, e alturas iguais às frequências observadas para os intervalos de classes da variável. OBS: As colunas, neste caso, são justapostas, coladas umas às outras, pois não há espaço entre os intervalos de classe. Exemplo: para os dados das estaturas das alunas de nutrição, tem-se: Fonte: dados coletados na aula de bioestatística de 23/03/2013 Figura 1 – Alunas do 2º período do curso de Nutrição da UFTM, segundo a estatura. Polígono de frequências Para construir um polígono de frequências, basta seguir os seguintes passos: a) Traçar o sistema de eixos cartesianos b) Os intervalos de classes da variável estudada são colocados no eixo das abscissas (X). c) A frequência absoluta deve ser colocada no eixo da ordenadas (Y). d) Marcar os pontos de coordenadas (xmédio , y) = (ponto médio do intervalo de classe, frequência do intervalo de classe) e) Ligar os pontos uns aos outros, com segmentos de retas. f) Ligar a figura ao eixo x, com o ponto que dá início ao primeiro intervalo de classe e o ponto de termina o último intervalo de classe. OBS: o polígono de frequências pode ser construído sobre o histograma, para ajudar a ilustrar o comportamento dos dados. Passando os mesmos dados para um polígono de frequências, temos: Fonte: dados coletados na aula de bioestatística de 23/03/2013 Figura 1 – Alunas do 2º período do curso de Nutrição da UFTM, segundo a estatura. Ogiva Este tipo de gráfico expressa as frequências acumuladas de cada intervalo de classe. Constrói-se de forma análoga ao polígono de frequências, acumulando-se, porém, a cada ponto médio de cada intervalo a porcentagem correspondente a ele e aquelas correspondentes aos intervalos anteriores. Fonte: dados coletados naaula de bioestatística de 23/03/2013 Figura 1 – Alunas do 2º período do curso de Nutrição da UFTM, segundo frequência acumulada da estatura.
Compartilhar