Buscar

Introduçao à Bioestatistica

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 3, do total de 5 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Prévia do material em texto

EPIDEMIOLOGIA E BIOESTATISTICA: INTRODUÇÃO À BIOESTATISTICA 
 Nessa aula, serão introduzidos alguns conceitos pertinentes à Bioestatística.
 A Unidade de análise consiste na menor unidade, dentro da estrutura da coleta de informações para a qual existe disponibilidade de dados. Pode consistir de um único indivíduo, um conjunto de indivíduos, um determinado momento no tempo ou até mesmo um local. Para cada unidade de análise é possível atribuir uma categoria ou um valor numérico, a partir do qual se obtém aquilo que se denomina de dado.
 Ex: Em uma pesquisa que tem como objetivo medir a media de altura dos alunos de uma faculdade, a unidade de análise é justamente o dado que compreende a altura de um único aluno.
 Em uma pesquisa que busque perguntar para as pessoas a qual raça elas pertencem, a unidade de análise é do tipo categórica. Por outro lado, em uma pesquisa que tem como objetivo medir a media do peso dos alunos de uma faculdade, a unidade de análise é do tipo valor numérico. 
 Normalmente, as pesquisas coletam vários dados de cada unidade de análise. O conjunto dos dados obtidos de cada unidade de análise pode ser denominado de Observação.
 Ex: Cada indivíduo participante de uma dada pesquisa será questionado sobre sua escolaridade, renda, etnia, religião e orientação sexual.
 O Banco de dados, por sua vez, é constituído pelo conjunto de todas as observações obtidas durante a coleta de informações.
 As Variáveis são as questões de interesse dentro da Observação, pois a resposta para as questões da pesquisa podem sempre variar de individuo para individuo. A distribuição da variável é o conjunto de categorias ou valores numéricos na qual determinada variável se encaixa, pois uma variável pode ser classificada em mais de uma categoria, como, por exemplo, a escolaridade, que é ao mesmo tempo uma Variável Múlticategorica e uma Variável Categórica Ordinal.
 Um Censo ocorre quando em uma pesquisa são coletados os dados de toda uma população para tirar conclusões pertinentes a esta população. Por outro lado, uma Pesquisa Amostral acontece quando em determinada pesquisa são coletados os dados de apenas uma parcela de determinada população, para tirar conclusões sobre esta população.
 
 As variáveis podem ser classificadas em diferentes tipos:
 I.Variáveis Categóricas 
 *Classificação em relação à variedade de respostas:
 - Variáveis Categóricas Binárias/Dicotômicas (Apenas duas possibilidades de respostas) 
 Ex: Fumante ou Não Fumante; Empregado ou Desempregado; Alfabetizado ou Não Alfabetizado
 - Variáveis Múlticategoricas (Diversas possibilidades de respostas)
 Ex: Grupo Sanguíneo (A;B;AB;O) ; Nacionalidade (Brasileiro; Argentino ...); Escolaridade 
 
 *Classificação em relação à organização das respostas:
 - Variáveis Categóricas Nominais (Não há ordenação de respostas em relação a outras)
 Ex: Grupo Sanguíneo (A;B;AB;O) ; Nacionalidade (Brasileiro; Argentino ...)
 - Variáveis Categóricas Ordinais (Há ordenação de respostas em relação a outras)
 Ex: Escalas construídas a partir de exames ou questionários; Escolaridade
 
 II.Variáveis Numerais
 -Variáveis Numerais Discretas (Variáveis representadas por números inteiros)
 Ex: N° de internações em um determinado período; N° de habitantes em um domicilio
 - Variáveis Numerais Contínuas (Variáveis que podem ser representadas por números reais)
 Ex: Valor do IMC (24,5 ; 18,6 ; 30,42); Valor da pressão arterial (120,4 mmHg), Peso (80,4Kg)
 *Em determinados contextos, variáveis continuas podem ser encaradas como variáveis discretas. Ex: Idade.
 
 Escalas construídas a partir de exames, e ou questionários, podem ser consideradas como variáveis categóricas ordinais. Ex: Uma pesquisa que aplica um questionário para que os pacientes de determinado hospital avaliem o próprio estado de saúde (Ruim; normal; bom; excelente).
 Variáveis múlticategóricas podem ser transformadas em variáveis binárias. Ex: Uma pesquisa que primeiramente busca identificar as nacionalidades de indivíduos de determinada população (Variável múlticategórica), em um segundo momento decide separar as nacionalidades apenas em Brasileiros e Estrangeiros (Variável categórica binária). O problema em realizar este tipo de transformação é que dentro de uma mesma classificação (Ex: Estrangeiros) estão diversas respostas distintas (Ex: Argentinos, Chilenos...) o que prejudica o detalhamento das informações obtidas.
 As variáveis numerais não devem ser confundidas com as variáveis categóricas ordinais, pois as variáveis numerais estão associadas a uma escala numérica e continuam fazendo sentido quando agrupadas e representadas por um único valor (Ex: Existem 8 marcas de Ketchup em determinado supermercado). Por outro lado, as variáveis categóricas ordinais apenas fazem sentido quando separadas e ordenadas adequadamente (Ex: Em determinada escola existem 10 crianças com IMC abaixo do normal, 15 com IMC normal e 5 com IMC acima do normal). 
 Variáveis numerais contínuas podem ser convertidas em variáveis categóricas binárias. Ex: Uma pesquisa que primeiramente busca identificar o valor do IMC de indivíduos de determinada população (Variável contínua), em um segundo momento decide separar apenas em IMC Normal e IMC inadequado (Variável Binária). Isso é possível a partir da escolha de uns “pontos de cortes” (Ex: IMC´s Entre 18,5 e 24,9 serão considerados normais, enquanto IMC´s acima de 24,9 ou abaixo de 18,5 serão considerados inadequados. Neste caso, os pontos de corte são os valores 18,5 e 24,9).
 Outro conceito relevante dentro da bioestatística é o da Proporção. A proporção pode ser expressa em valores de 0 a 1, e caso a proporção seja multiplicada por 100 será obtida a porcentagem referente aos resultados obtidos. Ex: A proporção de residências que possuem rede de esgoto em determinado bairro é calculada dividindo-se a quantidade de casas que contém rede de esgoto pelo numero total de casas existentes neste bairro. 
 As Taxas, por sua vez, são calculadas a partir de freqüências. A principal utilidade das taxas é de evitar que se trabalhe com números muito baixos. Ex: A Taxa de mortalidade infantil é calculada a partir da divisão do numero de óbitos de nascidos vivos, pelo número total de nascidos vivos em determinado período. No Brasil a taxa de mortalidade infantil é de 19 mortes a cada 1.000 nascidos vivos. 
 O Rank pode ser definido como um número inteiro designado a uma unidade de análise baseado em uma variável categórica ou numérica. Ranks variam de 1 a n, onde n é o número de observações. Se as categorias ou valores numéricos de duas ou mais unidades de análises coincidirem, a média dos ranks correspondentes deve ser designada para cada uma das unidades de análise. Portanto poderá ocorrer ranks com casa decimais.
 A Tabela é uma das formas mais simples de se apresentar os dados obtidos durante a pesquisa.
 A Distribuição de freqüências consiste em um conjunto de classes ou categorias junto com contagens numéricas que correspondem a cada conjunto de dados nominais e ordinais.
 Para exibir dados numéricos discretos e ou numéricos contínuos na forma de distribuição de freqüência, existe a necessidade de se realizar a divisão das observações em intervalos iguais, porém não superpostos. 
 Ano - Nº de cigarros
 1900 - 54
 1910 - 151
 1920 - 665
 1930 - 1485
 1940 - 1976
 1950 - 3522
 A Freqüência relativa mostra a proporção dos valores situados em um determinado intervalo de uma distribuição de freqüências.
 É possível exibir os dados tanto na forma de Freqüência absoluta (Expressa em números inteiros)quanto na forma de freqüência relativa (expressa em porcentagem). No entanto, para evitar interpretações equivocadas sobre a freqüência relativa, é necessário sempre colocá-la ao lado dos números absolutos. 
 
 
 Podem-se representar os dados em gráficos:
 I.Gráfico de barras (Utilizado para exibir a distribuição de variáveis categóricas nominais e categóricas ordinais) 
 
 
II.Histograma (Utilizado para exibir a distribuição de variáveis numéricas discretas e numéricas continuas)
 
 
 III.Polígono de Freqüência (Utilizado para exibir variáveis numéricas discretas e numéricas continuas) 
 
 O Histograma pode representar as mesmas variáveis que o Poligono de Frequência. No entanto, quando se quer comparar duas variáveis utilizando a sobreposição de gráficos, o mais indicado é a utilização do Poligono de freqüência . EX:
 
 Medidas de tendência central são utilizadas quando se quer que um número represente o valor de algo. 
 I.Média – soma de todas as observações de um conjunto de dados divididos pelo nº total de medidas.
 Ex: Para determinar se certa turma da faculdade é estudiosa, é feita a media das notas dessa turma. Nesse caso seriam somadas todas as observações de dados obtidas do conjunto (notas dos alunos) e dividido pelo numero de unidades de medida (número de alunos). 
 O problema de determinar algo pela média, é que ela se altera significativamente devido a indivíduos muito acima da media, assim como indivíduos muito abaixo da mesma.
 II.Mediana – A mediana é o 50º percentil de um conjunto de medidas, onde em uma lista de observações ordenada da menor até a maior, metade dos valores é maior ou igual à mediana e a outra metade é menor ou igual à mediana. Então se uns conjuntos de dados contem n observações, no qual n é ímpar, a mediana é o valor do meio ou a [(n + 1) /2] – ésima medida; se n for par a mediana é a média dos dois valoresmais centrais do intervalo a (n/2) – ésima e [(n/2)+1] –ésima
 
 Exemplo: volume expiratório forçado em 1 segundo para adolescentes asmáticos (litros).
 
 2,15; 2,25; 2,30; 2,60; 2,68; 2,75 2,82; 2.85; 3,00; 3,38; 3,50; 4,02; 4,05
 Como há um nº ímpar de observações a mediana é (13+1)/2 = 7ª observação ou 2,82. Sete observações são menores ou iguais a 2,82. Sete observações são maiores que 2,82.
 2,15; 2,25; 2,30; 2,60; 2,68; 2,75; 2,82; 2,85; 3,00; 3,38; 3,50; 4,02
 Agora o há um nº par de observações e a mediana é a média entre os valores das observações
 (12/2)= 6ª e [(12/2)+1)]= 7ª
 (2,75+2,82)/2= 2,78
 
 Medidas de Dispersão
 I.Amplitude – A amplitude é determinada pela diferença entre a menor e a maior observação.
 II. Intervalo Interquartil – Intervalo que contem a metade mais central dos dados , é calculado subtraindo-se o 25º percentil do 75º percentil, assim engloba 50% do meio das observações (0 25ºpercentil e 75º percentil de um conjunto de dados chamam-se quartis). Se nk é um inteiro, o k-ésimo percentil dos dados é a média da (nk/100)-ésima e (nk/100+1)-ésima observação. Se nk não for um inteiro, o k-ésimo percentil é a (j+1)-ésima observação, no qual j é o maior inteiro menor do que nk/100. Também pode ser calculado encontrando primeiramente a mediana da primeira metade das observações, e subtraindo-a da mediana da segunda metade das observações. 
 No exemplo anterior:
 
 2,15; 2,25; 2,30; 2,60; 2,68; 2,75 2,82; 2.85; 3,00; 3,38; 3,50; 4,02; 4,05
13(25)/100=3,25 não é um inteiro, então 3+1= 4ª observação ou 2,60 litros. 13(75)/100=9,75 não é um inteiro então 9+1= 10ª observação ou 3,38 litros.
 O intervalo interquartil é 3,38-2,60= 0,78 litros.
 
 III. Variância – Quantifica a variabilidade/espalhamento dos valores ao redor da média das medidas. Pode ser calculada ao se subtrair a média de um conjunto de dados de cada uma das observações, elevar ao quadrado esses desvios, somá-los e dividir a soma pelo nº de observações menos 1.
 IV.Desvio Padrão - Resultado da raiz quadrada da variância. 
 *O professor afirma que não irá pedir para que calculemos as medidas, apenas irá pedir para que saibamos de que forma calcular e interpretá-las.
 Entre a Média mais duas vezes desvio padrão, e a média menos duas vezes o desvio padrão, se encontram incluídos 95% das observações. Resultando em apenas 2,5% acima do valor encontrado e 2,5% abaixo do valor encontrado. Portanto, indivíduos fora do intervalo de 95% têm grandes chances de estarem doentes.
Classificando as Variaveis:
a) Cor da pele (Branca, Negra, Amarela)
b) O n° de consultas realizadas por ano, por um associado do plano de saúde
c) O teor de gorduras medidas em gramas por 24h nas fezes de crianças de 1 a 3 anos de idade
d) O tipo de droga que os participantes de um estudo ingeriram (Droga A, Droga B, Placebo)
e) A pressão intra-ocular medida em mmHg em pessoas
f) O n° de filhos dos participantes de certo estudo
g) A pressão arterial de cardiopatas (Alta, normal, Baixa)
h) Resultado de um tratamento (Cura ou Óbito)

Continue navegando