Buscar

Bioestatisticas

Esta é uma pré-visualização de arquivo. Entre para ver o arquivo original

Bioestatisticas
1) 
Pensamento científico
Ocorre a partir de uma linguagem teórica sobre conceitos e hipóteses científicas; porém, a comprovação dele necessita de uma linguagem e de um método operacional, que é a morada das hipóteses estatísticas (humanas + exatas)
Contribuição da estatística: 
· Na formulação de hipóteses estatísticas
· Fixação de regras de decisão
· Técnicas para um delineamento da pesquisa 
· Coleta
· Tabulação e Análise dos Dados (Estatística Descritiva)
· Testes de hipóteses para expressar as incertezas da inferência indutiva em um nível probabilístico
Estatísticas X Bioestatísticas
Estatística: ramo do conhecimento científico que consta de um conjunto de processos que têm por objeto a observação, a classificação formal e a análise dos fenômenos coletivos ou de massa e investigar a possibilidade de fazer inferências indutivas válidas a partir dos dados observados e buscar métodos capazes de permitir está inferência (coletar dados e saber trabalhar com eles de uma forma uniforme, sabendo os caminhos/confiabilidade/aplicabilidade)
Bioestatística é “A Ciência que trata os planos e os métodos de coleta, tabulação e análise de fatos numéricos nas Ciências da vida”
Conceitos de Variáveis
Quando estudamos as populações utilizando a óptica da Estatística, necessitamos, então, classificar os indivíduos de acordo com características mensuráveis. Essas características são chamadas de variáveis. A identificação e o estudo das variáveis vão permitir a descrição da população e o estabelecimento de comparações entre grupos, o que constitui, então, a base da Bioestatística (variáveis: cor dos olhos, peso, altura ...)
O entendimento do nível de mensuração o que se estabelece em uma população vai permitir a escolha de técnicas corretas de demonstração dos Dados (Tabelas e Gráficos), de utilização de medidas comparativas, técnicas de inferência e a tomada de decisão. Portanto, reside aqui a base da Bioestatística, de onde seguem todas as demais Teorias. (pegar as variáveis e colocá-los em tabelas e gráficos para melhor observação-forma direta)
Variáveis quantitativas
Contínuas: assumem qualquer valor. Por exemplo, peso, altura. Veja que entre a altura de 1,50m e a de 1,55m, por exemplo, existe uma infinidade de valores possíveis, dependendo da precisão do instrumento de medida utilizado
Discretas: assumem valores de um conjunto enumerável. Por exemplo, número de indivíduos nascidos de cada mãe. Perceba que podemos ter 1, 2, 3, 4, 5...10 filhos, mas nunca números fracionados; entre 1 e 2 filhos não existe nenhum valor possível.
Variáveis qualitativas
Nominais: não existe ordenação dentre as categorias, ex.: sexo, cor dos olhos, fumante/não fumante, doente/sadio
Ordinais: existe uma ordenação entre as categorias, ex.: escolaridade (1°, 2°, 3° graus), estágio da doença (inicial, intermediário, terminal), mês de observação (janeiro, fevereiro, ..., dezembro)
População x Amostra
População: conjunto de elementos que têm, em comum, determinada característica, ex.: pessoas que vivem em uma determinada região: população da cidade de São Paulo;
Amostra: todo subconjunto não vazio e com número menor de elementos da população, ex.: 50 pessoas da cidade de São Paulo é uma amostra desta população
Classificação das populações
Finita: é aquela população com um número total possível de se determinar, ex.: conjunto de alunos de um curso
Infinita: é aquela em que o número de elementos que faz parte dessa população é impossível de se determinar, ex.: número de vezes que posso jogar os dados.
Vantagens da amostra
· custo menos
· menor tempo
· objetivos mais amplos
Obtenção e expressão de dados utilizados em bioestatística
Elaboração de Questionários e Instrumentos de Coleta de Dados
A linguagem teórica precisa ser transformada em linguagem operacional - ser convertida para condições que nos permita agrupar e relacionar uma informação/dados com outra, bem como expressar informações a respeito do fenômeno investigado (comunicação)
	Ling. teórica
	Ling. operacional
	Preconceito
	Um possível escore que varie de 0 a 10 (variável quantitativa); 
Categorizar as respostas de acordo com a intensidade do preconceito: “muito”, “razoável”, “nenhum” (variável qualitativa)
	Escolaridade
	Nível de estudo: fundamental, médio ou superior (variável qualitativa); 
Anos de escolaridade (variável quantitativa);
Quantidade de anos cursados, não importando o tipo de curso: técnicos, de idiomas etc. (variável quantitativa).
Sobre o termo “preconceito”
1º) Quando se pergunta qual o nível de preconceito para aceitar uma campanha sanitária, é possível que muitas pessoas jamais tenham pensado que pudesse ser usado o termo “preconceito” fora das condições sociais, étnicas e socioeconômicas. Daí que muitas poderiam responder sem ter entendido realmente o significado de “preconceito”, que é um pré-julgamento, um pré-conceito a respeito de algo ou alguém
2º) A falta de conhecimento amplo sobre esse conceito poderia obrigar quem perguntou a criar breves definições para conceitos como esse. Possivelmente, ninguém iria admitir muito preconceito, pois, na nossa sociedade, causa má impressão admitir isso. Definir o que seria muito preconceito, razoável ou nenhum preconceito talvez fosse uma forma eficiente de obter respostas com mais fidedignidade.
Sobre o termo “escolaridade”
3º) Em relação à escolaridade, se fossemos entrevistar pessoas de todas as idades, talvez os idosos não tenham a resposta exata, pois, no “tempo deles” de estudo, não existia “esse tal” de ensino fundamental e médio; havia o ginasial e outros níveis de escolaridade. Perceba que o “erro” foi na formulação da pergunta, pois não havia essa divisão de níveis de escolaridade. 
4º) Definindo “escolaridade” como “anos de estudo”, você poderia entender que, independentemente da divisão vigente quanto aos níveis de escolaridade, as reais chances de identificarmos os anos estudados de cada participante seria muito maior – isso se fosse do nosso interesse investigar os anos estudados dos entrevistados. No entanto, se a pesquisa fosse realizada apenas com adolescentes, essa divisão de escolaridade não traria qualquer problema.
Se desejarmos saber o sexo e a idade de uma pessoa, o questionário poderia ser elaborado assim: Por favor, responda as seguintes questões: (por conta das ideologias de hoje)
1. Qual o seu sexo? (__) Masculino (__) Feminino
Tabulação de Dados
Na tabulação de dados se visualiza a quantidade e a qualidade dos dados obtidos.
· Simples: simples contagem dos números de casos
· Cruzada: quando os dados estão relacionados entre si
Elaboração de tabelas e gráficos
Forma de “expressar” as informações obtidas a partir de textos (parágrafos), tabelas e gráficos
Texto
A divulgação dos dados a partir de textos deverá ser feita sempre com muito cuidado. Não se pode colocar em um único parágrafo muitas informações, pois, ao final da leitura desse parágrafo, o leitor já não se lembrará de tudo o que leu
Gráficos
Os gráficos, que em estatística e metodologia também podem ser chamados de figuras, servem para expressar de forma generalizada (considerando toda a amostra ou população) ou detalhada (apresentando cada elemento da amostra) os dados apurados. Alguns:
· Gráficos de pontos
· Gráficos de setores
· Gráficos de barras
Tabelas 
Muito utilizadas para facilitar as informações obtidas e apuradas. A grande vantagem das tabelas é que essas conseguem explicar e esclarecer melhor o fenômeno investigado, trazem as informações para um único espaço e promovem as relações
Transmissão das informações relativas à amostra ou da população estudada
Medidas de Tendência Central
São confiáveis quanto mais representativo for o conjunto de elementos da amostra ou da população. Se o conjunto de elementos for bem selecionado, se guardar características semelhantes às características da população que foi extraída, se for suficientemente grande, os dados refletirão melhor o que poderíamos encontrar na população: moda, média, mediana
Média Aritmética
Consiste na soma dos valores de um conjunto de
dados, divididos pelo número de elementos. Ex.: 
11 10 10 12 23 24 3
A média aritmética será = 
11 + 10 + 10 + 12 + 23 + 24 + 30 / 7 = 17,14
Mediana
A mediana é a média dos dois valores centrais. Soma os dois valores centrais e divide o resultado por 2: (a + b) / 2. Se o número de elementos for ímpar, então a mediana é o valor central. Ex.:
2, 2, 3, 7, 8, 9, 9
Mediana = 7
1, 4, 4, 5, 6, 7, 7, 7
Mediana= (5 + 6) / 2 = 5,5
Moda
É o valor que ocorre com maior frequência. Essa medida, juntamente com a média e a mediana, ajudam a compreender o padrão homogêneo dos dados. Quando essas três medidas estão próximas, podemos dizer que o conjunto de dados é homogêneo, ou seja, não há valores extremos, mas sim uma tendência de que boa parte dos números se localizem próximos a essas três medidas. Ex.: 
0 1 1 2 3 4 4 4 5
número 4 = repete 3 vezes = unimodal
0 1 1 1 3 4 4 4 5
números 1 e 4 = repetem 3 vezes cada um = bimodal
podem ser também multimodais
Medidas de Dispersão
Indicam a variabilidade dos dados, isto é, o quanto os valores divergem em relação aos valores de caracterização geral da população ou amostra.
Quartis e Percentis
Há situações em que podemos dividir o conjunto de valores em partes menores: quartis, decis e percentis indicam essa possibilidade. Sendo assim, o primeiro quartil indica que 25% dos valores estão abaixo desse valor; o segundo quartil indica que 50% da amostra está abaixo desse valor; e assim por diante.
Os percentis consideram as posições dividindo o conjunto de valores em 100 partes. Da mesma forma que o quartil, o percentil 70, por exemplo, indica que 70% dos valores de um conjunto encontram-se abaixo desse valor.
Amplitude, Mínimo e Máximo
Amplitude: é a diferença entre o maior e o menor valor de um determinado conjunto de valores. 
Menor/mínimo: é o menor valor de um determinado conjunto de valores
Maior/máximo: é o maior valor de um determinado conjunto de valores
Variância e Desvio Padrão
Duas medidas que indicam a variabilidade, distância dos valores em torno do valor médio encontrado para um determinado conjunto de dados (valores). Se menores, a variância e o desvio padrão indicam pouca variabilidade dos valores, caracterizando um conjunto de valores mais homogêneo, ou seja, de variabilidade pequena.
Coeficiente de Variação
Indica a dispersão dos valores em relação à média. Para se calcular o coeficiente de variação, usamos o desvio padrão e a média não possui unidade de medida (é adimensional). Os coeficientes são importantes na elaboração de indicadores de saúde (CV= desvio padrão / média x 100)
Probabilidade e distribuição de frequências como estimativa da probabilidade
Probabilidade aleatório
Para entender a probabilidade de um evento aleatório, precisamos definir: 
S – Espaço amostral: conjunto de todos os elementos possíveis
Evento: qualquer subconjunto de S (notação a, b, c, ...)
O (phi): conjunto vazio, representa um evento impossível
Ex.: Um pesquisador deseja saber qual a probabilidade de, ao lançar um dado, esse cair com a face 3 voltada para cima. 
Em termos de probabilidade, temos o seguinte: 
· O espaço amostral (S) é: S = {1, 2, 3, 4, 5, 6}; 
· O evento (A) CAIR FACE 3 é: A = {3}; 
P (a) = 1/6 = 0,1667 ou 16,67
Probabilidade Condicional
Probabilidade de ocorrer determinado evento quando ele depende de uma dada condição. A probabilidade de ocorrer o evento A sob a condição de ter ocorrido o evento B é representada então: P(A|B); que se lê: probabilidade de A dado B
Qual a probabilidade de, ao lançar um dado ocorrer a face 6, sabendo, antecipadamente, que a face que ocorreu é par?
Em termos de Estatísticas, a pergunta deveria ser construída assim: qual a probabilidade de ocorrer o evento A dado que ocorreu evento B?
Entendendo a fórmula... 
· Evento A: face 6, já sabemos que o dado tem somente 1 face com o número 6
· Evento B: face par, o dado possui as seguintes faces com números pares: {2; 4; 6}, ou seja, 3 faces com números pares. A intersecção entre os Eventos A e B é a quantidade de elementos que existem nos dois conjuntos: A e B.
Sabemos que: A = 1 elemento; B = 3 elementos; P (A ∩ B) = 1 elemento. Então, temos:
P (a | b) = 1/3 = 0,3333 = 33,33%
Eventos Independentes 
Dizemos que dois eventos são independentes quando a probabilidade de ocorrer um dos eventos não é modificada pela ocorrência do outro
Ex.: Um jogador joga uma moeda e um dado, e ele deseja saber qual a probabilidade de ocorrer cara na moeda sabendo que, no jogo do dado, caiu a face 5. Portanto, dizemos que o evento “Cair 5 no jogo de dados” é independente do evento “Cair cara no jogo de moeda”
Teorema do produto
Esse teorema diz que, se A e B são eventos independentes, a probabilidade de ocorrer A e B é dada pela probabilidade de ocorrer A multiplicada pela de ocorrer B.
Ex.: Qual a probabilidade de ocorrer cara jogando uma moeda duas vezes?
Veja que a probabilidade de cair cara (C) no 1° lançamento é de ½, e de cair coroa (K) no 2º Lançamento é de ½. E de cair em dois lançamentos cara (C) e cara (C), é de ¼. Então, aplicando a fórmula, temos:
P (C e C) = ½ x ½ = ¼
Teorema da soma
Quando A e B são eventos que não podem ocorrer ao mesmo tempo, a probabilidade de ocorrer A ou B é dada pela seguinte expressão: 
P (A ou B) = P (A) + P (B).
Ex.: s e uma urna possui duas bolas brancas, uma azul e uma vermelha e retiramos uma ao acaso, qual a probabilidade de sair uma colorida? 
A condição só é satisfeita se for sorteada a bola vermelha ou a azul. Veja que duas bolas, das quatro existentes, satisfazem a condição. A probabilidade de ser retirada tanto a bola azul quanto a bola vermelha é de ¼, portanto:
P (azul ou vermelha) = ¼ + ¼ = ½
Distribuição Normal ou de Gauss
As frequências obtidas da maioria das medidas biológicas e de outras situações dão origem aos gráficos com características em comum, semelhante ao apresentado abaixo. Observem que essa distribuição de frequências apresenta muitos indivíduos com valores semelhantes. No exemplo, entre 39 e 41, poucos com valores abaixo disso e poucos com valores acima. Vemos então um gráfico com formato de sino. Esse tipo de distribuição de frequências recebe o nome de distribuição normal.
Ex.: Distribuição de medidas do tórax (polegadas) de soldados escoceses
A distribuição normal tem as seguintes características: 
· A variável aleatória pode assumir qualquer valor
· O gráfico da distribuição é uma curva em forma de sino, simétrica em torno da média populacional
· A área total da curva representa uma frequência de 100% da população. A área representa a probabilidade da variável assumir qualquer valor
· Os parâmetros são: média populacional e a variância populacional
Distribuição Normal Reduzida
O cálculo de probabilidades de populações com distribuição do tipo normal é complexo para ser utilizado rotineiramente. Para facilitar esse tipo de cálculo, foi feita o tabelamento de todas as possíveis probabilidades de uma única curva normal, que recebeu o nome de Curva Normal Reduzida. 
Essa curva possui as seguintes características: 
· É uma distribuição com média 0 e variância 1
· A variável aleatória representada pela distribuição normal reduzida é a z
· Na distribuição normal reduzida, os valores de probabilidade de 0 até z estão dispostos em tabelas. 
Ex.: A probabilidade de ocorrer valores entre 0 e 1,5 corresponde à área pintada: 
Testes de hipóteses
Introdução – Amostragens
Na pesquisa biomédica, necessitamos tomar conclusões com base em amostragens, já que é impossível analisar populações inteiras para que possamos saber o real efeito daquilo que desejamos estudar. Vários tipos de experimentos são feitos com o intuito de tentar entender o que aconteceria de fato na população estudada
Um estudo estatístico normalmente está baseado em amostragens. Isso se dá pela dificuldade operacional ou financeira de ter acesso a toda uma população
Ex.: Uma empresa farmacêutica resolve testar a toxicidade de um determinado fármaco. Cães serão utilizados como animais de laboratório para os testes antes do lançamento. Como fazer para obter uma resposta confiável
sobre a toxicidade, para que o responsável técnico tenha confiança em lançar essa droga no mercado?
Sugestões:
· Testar a droga em todos os cães do planeta
· Testar a droga em um grupo de cães (amostra)
A 1° sugestão parece absurda, tanto pela impossibilidade de operá-la quanto pelo altíssimo custo. Portanto, opta-se pela 2°, o que gera uma quantidade enorme de outras questões:
Todos os cães vão reagir da mesma forma? 
R.: SIM: testo em um ou dois animais → fim do experimento
R.: NÃO
a) Quantos animais devem ser testados? 
b) Os dois sexos respondem da mesma maneira? 
c) As diversas raças respondem da mesma maneira? d) As condições ambientais influenciam?
Resolvida as questões e desenhado um grupo experimental representativo, surgem outras questões sobre os possíveis resultados:
· O fármaco não é tóxico para os cães
· O fármaco é tóxico para TODOS os cães
· O fármaco é tóxico para alguns cães.
O pesquisador fica em outra situação complicada. Os itens a) e b) são conclusivos e encerram o experimento, mas e o item c)? Ele abre para mais questões: 
· Posso colocar à venda o fármaco se ele for tóxico para alguns indivíduos? 
Não: Encerra-se o experimento
SIM: mais dúvidas: 
a) Qual a proporção de indivíduos intoxicados para que ainda se possa considerar seguro para a venda? 
Para responder a todas essas questões, são necessários conhecimentos de: 
· Técnicas de amostragem
· Medidas de tendência central
· Medidas de dispersão
· Probabilidade
· Distribuição Normal
· Distribuição Binomial. 
O teste de hipótese é uma regra de decisão, na qual se leva em conta uma série de interferências, com uma chance calculada de errar. 
Definindo alguns termos: 
· Inferência estatística: qualquer procedimento utilizado para generalizar afirmações sobre determinada população, baseadas em dados retirados de uma amostra
· Parâmetro: a medida usada para descrever uma característica de uma população
· Estimação: processo por meio do qual estima-se o valor de um parâmetro de uma população com base no valor obtido em uma amostra
· Hipótese: uma forma de especulação relativa a um fenômeno estudado (qualquer que seja). É qualquer afirmação sobre a distribuição de probabilidade de uma variável aleatória (afirmação sobre um parâmetro)
· Hipótese estatística: é uma especulação feita em relação a uma proposição, porém relativa a uma população definida.
Alguns Testes de Hipótese Utilizados Rotineiramente na Pesquisa Biomédica
Testes Paramétricos
Aqueles que exigem que determinados parâmetros estejam presentes para que o seu resultado tenha valor. Se deve se preocupar mais com a indicação do teste e a interpretação dos resultados do que propriamente com a maneira de proceder com os cálculos
Testes Não Paramétricos
Aqueles nos quais determinados parâmetros, como a normalidade, não estão presentes para que o seu resultado tenha valor. Se deve se preocupar mais com a indicação do teste e a interpretação dos resultados do que propriamente com a maneira de proceder com os cálculos
Softwares de estatística
Existem vários softwares livres e pagos que fazem os testes de hipótese. Para utilizá-los, é necessário um forte embasamento teórico para que o resultado seja fidedigno. Alguns:
· InStat GraphPad 
· PAST
· EPINFO.
Bioestatísticas aplicada
Utilização da Informática na Bioestatística – Raciocínio lógico
Na verdade, a matemática e o raciocínio lógico estão presentes em quase tudo o que fazemos na área acadêmica. A tomada de decisão em adotar o tratamento X ou Y dependerá dos resultados obtidos em estudos anteriores, estudos esses que foram embasados em análises estatísticas.
Mas, para facilitar a vida de todos, saibam que a informática muito pode contribuir. Atualmente, como já foi dito no módulo anterior, temos à disposição vários softwares que ajudam nos cálculos estatísticos. O Excel é um programa presente em boa parte dos computadores e possui essa ferramenta. Podemos fazer o cálculo da média usando esse programa
Avaliação Crítica de Artigos Científicos
Um dos objetivos principais da bioestatística é o de contribuir para o melhor entendimento dos dados estatísticos relatados em publicações científicas. A assertividade sobre aquilo que é demonstrado na tabela ou na figura dependerá do contexto em que eles são apresentados e da análise crítica dos resultados numéricos.
A análise estatística descritiva é muito utilizada e, quando envolve tamanhos amostrais grandes ou uma determinada população, essa análise é capaz de permitir extrapolações dos resultados encontrados.
A análise analítica – que usa os testes de comparação de médias, que considera o nível de significância, que calcula o valor de p, etc. – viabiliza as tomadas de decisão para considerar um fator de risco que acomete um determinado grupo, para evidenciar o efeito de um tratamento, para visualizar o resultado futuro de uma campanha de prevenção, etc.
É essa uma das grandes importâncias da estatística: buscar ser conclusiva para a amostra, diminuindo as chances de que os resultados encontrados tenham sido ocorrências do acaso, da sorte. Dessa forma, fica claro que a compreensão de cada um dos testes é fundamental para melhor compreensão dos dados apresentados em tabelas ou figuras. Tanto para testes que utilizam dados quantitativos, como qualitativos, ou ambos, a regra é sempre a mesma.
Testes Estatísticos
Existem testes para serem aplicados em amostras e/ou populações. Esses testes também permitem identificar a relação entre duas ou mais variáveis
A Adequação da Amostra
Ponto que merece a nossa atenção durante uma análise crítica é o tamanho da amostra e a forma de amostragem. Esses aspectos determinarão quanto podemos confiar nas informações obtidas, bem como no poder de extrapolação dos resultados.
Teste de correlação de Pearson
Permite determinar o grau de correlação existente entre duas variáveis quantitativas. Seu valor pode variar de 0,0 a 1,0, sendo que, quanto maior o valor, melhor a correlação. O valor de correlação, comumente representado pela letra “r”, vem acompanhado de um sinal positivo (+) ou negativo (-) que indica se a correlação é diretamente proporcional (+) ou inversamente proporcional (-)
Variáveis
Variável PREDITORA, EXPLICATIVA OU INDEPENDENTE: permite predizer uma resposta. 
Ex.: Fumo e risco de doença coronariana. A variável resposta é FUMO. 
Variável RESPOSTA OU DEPENDENTE: aponta o evento que se pretende estudar.
Ex.: PREVALÊNCIA DE OBESIDADE. 
Variável de CONTROLE ou de CONFUSÃO: usada para avaliar a repercussão ou influência negativa de um evento/situação sobre os resultados. 
Ex.: A influência da escolaridade na estimativa de renda de um adulto.
A Tabela de Contingência
Esse tipo de tabela não necessita estar acompanhada do resultado de um teste estatístico analítico. A simples apresentação dessa tabela, mostrando a relação de duas ou mais variáveis, será bem explicativa se comparada à apresentação em separado que essas mesmas variáveis poderiam ter
Vale destacar que as tabelas de contingência não têm por finalidade determinar causa e consequência; essas tabelas mostram a relação, mas pode acontecer de a natureza e o aspecto observados em determinada variável darem a noção de causa e consequência

Teste o Premium para desbloquear

Aproveite todos os benefícios por 3 dias sem pagar! 😉
Já tem cadastro?

Continue navegando