Baixe o app para aproveitar ainda mais
Prévia do material em texto
Modulo 1 Bioestatística é definida como a aplicação de princípios de estatística nas áreas de: Medicina, Saúde publica ou Biologia Os princípios da estatística são baseados na: E incluem ferramentas e técnicas para coletar informações ou dados e, posteriormente, resumir, analisar e interpretar esses resultados. Esses princípios se estendem para que sejam feitas inferências e tiradas conclusões de forma adequada, levando em consideração a incerteza. aplicada o objetivo é fazer uma inferência sobre uma população especifica. é o conjunto de todos os indivíduos sobre os quais gostaríamos de fazer afirmação. estatística para fazer uma afirmativa da proporção desejada. subconjuntos da população de interesse. Quais são os problemas? A condução e interpretação apropriadas das aplicações da bioestatística requerem atenção a uma série de questões importantes. Elas incluem, mas não se limitam às seguintes: Definir claramente o objetivo ou a pergunta da pesquisa. Escolher um projeto de estudo adequado (por exemplo, a forma como os dados serão coletados). Selecionar uma amostra representativa e garantir que ela seja do tamanho adequado. Coletar e analisar cuidadosamente os dados Produzir medidas ou estatísticas resumidas adequadas. Gerar medidas de efeito ou associação adequadas. Quantificar a incerteza. Explicar adequadamente as relações entre as características. Limitar as inferências à população apropriada. Antes de serem realizadas analises bioestatística, devemos definir, explicitamente, a população de interesse. A população é o conjunto de todos os indivíduos sobre os quais queremos fazer generalizações. Na maioria das vezes a população é tão grande que é impraticável estuda-la toda. Em vez disso, selecionamos uma amostra (subconjunto) da população e fazemos inferências sobre a população com base nos resultados de uma analise da amostra. Técnicas para resumir os dados coletados em uma amostra às vezes chamada variáveis são classificadas em um dos seguintes tipos: Dicotômicas; Ordinais; Categóricas; Continuas. têm apenas duas respostas possíveis. As opções de resposta são geralmente codificadas como: têm mais de duas respostas possíveis, mas as opções de resposta são ordenadas e não ordenadas, respectivamente. Ordinais: respostas são ordenadas Categóricas: respostas não são ordenadas Os componentes básicos da bioestatística Matemática aplicada Os indivíduos são selecionados aleatoriamente na população para amostra. SIM NÃO Ou (variável quantitativa ou medição) assume um numero ilimitado de respostas entre valores mínimos e máximos. são medidas numéricas calculadas nas amostras. medidas resumidas calculadas sobre as populações. As variáveis dicotômicas assumem uma de apenas duas respostas. O sexo é um exemplo de uma variável dicotômica, com as opções de resposta “masculino” ou “feminino”, assim como é o status atual de tabagismo e diabetes, com as opções de resposta “sim” ou “não”. As respostas para cada uma dessas variáveis são: Estatística descritiva para variáveis dicotômicas As variáveis dicotômicas são frequentemente usadas para classificar os participantes como possuidores ou não de uma característica especifica, tendo ou não um atributo especifico. Gráficos de barras para variáveis dicotômicas A exibição gráfica adequada depende do tipo de variável que esta sendo analisada. Variáveis dicotômicas são mais bem resumidas usando gráficos de barra. As opções de resposta (sim/não, presente/ausente) são mostradas no eixo horizontal, e as frequências ou frequências relativas são plotadas no eixo vertical, produzindo um gráfico de barras de frequência ou um gráfico de barra de frequência relativa, respectivamente. SIM NÃO As variáveis dicotômicas costumam ser resumidas em tabelas de distribuição de frequência. 1625/3539= 0,459 X 100= 45,9% total da amostra para sexo masculino. As frequências relativas podem, em teoria, ir de 0% a 100%, não é necessário sempre dimensionar os eixos de 0% a 100%. Histogramas para variáveis ordinais Os histogramas são exibições gráficas apropriadas para variáveis ordinais. Um histograma difere de um gráfico de barras em uma característica importante. O eixo horizontal de um histograma mostra as opções de resposta ordenadas distintas da variável ordinal. O eixo vertical pode mostrar frequências ou frequências relativas, produzindo um histograma de frequência ou um histograma de frequência relativa, respectivamente. As barras são centradas sobre cada opção de resposta e dimensionadas de acordo com as frequências ou frequências relativas, conforme desejado. A diferença entre um histograma e um gráfico de barras é que as barras em um histograma ficam juntas, não há espaço entre respostas adjacentes. Variável continua às vezes chamada de variável de medição ou quantitativas, assumem um numero ilimitado de respostas distintas entre um valor mínimo e máximo teóricos. HORIZONTAL (Tipos de respostas) V ER TI C A L (f re q u ên ci a) Categorias de pressão arterial ordenada Fr eq u ên ci as o u n u m er o d e p ar ti ci p an te s O histograma transmite a mensagem de que a maioria dos participantes esta nas duas categorias inferiores (mais saudáveis) da distribuição. Estatística descritiva para variáveis continuas Media: o valor “médio”: conjunto de dados numéricos obtido somando os valores de todos os dados e dividindo a soma pelo número de dados. Mediana: o valor “do meio”: ponto central da distribuição, que é obtido após todas as observações serem colocadas em ordem crescente (ou decrescente), de acordo com o seu valor. Moda: o valor “mais comum”: indica o valor que aparece com maior frequência na amostra. Media Na bioestatística, o termo "média" é um termo muito geral. Existem várias estatísticas que descrevem o valor médio de uma variável contínua. O primeiro provavelmente é o mais familiar-a média da amostra. A média da amostra é calculada pela soma de todos os valores e da divisão pelo tamanho da amostra. A média da amostra das pressões arteriais diastólicas é calculada da seguinte forma: MÉDIA= Mediana A mediana da amostra é o valor do meio do conjunto de dados ordenados, ou o valor que separa os: A mediana é definida como a média dos dois valores do meio no conjunto de dados ordenados. 62+63+64+67+70+72+76+77+81+81 Na amostra de n= 10 pressões arteriais diastólicas, os dois valores médios são 70 e 72 e, portanto, a mediana é: Moda Moda é definida como valor mais frequente (o numero repetitivo). 62+63+64+67+70+72+76+77+81+81 Amplitude da amostra Em cada coluna da tabela 4-13 possui um numero mínimo e numero máximo. O calculo da amplitude se da por: Media Mediana Moda Amostra (população) aqui é n=10 62+63+64+67+70+72+76+77+81+81 10 713 10 = = 71,3 Soma de todos os numero Amostra, quantidade a ser dividida Media indicada 713 10 71,3 50% superiores dos valores 50% inferiores. (70 + 72) /2 = 71 Mediana de cada coluna da tabela 4-13 Valor repetido é 81 Valor mínimo – valor máximo Desvio padrão da media Se todos os valores observados em uma amostra estiverem próximos da sua media, o desvio padrão é pequeno (ou seja, próximo a zero), e se os valores observados variarem amplamente em relação a media da amostra, o desvio padrão é grande.Se todos os valores na amostra forem idênticos, o desvio padrão da amostra é zero. - = Amplitude seria então 62-81= 19 (𝐗−𝐗 ̅) Seria o numero da tabela Valor da média 76- 71,3= 4,7 (𝐗−𝐗 ̅) 𝟐 Desvio da média elevado ao quadrado 4,7 (4,7 X 4,7) = 22,09 2 A variância da amostra Soma-se tudo 472,10 10-1 472,10 9 =52,46 = Desvio padrão da amostra 𝑠=√52,46=7,2 Estatística chamada amplitude interquartil (AIQ). A amplitude interquartil é a diferença entre o primeiro e o terceiro quartil. O primeiro quartil indicado como Q1, é o valor no conjunto de dados que tem 25% dos valores abaixo dele. O terceiro quartil indicado como Q3, é o valor no conjunto de dados que tem 25% dos valores acima dele. A AIQ é definida como: AIQ = Q3− Q1 77-64=13 AQ Quando o tamanho da amostra for 9, a mediana é o número do meio, 72. Os quartis são determinados da mesma maneira, observando as metades inferior e superior, respectivamente. Existem quatro valores na metade inferior, assim, o primeiro quartil é a média dos dois valores do meio da metade inferior, (64 + 67) / 2 = 65,5. A mesma abordagem é usada na metade superior para determinar o terceiro quartil, (77 + 81) / 2 = 79. Alguns pacotes de cálculo estatístico usam algoritmos ligeiramente diferentes para calcular os quartis. Os resultados podem ser diferentes, principalmente para amostras pequenas. Os valores atípicos são os valores abaixo de Q1− 1,5 × (Q3− Q1)ou acima de Q3+ 1,5 × (Q3− Q1). Diagramas de caixa para variáveis continua Os diagramas de caixa são uteis para exibir a distribuição de uma variável continua. Máximo Q3 Mediana Q1 Mínimo O modelo de distribuição normal é um modelo de distribuição de probabilidade importante que é adequado quando uma experiência ou processo específicos apresentam um resultado contínuo. Existem muitos modelos de probabilidade diferentes para resultados contínuos e o modelo adequado depende da distribuição do resultado de interesse. O modelo de probabilidade normal se aplica quando a distribuição do resultado contínuo segue o que chamamos de distribuição gaussiana, ou é bem descrita por uma curva em forma de sino. O eixo vertical reflete a probabilidade de se observar cada valor. Note que a curva é mais alta no meio, sugerindo que os valores médios têm maiores probabilidades ou tendem mais a ocorrer. A curva cai acima e abaixo do meio, sugerindo que os valores nas duas extremidades são muito menos prováveis de ocorrer. Variáveis ordinais e variáveis categóricas possuem um número fixo de opções de resposta, as quais podem ser ordenadas ou não, respectivamente. Variáveis categóricas e ordinais geralmente têm mais de duas opções de resposta, enquanto variáveis dicotômicas possuem somente duas opções de resposta. Estatísticas resumidas para variáveis categóricas e ordinais enfocam principalmente frequências relativas (ou porcentagens) ou respostas obtidas para cada categoria. Estatística descritiva para variáveis ordinais e categóricas , muitas vezes duas colunas são adicionadas à tabela de distribuição de frequência: Frequência acumulada Frequência relativa acumulada 3533 - 100% 1206 - X% 3533x = 1206 x100 3533x= 120.600 X= 34,1% são aquelas com duas ou mais respostas distintas, sendo que estas não são ordenadas. Alguns exemplos de variáveis categóricas mensuradas são: Estado civil, Mão dominante E tabagismo. Frequência Frequência relativa
Compartilhar