Baixe o app para aproveitar ainda mais
Prévia do material em texto
MEP II - APG 1 Objetivo 1 - Compreender a Bioestatística e medidas de Tendência Central A estatística é uma ciência que usa a análise dos dados para testar as hipóteses estatísticas, verificar a força da evidência clínica e, assim, se existem associações entre grupos ou a veracidade de fenômenos de interesse voltados para a prática clínica e biológica. O pesquisador deve formular hipóteses, observar os fenômenos biológicos que ocorrem na população e retirar dessa população uma amostra para testar suas hipóteses 1.1 Símbolos Matemáticos - Para representar uma amostra com n unidades, escreve-se X₁, X₂, X₃, …, Xn Sendo n o número de observações - Não necessariamente segue uma ordem, o primeiro da amostra. Qualquer que for a amostra, os valores X₁, X₂ ou X₃ estarão na ordem em que foram coletados. Os pontos significam "e assim por diante" O símbolo 𝚺 que indica o somatório, é a letra grega sigma maiúscula. O subscrito i = 1, indica que o índice i deve ser substituído por números inteiros em ordem crescente sucessivamente, começando por 1 e terminando em n : 1.2 Média da Amostra - É a medida de tendência central mais conhecida e mais utilizada - Cálculo : Soma do conjunto de todos os dados dividido pelo número de dados - A média, que se indica média por (lê-se: x-traço ou x-barra) - A fórmula da soma é dada por : Somatório de x, dividido por n. Sendo n o tamanho da amostra e x a soma de todos os dados da amostra - Exemplo: - A média indica o centro de gravidade do conjunto de dados - Quando a amostra é grande e os dados são discretos, podem ocorrer valores repetidos, é razoável organizar os dados em uma tabela de distribuição de freqüências, como no exemplo : - Faz-se a tabela da distribuição de frequência e depois calcula-se a média : - Em certos casos - principalmente quando a variável é contínua e a amostra é grande - são apresentadas apenas as tabelas de distribuição de frequências - os dados brutos não são fornecidos 1.3 Mediana da Amostra - É o valor que ocupa a posição central do conjunto dos dados ordenados - Divide a amostra em duas partes: uma com números menores ou iguais à mediana, outra com números maiores ou iguais à mediana - Quando o número de dados é ímpar, existe um único valor na posição central. Exemplo : (3,5,9) - O elemento 5 é a mediana - Quando o número de dados é par, existem dois valores na posição central. A mediana é a média desses dois valores. Exemplo: (3,5,9,11) - A mediana é dada por 5+9/2 = 7 - Em algumas circunstâncias a mediana mais bem descreve a tendência central dos dados. É o caso dos conjuntos com dados discrepantes, isto é, dados de conjuntos que têm um ou alguns valores bem maiores ou bem menores que os demais - Exemplos práticos - Existem casos, porém, em que o uso da média é mais razoável do que a mediana, mesmo que haja um valor discrepante: Considere que você jogou três vezes na loteria e ganhou: 1. R$ 0,00; na primeira vez 2. R$ 0,00; na segunda vez 3. R$1.000.000,00 na terceira vez A mediana é zero, mas a média é 1/3 do valor de 1000000 1.4 Moda da Amostra - É o valor que ocorre com maior freqüência - Um conjunto de dados pode não ter moda porque nenhum valor se repete maior número de vezes, ou ter duas ou mais modas. - Exemplo: 1. O conjunto de dados ( 2,. 4, 6, 8, 10 ) não tem moda 2. O conjunto (1, 2, 2, 3, 4, 4, 5, 6, 7 )tem duas modas: 2 e 4. - Quando uma tabela de distribuição de frequências apresenta grande quantidade de dados, é importante destacar a classe de maior frequência, a chamada classe modal. Essa classe mostra a área em que os dados estão concentrados - Exemplos práticos - Nesse caso a moda está na idade entre 10 a 19 anos - A moda também pode ser usada para descrever dados qualitativos. Nesse caso, a moda é a categoria que ocorre com maior freqüência: - A moda é bastante informativa quando o conjunto de dados é grande. Se o conjunto de dados for relativamente pequeno (menos de 30 observações), você pode até obter a moda, mas, na maioria das vezes, ela não terá qualquer sentido prático. A média e a mediana fornecem, nesses casos, melhor descrição da tendência central dos dados 1.5 Importância das medidas de tendência central para a produção científica - As medidas de tendência central resumem a informação contida em um conjunto de dados, mas não contam toda a história. Por exemplo, é fato de observação diária que, na mesma cidade, a temperatura varia ao longo do dia. Ainda, no mesmo dia, registram-se temperaturas muito diferentes em diferentes lugares do mundo. - Por causa da variabilidade, a média, a mediana e a moda não bastam para descrever um conjunto de dados: elas informam a tendência central, mas nada dizem sobre a variabilidade - As medidas de tendência central são mais descritivas de um conjunto de dados quanto menor for a variabilidade Objetivo 2 -Compreender o conceito e como é feita a mensuração de variabilidade (medidas de dispersão) (Introdução à Bioestatística, 4 ed - Sônia Vieira - CAPÍTULO 5) (Introdução á Bioestatística - Ulysses Doria Filho - PÁGINA 22 ) 2.1 Mínimo, Máximo e Amplitude - Para medir variabilidade é necessário os valores mínimo e máximo do conjunto de dados e calcular a amplitude usando a fórmula: amplitude = máximo - mínimo 1. O mínimo de um conjunto de dados é o número de menor valor 2. O máximo de um conjunto de dados é o número de maior valor 3. A amplitude de um conjunto de dados, definida como a diferença entre o máximo e o mínimo, é uma medida de dispersão ou variabilidade - Alguns autores fornecem os valores mínimos e máximos para descrever seus dados e não fornecem a amplitude - Isto está certo, porque esses valores são, muitas vezes, mais úteis. Por exemplo, se alguém informar que os policiais que estão na ativa em certa corporação têm idades entre 18 e 52 anos, estará fornecendo informação mais útil do que se disser que a amplitude das idades é 34 anos - Essa medida não mede bem a variabilidade por uma razão simples: para calculá-la, usam-se apenas os dois valores extremos 2.2 Conceito de Quartil - Os quartis dividem um conjunto de dados em quatro partes iguais. Os quartis são, portanto, três: o primeiro quartil, o segundo quartil (que é a mediana) e o terceiro quartil - Para calcular, faça: 1. Organize os dados em ordem crescente. Ache a mediana (que é, também, o segundo quartil); marque esse valor 2. Ache o primeiro quartil, da seguinte forma: tome o conjunto de dados à esquerda da mediana; o primeiro quartil é a mediana do novo conjunto de dados 3. Ache o terceiro quartil, da seguinte forma: tome o conjunto de dados à direita dessa mediana; o terceiro quartil é a mediana do novo conjunto de dados - Distância interquartílica também é uma medida de dispersão e pode ser entendida como a distância entre o primeiro e o terceiro quartil Distância interquartílica = Terceiro quartil - Primeiro quartil Diagrama de Caixa - Box Plot - Serve para detalhar graficamente todos os dados expostos acima - Para desenhar o diagrama, são necessárias cinco medidas: mínimo, primeiro quartil, mediana, terceiro quartil, máximo: 1. Desenhe um segmento de reta em posição vertical, para representar a amplitude dos dados 2. Marque, nesse segmento, o primeiro, o segundo e o terceiro quartis. 3. Desenhe um retângulo (box) de maneira que o lado superior e o lado inferior passem exatamente sobre os pontos que marcam o primeiro e o terceiro quartis 4. Faça um ponto para representar a mediana (obedecendo a escala) Objetivo 3- Entender Desvio Padrão ( Introdução à Bioestatística, 4 ed - Sônia Vieira - CAPÍTULO 5) (Introdução á Bioestatística - Ulysses Doria Filho - PÁGINA 22 ) 3.1 Variância Conceito - Quando a média é usada como medida de tendência central, ou seja, quando a média indica o centro, podemos calcular o desvio de cada observação em relação à média e para calcular esse desvio padrão é necessário calcular a variância - Variabilidade é pequena: Quando os desviossão pequenos - Variabilidade é grande : Quando os desvios são grandes Cálculo e fórmula da variância - O cálculo da variância envolve quadrados de desvios - É a soma dos quadrados dos desvios de cada observação em relação à média, dividida por (n - 1) OU 1. Calcule os desvios, de cada observação em relação à média; 2. Eleve cada desvio ao quadrado; 3. Some os quadrados; 4. Divida o resultado por n-1 (n é o número de observações) 3.2 Desvio Padrão Definição : - É uma medida de variabilidade muito recomendada porque mede bem a dispersão dos dados e permite, por conta disso, interpretação de interesse Cálculo e Fórmula : - Desvio padrão é a raiz quadrada da variância, com sinal positivo Exemplos 3.3 Coeficiente de Variação - O coeficiente de variação é a razão entre o desvio padrão e a média. O resultado é multiplicado por 100, para que o coeficiente de variação seja dado em porcentagem - Um coeficiente de variação alto indica que a dispersão dos dados em relação à média é muito grande, ou seja, a dispersão relativa é alta. Um coeficiente de variação de baixo indica que a dispersão dos dados em relação à média é pequena - Coeficiente de variação pode ser expresso em porcentagem porque é adimensional, isto é, não tem unidade de medida 3.4 Importância do desvio padrão para a produção científica - Estima o grau em que o valor de determinada variável se desvia da média
Compartilhar