Baixe o app para aproveitar ainda mais
Prévia do material em texto
Medidas de Tendência Central e Medidas de Dispersão Símbolos matemáticos Para apresentar os valores numéricos de n unidades, escrevemos → x1, x2, x3, ..., xi O subscrito i indica a posição da medida, portanto xi, é a i-ésima observação. A soma dos valores pode ser escrita: x1 + x2 + x3 + ... + xn ou pela, fórmula da soma: ∑ 1𝑥𝑖 𝑛 𝑖 Medidas de Tendência Central Para entender as características gerais de um conjunto de dados, muitas pessoas preferem olhar uma figura. Daí a importância dos métodos gráficos. No caso das variáveis quantitativas ou numéricas – mais usadas na pesquisa cientifica, por serem mais exatas – os gráficos são, porém, menos informativos, porque, para desenhar um histograma ou um polígono de frequências para uma grande quantidade de dados, é preciso agrupar valores exatos em classes. Mas já foram propostas, há muito tempo, medidas estatísticas que sumarizam as informações contidas em um grande conjunto de dados. Essas medidas apontam características específicas do conjunto de dados e permitem, a quem conhece suas propriedades e limitações, uma visão geral do comportamento dos dados. ● Média aritmética Consiste simplesmente na média do conjunto de dados, que é obtida somando-se todos os dados e dividindo-se o resultado da soma pelo número deles. Ex. Estudo avaliou a associação entre idade e hipertensão CND WJI ILJH GUN BUR JIO STUI AHN JOW DOU FILE BIL 50 40 30 70 80 70 70 20 40 40 50 70 Qual a média? → Soma-se todos os valores obtidos e divide pela quantidade de números (N = número de participantes do estudo), assim será possível obter a média. 630/12 = 52,5 anos → Não se esquecer da unidade medida ● Mediana A Mediana é o valor que ocupa a posição central do conjunto dos dados ordenados. A mediana divide a amostra em duas partes: uma com números menores ou iguais à mediana e outra com números maiores ou iguais à mediana. Quando o número de dados é ímpar, existe um único valor na posição central. Esse valor é a mediana. Quando o número de dados, é par, existem dois valores na posição central. A mediana é a média desses dois valores. Ex1. Um asilo teve 11 casos de fraturas no ano passado. Foi aferido o peso de cada idoso (Kg). Medidas de Tendência Central ● Média ● Mediana ● Moda Medidas de Dispersão ● Mín., Máx. e Amplitude ● Desvio ● Variância ● Desvio Padrão ● Distância Interquartílica → 70 80 72 77 79 85 76 125 82 60 85 → Mediana é o valor central dos dados organizados em ordem crescente = 79 Kg → Caso o número de dados for par, a mediana é a média dos dois termos centrais Ex2. Renda familiar mensal de pacientes que tiveram febre amarela (Reais): 500 1000 800 1100 700 2000 900 1500 10000000 Ordenado: 500 700 800 900 1000 1100 1500 2000 10.000.000 Média: 1.112.055,56 reais/mês → Esta média realmente representa esta população??? Não!!!!! A mediana representa os dados da melhor forma… Mediana: 1000 reais/mês Neste estudo, a mediana representa melhor o grupo estudado. ● Moda É o valor que ocorre com maior frequência. Um conjunto de dados pode não ter moda ou ter duas ou mais modas. A moda é a única medida de tendência central que também pode ser usada para descrever dados qualitativos. Nesse caso, a moda é a categoria da variável que ocorre com maior frequência. Ex. Um grupo de alunos elaborou um questionário para o trabalho de conclusão da disciplina de bioestatística. Uma das questões era a seguinte: Você sente dor de cabeça com qual frequência? 1. Menos de 1 vez por mês 1. Mais de vez por mês e menos de 1 vez por semana 1. Mais de 1 vez por semana mais não diariamente 2. Diariamente Percentual de respostas: A) 35%, B) 28%, C) 22% e D) 15% A moda é o dado que aparece com maior frequência, ou seja, a LETRA A!!! → Pode ter duas modas. Medidas de Dispersão As medidas de tendência central resumem a informação contida em um conjunto de dados, mas não contam toda a história. Por causa da variabilidade, a média, a mediana e a moda, não são suficientes para descrever um conjunto de dados: apenas informam a tendência central, ou seja, onde está o centro, mas nada dizem sobre a variabilidade. Ad medidas de tendência central são tanto mais descritivas de um conjunto de dados quanto menor é a variabilidade. Então, quando você apresentar um conjunto de dados, deve fornecer não apenas as medidas de tendência central, mas também uma medida de variabilidade ou dispersão. Mín., Máx. e Amplitude Mínimo: de um conjunto é valor menor. A mediana apresenta alguma vantagem sobre a média? → De acordo com a normalidade, escolhe-se as medidas de tendência central e dispersão → A mediana é usada quando se tem um "outlier" (valor aberrante) Ex.: Renda familiar mensal de várias famílias de classe média e no meio um magnata. Se fosse calculada a média, o valor seria inflacionado. Por isso, usa-se mediana. ● Para dados numéricos próximos, usa-se a média. Máximo: de um conjunto é o valor maior Amplitude: diferença entre o menor e o maior valor Ex. Idade (anos) da primeira internação de pacientes asmáticos: 1 3 4 5 7 9 11 Desvio Padrão o Medida de Tendência Central: Média o Medida de Dispersão correspondente a média (Medida de Tendência Central): Desvio Padrão Ex. Quantas vezes as crianças asmáticas deste município foram internadas na UTI? Nº de internações Média Desvio 3 4,4 -1,4 4 4,4 -0,4 7 4,4 +2,6 2 4,4 -2,4 6 4,4 +1,6 ⤷ Total desvio = 0 É necessário fazer a média, ou seja, somar os valores (nº de internações) e dividir por 5 para encontrar a média. Depois faz-se a subtração de todos números de internação pela média de cada, encontrando, assim o desvio de cada média, e consequentemente a soma de todos os DESVIOS, que deve sempre dar 0, para garantir que o valor esteja correto. Quadrado do desvio É necessário em seguida, elevar o DESVIO ao quadrado para retirar o sinal negativo. Variância Depois, faz-se a soma de todos os quadrados do DESVIO, que deu 17,2 e divide-se por N - 1, sendo este o valor chamado, VARIÂNCIA. Resultando em 4,3 Desvio Padrão O desvio padrão consiste na raiz quadrada do valor encontrado na variância, ou seja, raiz quadrada de 4,3 = 2,07 Qual a utilidade do desvio padrão?? → Serve para mostrar o quão distante está o valor da média. Quanto maior o valor do Dp, maior é a dispersão dos dados da pesquisa (mais diferentes entre si). Valores de Dp mais próximos de 0, estão mais próximos da média. Mínimo: 1 ano Máximo: 11 anos Amplitude: 10 anos ○ Subtrai o menor valor do maior valor Desvio >>>>>Variância >>>>> Desvio Padrão Usamos o Dp quando foi calculada a média. → Quanto menor o desvio, mais próximos os valores estão da média. Quartil Divide um conjunto de dados em 4 partes iguais. o 1° quartil, 2° quartil e 3° quartil. o 3 valores e 4 bloco de dados o 2° quartil = mediana Obs.: Para se descobrir o quartil, primeiro acha-se a Mediana Aonde faz-se o corte é que se considera como quartil o Quando o conjunto de números é ímpar, considera-se a mediana para descobrir o 1º e o 3º quartil o Quando o conjunto de números é par, não é necessário também considerar a mediana para achar os demais quartis Ex. Doses de vacina contra poliomielite recebidas: 1 3 3 4 5 7 7 7 9 É necessário ordenar os valores!!! ** 2º quartil = mediana = 5 ** 1º quartil = 3 ** 3º quartil = 7 ** Distância quartílica = Faz-se a subtração: 7 – 3 = 5 Distância interquartílica = 3° quartil – 1º quartil
Compartilhar