Prévia do material em texto
Mário Ferreira Neto Professor Especialista em Matemática e Estatística – UFLA/MG ESTATÍSTICA DESCRITIVA EQUAÇÕES E FÓRMULAS ALGÉBRICAS DAS MEDIDAS DE TENDÊNCIA CENTRAL E DE DISPERSÃO 1- ELEMENTOS DA DISTRIBUIÇÃO DE FREQUENCIA 1.1- Frequência absoluta ou simples nfi → Somatório if → Frequência absoluta ou simples n → Quantidade de frequência da amostra ou tamanho da amostra 1.2- Frequência acumulada simples kk ffffF ...321 kF → Frequência acumulada simples 1f → Frequência na primeira ordem 2f → Frequência na segunda ordem kf → Frequência na última ordem 1.3- Frequência relativa i i ri f f f rif → Frequência relativa if → Frequência absoluta ou simples → Somatório Mário Ferreira Neto Professor Especialista em Matemática e Estatística – UFLA/MG 1.4- Frequência acumulada relativa i i ri f F F riF → Frequência acumulada relativa if → Frequência acumulada → Somatório 1.5- Frequência relativa (percentual) 100.% i i ri f f f rif → Frequência relativa em porcentagem if → Frequência absoluta ou simples → Somatório 1.6- Frequência acumulada relativa 100.% i i ri F F F riF → Frequência acumulada relativa em porcentagem if → Frequência acumulada → Somatório 2- AMOSTRA 2.1- Dados brutos (não agrupados) ou dados em rol Mário Ferreira Neto Professor Especialista em Matemática e Estatística – UFLA/MG 2.1.1- Número de classes (K) K = 5 se n ≤ 25 nK se n > 25 ou K = 1 + 3,32 log(n) → Regra de Sturges K → Número de classes n → Quantidade de frequência da amostra ou tamanho da amostra 2.1.2- Amplitude de classe K MenorMaior h h → Amplitude da classe Maior → Maior número do rol ou da série Menor → Menor número do rol ou da série K → Número de classes 2.1.3- Média aritmética simples n x x i x → Média aritmética ix → Valor genérico da observação ou da frequência (rol ou série) n → Quantidade de frequência da amostra ou tamanho da amostra 2.1.4- Média geométrica simples n ng xxxxx ..... 321 gx → Média geométrica 1x → Valor dado qualquer do rol ou da série (primeiro) 2x → Valor dado qualquer do rol ou da série (segundo) nx → Valor dado qualquer (último valor do rol ou da série) n → Quantidade de frequência da amostra ou tamanho da amostra Mário Ferreira Neto Professor Especialista em Matemática e Estatística – UFLA/MG 2.1.5- Média harmônica simples n h xxx n x 1 ... 11 21 hx → Média harmônica 1x → Valor dado qualquer do rol ou da série (primeiro) 2x → Valor dado qualquer do rol ou da série (segundo) nx → Valor dado qualquer (último valor do rol ou da série) n → Quantidade de frequência da amostra ou tamanho da amostra 2.1.6- Média ponderada simples 1 . c xc x ii p px → Média ponderada ix → Valor genérico da observação ou da frequência (rol ou série) ic → Valor do peso da variável 2.1.7- Desvio em relação à média xxd ii id → Desvio ix → Valor genérico da observação ou frequência x → Média aritmética 2.1.8- Desvio médio simples n xx DM i Mário Ferreira Neto Professor Especialista em Matemática e Estatística – UFLA/MG DM → Desvio médio ix → Valor genérico da observação ou frequência x → Média aritmética n → Quantidade de frequência da amostra ou tamanho da amostra → Somatório 2.1.9- Mediana 2 1 n M d Quando for ímpar (A mediana divide o rol ou a série em duas partes iguais - ordem central do rol ou da série). dM → Mediana n → Quantidade de dados do rol ou da série ou a frequência da amostra ou tamanho da amostra 2 n M d e 1 2 n M d Quando for par (A medida divide o rol ou a série em duas partes iguais - duas ordens centrais do rol ou da série). A mediana será a média aritmética entre os termos da ordem. dM → Mediana n → Quantidade de frequência da amostra ou tamanho da amostra 2.1.10- Moda oM Valor com maior número de repetições (classe modal). A moda é o valor que estiver na ordem ou na classe modal (valor modal). oM → Moda Observações: Mário Ferreira Neto Professor Especialista em Matemática e Estatística – UFLA/MG Série amodal → não tem valor modal Série unimodal → um valor modal Série bimodal → dois valores modais Série trimodal → três valores modais Série polimodal → quatro ou mais valores modais 2.1.11- Quartis 1Q → Mediana da primeira metade dos elementos da série 2Q → Mediana de todos os elementos da série 3Q → Mediana da segunda metade dos elementos da série Observações: Nos quartis a série é dividida em quatro partes iguais com o mesmo número de elementos, de tal forma que cada intervalo do quartil contenha 25% dos elementos coletados: 1º quartil separa os primeiros 25% dos elementos da serie; 2º quartil separa os primeiros 50% dos elementos da serie; 3º quartil separa os primeiros 75% dos elementos da serie. 2.1.12- Variância 1 2 2 n xx s i 2s → Variância ix → Valor genérico da observação ou frequência x → Média aritmética n → Quantidade de frequência da amostra ou tamanho da amostra → Somatório Mário Ferreira Neto Professor Especialista em Matemática e Estatística – UFLA/MG 2.1.13- Desvio-padrão 2ss s → Desvio-padrão 2s → Variância 2.2- Dados agrupados sem intervalos de classes 2.2-1. Média aritmética simples n fx x ii . ou i ii f fx x . Observação: nfi x → Média aritmética ix → Valor genérico da observação ou frequência if → Frequência absoluta ou simples n → Quantidade de frequência da amostra ou tamanho da amostra → Somatório 2.2-2. Mediana 2 1 n M d Quando for ímpar (A mediana divide o rol ou a série em duas partes iguais, mas a ordem central do rol ou da série). dM → Mediana n → Quantidade de dados do rol ou da série ou a frequência da amostra ou tamanho da amostra 2 n M d e 1 2 n M d Quando for par (A medida divide o rol ou a série em duas partes iguais - duas ordens centrais do rol ou da série). A mediana será a média aritmética entre os termos da ordem. Mário Ferreira Neto Professor Especialista em Matemática e Estatística – UFLA/MG dM → Mediana n → Quantidade de frequência da amostra ou tamanho da amostra 2.2-3. Moda oM Valor com maior número de repetições ou maior frequência (classe modal). A moda é o valor que estiver na ordem ou na classe. oM → Moda Observação: 1º- Localizar a classe modal (classe que contém o maior valor de frequência); 2º- Verificar o valor da variável contidona classe modal. 2.2-4. Quartis 1Q → k = 1 2Q → k = 2 3Q → k = 3 kQ → É o valor da variável que corresponde à classe desse quartil considerado. 1º- Calcular a posição do quartil para estabelecer em que classe se localiza o quartil considerado 4 .nk Qk kQ → É o valor da variável que corresponde à classe desse quartil considerado. k → Número do quartil considerado n → Quantidade de frequência da amostra ou tamanho da amostra Mário Ferreira Neto Professor Especialista em Matemática e Estatística – UFLA/MG Observação: 1º- Localizar esse valor na coluna da frequência acumulada para conhecer qual é a classe que corresponde a essa posição (classe do quartil k); 2º- Verificar na coluna da variável em estudo qual o valor da variável localizada na classe do quartil considerado. 2.2-5. Variância 1 2 2 2 n n x x s i i 2s → Variância ix → Valor genérico da observação ou frequência x → Média aritmética n → Quantidade de frequência da amostra ou tamanho da amostra → Somatório 2.2-6. Desvio-padrão 2ss s → Desvio-padrão 2s → Variância 2.3- Dados agrupados com intervalos de classes 2.3.1- Amplitude de classe ii lLh ou k R h h → Amplitude da classe h → Amplitude da classe iL → Limite superior da classe R → Amplitude Mário Ferreira Neto Professor Especialista em Matemática e Estatística – UFLA/MG il → Limite inferior da classe k → Número de classes 2.3.2- Amplitude total da distribuição mínmáx lLAT AT → Amplitude total da distribuição máxL → Limite superior da distribuição mínl → Limite inferior da distribuição 2.3.3- Amplitude amostral mínmáx xxAA AA → Amplitude amostral máxx → Limite máximo da amostra mínx → Limite mínimo da amostra 2.3.4- Ponto médio de classe 2 ii LlPM PM → Ponto Médio il → Limite inferior da classe iL → Limite superior da classe 2.3.5- Média aritmética ponderada i ii f fx x . x → Média aritmética ponderada ix → Valor do ponto médio do intervalo de classe Mário Ferreira Neto Professor Especialista em Matemática e Estatística – UFLA/MG if → Frequência absoluta ou simples → Somatório 2.3.6- Ponto médio de classe 2 supinf Ll xi ix → Valor genérico da observação ou frequência infl → Limite inferior da classe supL → Limite superior da classe 2.3.7- Desvio em relação à média xxd ii id → Desvio ix → Valor genérico da observação ou frequência x → Média aritmética 2.3.8- Desvio médio simples n xx DM i DM → Desvio médio ix → Valor genérico da observação ou frequência x → Média aritmética n → Quantidade de frequência da amostra ou tamanho da amostra → Somatório 2.3.9- Desvio médio absoluto Mário Ferreira Neto Professor Especialista em Matemática e Estatística – UFLA/MG n xx DM i A Observação: O desvio médio, em geral, é aproximadamente igual a 0,8 vezes o desvio-padrão. ADM → Desvio médio ix → Valor genérico da observação ou frequência x → Média aritmética n → Quantidade de frequência da amostra ou tamanho da amostra → Somatório 2.3.10- Mediana Critérios para determinação da mediana: 1º- 2 if ou 2 n → Somatório if → Frequência absoluta ou simples n → Quantidade de frequência da amostra ou tamanho da amostra 2º- A menor frequência acumulada que superar o valor da frequência acumulada da classe mediana 3º- i ant i d f hF f lM . 2 inf ou Md Mdant Mdd f hF n lM . 2 dM → Mediana infl → Limite inferior do intervalo de classe mediana if → Frequência absoluta ou simples da classe mediana antF → Frequência acumulada da classe anterior à classe mediana h → Amplitude do intervalo de classe mediana Mário Ferreira Neto Professor Especialista em Matemática e Estatística – UFLA/MG → Somatório dM → Mediana Mdl → Limite inferior da classe que contém a mediana n → Quantidade de frequência da amostra ou tamanho da amostra ou número de elementos do conjunto de dados Mdf → Frequência absoluta ou simples da classe que contém a mediana antF → Frequência acumulada da classe anterior à classe mediana ou soma das frequências simples anteriores à classe que contém a medida Mdh → Amplitude do intervalo da classe que contém a mediana 2.3.11- Moda h dd d lM o . 21 1 inf Mo → Moda infl → Limite inferior da classe modal 1d → Frequência absoluta ou simples menos frequência absoluta ou simples anterior à classe modal (diferença entre a frequência da classe modal e a da classe imediatamente anterior) 2d → Frequência absoluta ou simples menos frequência absoluta ou simples posterior à classe modal (diferença entre a frequência da classe modal e a da classe imediatamente posterior - seguinte) h → Amplitude de intervalo da classe modal Observação: 1º- Localizar a classe modal (classe que contém o maior valor de frequência); 2º- A moda é um valor contido no intervalo de Mário Ferreira Neto Professor Especialista em Matemática e Estatística – UFLA/MG classe modal; 3º - Cálculo da moda pela Regra de Czuber com base nos valores da classe modal. MoMoMo lLh Moh → Amplitude de intervalo da classe modal MoL → Limite Superior da classe modal Mol → Limite inferior da classe modal antMo ffd 1 1d → Diferença entre a frequência da classe modal e a frequência da classe anterior à classe modal Mof → Frequência da classe modal antf → Frequência da classe anterior à classe modal postMo ffd 2 2d → Diferença entre a frequência da classe modal e a frequência da classe posterior à classe modal Mof → Frequência da classe modal postf → Frequência da classe posterior à classe modal Observação: Moda bruta é o valor do ponto médio da classe modal. 2.3.12- Quartis Qk Qk ant Qkk h f F nk lQ .4 . kQ → Quartil k → Quartil considerado Qkl → Limite inferior do intervalo de classe do quartil considerado Mário Ferreira Neto Professor Especialista em Matemática e Estatística – UFLA/MG n → Quantidade de frequência da amostra ou tamanho da amostra ou número de elementos do conjunto de dados Qkf → Frequência absoluta ou simples da classe do quartil considerado antF → Frequência acumulada da classe anterior à classe do quartil considerado Qkh → Amplitude do intervalo de classe do quartil considerado QkQkQk lLh Qkh → Amplitude do intervalo de classe do quartil considerado QkL → Limite Superior da classe do quartil considerado Qkl → Limite inferior da classedo quartil considerado 2.3.13- Relação empírica entre média, mediana e moda do MxMx 3 x → Média aritmética Mo → Moda dM → Mediana 2.3.14- Amplitude total mínmáx xxR R → Amplitude total máxx → Limite máximo e mínx → Limite mínimo 2.3.15- Variância 1 . . 2 2 2 n n fx fx s ii ii 2s → Variância Mário Ferreira Neto Professor Especialista em Matemática e Estatística – UFLA/MG ix → Valor genérico da observação ou frequência if → Frequência absoluta ou simples n → Quantidade de frequência da amostra ou tamanho da amostra → Somatório 2.3.16- Desvio-padrão 2ss s → Desvio-padrão 2s → Variância 2.3.17- Erro padrão n s sx xs → Erro padrão s → Desvio-padrão n → Quantidade de frequência da amostra ou tamanho da amostra 2.3.18- Relação empírica entre o desvio-padrão e a amplitude 3 R <s< 6 R R → Amplitude s → Desvio-padrão 2.3.19- Coeficiente de variação 100. x s CV Observação: CV é dado em percentual Mário Ferreira Neto Professor Especialista em Matemática e Estatística – UFLA/MG CV → Coeficiente de variação s → Desvio-padrão x → Média aritmética Análise do coeficiente de variação CV≥ 30% → Dispersão alta (elevada, intensa) 15%<CV<30% → Dispersão média (central, mediana) CV≤ 15% → Dispersão baixa (mínima, pequena) 2.3.20- Momentos de uma distribuição de frequências 2.3.19.1- Dados em ordem ou rol ou série n x M t i t Observação: momento de ordem t de um conjunto de dados tM → Momento de ordem t ix → Valor genérico da observação ou frequência n → Quantidade de frequência da amostra ou tamanho da amostra n ax M t ia t Observação: momento de ordem t em relação a uma constante a a tM → Momento de ordem t em relação a constante a ix → Valor genérico da observação ou frequência a → Constante n → Quantidade de frequência da amostra ou tamanho da amostra n xx M t i t Observação: momento de ordem t centrado em relação à média Mário Ferreira Neto Professor Especialista em Matemática e Estatística – UFLA/MG tM → Momento de ordem t ix → Valor genérico da observação ou frequência x → Média aritmética n → Quantidade de frequência da amostra ou tamanho da amostra 2.3.19.2- Dados agrupados em classes de frequências n fx M i t i t . Observação: momento de ordem t de um conjunto de dados tM → Momento de ordem t ix → Valor genérico da observação ou frequência if → Frequência absoluta ou simples n → Quantidade de frequência da amostra ou tamanho da amostra n fax M i t ia t . Observação: momento de ordem t em relação a uma constante a a tM → Momento de ordem t em relação a constante a ix → Valor genérico da observação ou frequência a → Constante if → Frequência absoluta ou simples n → Quantidade de frequência da amostra ou tamanho da amostra n fxx M i t i t . Observação: momento de ordem t centrado em relação à média tM → Momento de ordem t ix → Valor genérico da observação ou frequência x → Média aritmética Mário Ferreira Neto Professor Especialista em Matemática e Estatística – UFLA/MG if → Frequência absoluta ou simples n → Quantidade de frequência da amostra ou tamanho da amostra 2.3.19.3- Momentos em ordens xM 1 e 01 m 1M → Momento de ordem 1 x → Média aritmética 2 2 . 1 s n n m 2m → Momento de ordem 2 2s → Variância n → Quantidade de frequência da amostra ou tamanho da amostra 2.3.19.4- Momentos centrados de 3ª e 4ª ordem em rol ou série 3 23 3 2.3 x n x x n x m ii 3m → Momento de ordem 3 x → Média aritmética n → Quantidade de frequência da amostra ou tamanho da amostra 4 2 2 34 4 3.6.4 x n x x n x x n x m iii 4m → Momento de ordem 4 x → Média aritmética n → Quantidade de frequência da amostra ou tamanho da amostra Mário Ferreira Neto Professor Especialista em Matemática e Estatística – UFLA/MG 2.3.19.5- Momentos centrados de 3ª e 4ª ordem em classes 3 23 3 2 . .3 . x n fx x n fx m iiii 3m → Momento de ordem 3 if → Frequência absoluta ou simples x → Média aritmética n → Quantidade de frequência da amostra ou tamanho da amostra 4 2 2 34 4 3 . .6 . .4 . x n fx x n fx x n fx m iiiiii 4m → Momento de ordem 4 if → Frequência absoluta ou simples x → Média aritmética n → Quantidade de frequência da amostra ou tamanho da amostra 4 22 4 . 240 2 2 . h sh m Observação: Correção de Sheppard (subtração) para dados agrupados em classes 4m → Momento de ordem 4 h → Amplitude da classe 2s → Variância 2.3.21- Escore padronizado s xx z ii Observação: xxi afastamento do valor da observação em relação a media com a divisão pelo Desvio-padrão como unidade de medida iz → Escore padronizado Mário Ferreira Neto Professor Especialista em Matemática e Estatística – UFLA/MG ix → Valor genérico da observação ou frequência x → Média aritmética s → Desvio-padrão z>1 → Anormal z<1 → Normal 2.3.22- Assimetria s mx AS d 3 Observação: assimetria situa-se entre -3 e 3 AS → Assimetria x → Média aritmética dM → Mediana s → Desvio-padrão Análise da assimetria AS > 1 → Assimetria Moderada AS > 0 → Assimetria positiva AS < 0 → Assimetria negativa 2.3.23- Medidas de assimetria (coeficiente de assimetria) 3 3 3 s m a Observação: momento de 3ª ordem dividido pelo cubo do desvio-padrão (indica o sentido da assimetria) 3a → Coeficiente de assimetria de ordem 3 3m → Momento de ordem 3 s → Desvio-padrão 2.3.24- Índice de assimetria de Pearson x o s mx A Mário Ferreira Neto Professor Especialista em Matemática e Estatística – UFLA/MG A → Coeficiente de assimetria de ordem 3 x → Média aritmética Mo → Moda s → Desvio-padrão Análise da assimetria |A| < 0,15 → praticamente a distribuição é simétrica 0,15 < |A| < 1 → Assimetria moderada |A| > 1 → Assimetria forte 2.3.25- Medidas de achatamento ou curtose 22 4 4 s m a 4a → Coeficiente de curtose 4m → Momento de ordem 4 2s → Variância Observação: Coeficiente de curtose é o quociente do momento de 4ª ordem pelo quadrado da variância Análise da assimetria Adimensional < 3 para as distribuições platicúrticas Adimensional = 3 para as distribuições mesocúrticas Adimensional > 3 para as distribuições leptocúrticas Observação: Distribuição normal é mesocúrtica; Distribuiçõesachatadas: platicúrtica e leptocúrtica. Coeficiente de excesso: 34 a para fixar o zero como referência mesocúrtica. Observação especial: Os tamanhos da população e da amostra permitem estabelecer duas relações importantes: Mário Ferreira Neto Professor Especialista em Matemática e Estatística – UFLA/MG Fração de amostragem = N n n → Tamanho da amostra N → Tamanho da população Fator de expansão ou Intervalo de Seleção = n N N → Tamanho da população n → Tamanho da amostra