Buscar

topico 4 estatistica nivelamento resumo

Prévia do material em texto

✓ Medidas de dispersão: Desvio padrão
✓ Intervalo de confiança
✓ Estatística usando o excel
ESTATÍSTICA: Tópico 4
ESTA
TÍSTIC
A
MEDIDAS DE DISPERSÃO
As medidas de dispersão são utilizadas para indicar o grau de variação 
ou afastamento de todos os valores em relação à sua média.
A partir do desvio padrão é possível saber a “distância” de cada uma 
informações numéricas até a média aritimética delas. O desvio é obtido 
a partir da subtração de cada um dos valores de um conjunto da média 
aritmética. E a variância é igual ao desvio padrão ao quadrado, é 
representada por S2, refere-se a medida que se obtém, somando os 
quadrados dos desvios para a média das observações da amostra.
O desvio padrão é igual a raiz quadrada da variância.
MEDIDAS DE DISPERSÃO
Variância populacional
A variância de uma população {x1,...,xN} de N elementos é a medida de 
dispersão definida como a média do quadrado dos desvios dos elementos 
em relação à média populacional μ.
Variância amostral
A variância de uma amostra {x1,...,xn} de n elementos é definida como a 
soma ao quadrado dos desvios dos elementos em relação à sua 
média dividido por (n-1).
MEDIDAS DE DISPERSÃO
Para calcularmos o desvio padrão de uma amostra devemos 
primeiramente calcular a média , isto é:
ҧ𝑥 = 65 + 72 + 70 +72 + 60 + 67 + 69 + 68 = 67,87
8
Agora vamos subtrair de cada valor, elevar os resultados ao 
quadrado e somá-los. Então dividimos o total dos quadrados pelo 
número de valores menos 1, ou seja, por (n-1) e extraímos a raiz 
quadrada:
110,875 ÷7 = 15,839
ⱱ15,839 = 3,979
Portanto, o desvio 
padrão é 3,97986.
MEDIDAS DE DISPERSÃO
Vamos calcular o desvio padrão de uma população composta pelas notas: 3; 4; 7 e 9, 
obtidas por 4 alunos, numa avaliação da disciplina de análise de dados.
Primeiro passo: calcular a média: ∑ fi ÷ n = 
3 + 4 + 7 + 9 = 23 ÷ 4 = �̅� = 5,75 
Segundo passo: Usando a média (5,75) determinar cada desvio.
O desvio padrão corresponde a raiz quadrada da variância (5,68).
Variância é a média aritmética dos quadrados dos desvios.
S = √5,68 = 2,38
1º passo: cálculo da média:
Média=2 + 8 + 5 + 6 = 21 = 5,25
4 4
2º passo: cálculo da variância da população:
Desvio médio = Soma do quadrado do desvio para a média dividido por n (4)
Variância = 10,56 + 7,56+ 0,06 + 0,56 = 18,74 = 4,6850
4 4
Desvio padrão = 𝟒, 𝟔𝟖5 =2,16
Notas (n) Desvio para a média Quadrado do desvio para a média
2 (2-5,25) = -3,25 (-3,25)2 = 10,56
8 (8-5,25) = 2,75 (-2,75)2 = 7,56
5 (5-5,25) = -0,25 (-0,25)2 = 0,062
6 (6-5,25) = 0,75 (-0,75)2 = 0,56
Soma 7,5 (DM) 18,74 ÷ 4 = 4,685
MEDIDAS DE DISPERSÃO
MEDIDAS DE DISPERSÃO
ҧ𝑥: média
Ʃ: soma
𝑛: quantidade de elementos da amostra
𝐷𝑀𝑆 : desvios médios
S2: variância
S: desvio padrão
CV: coeficiente de variação
Pm: ponto médio
Os desvios são calculados da seguinte forma:
di = Pm - 𝑥 ̅
Já os desvios médios são calculados da seguinte forma:
Dm = ∑ Pm - �̅� × fi ÷ n
S = √∑ (Pm - x ) 2 × fi ÷ n-1
DESVIO MÉDIO: POPULAÇÃO
Para iniciar você precisa obter a média 
aritmética dos valores:
ഥ𝑥 = 4 + 6 + 8 + 9 + 10 + 11 = 48 = 8
6 6
ഥ𝑥 = 8
O Dm = 12 ÷ 6 = 2
Dm =528 ÷ 100 = 5,28
DESVIO MÉDIO: POPULAÇÃO
Dm = ∑ Pm - �̅� × fi ÷ n
DESVIO MÉDIO: AMOSTRA
S = √ 3879 ÷ 100-1
S = √ 3879 ÷ 99
S = √ 39,18
S = 6,26
S = √∑ (Pm - x ) 2 × fi ÷ n-1
OUTLIERS
Presuma que os valores medidos do Índice Cardíaco de 15 pacientes 
foram: 405, 348, 365, 291, 135, 260, 300, 155, 34, 294, 758, 472, 459, 143, 
172.
Sabe-se que “Um outlier é uma observação que se diferencia tanto das 
demais observações que levanta suspeitas de que aquela observação foi 
gerada por um mecanismo distinto” (Hawkins, 1980). Outliers são 
observações que apresentam um grande desvio das restantes, podem ser 
também designadas por observações “anormais”.
Considerando os valores medidos do Índice Cardíaco, quais valores podem 
ser Outliers? 34 e 758
ASSIMETRIA
Na distribuição estatística, a assimetria é o quanto a sua curva de frequência se afasta 
da média, pode ser definida também, como uma distribuição que depende das suas 
medidas de posição: média, mediana e moda. Uma distribuição é simétrica somente 
quando apresenta o mesmo valor para a moda, a média e a mediana, coincidem num 
mesmo ponto, havendo um perfeito equilíbrio na distribuição
-0,6275 +0,88905
INTERVALO DE CONFIANÇA
Presuma que os valores medidos do Índice Cardíaco de 15 pacientes foram: 
405, 348, 365, 291, 135, 260, 300, 155, 34, 294, 758, 472, 459, 143, 172.
O intervalo de confiança se refere a dois limites numéricos: limite superior e 
limite inferior, onde se encontra o verdadeiro parâmetro, com o grau de 
confiança especificado. Os mais utilizados são: 90%, 95% e 99%.
Uma das vantagens do intervalo de confiança é expressar o erro que o 
pesquisador deseja aceitar em seu cálculo, permitindo ter uma ideia da 
precisão da estimativa do parâmetro. Cálculo no excel:
Comando:=INT.CONFIANÇA.NORM(αlfa; desvio_padrão; tamanho da 
amostra)
Intervalo de confiança (90%) 78,90946933 (=INT.CONFIANÇA.NORM(0,10;185,800764;15)
Intervalo de confiança (95%) 94,02643213 (=INT.CONFIANÇA.NORM(0,05;185,800764;15)
Intervalo de confiança (99%) 123,5716784 (=INT.CONFIANÇA.NORM(0,01;185,800764;15)
ESTATÍSTICA USANDO O EXCEL
O coeficiente de variação é usado para analisar a dispersão em termos 
relativos a seu valor médio quando duas ou mais séries de valores 
apresentam unidades de medida diferentes.
Como o coeficiente de variação analisa a dispersão em termos relativos, ele 
será dado em %. Quanto menor for o valor do coeficiente de variação, 
mais homogêneos serão os dados, ou seja, menor será a dispersão em 
torno da média. De uma forma geral, se o CV:
For menor ou igual a 15% → baixa dispersão: dados homogêneos
For entre 15 e 30% → média dispersão
For maior que 30% → alta dispersão: dados heterogêneos
ESTATÍSTICA USANDO O EXCEL
Função média:
Para calcular a média de uma faixa de valores, basta digitar o comando 
=MÉDIA(..) marcar os valores e clicar enter.
ESTATÍSTICA USANDO O EXCEL
Função mediana:
Para calcular a mediana de uma faixa de valores, basta digitar o comando 
=MÉDIA(..) marcar os valores e clicar enter.
ESTATÍSTICA USANDO O EXCEL
Presuma que os valores medidos do Índice Cardíaco de 15 pacientes foram: 
405, 348, 365, 291, 135, 260, 300, 155, 34, 294, 758, 472, 459, 143, 172.
Intervalo de confiança 95%
Média 312,73333 (=MÉDIA(b48:b62)
Mediana 294 (=MED(b48:b62)
Desvio padrão 185,800764 (=DESVPAD.A(B48:B62)
Variância 34521,92381 (=VAR.A(b48:b62)
Curtose 1,080386 (=CURT(B48:B62)
Intervalo de confiança (95%) 94,02643213 (=INT.CONFIANÇA.NORM(0,05;185,800764;15)
Limite inferior 218,70690 (média - interv de confiança)
Limite superior 406,75977 (média + interv de confiança)
Coeficiente de variação (CV) 59,41% (CV=DP/Média x 100)
Assimetria 0,88903947 (=DISTORÇÃO(B48:B62)
n (números de elementos) 15
ESTATÍSTICA USANDO O EXCEL
Média 312,73333
Mediana 294
Desvio padrão 185,800764
Variância 34521,92381
Curtose 1,080386
Intervalo de confiança 94,02643213
Limite inferior 218,70690
Limite superior 406,75977
Coeficiente de variação 59,41%
Assimetria 0,88903947
n (números de elementos) 15
CV=desvio padrão/média dos dados x 100. Neste 
caso é heteregêneo > de 50%
Quanto ao Grau de homogeneidade dos dados, o 
CV foi de 59,41% portanto, ruim, acima de 30% .
Os valores 34 e o 758 podem ser Outliers: valores de dados que estão distantes de outros 
valores de dados e podem afetar fortemente os resultados de sua análise. 
Presuma que os valores medidos do Índice Cardíaco de 15 pacientes foram: 
405, 348, 365, 291, 135, 260, 300, 155, 34, 294, 758, 472, 459, 143, 172.
Intervalo de confiança 95%
Tópico 4
Profª Me. Lourdes Utrilla
MUITO OBRIGADA!
ESTA
TÍSTIC
A

Continue navegando