Buscar

Prof. Rafael Faria - Probabilidade e Estatística - Aula 02

Esta é uma pré-visualização de arquivo. Entre para ver o arquivo original

Probabilidade e Estatística
MAT013
Professor: Rafael Faria
Medidas de Tendência Central
Média
Mediana
Moda
Ponto médio
Medidas de Variação
Variância
Desvio Padrão
Medidas de Posição Relativa
Escores Z
Quartis; Percentis
Boxplot
Definição dos limites
Outliers
Sumário
Média
Manequins
Realidade
Altura
1,82m
1,62 m
Cintura
58cm
73 cm
Quadril
86 cm
101 cm
É a medida de centro definida pela razão entre a soma dos valores pelo número total de valores.
Média
Número de Valores Amostrais
Soma dos Valores Amostrais
Quando a média é relativa à população:
Média
Número de Valores Populacionais
Soma dos Valores Populacionais
É necessário multiplicar os pontos médios das classes pelas respectivas frequências e dividir o resultado pela soma de frequências
Média em Distribuição de Frequência
Quando os valores variam em grau de importância.
Cada valor é multiplicado pelo seu peso e a soma destes produtos é dividida pela soma dos pesos
Média Ponderada
Salários médios Sudeste => 	 R$4000,00
Salários médios Sul = > 		 R$4500,00
Salários médios Centro-Oeste>R$5000,00
Salários médios Norte => 	 R$3500,00
Salários médios Nordeste = > R$3900,00
Salário médio Brasil = > 		 R$4180,00
Exemplo
Para dados arranjados em ordem crescente ou decrescente, a mediana é o valor central
Geralmente expressa por: 
1 3 5 6 7 8 9 = > mediana 6
1 3 5 7 8 9 = > mediana 6
Mediana
É o valor que aparece mais frequentemente no conjunto de dados
1;3;3;3;5;7;8;9 = > moda 3
1;3;3;3;5;5;5;7;8;9 => moda 3 e 5
1;1;1;3;3;3;5;5;5;7;8;9 = > moda 1, 3 e 5
1;2;3;4;5;6;7;8;9; => não há moda
Moda
É a média aritmética entre o máximo e o mínimo valor do conjunto de dados
18;34;23;4;5;6;7;66;43;12;87;102
Ponto Médio
Medidas de tendência central podem não ser suficientes para chegar a alguma conclusão
Outros tipos de análises e ferramentas são necessárias
Medidas de Variação
É a diferença entre o maior e o menor valor
Amplitude
Medida de variação dos valores amostrais em torno da média
Nunca é negativo
Possui a mesma unidade dos dados
Desvio padrão
Utiliza-se para a população N e não (n-1) no denominador
Desvio Padrão para uma População
É uma medida de variação igual ao quadrado do desvio padrão
Variância
Para estimar grosseiramente o desvio padrão, considera-se:
Relação entre Amplitude e Desvio Padrão
Pode-se utilizar o Desvio Padrão para estimar valores máximos e mínimos usuais.
Interpretação do Desvio Padrão
Média – 2s
Média
Média + 2s
Distribuição Normal
68% - 1 desvio padrão
95% - 2 desvios padrões
99,7% - 3 desvios padrões
Exemplo
A fração de qualquer conjunto de dados que se situa a K desvios padrões da média é sempre, no mínimo, igual a fórmula abaixo, onde K é um número positivo maior do que 1.
Teorema de Chebyshev
O coeficiente de variação (CV) é a relação entre o desvio padrão e a média
Comparação de variação entre duas populações ou dois conjuntos de dados
Coeficiente de Variação
Altura => média 68,34 in; DP = 3,12 in
Peso = > média 175,22 lb; DP = 26,33lb
CV (alturas) = 4,42 %
CV (pesos) = 15,26%
Exemplo
Estes valores são utilizados para avaliar valores de conjuntos de dados diferentes ou para comparação de valores dentro de um mesmo conjunto de dados
Medidas de Posição Relativa
Representa o número de desvio padrões a que se situa determinado valor de x
Pode ser negativo
Converte os valores para uma escala padronizada
Escore z
Exemplo
Salário de um professor da USP (R$12000,00) – média dos salários de SP
Salário de um professor da UNIFEI (R$8000,00) – média dos salários de MG
Escore z
MG
SP
Salário Médio
R$4000,00
R$5000,00
Desvio Padrão
R$ 1000,00
R$2000,00
Valores usuais e não-usuais
Escore z
Valores não usuais
ValoresUsuais
Valores nãousuais
z< -2
-2≤ z ≤2
z > 2
Divide os dados em partes iguais
Valores ordenados
Cálculo do quartil será baseado no cálculo do percentil
Quartis e Percentis
Há 99 percentis que separam o conjunto de dados. 
São gerados 100 grupos com cerca de 1% dos valores em cada um
Percentil
Em um conjunto com 500 dados eu determine que existem 350 dados menores que 30.
O valor 30 é o 70º percentil
Percentil
Determinar o valor a partir do percentil
p é o percentil em uso
n é o número total de valores
L é a localização do valor (usar número inteiros)
Percentil
Se L for um número não inteiro
Arredondar para cima
Se L for inteiro
O valor do k-ésimo percentil é a média entre os valores da localização L e o valor seguinte
Se L = 60, o valor do percentil é a média entre o 60º e o 61º termo
Percentil
Para determinar os Quartis utiliza-se :
Q1 = P25
Q2 = P50
Q3 = P75
Quartil
Valores de mínimo, máximo e dos quartis (Q1, Q2 e Q3)
Outliers = acima de Q3 por uma quantidade maior que 1,5*(Q3-Q1) ou abaixo de Q1 por uma quantidade maior que 1,5*(Q3-Q1)
Boxplot
40
51
52
53
53
55
55
55
58
60
60
75
90
100
100
105
105
110
110
10000
Exemplo

Teste o Premium para desbloquear

Aproveite todos os benefícios por 3 dias sem pagar! 😉
Já tem cadastro?

Continue navegando