Baixe o app para aproveitar ainda mais
Esta é uma pré-visualização de arquivo. Entre para ver o arquivo original
Probabilidade e Estatística MAT013 Professor: Rafael Faria Medidas de Tendência Central Média Mediana Moda Ponto médio Medidas de Variação Variância Desvio Padrão Medidas de Posição Relativa Escores Z Quartis; Percentis Boxplot Definição dos limites Outliers Sumário Média Manequins Realidade Altura 1,82m 1,62 m Cintura 58cm 73 cm Quadril 86 cm 101 cm É a medida de centro definida pela razão entre a soma dos valores pelo número total de valores. Média Número de Valores Amostrais Soma dos Valores Amostrais Quando a média é relativa à população: Média Número de Valores Populacionais Soma dos Valores Populacionais É necessário multiplicar os pontos médios das classes pelas respectivas frequências e dividir o resultado pela soma de frequências Média em Distribuição de Frequência Quando os valores variam em grau de importância. Cada valor é multiplicado pelo seu peso e a soma destes produtos é dividida pela soma dos pesos Média Ponderada Salários médios Sudeste => R$4000,00 Salários médios Sul = > R$4500,00 Salários médios Centro-Oeste>R$5000,00 Salários médios Norte => R$3500,00 Salários médios Nordeste = > R$3900,00 Salário médio Brasil = > R$4180,00 Exemplo Para dados arranjados em ordem crescente ou decrescente, a mediana é o valor central Geralmente expressa por: 1 3 5 6 7 8 9 = > mediana 6 1 3 5 7 8 9 = > mediana 6 Mediana É o valor que aparece mais frequentemente no conjunto de dados 1;3;3;3;5;7;8;9 = > moda 3 1;3;3;3;5;5;5;7;8;9 => moda 3 e 5 1;1;1;3;3;3;5;5;5;7;8;9 = > moda 1, 3 e 5 1;2;3;4;5;6;7;8;9; => não há moda Moda É a média aritmética entre o máximo e o mínimo valor do conjunto de dados 18;34;23;4;5;6;7;66;43;12;87;102 Ponto Médio Medidas de tendência central podem não ser suficientes para chegar a alguma conclusão Outros tipos de análises e ferramentas são necessárias Medidas de Variação É a diferença entre o maior e o menor valor Amplitude Medida de variação dos valores amostrais em torno da média Nunca é negativo Possui a mesma unidade dos dados Desvio padrão Utiliza-se para a população N e não (n-1) no denominador Desvio Padrão para uma População É uma medida de variação igual ao quadrado do desvio padrão Variância Para estimar grosseiramente o desvio padrão, considera-se: Relação entre Amplitude e Desvio Padrão Pode-se utilizar o Desvio Padrão para estimar valores máximos e mínimos usuais. Interpretação do Desvio Padrão Média – 2s Média Média + 2s Distribuição Normal 68% - 1 desvio padrão 95% - 2 desvios padrões 99,7% - 3 desvios padrões Exemplo A fração de qualquer conjunto de dados que se situa a K desvios padrões da média é sempre, no mínimo, igual a fórmula abaixo, onde K é um número positivo maior do que 1. Teorema de Chebyshev O coeficiente de variação (CV) é a relação entre o desvio padrão e a média Comparação de variação entre duas populações ou dois conjuntos de dados Coeficiente de Variação Altura => média 68,34 in; DP = 3,12 in Peso = > média 175,22 lb; DP = 26,33lb CV (alturas) = 4,42 % CV (pesos) = 15,26% Exemplo Estes valores são utilizados para avaliar valores de conjuntos de dados diferentes ou para comparação de valores dentro de um mesmo conjunto de dados Medidas de Posição Relativa Representa o número de desvio padrões a que se situa determinado valor de x Pode ser negativo Converte os valores para uma escala padronizada Escore z Exemplo Salário de um professor da USP (R$12000,00) – média dos salários de SP Salário de um professor da UNIFEI (R$8000,00) – média dos salários de MG Escore z MG SP Salário Médio R$4000,00 R$5000,00 Desvio Padrão R$ 1000,00 R$2000,00 Valores usuais e não-usuais Escore z Valores não usuais ValoresUsuais Valores nãousuais z< -2 -2≤ z ≤2 z > 2 Divide os dados em partes iguais Valores ordenados Cálculo do quartil será baseado no cálculo do percentil Quartis e Percentis Há 99 percentis que separam o conjunto de dados. São gerados 100 grupos com cerca de 1% dos valores em cada um Percentil Em um conjunto com 500 dados eu determine que existem 350 dados menores que 30. O valor 30 é o 70º percentil Percentil Determinar o valor a partir do percentil p é o percentil em uso n é o número total de valores L é a localização do valor (usar número inteiros) Percentil Se L for um número não inteiro Arredondar para cima Se L for inteiro O valor do k-ésimo percentil é a média entre os valores da localização L e o valor seguinte Se L = 60, o valor do percentil é a média entre o 60º e o 61º termo Percentil Para determinar os Quartis utiliza-se : Q1 = P25 Q2 = P50 Q3 = P75 Quartil Valores de mínimo, máximo e dos quartis (Q1, Q2 e Q3) Outliers = acima de Q3 por uma quantidade maior que 1,5*(Q3-Q1) ou abaixo de Q1 por uma quantidade maior que 1,5*(Q3-Q1) Boxplot 40 51 52 53 53 55 55 55 58 60 60 75 90 100 100 105 105 110 110 10000 Exemplo
Compartilhar