Baixe o app para aproveitar ainda mais
Esta é uma pré-visualização de arquivo. Entre para ver o arquivo original
ESTATÍSTICA I AULA 5 Profª Adriana Maria Balena Tostes Suponhamos 3 turmas diferentes, cada uma com 10 alunos, onde foi aplicada uma avaliação com valor de 10 pontos. As notas foram as seguintes: Notas Turmas N1 N2 N3 N4 N5 N6 N7 N8 N9 N10 Total Turma “A” 5 5 5 5 5 5 5 5 5 5 50 Turma “B” 0 0 0 5 5 5 5 10 10 10 50 Turma “C” 1 2 3 4 5 5 6 7 8 9 50 Calcular a média, a mediana e a moda para cada turma. O que podemos concluir com estas medidas? Precisamos de outras medidas estatísticas, que são as Medidas de Dispersão ou Variabilidade. Amplitude (Range) É a diferença entre o maior e o menor valor do conjunto. ➢ Ex. Turma 1: 5 – 5 = 0 ➢ Ex Turma 2: 10 – 0 = 10 ➢ Ex Turma 3: 9 -1 = 8 Para dados agrupados com intervalos de classe, a amplitude total é a diferença entre o limite superior da última classe e o limite inferior da primeira classe. Sua desvantagem é de levar em conta apenas dois valores, desprezando todos os outros. R=L(máx) - L(mín) Quanto maior a amplitude total, mais heterogêneos são os dados entre si. Desvio ➢ É a diferença entre cada valor observado e a média destes valores. Propriedade importante: A soma dos desvios em relação à média é sempre igual a zero. di = xi - X Variância (s2 ou σ2) É a média aritmética dos quadrados dos desvios em relação à média da distribuição. 1- Para dados não agrupados: Onde: S2 = variância amostral xi = valor observado X = média amostral n = tamanho da amostra Onde: σ2= variância populacional xi = valor observado μ= média populacional N = tamanho da população Observar os denominadores n – 1 para amostra N para população Exemplos: 1- Encontre a variância do conjunto de dados amostral. 2- Encontre a variância do conjunto de dados populacional. 17 8 13 18 15 9 10 11 6 Média=11,9 5,1 -‐3,9 1,1 6,1 3,1 -‐2,9 -‐1,9 -‐0,9 -‐5,9 26,1 15,1 1,2 37,3 9,7 8,3 3,6 0,8 34,7 136,9 s2 = 17,1 12 9 7 5 7 8 10 4 11 6 μ = 7,9 4,1 1,1 -‐0,9 -‐2,9 -‐0,9 0,1 2,1 -‐3,9 3,1 -‐1,9 16,8 1,2 0,8 8,4 0,8 0,0 4,4 15,2 9,6 3,6 σ2= 6,1 Variância 2- Para dados agrupados sem intervalo de classes: Onde: S2 = variância amostral xi = valor observado X = média amostral n= tamanho da amostra fi = frequência simples da classe Onde: σ2= variância populacional xi = valor observado μ= média populacional N = tamanho da população fi = frequência simples da classe Exemplo: Foi coletada uma amostra aleatória sobre o número de crianças por residência em certa região. Os resultados são mostrados na tabela abaixo. Encontre a variância para esse conjunto de dados. x fi xi . Fi (xi -‐ Média) (xi – Média)2 (xi – Média)2 * fi 0 10 0 -‐1,8 3,24 32,4 1 19 19 -‐0,8 0,64 12,16 2 7 14 0,2 0,04 0,28 3 7 21 1,2 1,44 10,08 4 2 8 2,2 4,84 9,68 5 1 5 3,2 10,24 10,24 6 4 24 4,2 17,64 70,56 Total 50 91 145,4 Média = 1,8 S2=3 Variância 3- Para dados agrupados com intervalo de classes: Utilizar para xi o ponto médio da classe. Onde: S2 = variância amostral xi = ponto médio da classe X = média amostral n= tamanho da amostra fi = frequência simples da classe Onde: σ2= variância populacional xi = ponto médio da classe μ= média populacional N = tamanho da população fi = frequência simples da classe Exemplo: Na auditoria anual de uma empresa foi anotado o tempo necessário (em minutos) para realizar a auditoria de uma amostra de 50 balanços. Caracterizar a dispersão da distribuição por meio da variância. Logo, podemos dizer que os valores observados se distanciam cerca de 12,4 min da média. Desvio Padrão (s ou σ) • Desvio padrão é a medida de dispersão mais usada. • Como os desvios foram elevados ao quadrado para o cálculo da variância, não se consegue expressá-la na mesma unidade dos valores da variável. Por isso, para calcular o desvio padrão, basta extrair a raiz quadrada da variância. • Quanto maior é o desvio padrão maior é a dispersão dos dados em torno da média. • Quanto mais o desvio padrão se aproxima de zero, mais homogênea é a distribuição dos valores observados. S = desvio padrão amostral σ = desvio padrão populacional s = 3 1 2 3 4 5 6 7 s = 1,0 1 2 3 4 5 6 7 s = 0,8 1 2 3 4 5 6 7 1 2 3 4 5 6 7 fr eq üê nc ia s = 0 7 6 5 4 3 2 1 0 O desvio-padrão cresce quando a dispersão dos dados aumenta Desvio Padrão (s ou σ) Em todos os casos temos 7 medidas com média = 4 Coeficiente de Variação Para saber se uma dispersão é muito grande em relação à média, ou para comparar o grau de dispersão relativa entre as distribuições de duas ou mais variáveis é preciso utilizar uma medida de dispersão relativa, que se chama Coeficiente de Variação. É o quociente, expresso em %, entre o desvio padrão e a média de uma distribuição. Alguns pesquisadores consideram: Ø Dispersão baixa quando CV inferior a 10% Ø Dispersão média quando CV estiver entre 10% e 20% Ø Dispersão alta quando CV estiver entre 20% e 30% Ø Dispersão muito alta quando CV for superior a 30% (pequena representatividade da média) Exemplo: Qual destas grandezas apresenta maior grau de dispersão? Portanto as massas apresentam maior grau de dispersão do que as estaturas Exercícios Os seguintes valores em Km representam as distâncias percorridas por um maratonista em 50 dos 180 dias de treinamento que se preparou para uma competição. a) Construir uma tabela de distribuição de frequências completa. (li=1,1 , h=5) b) Calcular a média, a moda e a mediana c) Calcular a variância, o desvio padrão e o coeficiente de variação. Respostas: Classes (f i) (fri%) (Fi) (Fri%) (Xi) fi . Xi desvio desvio2 desvio2. fi 1,1 |-‐-‐-‐ 6,1 4 8,0% 4 8,0% 3,6 14,4 -‐12,8 163,84 655,36 6,1 |-‐-‐-‐ 11,1 11 22,0% 15 30,0% 8,6 94,6 -‐7,8 60,84 669,24 11,1 |-‐-‐-‐ 16,1 12 24,0% 27 54,0% 13,6 163,2 -‐2,8 7,84 94,08 16,1 |-‐-‐-‐ 21,1 8 16,0% 35 70,0% 18,6 148,8 2,2 4,84 38,72 21,1 |-‐-‐-‐ 26,1 8 16,0% 43 86,0% 23,6 188,8 7,2 51,84 414,72 26,1 |-‐-‐-‐ 31,1 5 10,0% 48 96,0% 28,6 143 12,2 148,84 744,2 31,1 |-‐-‐-‐ 36,1 2 4,0% 50 100,0% 33,6 67,2 17,2 295,84 591,68 Total 50 100,0% 820 3208 Média = 820 / 50 = 16,4 Moda = 13,6 Mediana = 15,27 Moda = 12,1 Variância = 3208/49 = 65,47 Desvio Padrão = 8,09 CV = 0,49 = 49% Forma das distribuições Quando a distribuição for simétrica e unimodal, a média, a mediana e a moda são iguais Se a distribuição for assimétrica à esquerda (negativamente assimétrica), a média é menor que a mediana que é menor que a moda. Se a distribuição for simétrica e uniforme a média e a mediana são iguais. Não haverá moda para essa distribuição. Se a distribuição for assimétrica à direita (positivamente assimétrica), a média é maior que a mediana que é maior que a moda. A média sempre irá na direção que a distribuição for assimétrica, ou seja, na direção da cauda. Medidas de Assimetria e Curtose Determinar o coeficiente de assimetria da distribuição populacional abaixo e concluir sobre o seu grau de enviesamento. As = 0 Média = 75 Moda = 75 S = 12,65 A distribuição é simétrica Classes fi xi Fa [50,60[ 15 55 15 [60,70[ 20 65 35 [70,80[ 30 75 65 [80,90[ 20 85 85 [90,100[ 15 95 100 Total 100 Q1=65 Q2=Md=75 Q3=85 As = 0 0 10 20 30 40 55 65 75 85 95 Histograma Dados NI Curtose (k) É o estudo do grau de achatamento da curva de frequência em relação à curva normal. (a) Leptocúrtica (b) Mesocúrtica (normal padão) (c) Platicúrtica Coeficiente de Curtose (k) K = 0,263, DISTRIBUIÇÃO MESOCÚRTICA K < 0,263 DISTRIBUIÇÃO LEPTOCÚRTICA (CUME) K>0,263 DISTRIBUIÇÃO PLATICÚRTICA (PLANA) Exercício: Considere os seguintes resultados relativos a três distribuições de frequência: Determine o coeficiente de curtose e classifique a distribuição. Boxplot • Limite superior da caixa: P75=Q3 • Limite inferior da caixa: P25 = Q1 • Altura da caixa: Desvio interquartílico. • A caixa (box) propriamente contém a metade 50% dos dados. • Linha na caixa: Md = Q2 (Se a linha mediana dentro da caixa não é equidistante dos extremos, diz-se então que os dados são assimétricos). • Extremos do gráfico: valores mínimo e máximo, a menos que valores outliers estejam presentes, nesse caso o gráfico de estende ao máximo de 1.5 vezes da distância interquartil. • Pontos fora do gráfico são então outliers ou suspeitos de serem outliers. Exercícios Criar os gráficos de Box-Plot para a tabela abaixo:
Compartilhar