Prévia do material em texto
Probabilidade e Estatística Valéria Ferreira Aula 5 Medidas Separatrizes As medidas separatrizes fornecem uma ideia sobre a distribuição dos dados ordenados. Apresentam a vantagem de não serem afetadas por valores extremos. As medidas de ordenamento são: •Quartis; •Decis; •Percentis. 2 Dados não agrupados 3 Então, adotaremos a seguinte convenção: •Se a divisão resultar num número fracionário, arredonde-o para cima e o valor do quartil será a resposta da variável encontrada nesta posição. •Se a divisão for um número inteiro, o quartil será a média aritmética da resposta da variável que ocupar a posição encontrada com a resposta da variável que ocupar a posição seguinte. 4 Exemplo 1 Um escritório que presta consultoria em administração levantou os tempos de espera de pacientes que chegam a uma clínica de ortopedia para atendimento de emergência. Foram coletados os seguintes tempos, em minutos, durante uma semana. Encontre os quartis. 2 5 10 11 3 14 8 8 7 12 3 4 7 3 4 2 6 7 5 Resolução 6 Resolução 7 Resolução 8 Percentis 9 • Se a divisão resultar num número fracionário, arredonde-o para cima e o valor do percentil será a resposta da variável encontrada nessa posição. • Se a divisão for um número inteiro, o percentil será a média aritmética da resposta da variável que ocupar a posição encontrada com a resposta da variável que ocupar a posição seguinte. 10 Medidas Separatrizes – Dados Agrupados 11 1inf1 1 1 1 1 4 q i q q q F f f A lQ 1inf q l é o limite inferior da classe que contém o primeiro quartil; é o número total de observações da distribuição de frequências; 11q F é a frequência acumulada da classe anterior à classe que contém o primeiro quartil; 1q f é o número de observações da classe que contém o primeiro quartil; 1q A é a amplitude do intervalo de classe que contém o primeiro quartil. if 12 1inf 2 md i md md md F f f A lMd mdlinf é o limite inferior da classe que contém a mediana; é o número total de observações da distribuição de frequências; 1mdF é a frequência acumulada da classe anterior à classe que contém a mediana; mdf é o número de observações da classe que contém a mediana; mdA é a amplitude do intervalo de classe que contém a mediana. if E o cálculo do terceiro quartil é feito da seguinte maneira: 13 1inf3 3 3 3 3 4 3 q i q q q F f f A lQ 3inf q l é o limite inferior da classe que contém o terceiro quartil; é o número total de observações da distribuição de frequências; 13q F é a frequência acumulada da classe anterior à classe que contém o terceiro quartil; 3q f é o número de observações da classe que contém o terceiro quartil; 3q A é a amplitude do intervalo de classe que contém o terceiro quartil. if Cálculo dos Percentis 14 1inf 100 k k k k p i p p pk F fk f A lP Exemplo 2 A tabela abaixo apresenta a distribuição de frequências do tempo de vida de 60 componentes eletrônicos (medido em dias) submetidos à experimentação num laboratório especializado. 15 16 4 if 15 4 60 4 if 17 18 5,555,7481115 8 15 4811 4 60 8 15 481 Q Medidas de Dispersão As medidas de dispersão indicam o grau de variabilidade das observações. Essas medidas possibilitam que façamos distinção entre conjuntos de observações quanto à sua homogeneidade. Quanto menor as medidas de dispersão, mais homogêneo é o conjunto de dados. As medidas de dispersão são: •Amplitude Total •Amplitude interquartil •Desvio-Padrão •Variância •Coeficiente de Variação 19 Desvio-Padrão Quando os dados estiverem dispostos numa distribuição de frequências, o desvio-padrão pode ser encontrado da seguinte forma: 20 11 1 2 12 1 2 n n fx fx n fxx s k i k i ii ii k i ii Exemplo 3: Considere a distribuição a seguir relativa às notas de dois alunos de informática durante determinado semestre: a)Qual a nota média de cada aluno? b)Qual aluno apresentou resultado mais homogêneo? 21 Aluno A 9,0 9,0 2,0 5,0 6,0 2,0 6,0 1,0 Aluno B 5,0 5,5 4,5 6,0 5,5 5,0 4,5 4,0 Aluno A 22 Notas Frequência 1 1 1 1 2 2 4 8 5 1 5 25 6 2 12 72 9 2 18 162 Total 8 40 268 ii fx 2 ii fx Aluno A 23 12,371,9 7 200268 7 8 40 268 1 2 1 2 12 s s n n fx fx s k i k i ii ii 5 8 40 1 1 k i i k i ii f fx x Aluno B 24 Notas Frequência 4 1 4 16 4,5 2 9 40,5 5 2 10 50 5,5 2 11 60,5 6 1 6 36 Total 8 40 203 ii fx 2 ii fx Aluno B A aluno B apresentou resultado mais homogêneo. 25 65,043,0 7 200203 7 8 40 203 1 2 1 2 12 s s n n fx fx s k i k i ii ii 5 8 40 1 1 k i i k i ii f fx x Referências BRUNI, Adriano L. Estatística Aplicada à Gestão Empresarial. 2.ed. São Paulo: Atlas, 2010. TRIOLA, Mário F. Introdução à Estatística. 10.ed. Rio de Janeiro: LTC, 2008. VIEIRA, Sonia. Estatística básica. São Paulo: Cengage Learning, 2013. 26 Probabilidade e Estatística Valéria Ferreira Atividade 5 Vamos utilizar os dados abaixo para calcular as medidas de dispersão. 28 Idade Nº funcionários 18 1 18 324 19 1 19 361 21 1 21 441 22 2 44 968 24 2 48 1152 25 3 75 1875 28 2 56 1568 Total 12 281 6689 ii fx ii fx 2 A amplitude é calculada como: O desvio-padrão é calculado por: 29 anos 101828 mínimomáximo xxR anos 15,390,9 11 08,65806689 11 12 281 6689 1 2 1 2 12 s s n n fx fx s k i k i ii ii Como a variância é definida como o quadrado do desvio-padrão, temos: o que nos mostra que não conseguimos interpretar esse valor. O coeficiente de variação é dado por: 30 22 anos 90,9s %45,13 100 42,23 15,3 100 cv cv x s cv Slide 1 Slide 2 Slide 3 Slide 4 Slide 5 Slide 6 Slide 7 Slide 8 Slide 9 Slide 10 Slide 11 Slide 12 Slide 13 Slide 14 Slide 15 Slide 16 Slide 17 Slide 18 Slide 19 Slide 20 Slide 21 Slide 22 Slide 23 Slide 24 Slide 25 Slide 26 Slide 27 Slide 28 Slide 29 Slide 30