Baixe o app para aproveitar ainda mais
Prévia do material em texto
54 AD M / CC TB - R ev isã o: Ju lia na M ar ia M en de s - D ia gr am aç ão : L uc as M an sin i - d at a 13 /1 2/ 20 13 / / Ex er cí ci os - Ju lia na - D ia gr am aç ão : M ár ci o - 26 /1 2/ 20 13 Unidade II Unidade II 5 MEDIDAS OU PARÂMETROS ESTATÍSTICOS O estudo que fizemos anteriormente diz respeito ao agrupamento de dados coletados e à representação gráfica de alguns deles. Cumpre agora estudarmos as medidas estatísticas. Esses valores nos darão a imagem sintetizada do comportamento de uma amostra, permitindo que, com relativamente poucas informações, possamos chegar a conclusões sobre essa amostra estudada. Existem basicamente dois grandes grupos de medidas estatísticas. O primeiro grupo é formado pelas medidas de tendência central, também chamadas de medidas de posição, que informam a magnitude da amostra estudada. Essas medidas nos dão uma visão global da amostra sem se aterem às características individuais de seus elementos. No entanto, como é necessário que tenhamos ideia das variações dos elementos da amostra em torno de suas medidas centrais, iremos estudar, também, um segundo grupo de medidas estatísticas: as medidas de dispersão, também chamadas de medidas de variabilidade. 5.1 Medidas de posição As medidas de posição ou medidas de tendência central, como o próprio nome indica, preocupam‑se com definir uma posição central da amostra, ou seja, um valor que seja representativo do que é típico da amostra. Iremos trabalhar com as três principais medidas desse tipo: a média, a mediana e a moda. 5.1.1 Média De todas as medidas de posição, a média é, seguramente, a mais usada. É chamada de média simples quando a frequência dos diversos valores é igual a 1, ou seja, cada valor aparece uma única vez na amostra, e de média ponderada quando os dados são dotados de certa frequência. Existem vários métodos diferentes para calcularmos as médias. Iremos nos preocupar com a principal delas, a média aritmética. As demais (geométrica, quadrática e harmônica), além de serem muito menos utilizadas, seguem os mesmos princípios da média aritmética, apenas com a utilização de operações matemáticas diferentes. A média aritmética é o resultado da soma dos valores de todos os elementos dividido pelo número total de elementos, ou seja, pela frequência total. Em outras palavras, se tivermos um 55 AD M / CC TB - R ev isã o: Ju lia na M ar ia M en de s - D ia gr am aç ão : L uc as M an sin i - d at a 13 /1 2/ 20 13 / / Ex er cí ci os - Ju lia na - D ia gr am aç ão : M ár ci o - 26 /1 2/ 20 13 ESTATÍSTICA conjunto de valores S = {x1, x2, x3,………xn}, a média aritmética desse conjunto será calculada por meio das fórmulas: X x x x x N n = + + + +1 2 3 .... Ou X x N i = Σ Onde: X é a média aritmética; x1, x2, etc. são os diversos valores; N é a quantidade total de elementos da amostra. Exemplo 1. Calcular a média aritmética dos valores relacionados a seguir: S = {2; 5; 7; 9; 10; 12; 16; 18} Observe que são oito elementos de diferentes valores, portanto: X x N X Xi= ⇒ = + + + + + + + ⇒ = Σ 2 5 7 9 10 12 16 18 8 9 9, Exemplo de aplicação 1. Uma corretora de valores relacionou 12 investimentos feitos recentemente e os rendimentos correspondentes a cada um. Os dados estão na tabela a seguir: Tabela 25 12% 13% 18% 9% 10% 11% 13% 15% 16% 14% 8% 17% A partir desse dado, podemos dizer que o rendimento médio dessas aplicações é de: A) 13% B) 12% 56 AD M / CC TB - R ev isã o: Ju lia na M ar ia M en de s - D ia gr am aç ão : L uc as M an sin i - d at a 13 /1 2/ 20 13 / / Ex er cí ci os - Ju lia na - D ia gr am aç ão : M ár ci o - 26 /1 2/ 20 13 Unidade II C) 15% D) 18% E) 16% Caso os valores sejam repetidos na amostra, ou seja, caso tenham uma frequência diferente de 1 (x1 com f1; x2 com f2 e assim por diante), então a fórmula para o cálculo da média aritmética é: X x f f i i i = Σ Σ Este último conceito define a média ponderada; eventualmente, as frequências podem ser substituídas por “pesos” que conferem importância diferenciada a cada valor. O exemplo a seguir mostra o cálculo para dados não agrupados em classe: Exemplo 2. Calcular a média aritmética dos valores relacionados a seguir: Tabela 26 Valor Frequência simples xi fi 25 37 42 28 57 54 62 62 39 12 Como no exemplo anterior, o cálculo da média aritmética consiste na soma de todos os valores dividida pela quantidade total de elementos. Porém, cada um dos valores da tabela aparece certo número de vezes, diferente de 1; por exemplo, o valor 25 aparece 37 vezes, portanto precisamos somar 25 com ele mesmo 37 vezes; ou, de maneira mais direta, precisamos multiplicar 25 por 37. A coluna C mostra todos os cálculos desse tipo. Quando somamos essa coluna, obtemos o valor 9.491, que corresponde à soma de todos os elementos da amostra (193 elementos). Assim, a média é: 57 AD M / CC TB - R ev isã o: Ju lia na M ar ia M en de s - D ia gr am aç ão : L uc as M an sin i - d at a 13 /1 2/ 20 13 / / Ex er cí ci os - Ju lia na - D ia gr am aç ão : M ár ci o - 26 /1 2/ 20 13 ESTATÍSTICA Tabela 27 A B C = A x B Valor Frequência simples Valor x Frequência xi fi xi . fi 25 37 925 42 28 1176 57 54 3078 62 62 3844 39 12 468 ft 193 9491 X x f f X Xi i i = ⇒ = ⇒ = Σ Σ 9491 193 49 2, No caso de dados agrupados em classes, o processo de cálculo é idêntico ao anterior, com a diferença de que o valor a ser usado é o ponto médio de classe (lembre‑se de que já definimos esse valor anteriormente): x pi mi= O exemplo a seguir mostra‑nos, passo a passo, o cálculo da média aritmética ponderada para dados agrupados por classes: Exemplo de aplicação 2. O departamento de produção de uma empresa de confecções anota diariamente quantos defeitos ocorreram na linha de produção. Na tabela a seguir, estão relacionados as informações referentes aos últimos 120 dias de produção. Tabela 28 Número de defeitos diários Número de dias 6 20 7 23 8 21 9 18 10 16 12 13 13 5 14 3 15 1 58 AD M / CC TB - R ev isã o: Ju lia na M ar ia M en de s - D ia gr am aç ão : L uc as M an sin i - d at a 13 /1 2/ 20 13 / / Ex er cí ci os - Ju lia na - D ia gr am aç ão : M ár ci o - 26 /1 2/ 20 13 Unidade II Nessas condições o número médio de defeitos diários é de aproximadamente: A) 7,9 B) 10,0 C) 9,3 D) 8,0 E) 8,7 Exemplo 3. Dada a tabela de frequências a seguir, calcular a média aritmética. Tabela 29 A B C D E = (C + D)/2 F = D x E Classe Limites de classe li ls Frequência simples fi Ponto médio de classe pmi Frequência x ponto médio fi x pmi 1,0 3,0 |‑‑‑‑‑‑‑ 414,0 14,0 208,5 2.919,0 2,0 414,0 |‑‑‑‑‑‑‑ 825,0 19,0 619,5 11.770,5 3,0 825,0 |‑‑‑‑‑‑‑ 1.236,0 41,0 1.030,5 42.250,5 4,0 1.236,0 |‑‑‑‑‑‑‑ 1.647,0 53,0 1.441,5 76.399,5 5,0 1.647,0 |‑‑‑‑‑‑‑ 2.058,0 32,0 1.852,5 59.280,0 6,0 2.058,0 |‑‑‑‑‑‑‑ 2.469,0 27,0 2.263,5 61.114,5 7,0 2.469,0|‑‑‑‑‑‑‑ 2.880,0 20,0 2.674,5 53.490,0 8,0 2.880,0 |‑‑‑‑‑‑‑ 3.291,0 11,0 3.085,5 33.940,5 9,0 3.291,0 |‑‑‑‑‑‑| 3.702,0 8,0 3.496,5 27.972,0 ∑= ft = 225,0 369.136,5 A tabela anterior apresenta os valores e cálculos necessários para determinarmos a média aritmética para uma amostra que estivermos descrevendo. As áreas sombreadas da tabela mostram os cálculos necessários para a obtenção da média aritmética. O uso de uma tabela para esses cálculos facilita as operações, além de estas serem mais facilmente trabalhadas em computador. Nesse exemplo, somamos os valores de todos os elementos da amostra, ficando na seguinte situação: o valor da soma dos 225 elementos da amostra é 369136,5, portanto a média aritmética será de: 59 AD M / CC TB - R ev isã o: Ju lia na M ar ia M en de s - D ia gr am aç ão : L uc as M an sin i - d at a 13 /1 2/ 20 13 / / Ex er cí ci os - Ju lia na - D ia gr am aç ão : M ár ci o - 26 /1 2/ 20 13 ESTATÍSTICA X x f f X Xi i i = ⇒ = ⇒ = Σ Σ 369136 5 225 1640 6 , , É importante observar as seguintes propriedades das médias aritméticas: • a soma algébrica dos afastamentos (ou desvios, ou resíduos) de um conjunto de números tomados em relação à média é nula; • se multiplicarmos ou dividirmos todas as informações por uma constante, a média aritmética ficará multiplicada ou dividida por essa constante; • somando‑se ou subtraindo‑se uma constante de todos os valores de um conjunto de informações, a média aritmética ficará somada ou subtraída dessa constante; • a soma dos quadrados dos desvios tomados em relação à média aritmética é mínima (essa propriedade é muito importante para a definição de desvio‑padrão, que veremos mais à frente) Exemplo de aplicação 3. Uma pequena agência de publicidade relacionou, na tabela a seguir, o custo das suas 120 últimas campanhas publicitárias: Tabela 30 Classes Custo das campanhas publicitárias (limites) Quantidade de campanhas publicitárias (frequência simples) A R$ 5.000 |‑‑‑‑ R$ 10.000 12 B R$ 10.000 |‑‑‑‑ R$ 15.000 15 C R$ 15.000 |‑‑‑‑ R$ 20.000 18 D R$ 20.000 |‑‑‑‑ R$ 25.000 23 E R$ 25.000 |‑‑‑‑ R$ 30.000 25 F R$ 30.000 |‑‑‑‑ R$ 35.000 14 G R$ 35.000 |‑‑‑‑ R$ 40.000 13 Nessas condições, podemos afirmar que o custo médio das campanhas publicitárias dessa agência é de aproximadamente: A) R$ 22.833,00 B) R$ 22.500,00 C) R$ 20.000,00 60 AD M / CC TB - R ev isã o: Ju lia na M ar ia M en de s - D ia gr am aç ão : L uc as M an sin i - d at a 13 /1 2/ 20 13 / / Ex er cí ci os - Ju lia na - D ia gr am aç ão : M ár ci o - 26 /1 2/ 20 13 Unidade II D) R$ 25.833,00 E) R$ 20.833,00 5.1.2 Mediana Conceitualmente, definimos mediana como o valor, em um conjunto de valores ordenados, que divide exatamente esse conjunto em duas metades, com 50% dos valores superiores à mediana e 50% inferiores. Essa definição precisa adaptar‑se ao número N de elementos da amostra: • caso N seja um número ímpar, a mediana será o valor do elemento central (chamado de elemento mediano); • caso N seja um número par, a mediana será a média aritmética simples dos dois elementos centrais (o elemento mediano passa a ser um elemento teórico intermediário). Veja no exemplo a seguir: Exemplo 1. Dados os seguintes conjuntos de notas de alunos de Estatística, calcule a mediana: Grupo A = {6,2; 4,2; 8,7; 6,4; 2,8; 9,1; 5,0; 3,9; 7,1}. Para calcular a mediana é necessário colocar os dados em ordem crescente: {2,8; 3,9; 4,2; 5,0; 6,2; 6,4; 7,1; 8,7; 9,1} Como o número de elementos é ímpar (N = 9), a mediana será o valor do elemento central (o quinto elemento), ou seja, o valor da mediana será 6,2. Poderíamos dar uma roupagem mais matemática ao cálculo utilizando as fórmulas a seguir, onde: Eme é o elemento mediano e Me a mediana: E N E Eme me me= + => = + => = 1 2 9 1 2 5º O valor do quinto elemento é a mediana: Me = 6,2 Grupo B = { 8,4; 6,3; 9,2; 4,9; 6,5; 8,0} Ordenando: {4,9; 6,3; 6,5; 8,0; 8,4; 9,2} 61 AD M / CC TB - R ev isã o: Ju lia na M ar ia M en de s - D ia gr am aç ão : L uc as M an sin i - d at a 13 /1 2/ 20 13 / / Ex er cí ci os - Ju lia na - D ia gr am aç ão : M ár ci o - 26 /1 2/ 20 13 ESTATÍSTICA E N E Eme me me o = + => = + => = 1 2 6 1 2 3 5, Evidentemente, não existe um elemento 3,5º. A mediana será a média aritmética entre o valor do terceiro e do quarto elemento: Me x x Me Me= + => = + => =3 4 2 6 5 8 0 2 7 25 , , , Cálculo semelhante se fará quando trabalhamos com dados agrupados, seja em classes ou não. Primeiro, veremos quando os dados não forem agrupados em classes. Nesse caso, o procedimento é semelhante ao feito no Exemplo 1, com a diferença de que precisaremos calcular a frequência acumulada crescente para permitir localizarmos o elemento mediano. Exemplo de aplicação 4. Uma corretora de valores relacionou 12 investimentos feitos recentemente e os rendimentos correspondentes a cada um. Os dados estão na tabela a seguir: Tabela 31 12% 13% 18% 9% 10% 11% 13% 15% 16% 14% 8% 17% A partir desse dado, podemos dizer que o rendimento mediano dessas aplicações é de: A) 18% B) 12% C) 15% D) 13% E) 16% O exemplo 2 mostra o cálculo em duas situações diferentes: Exemplo 2. Calcular a mediana para os dados relacionados a seguir, relativos ao número de filhos por família moradora em determinada cidade. 62 AD M / CC TB - R ev isã o: Ju lia na M ar ia M en de s - D ia gr am aç ão : L uc as M an sin i - d at a 13 /1 2/ 20 13 / / Ex er cí ci os - Ju lia na - D ia gr am aç ão : M ár ci o - 26 /1 2/ 20 13 Unidade II Tabela 32 – Cidade A Número de filhos por família Quantidade de familias na cidade Frequência acumulada crescente Valor Frequência simples xi fi fac 0 15 15 1 18 33 2 12 45 3 8 53 4 5 58 5 3 61 6 1 62 Mais do que 6 1 63 Soma 63 Perceba que o número de elementos (N = 63) é ímpar, logo o elemento mediano será o 32º: E Eme me= + => = 63 1 2 32º O 32º elemento tem o valor 18, isso porque, com os valores ordenados, os 15 primeiros referem‑se a famílias com 0 filho; o 16º ao 33º valor referem‑se a famílias com 1 filho, e assim por diante. Logo a mediana será: Me = 18 Portanto, podemos afirmar que 50% das famílias têm um filho ou menos, e 50% das famílias têm um filho ou mais. Tabela 33 – Cidade B Número de filhos por família Quantidade de famílias na cidade Frequência acumulada crescente Valor Frequência simples xi fi fac 0 15 15 1 21 36 2 16 52 3 9 61 4 6 67 5 4 71 6 1 72 Mais do que 6 0 72 Soma 72 63 AD M / CC TB - R ev isã o: Ju lia na M ar ia M en de s - D ia gr am aç ão : L uc as M an sin i - d at a 13 /1 2/ 20 13 / / Ex er cí ci os - Ju lia na - D ia gr am aç ão : M ár ci o - 26 /1 2/ 20 13 ESTATÍSTICA Perceba que o número de elementos (N = 72) é par, logo o elemento mediano seria o 36,5º, que, evidentemente, não existe. E Eme me o = + => = 72 1 2 36 5, O 36º elemento tem o valor 1,e o 37º, o valor o valor 2, portanto o 36,5º seria um valor médio entre esses dois valores, ou seja, a mediana será: Me Me= + => = 1 2 2 15, Portanto, podemos afirmar que 50% das famílias têm menos de 1,5 filho e 50% das famílias tem mais de 1,5 filho. Exemplo de aplicação 5. O departamento de produção de uma empresa de confecções anota diariamente quantos defeitos ocorreram na linha de produção. Na tabela a seguir estão relacionadas as informações referentes aos últimos 120 dias de produção. Tabela 34 Número de defeitos diários Número de dias 6 20 7 23 8 21 9 18 10 16 12 13 13 5 14 3 15 1 Nessas condições, o número médio de defeitos diários é de aproximadamente: A) 7,9 B) 10,0 C) 9,3 64 AD M / CC TB - R ev isã o: Ju lia na M ar ia M en de s - D ia gr am aç ão : L uc as M an sin i - d at a 13 /1 2/ 20 13 / / Ex er cí ci os - Ju lia na - D ia gr am aç ão : M ár ci o - 26 /1 2/ 20 13 Unidade II D) 8,0 E) 8,7 O cálculo da mediana, quando trabalhamos com dados agrupados em classes, é mais trabalhoso porque conseguimos determinar o elemento mediano e a classe da qual o elemento faz parte, mas não o valor exato da mediana. A maneira de contornarmos esse inconveniente é utilizando os conceitos de interpolação. Lembrete No nosso contexto, interpolar significa encontrar, dentro de uma faixa de valores, aquele valor que melhor corresponde às condições estabelecidas, normalmente situado entre dois outros valores conhecidos. No caso do cálculo da mediana, o processo de interpolação gera a seguinte fórmula, que sempre iremos usar: Me li E f f hMe me ac ant Me = + − × Onde: Me = Mediana. lime = Limite inferior da classe que contém o elemento mediano (classe mediana). Eme = Elemento mediano. fac ant = Frequência acumulada crescente até a classe anterior à classe mediana. fme = Frequência da classe mediana. h = Amplitude da classe mediana. O Exemplo 3, a seguir, demonstra o cálculo da mediana para uma distribuição de vendas em reais agrupadas por classe. Exemplo 3. Calcular a mediana para a tabela a seguir, que apresenta a distribuição de vendas de determinada empresa. 65 AD M / CC TB - R ev isã o: Ju lia na M ar ia M en de s - D ia gr am aç ão : L uc as M an sin i - d at a 13 /1 2/ 20 13 / / Ex er cí ci os - Ju lia na - D ia gr am aç ão : M ár ci o - 26 /1 2/ 20 13 ESTATÍSTICA Tabela 35 Classes número Vendas mensais em R$ Quantidade de meses Frequência acumulada crescenteValor frequência li ls fi fac 1 R$ 50.000,00 |‑‑‑‑ R$ 80.000,00 12 12 2 R$ 80.000,00 |‑‑‑‑ R$ 110.000,00 18 30 3 R$ 110.000,00 |‑‑‑‑ R$ 140.000,00 27 57 4 R$ 140.000,00 |‑‑‑‑ R$ 170.000,00 26 83 5 R$ 170.000,00 |‑‑‑‑ R$ 200.000,00 21 104 6 R$ 200.000,00 |‑‑‑‑ R$ 230.000,00 18 122 7 R$ 230.000,00 |‑‑‑‑ R$ 260.000,00 12 134 8 R$ 260.000,00 |‑‑‑| R$ 290.000,00 9 143 TOTAL 143 O elemento mediano é dado por: E Eme me= + => = 143 1 2 72º O 72º elemento está na quarta classe, que chamamos de classe mediana, ou seja, a mediana é um valor entre R$ 140.000,00 e R$ 170.000,00. Obteremos o resultado usando a fórmula da interpolação: Me li E f f hMe me ac ant Me = + − × = + − ×. .140 000 72 57 26 30 0000 157 307 69=> =Me . , Portanto, podemos afirmar que 50% das vendas mensais dessa empresa estão acima de R$ 157.307,69, e 50%, abaixo desse valor. Exemplo de aplicação 6. Uma pequena agência de publicidade relacionou, na tabela seguinte, o custo das suas 120 últimas campanhas publicitárias: Tabela 36 Classes Custo das campanhas publicitárias Quantidade de campanhas publicitárias (frequência simples) A R$ 5.000 ï‑‑‑‑ R$ 10.000 12 B R$ 10.000 ï‑‑‑‑ R$ 15.000 15 C R$ 15.000 ï‑‑‑‑ R$ 20.000 18 D R$ 20.000 ï‑‑‑‑ R$ 25.000 23 E R$ 25.000 ï‑‑‑‑ R$ 30.000 25 F R$ 30.000 ï‑‑‑‑ R$ 35.000 14 G R$ 35.000 ï‑‑‑‑ R$ 40.000 13 66 AD M / CC TB - R ev isã o: Ju lia na M ar ia M en de s - D ia gr am aç ão : L uc as M an sin i - d at a 13 /1 2/ 20 13 / / Ex er cí ci os - Ju lia na - D ia gr am aç ão : M ár ci o - 26 /1 2/ 20 13 Unidade II Nessas condições podemos afirmar que o custo mediano das campanhas publicitárias dessa agência é de aproximadamente: A) R$ 22.370 B) R$ 22.500 C) R$ 23.370 D) R$ 25.833 E) R$ 20.833 5.1.3 Moda O conceito de moda é o mais simples entre as medidas estatísticas. Trata‑se do valor que mais vezes se repete numa distribuição de frequências, ou seja, aquele dotado de maior frequência. O cálculo da moda para dados isolados ou para dados não agrupados em classes é imediato: decorre de simples observação, como mostra o Exemplo 1; já para dados agrupados necessitamos adotar algumas recomendações feitas por estatísticos renomados. No Exemplo 2, apresentamos um cálculo deste último tipo de distribuição. Exemplo 1. Calcular a moda para os conjuntos de dados mostrados a seguir, referentes ao consumo de rolamentos (em unidades) em várias linhas de produção. Linha A: {21; 22; 24; 24; 25; 25; 25; 27; 28} A moda evidentemente é: Mo = 25 Linha B: {8; 8; 9; 9; 9; 9; 10; 11; 11; 11; 11; 12; 12; 12} Neste conjunto temos duas modas: Mo = 9 e Mo = 11. Chamamos de amostra multimodal. Linha C: {15; 18; 25; 32; 43; 50; 61} Não existe um valor que se repita mais de uma vez. Temos uma amostra sem moda, ou seja, amodal. 67 AD M / CC TB - R ev isã o: Ju lia na M ar ia M en de s - D ia gr am aç ão : L uc as M an sin i - d at a 13 /1 2/ 20 13 / / Ex er cí ci os - Ju lia na - D ia gr am aç ão : M ár ci o - 26 /1 2/ 20 13 ESTATÍSTICA Tabela 37 Quantidade de rolamentos conumidos Número de vezes em que ocorreu o consumo xi fi Valor Frequência 8 18 10 25 12 32 13 45 15 28 16 21 17 12 21 8 A moda é o valor de maior frequência; portanto, para a linha D, teríamos Mo = 13 Exemplo de aplicação 7. Uma corretora de valores relacionou 12 investimentos feitos recentemente e os rendimentos correspondentes a cada um. Os dados estão na tabela que segue: Tabela 38 12% 13% 18% 9% 10% 11% 13% 15% 16% 14% 8% 17% A partir desse dado, podemos dizer que o rendimento modal dessas aplicações é de: A) 18% B) 13% C) 15% D) 12% E) 16% 8. O departamento de produção de uma empresa de confecções anota diariamente quantos defeitos ocorreram na linha de produção. Na tabela a seguir estão relacionadas as informações referentes aos últimos 120 dias de produção. 68 AD M / CC TB - R ev isã o: Ju lia na M ar ia M en de s - D ia gr am aç ão : L uc as M an sin i - d at a 13 /1 2/ 20 13 / / Ex er cí ci os - Ju lia na - D ia gr am aç ão : M ár ci o - 26 /1 2/ 20 13 Unidade II Tabela 39 Número de defeitos diários Número de dias 6 20 7 23 8 21 9 18 10 16 12 13 13 5 14 3 15 1 Nessas condições, o número modal de defeitos diários é de aproximadamente: A) 7,0 B) 6,0 C) 9,0 D) 8,0 E) 8,7 Exemplo 2. Calcular a moda para a distribuição de rendas familiaresapresentada na tabela a seguir. Classes número Rendas familiares mensais em R$ Quantidade de meses Valor Frequência li ls fi 1 R$ 650,00 |‑‑‑‑ R$ 1.100,00 16 2 R$ 1.100,00 |‑‑‑‑ R$ 1.550,00 21 3 R$ 1.550,00 |‑‑‑‑ R$ 2.000,00 28 4 R$ 2.000,00 |‑‑‑‑ R$ 2.450,00 31 5 R$ 2.450,00 |‑‑‑‑ R$ 2.900,00 18 6 R$ 2.900,00 |‑‑‑‑ R$ 3.350,00 16 7 R$ 3.350,00 |‑‑‑‑ R$ 3.800,00 12 Total 142 69 AD M / CC TB - R ev isã o: Ju lia na M ar ia M en de s - D ia gr am aç ão : L uc as M an sin i - d at a 13 /1 2/ 20 13 / / Ex er cí ci os - Ju lia na - D ia gr am aç ão : M ár ci o - 26 /1 2/ 20 13 ESTATÍSTICA Você pode notar que os valores se repetem mais na classe 4 (a frequência é a maior de todas), logo a moda deve ser um valor entre R$ 2.000,00 e R4 2.450,00. Mas exatamente qual é o valor da moda? Normalmente esse cálculo pode ser feito por três recomendações diferentes: as formulas de Czuber, King e Pearson, que utilizaremos a seguir. Observação Recomendação é diferente de equacionamento matemático. Decorre de estudos, normalmente empíricos, que apresentam validade prática, mas não exatidão matemática. São, portanto, aproximações. Recomendação de Czuber Para utilizarmos a recomendação de Czuber devemos inicialmente localizar a classe que tem maior frequência, a chamada classe modal. No nosso exemplo essa classe é a de número 4, como já falamos. Em seguida aplicamos a seguinte fórmula: Mo li f f f f f f hMo Mo ant Mo ant Mo post = + − − + − × ( ) ( ) ( ) Onde: Mo = Moda. Limo = Limite inferior da classe modal. fmo = Frequência da classe modal. fant = Frequência da classe imediatamente anterior à classe modal. fpost = Frequência da classe imediatamente posterior à classe modal. h = Amplitude da classe modal. No nosso exemplo, ficaria: Mo Mo R= + − −( ) + − × => =2 000 31 28 31 28 31 18 450 2 084 61. ( ) ( ) $ . , 70 AD M / CC TB - R ev isã o: Ju lia na M ar ia M en de s - D ia gr am aç ão : L uc as M an sin i - d at a 13 /1 2/ 20 13 / / Ex er cí ci os - Ju lia na - D ia gr am aç ão : M ár ci o - 26 /1 2/ 20 13 Unidade II Recomendação de King Como no cálculo anterior, para utilizarmos a recomendação de King, devemos inicialmente localizar a classe que tem maior frequência, a chamada classe modal. No nosso exemplo, essa classe é a de número 4, como já falamos. Em seguida, aplicamos a seguinte fórmula: Mo li f f f hMo post ant post = + + × Onde: Mo = Moda. limo = Limite inferior da classe modal. fant = Frequência da classe imediatamente anterior à classe modal. fpost = Frequência da classe imediatamente posterior à classe modal. h = Amplitude da classe modal. No nosso exemplo ficaria: Mo Mo R= + + × => =2 000 18 28 18 450 2 176 09. $ . , Recomendação de Pearson No caso de Pearson, a recomendação parte de conceito diferente do adotado nas anteriores. Baseia‑se no uso da média e da mediana: Mo Me X= × − ×3 2 Onde: Mo = Moda. Me = Mediana. X = Média. 71 AD M / CC TB - R ev isã o: Ju lia na M ar ia M en de s - D ia gr am aç ão : L uc as M an sin i - d at a 13 /1 2/ 20 13 / / Ex er cí ci os - Ju lia na - D ia gr am aç ão : M ár ci o - 26 /1 2/ 20 13 ESTATÍSTICA No nosso exemplo teríamos: Me = R$ 2.094,36 X = R$ 2.123,59 Logo, a moda seria: Mo = 3 x 2.094,36 ‑ 2 x 2.123,59 => Mo = R$ 2.035,90 Cada recomendação resultou em um valor diferente. Isso ocorre porque são recomendações que partem de considerações diferentes. A experiência nos ensina qual é a melhor recomendação a utilizar em cada caso prático. Exemplo de aplicação 9. Uma pequena agência de publicidade relacionou na seguinte tabela o custo das suas 120 últimas campanhas publicitárias: Tabela 40 Classes Custo das campanhas publicitárias (limites) Quantidade de campanhas publicitárias (frequência simples) A R$ 5.000 |‑‑‑‑ R$ 10.000 12 B R$ 10.000 |‑‑‑‑ R$ 15.000 15 C R$ 15.000 |‑‑‑‑ R$ 20.000 18 D R$ 20.000 |‑‑‑‑ R$ 25.000 23 E R$ 25.000 |‑‑‑‑ R$ 30.000 25 F R$ 30.000 |‑‑‑‑ R$ 35.000 14 G R$ 35.000 |‑‑‑‑ R$ 40.000 13 Nessas condições, podemos afirmar que o custo modal (pelo Método de King) das campanhas publicitárias dessa agência é de aproximadamente: A) R$ 27.500 B) R$ 30.000 C) R$ 28.370 D) R$ 25.000 E) R$ 26.892 72 AD M / CC TB - R ev isã o: Ju lia na M ar ia M en de s - D ia gr am aç ão : L uc as M an sin i - d at a 13 /1 2/ 20 13 / / Ex er cí ci os - Ju lia na - D ia gr am aç ão : M ár ci o - 26 /1 2/ 20 13 Unidade II O uso de cada uma dessas medidas depende da situação prática que se apresenta. Bruni (2007) apresenta uma série de vantagens e desvantagens de cada uma delas, as quais podem ser resumidas no quadro a seguir: Quadro 2 Medida de posição Vantagens Desvantagens Média É de fácil compreensão, podendo ser calculada diretamente usando‑se calculadoras apropriadas. É afetada por valores extremos da série, não representando com precisão a distribuição em que esses valores ocorrem com frequencia acentuada. Depende de todos os valores da distribuição, usando todos os dados disponíveis. É necessário conhecer todos os valores da distribuição. Evidencia bastante estabilidade de amostra para amostra. A média não tem, necessáriamente, existência real. Possibilita a manipulação de dados, com cálculo de médias combinadas Pode ser obtida uma média de número fracionario inexistente, por exemplo, 6,7 alunos. Pode ser facilmente incluida em equações matemáticas Mediana Mesmo que alguns valores da série sejam modificados, ela pode manter‑se inalterada Se for determinada a mediana dos grupos separados, não será encontrada a mediana do grupo. Os valores extremos não interferem no seu resultado, por isso é indicada quando existem valores discrepantes. Mesmo que os valores mais altos ou mais baixos da série não estejam definidos, ela pode ser determinada. Pode ser utilizada para dados que têm a possibilidade de ser ordenados. Moda Caso algum valor da série seja modificado, não necessariamente a moda se alterará. A moda tem de ter, necessariamente, um valor real, já que ela é representada por algum valor da série. Os valores extremos não interferem no seu resultado. Quando utilizadas para calcular distribuições de classe aberta, não pode ser determinada a moda empregando‑se algum procedimento aritmético elementar. Pode ser calculada em distribuições que possuam classe indeterminada. Fonte: Bruni (2007). 5.2 Medidas de dispersão As medidas de dispersão completam a informação contida nas medidas de posição, revelando o afastamento ou o desvio dos elementos do valor central. Quanto menor for a dispersão de uma amostra, maior será a qualidade da informação contida na medida de posição, ou, em outras palavras, menor a margem de erro que será assumida, considerando a medida de posição como representante de toda a amostra. 73 AD M / CC TB - R ev isã o: Ju lia na M ar ia M en de s - D ia gr am aç ão : L uc as M an sini - d at a 13 /1 2/ 20 13 / / Ex er cí ci os - Ju lia na - D ia gr am aç ão : M ár ci o - 26 /1 2/ 20 13 ESTATÍSTICA Essas medidas, também chamadas de medidas de variabilidade, caracterizam a homogeneidade ou heterogeneidade da amostra. Quanto menor o valor, mais homogênea a amostra será. Existem basicamente dois grandes grupos de medidas de dispersão: • medidas de dispersão absolutas: levam em conta a dispersão propriamente dita; • medidas de dispersão relativas: levam em conta, simultaneamente, uma medida de posição e a medida de dispersão correspondente. São úteis para efetuarmos comparações entre amostras. O objetivo deste tópico é tomarmos contato com ambos os grupos. 5.2.1 Medidas de dispersão absolutas 5.2.1.1 Amplitude total A amplitude total (AT) já é nossa conhecida e é a mais elementar das medidas de dispersão. É extremamente fácil de ser calculada, mas de difícil interpretação, em especial quando os dados extremos são muito grandes ou muito pequenos. Portanto, é mais utilizada quando as distribuições apresentam certa homogeneidade. Por exemplo, suponha que tenhamos as valorizações mensais das ações de duas diferentes empresas, A e B, com os seguintes valores (dados em porcentagem): Empresa A = {21,5; 18,0; 26,3; 32,4; 45,1; 18,6; 37,6} Empresa B = {15,3; 19,7; 23,9; 16,7; 25,9; 14,6; 18,9; 25,8} As amplitudes seriam, respectivamente, de 45,1 – 18,0 = 27,1% para as ações da empresa A e de 25,9 – 14,6 = 11,3% para a empresa B. Em outras palavras, as variações máximas seriam de 27,1% para as ações da empresa A e de 11,3% para a empresa B. Logo, o risco de oscilação é maior para a empresa A do que para a empresa B. 5.2.1.2 Desvio médio Definido como a média aritmética do módulo dos desvios dos elementos em relação à média destes. Lembrete Módulo ou valor absoluto de um número é a distância deste número para zero, independentemente do sinal, ou seja, módulo de um número será o próprio número, se ele for positivo, ou seu simétrico (positivo), se for negativo. 74 AD M / CC TB - R ev isã o: Ju lia na M ar ia M en de s - D ia gr am aç ão : L uc as M an sin i - d at a 13 /1 2/ 20 13 / / Ex er cí ci os - Ju lia na - D ia gr am aç ão : M ár ci o - 26 /1 2/ 20 13 Unidade II Saiba mais Os conceitos básicos sobre módulo ou valor absoluto podem ser revistos no seguinte artigo: MIRANDA, D. Definição de módulo de um número real. Mundo Educação, Goiânia, [s.d.]. Disponível em: <http://www.mundoeducacao.com/matematica/ definicao‑modulo‑um‑numero‑real.htm>. Acesso em: 6 dez. 2013. Entende‑se por desvio a diferença entre o valor de um elemento da amostra e a média dessa mesma amostra: d x Xi i= − Portanto, o desvio médio será dado pela fórmula: dm d N i n i = =Σ 1| | O exemplo a seguir deixará mais claro esse processo. Exemplo 1. Calcular o desvio médio da amostra {18; 21; 22; 27; 28; 29; 32; 37}. O primeiro passo será calcular a média aritmética desses valores e, em seguida, os desvios de cada um dos valores. Depois, somaremos o módulo desses valores dividindo‑os pelo número total de elementos da amostra. A tabela a seguir mostra passo a passo esses cálculos: Tabela 41 Ordem dos elementos Valores xi Desvios di = xi - X Módulo dos desvios | di = xi - X | 1 18 18 ‑ 27 = ‑9 9 2 21 21 ‑ 27 = ‑6 6 3 22 22 ‑ 27 = ‑5 5 4 27 27 ‑ 27 = 0 0 5 28 28 ‑ 27 = 1 1 6 29 29 ‑ 27 = 2 2 7 33 33 ‑ 27 = 6 6 8 38 38 ‑ 27 = 11 11 Soma 216 0 40 Média ( X ) 216/8=27 Desvio médio (dm) 40/8 = 5 Observe que a soma dos desvios é zero. O próprio conceito de média (valor equidistante de todos os elementos da amostra) nos conduz a isso. O conceito de desvio médio só tem sentido quando utilizamos 75 AD M / CC TB - R ev isã o: Ju lia na M ar ia M en de s - D ia gr am aç ão : L uc as M an sin i - d at a 13 /1 2/ 20 13 / / Ex er cí ci os - Ju lia na - D ia gr am aç ão : M ár ci o - 26 /1 2/ 20 13 ESTATÍSTICA o módulo dos desvios. Para ficar mais claro, veja a seguir os cálculos feitos, utilizando‑se das fórmulas informadas: Cálculo da média: X x N X Xi= ⇒ = ⇒ = Σ 216 8 27 Cálculo do desvio médio: dm d N dm dmi n i = => = => == ∑ 1 40 8 5 | | Quando trabalhamos com dados agrupados em classes ou não, utilizamos exatamente o mesmo processo de cálculo, evidentemente, com alterações nas fórmulas de cálculo, introduzindo o conceito de frequência simples, como mostramos a seguir: dm d f f i n i i i n i = × = = ∑ ∑ 1 1 | | Observar que, para dados agrupados em classes, o cálculo dos desvios é dado por: d pm Xi i= − Os exemplos a seguir demonstram esses cálculos. Exemplo 2. Calcular o desvio médio da amostra de distribuição a seguir, relativa ao número de acidentes diários numa estrada federal. Tabela 42 – Distribuição de acidentes por dia – Estrada X Número de acidentes diários Dias pesquisados Valor x frequência Desvios Módulo dos desvios Módulo dos desvios x FrequênciaValor Frequência xi fi xi.fi di = xi ‑ X | di = xi ‑ X | | di | x fi 0 12 0 ‑3,6 3,6 43,5 1 15 15 ‑2,6 2,6 39,4 2 28 56 ‑1,6 1,6 45,6 4 23 92 0,4 0,4 8,6 5 19 95 1,4 1,4 26,1 6 8 48 2,4 2,4 19,0 8 6 48 4,4 4,4 26,2 76 AD M / CC TB - R ev isã o: Ju lia na M ar ia M en de s - D ia gr am aç ão : L uc as M an sin i - d at a 13 /1 2/ 20 13 / / Ex er cí ci os - Ju lia na - D ia gr am aç ão : M ár ci o - 26 /1 2/ 20 13 Unidade II 10 4 40 6,4 6,4 25,5 11 2 22 7,4 7,4 14,7 12 1 12 8,4 8,4 8,4 Somas 118 428 257,0 Média 3,6 Desvio médio 2,2 dm d f f dm dmi n i i i n i = × => = => == = ∑ ∑ 1 1 257 118 2 2 | | , Exemplo 3. Calcular o desvio médio da amostra de distribuição a seguir, relativa ao tempo de mão de obra gasto com a manutenção dos aviões de uma empresa aérea. Tabela 43 – Distribuição de horas de manutenção – Aero X Classes Limites de classes Pontos médios de classe Manutenções pesquisadas Valor x frequência Desvios Módulo dos desvios Módulo dos desvios x frequência Valor Frequência li ls pmi fi pmi.fi di = xi - X | di = xi - X | | di | x fi 1 0 |‑‑‑ 3 1,5 26 39 ‑4,1 4,1 106,0 2 3 |‑‑‑ 6 4,5 20 90 ‑1,1 1,1 21,5 3 6 |‑‑‑ 9 7,5 16 120 1,9 1,9 30,8 4 9 |‑‑‑ 12 10,5 10 105 4,9 4,9 49,2 5 12 |‑‑| 15 13,5 6 81 7,9 7,9 47,5 Somas 78 435 255,1 Média 5,6 Desvio médio 3,3 dm d f f dm dmi n i i i n i = × => = => == = ∑ ∑ 1 1 255 1 78 3 3 | | , , 5.2.1.3 Variância A definição de desvio médio leva em consideração os desvios dos elementos tomados à primeira potência. Matematicamente, demonstra‑se que os efeitos de desvio são mais bem‑representados quando tomados ao quadrado. Observação Dois motivos justificam os desvios ao quadrado: a soma dos quadrados dos desvios tomados ao quadrado é mínima; e, elevando ao quadrado, resolvemos o problema de alguns desvios serem positivos e outros negativos, gerando soma algébrica zero. 77 AD M / CC TB - R ev isã o: Ju lia na M ar ia M en de s - D ia gr am aç ão : L uc as M an sin i - d at a 13 /1 2/ 20 13 / / Ex er cí ci os- Ju lia na - D ia gr am aç ão : M ár ci o - 26 /1 2/ 20 13 ESTATÍSTICA Essa consideração nos leva à definição das duas mais importantes medidas de variabilidade absolutas: a variância e o desvio‑padrão, que veremos em seguida. A variância é o somatório dos desvios tomados ao quadrado, ou seja, é basicamente a mesma definição do desvio médio, alterando‑se apenas a potência dos desvios: S d N i n i2 1 2 1 = − = ∑ Observação O denominador N – 1 justifica‑se pelos chamados graus de liberdade, que podem ser entendidos com o número de espaços entre os dados. No decorrer do curso, utilizaremos a fórmula apresentada para amostras e a mesma fórmula com denominador igual a N para populações. No caso em que estivermos trabalhando com dados agrupados, a fórmula, naturalmente, deverá incluir o conceito de frequência simples, ou seja: S d f f i n i i i n i 2 1 2 1 1 = × − = = ∑ ∑ Os Exemplos de 1 a 3 no próximo subtópico mostram o cálculo da variância nos vários casos possíveis. 5.2.1.4 Desvio‑padrão O cálculo ou a análise da variância tem um grande inconveniente prático: apresenta unidades ao quadrado em relação à medida de tendência central. Por exemplo, suponha que queiramos descrever uma amostra de salários de uma empresa. Poderíamos afirmar que o salário médio da empresa é de 1.340 reais, e a variância, de 11.025 reais ao quadrado. Observe a estranheza que causa a unidade: “reais ao quadrado”. Sem falar do número extravagante que resultou dos cálculos. Para contornar esse problema, define‑se a mais utilizada das medidas de variabilidade: o desvio‑padrão. Conceitualmente, o desvio‑padrão é a raiz quadrada da variância e é simbolizado pela letra S (maiúscula). Dessa forma, é calculado pelas fórmulas: S d N i n i = − = ∑ 1 2 1 78 AD M / CC TB - R ev isã o: Ju lia na M ar ia M en de s - D ia gr am aç ão : L uc as M an sin i - d at a 13 /1 2/ 20 13 / / Ex er cí ci os - Ju lia na - D ia gr am aç ão : M ár ci o - 26 /1 2/ 20 13 Unidade II para dados isolados e S d f f i n i i i n i = × − = = ∑ ∑ 1 2 1 1 para dados agrupados em classes ou não. Nos Exemplos de 1 a 3 a seguir, são calculados os valores do desvio‑padrão e da variância, de maneira semelhante ao que foi feito anteriormente para o desvio médio. Observe que o cálculo obedece aos seguintes passos, em ambos os casos: • calcular a média da distribuição; • calcular os desvios de cada elemento; • calcular o quadrado dos desvios; • somar o quadrado dos desvios (usando o conceito de frequência, caso sejam dados agrupados); • dividir a soma obtida pelo número de elementos menos 1, obtendo‑se a variância; • extrair a raiz quadrada, obtendo‑se o desvio‑padrão. Exemplo 1. Calcular a média e o desvio‑padrão da amostra {18; 21; 22; 27; 28; 29; 32; 37}. Tabela 44 Ordem dos elementos Valores xi Desvios di = xi - X Desvios ao quadrado di 2 1 18 18 ‑ 27 = ‑9 81 2 21 21 ‑ 27 = ‑6 36 3 22 22 ‑ 27 = ‑5 25 4 27 27 ‑ 27 = 0 0 5 28 28 ‑ 27 = 1 1 6 29 29 ‑ 27 = 2 4 7 33 33 ‑ 27 = 6 36 8 38 38 ‑ 27 = 11 121 Soma 216 0 304 Média 216/8=27 Variância 304/7 = 43,4 Desvio‑padrão 6,6 79 AD M / CC TB - R ev isã o: Ju lia na M ar ia M en de s - D ia gr am aç ão : L uc as M an sin i - d at a 13 /1 2/ 20 13 / / Ex er cí ci os - Ju lia na - D ia gr am aç ão : M ár ci o - 26 /1 2/ 20 13 ESTATÍSTICA Cálculo da média: X x N X Xi= ⇒ = ⇒ = Σ 216 8 27 Cálculo da variância: S d N S Si n i2 1 2 2 2 1 304 8 1 43 4= − => = − => == ∑ , Cálculo do desvio‑padrão: S d N S S Si n i = − => = − => = => == ∑ 1 2 1 304 8 1 43 4 6 6, , Mo = 26.892 Exemplo de aplicação 10. As últimas dez ligações telefônicas para um call center duraram, em minutos, os seguintes valores: Tabela 45 15 12 16 18 14 11 17 16 12 13 Para esses dados, podemos dizer que o valor aproximado do desvio‑padrão é: A) 3,0 B) 3,2 C) 1,6 D) 2,4 E) 2,2 80 AD M / CC TB - R ev isã o: Ju lia na M ar ia M en de s - D ia gr am aç ão : L uc as M an sin i - d at a 13 /1 2/ 20 13 / / Ex er cí ci os - Ju lia na - D ia gr am aç ão : M ár ci o - 26 /1 2/ 20 13 Unidade II Exemplo 2. Calcular a variância e o desvio‑padrão da amostra de distribuição a seguir, relativa ao número de acidentes diários numa estrada federal. Tabela 46 – Distribuição de acidentes por dia – Estrada X Número de acidentes diários Dias pesquisados Valor x Frequência Desvios Quadrado dos desvios Quadrado dos desvios x FrequênciaValor Frequência xi fi xi.fi di = xi ‑ X di 2 di 2 x fi 0 12 0 ‑3,6 13,2 157,9 1 15 15 ‑2,6 6,9 103,5 2 28 56 ‑1,6 2,6 74,1 4 23 92 0,4 0,1 3,2 5 19 95 1,4 1,9 35,8 6 8 48 2,4 5,6 45,0 8 6 48 4,4 19,1 114,7 10 4 40 6,4 40,6 162,5 11 2 22 7,4 54,4 108,7 12 1 12 8,4 70,1 70,1 Somas 118 428 875,6 Média 3,6 Variância 7,5 Desvio médio 2,7 Cálculo da variância: S d f f S Si n i i i n i 2 1 2 1 2 2 1 875 6 118 1 7 5= × − => = − => == = ∑ ∑ , , Cálculo do desvio‑padrão: S d f f S S Si n i i i n i = × − => = − => = => == = ∑ ∑ 1 2 1 1 875 6 118 1 7 5 2 7 , , , Exemplo de aplicação 11. A CIPA de uma empresa relacionou o número de acidentes ocorridos nos últimos seis anos, montando a seguinte tabela: 81 AD M / CC TB - R ev isã o: Ju lia na M ar ia M en de s - D ia gr am aç ão : L uc as M an sin i - d at a 13 /1 2/ 20 13 / / Ex er cí ci os - Ju lia na - D ia gr am aç ão : M ár ci o - 26 /1 2/ 20 13 ESTATÍSTICA Tabela 47 Número de acidentes por mês Número de meses 0 38 1 12 2 9 3 7 4 4 5 2 O desvio‑padrão dos acidentes nessa empresa é de: A) 0,4 B) 0,5 C) 0,6 D) 0,7 E) 0,8 Exemplo 3. Calcular o desvio‑padrão da amostra de distribuição a seguir, relativa ao tempo de mão de obra gasto com a manutenção dos aviões de uma empresa aérea. Tabela 48 – Distribuição das horas de manutenção – Aero X Classes Limites de classes Pontos médios de classe Manutenções pesquisadas Valor x Frequência Desvios Quadrado dos desvios Quadrado dos desvios x FrequênciaValor Frequência li ls pmi fi pmi.fi di = xi - X di 2 di 2 x fi 1 0 |‑‑‑ 3 1,5 26 39 ‑4,1 16,6 432,2 2 3 |‑‑‑ 6 4,5 20 90 ‑1,1 1,2 23,2 3 6 |‑‑‑ 9 7,5 16 120 1,9 3,7 59,2 4 9 |‑‑‑ 12 10,5 10 105 4,9 24,2 242,4 5 12 |‑‑| 15 13,5 6 81 7,9 62,8 376,7 Somas 78 435 1133,5 Média 5,6 Variância 14,7 Desvio‑padrão 3,8 82 AD M / CC TB - R ev isã o: Ju lia na M ar ia M en de s - D ia gr am aç ão : L uc as M an sin i - d at a 13 /1 2/ 20 13 / / Ex er cí ci os - Ju lia na - D ia gr am aç ão : M ár ci o - 26 /1 2/ 20 13 Unidade II Cálculo da variância: S d f f S Si n i i i n i 2 1 2 1 2 2 1 11335 78 1 14 7= × − => = − => == = ∑ ∑ , , Cálculo do desvio‑padrão: S d f f S S Si n i i i n i = × − => = − => = => == = ∑ ∑ 1 2 1 1 1133 5 78 1 14 7 3 8 , , , O desvio‑padrão é a mais utilizada medida de dispersão, e, quando relacionada com a média, informa a quantidade de elementos da amostra ou da população que se situam em torno da média. O mais comum, na Estatística, é que essa relação entre média e desvio‑padrão seja feita pela chamada distribuição normal, à qual nós voltaremos na disciplina Estatística Aplicada. Nessa relação, válida na maior parte dos casos práticos, há os seguintes intervalos: • entre a média mais uma vez o desvio‑padrão e a média menos uma vez o desvio‑padrão, estão contidos 68% dos elementos da amostra ou da população; • entre a média mais duas vezes o desvio‑padrão e a média menos duas vezes o desvio‑padrão, estão contidos 85% dos elementos da amostra ou da população; • entre a média mais três vezes o desvio‑padrão e a média menos três vezes o desvio‑padrão, estão contidos 99,74% dos elementos da amostra ou da população; • entre a média mais quatro vezes o desvio‑padrão e a média menos quatro vezes o desvio‑padrão, estão contidos 100% dos elementos da amostra ou da população. Exemplo 4. Um estudo estatístico com 4.850 alunos de Administração da Produção de uma universidade mostrou que a nota final média deles foi de 5,3 com desvio‑padrão de 1,2. Quantos alunos tiveram médias finais entre 4,1 e 6,5? Observe que as notas: 4,1 e 6,5 correspondem exatamente à média menos um desvio‑padrão (5,3 – 1,2 = 4,1) e à média mais um desvio‑padrão (5,3 + 1,2 = 6,5). Portanto, 68% dos alunos estão contidos nesse intervalo, ou seja: 68% de 4.850 são 3.298 alunos. Como 60% de 4.850 é 3.298, podemos afirmar que essa é a quantidade de alunos que tiveram notas entre 4,1 e 6,5. 83 AD M / CC TB - R ev isã o: Ju lia na M ar ia M en de s - D ia gr am aç ão : L uc as M an sin i - d at a 13 /1 2/ 20 13 / / Ex er cí ci os - Ju lia na - D ia gr am aç ão : M ár ci o - 26 /1 2/ 20 13 ESTATÍSTICA Exemplo de aplicação 12. Certa repartição pública anotou e relacionou os tempos de inspeção que faz nas empresas, chegando à seguinte distribuição de frequências: Tabela 49 Tempo de inspeção em minutos Número de inspeções realizadas 10 ï‑‑‑‑ 20 3 20 ï‑‑‑‑ 30 6 30 ï‑‑‑‑ 40 15 40 ï‑‑‑‑ 50 36 50 ï‑‑‑‑ 60 19 O desvio‑padrão do tempo de inspeção nessa repartição é: A) 10,2 B) 9,5 C) 12,3 D) 11,9 E) 8,3 5.2.2 Medidas de dispersão relativas A maneira mais comum de se informar de maneira sintética (resumida) dados quantitativos é por meio de uma medida de posição (média, mediana ou moda) em conjunto com uma medida de dispersão absoluta (desvio médio, variância ou desvio‑padrão). O mais comum é o par de informações média – desvio‑padrão. Frequentemente, no entanto, é interessante utilizar as chamadas medidas de dispersão relativas, que analisam simultaneamente uma medida de posição e a mediada de dispersão correspondente. São especialmente interessantes essas medidas quando fazemos comparações entre amostras diferentes. A rigor, podemos obter essas medidas, costumeiramente chamadas de coeficientes de variação, dividindo uma medida de dispersão por uma medida de posição; no entanto, as mais comuns são: 1. Coeficiente de variação de Pearson: divisão do desvio‑padrão pela média: Cv S X Cv S Xp p = = ×ou 100 84 AD M / CC TB - R ev isã o: Ju lia na M ar ia M en de s - D ia gr am aç ão : L uc as M an sin i - d at a 13 /1 2/ 20 13 / / Ex er cí ci os - Ju lia na - D ia gr am aç ão : M ár ci o - 26 /1 2/ 20 13 Unidade II 2. Coeficiente de variação de Thorndike: divisão do desvio‑padrão pela mediana: Cv S Me Cv S Mep p = = ×ou 100 O Exemplo 1 a seguir mostra uma aplicação dos coeficientes de variação, num caso de ordem prática. Exemplo 1. Um especialista estudou, estatisticamente, dois tipos de investimentos, chegando às conclusões da tabela que segue. Qual é o investimento que apresenta menor risco? Estatísticas Aplicações Observações X Y Retorno esperado 12% 20% O especialista teria chegado a essas conclusões através de um estudo estatístico no qual pesquisou e resumiu os retornos ocorridos no passado, conforme vimos no item 3.1.1 Desvio‑padrão 9% 10% Analogamente o especialista teria calculado o desvio‑padrão conforme vimos no item 3.2.1.4 Observe que se o especialista comparasse as aplicações somente com base em seus desvios padrões, ele preferiria a aplicação X, uma vez que essa aplicação tem um desvio‑padrão menor que Y (9% versus 10%). Essa comparação seria baseada no fato de que, sendo mais homogênea a aplicação A, “daria menos sustos”. No entanto, se ele calculasse e comparasse os coeficientes de variação, chegaria a conclusões diferentes: Estatísticas Aplicações X Y Retorno esperado 12% 20% Desvio‑padrão 9% 10% Coeficiente de Variação de Pearson 75% 50% Cv Cvpa pa= × => = 9 12 100 75% Cv Cvpb pa= × => = 10 20 100 50% A comparação dos coeficientes de variação das aplicações mostra que o especialista estaria cometendo um erro sério se escolhesse a aplicação X em vez da aplicação Y, já que a dispersão relativa, ou risco, das aplicações, conforme refletida no coeficiente de variação, é menor para o ativo Y do que para o X (50% versus 75%). Evidentemente, o uso do coeficiente de variação para comparar o risco da aplicação é melhor porque este também considera o tamanho relativo, ou retorno esperado, das aplicações. 85 AD M / CC TB - R ev isã o: Ju lia na M ar ia M en de s - D ia gr am aç ão : L uc as M an sin i - d at a 13 /1 2/ 20 13 / / Ex er cí ci os - Ju lia na - D ia gr am aç ão : M ár ci o - 26 /1 2/ 20 13 ESTATÍSTICA Exemplo de aplicação 13. A tabela a seguir relaciona médias e desvios‑padrões de três diferentes amostras de investimentos feitos por um aplicador financeiro: Tabela 50 Investimento Rendimento médio Desvio-padrão A 18,0% 6,0% B 14,5% 4,9% C 9,3% 5,0% Acerca dessas informações, não podemos dizer que: A) A maior rentabilidade média é a do investimento C. B) O investimento que apresenta maior homogeneidade é o investimento B. C) O melhor compromisso entre posição e variabilidade é o do investimento C. D) O maior coeficiente de variação é o do investimento A e vale 33,3%. E) O coeficiente de variação do investimento C é o menor e vale 25,9%. 14. Foram comparados os dados referentes a acidentes de trabalho em dois grupos de ramos diferentes de indústria. Nas 35 indústrias do ramo A foi notada uma taxa média de 2,62 acidentes por mil homens/hora de trabalho, com desvio‑padrão de 0,72. Nas 35 empresas das indústrias do ramo B foi notada taxa média de 3,10 acidentes por mil homens/hora de trabalho, com desvio‑padrão de 0,80. Com base nesses dados, informou‑se: I – Em termos absolutos, as empresas do ramo A apresentaram menor variação na taxa de acidentes porque o desvio‑padrão delas é menor. II – Em termos relativos, as empresas do ramo A também apresentam menor variação na taxa de acidentes, porque têm maior coeficiente de variação. III – As empresas do ramo B apresentam menor variação relativa, pois têm menor coeficiente de variação. Em relação a essas afirmativas, podemos garantir que: A) Todas estãocorretas. B) Estão corretas as afirmativas I e II. 86 AD M / CC TB - R ev isã o: Ju lia na M ar ia M en de s - D ia gr am aç ão : L uc as M an sin i - d at a 13 /1 2/ 20 13 / / Ex er cí ci os - Ju lia na - D ia gr am aç ão : M ár ci o - 26 /1 2/ 20 13 Unidade II C) Estão corretas as afirmativas I e III. D) Estão corretas as afirmativas II e III. E) Todas estão erradas. 6 RELAÇÕES GRÁFICAS ENTRE AS MEDIDAS ESTATÍSTICAS Nos estudos e análises estatísticos, é interessante e importante visualizar as informações contidas nos dados por meio do uso dos diversos gráficos, assunto que tratamos na unidade I. Quando utilizamos os histogramas, é facilmente perceptível que as frequências dos valores mais centrais tendem a ser maiores que as dos valores extremos. Esse comportamento nos permitirá tirar conclusões importantes no tópico da Estatística Indutiva, porque, via de regra, ocorre de modo repetitivo. Observações do padrão de comportamento das distribuições mostram que grande parte delas tende a apresentar‑se da maneira conhecida como distribuição normal. A figura 22 mostra o comportamento estatístico de uma distribuição de frequências relativa aos pesos de um grupo de pessoas qualquer. Observe que os pesos próximos da média têm maior frequência, e os mais afastados, menor frequência. Observe também a curva que se forma pela distribuição das colunas. 30 35 40 45 50 55 60 65 70 75 80 85 90 95 100 105 Peso em quilos Fr eq uê nc ia s im pl es 40 35 30 25 20 15 10 5 0 Figura 23 – Pesos corporais No curso de Estatística Aplicada, retornaremos ao assunto, quando diremos, por exemplo, que é pouco provável alguém ter peso acima de 100 kg ou abaixo de 35 kg, e utilizaremos essa curva para determinar qual é essa probabilidade, se houver. 87 AD M / CC TB - R ev isã o: Ju lia na M ar ia M en de s - D ia gr am aç ão : L uc as M an sin i - d at a 13 /1 2/ 20 13 / / Ex er cí ci os - Ju lia na - D ia gr am aç ão : M ár ci o - 26 /1 2/ 20 13 ESTATÍSTICA Por ora, iremos nos preocupar com a variação de formatos desse tipo de curva, chamada de curva normal, curva de Gauss ou, ainda, de curva do sino. Em teoria, espera‑se que essa curva tenha o comportamento mostrado nas curvas desenhadas em linha contínua nas Figuras 23 e 24. Na prática, porém, ocorrem deformações nessas curvas, demonstradas nas curvas pontilhadas das mesmas figuras. Essas deformações são chamadas, respectivamente, de assimetria (Figura 23) e curtose (Figura 24). Média0 0 Variável Fr eq uê nc ia si m pl es Assimétrica positiva Assimétrica negativa Simétrica Figura 24 – Assimetria Curva platicúrtica Curva mesocúrtica Curva leptocúrtica Fr eq uê nc ia si m pl es Média Variável Figura 25 – Curtose 6.1 Assimetria A assimetria mede o quanto a distribuição se afasta da média. Esse afastamento pode ocorrer para a direita ou para a esquerda, gerando, respectivamente, as assimetrias positiva e negativa. O grau de assimetria é dado, frequentemente, pelo chamado 1º coeficiente de Pearson: As X MeS= − 88 AD M / CC TB - R ev isã o: Ju lia na M ar ia M en de s - D ia gr am aç ão : L uc as M an sin i - d at a 13 /1 2/ 20 13 / / Ex er cí ci os - Ju lia na - D ia gr am aç ão : M ár ci o - 26 /1 2/ 20 13 Unidade II Onde: As = Coeficiente de assimetria. X = Média. Me = Mediana. S = Desvio‑padrão. Esse coeficiente pode assumir diferentes valores. De acordo com o sinal desses valores, a assimetria será numa direção, como se vê a seguir: As = 0 – A distribuição é simétrica. As > 0 – A distribuição é assimétrica positiva ou à direita. As < 0 – A distribuição é assimétrica negativa ou à esquerda. Por esse critério, costuma‑se classificar as distribuições da seguinte maneira: Caso As ≤ ‑1: assimétrica negativa forte. Caso ‑1 < As < 0: assimétrica negativa fraca. Caso As = 0: simétrica. Caso 0 < As < 1: assimétrica positiva fraca. Caso As ≥ 1: assimétrica positiva forte. 6.2 Curtose A curtose mede o quanto a distribuição se alonga ou se achata em relação à curva teórica. A curva teórica é chamada de mesocúrtica; as mais alongadas, de leptocúrticas; e as mais achatadas, de platicúrticas. O grau de curtose é dado, frequentemente, pelo coeficiente: K d f f S i i i = × − ∑ ∑ 4 4 3 89 AD M / CC TB - R ev isã o: Ju lia na M ar ia M en de s - D ia gr am aç ão : L uc as M an sin i - d at a 13 /1 2/ 20 13 / / Ex er cí ci os - Ju lia na - D ia gr am aç ão : M ár ci o - 26 /1 2/ 20 13 ESTATÍSTICA Onde: K = Coeficiente de curtose. di = Desvios. fi = Frequências simples. S = Desvio‑padrão. Assim como na assimetria, também na curtose os coeficientes podem assumir diferentes valores. De acordo com o sinal desses valores, a assimetria será numa direção, como se vê a seguir: K = 0: a distribuição é mesocúrtica. K > 0: a distribuição é leptocúrtica. K < 0: a distribuição é platicúrtica. Lembrete Existem outras medidas de assimetria e curtose além das apresentadas aqui, mas que não são objeto do nosso curso. Vamos usar o exemplo a seguir para demonstrar o cálculo da assimetria e da curtose de uma distribuição referente ao consumo de energia elétrica entre 1.245 famílias de determinada região. Observando os resultados obtidos (expostos a seguir), notamos que a distribuição (e a curva dela decorrente) é assimétrica negativa fraca, ou seja, ligeiramente deslocada para a nossa direita, e que é platicúrtica, ou seja, achatada. A curva teria a aparência aproximada da figura que segue (a curva pontilhada é a do exercício; a cheia é a padrão): Média Variável Fr eq uê nc ia si m pl es Figura 26 – Assimetria e curtose 90 AD M / CC TB - R ev isã o: Ju lia na M ar ia M en de s - D ia gr am aç ão : L uc as M an sin i - d at a 13 /1 2/ 20 13 / / Ex er cí ci os - Ju lia na - D ia gr am aç ão : M ár ci o - 26 /1 2/ 20 13 Unidade II Tabela 51 Classes número Consumo mensal por número de famílias Pontos médios de classe Frequência acumulada crescente Pontos médios x Frequências Desvios Desvios ao quadrado Desvio ao quadrado x Frequências Desvios à quarta potência Desvios à quarta potência x Frequências Valor Frequência li | ‑‑‑‑ ls fi pmi fac pmi x fi di = xi ‑ X di 2 di 2 x fi di 4 di 4 x fi 1 0 | ‑‑‑‑ 50 158 25 158 3.950 ‑192 36.944 5.837.189 1.364.876.602 215.650.503.107 2 50 | ‑‑‑‑ 100 100 75 258 7.500 ‑142 20.223 2.022.335 408.984.000 40.898.400.046 3 100 | ‑‑‑‑ 150 112 125 370 14.000 ‑92 8.502 952.277 72.291.984 8.096.702.259 4 150 | ‑‑‑‑ 200 164 175 534 28.700 ‑42 1.782 292.180 3.174.048 520.543.855 5 200 | ‑‑‑‑ 250 175 225 709 39.375 8 61 10.623 3.685 644.833 6 250 | ‑‑‑‑ 300 280 275 989 77.000 58 3.340 935.149 11.154.389 3.123.228.929 7 300 | ‑‑‑‑ 350 84 325 1.073 27.300 108 11.619 975.991 134.999.655 11.339.970.993 8 350 | ‑‑‑‑ 400 63 375 1.136 23.625 158 24.898 1.568.577619.912.976 39.054.517.468 9 400 | ‑‑‑‑ 450 56 425 1.192 23.800 208 43.177 2.417.921 1.864.267.846 104.398.999.377 10 450 | ‑‑‑‑ | 500 53 475 1.245 25.175 258 66.456 3.522.183 4.416.437.760 234.071.201.262 Somatórios 1.245 270.425 18.534.426 657.154.712.129 • Cálculo da média: x f f i i i = =>= =>= ∑ ∑ 270 425 1 245 217 2 . . , • Cálculo do desvio‑padrão: S d f f S S Si n i i i n i = × − => = − => = => == = ∑ ∑ 1 2 1 1 18 534 426 1 245 1 14 899 1 . . . . 222 1, • Cálculo da mediana: — elemento mediano: E N E Eme me me= + => = + => = 1 2 1 245 1 2 623 . º — mediana: Me li E f f h MeMe me ac ant Me = + − × = + − × =>200 623 534 175 50 == 225 4, 91 AD M / CC TB - R ev isã o: Ju lia na M ar ia M en de s - D ia gr am aç ão : L uc as M an sin i - d at a 13 /1 2/ 20 13 / / Ex er cí ci os - Ju lia na - D ia gr am aç ão : M ár ci o - 26 /1 2/ 20 13 ESTATÍSTICA Cálculo da assimetria: As X S As As= − => = − => = − Me 217 2 225 4 122 1 0 067 , , , , Portanto, a curva é fracamente assimétrica negativa. • Cálculo da curtose: K d f f S K K i i i = × − => = − => = − ∑ ∑ 4 4 43 657 154 712 129 1245 122 1 3 0 6 . . . ( , ) , 225 Portanto, a curva é platicúrtica. Exemplo de aplicação 15. Com relação à assimetria e à curtose das distribuições, foram feitas as seguintes afirmações: I – Uma curva assimétrica positiva tem uma média superior à curva simétrica. II – Curvas platicúrticas têm desvio‑padrão maior do que curvas leptocúrticas. III – Curvas com coeficiente menor do que zero têm deslocamento para a esquerda em relação à curva simétrica. IV – Análise da curtose consiste em estudar o achatamento ou o alongamento da distribuição. Em relação a essas afirmações, podemos dizer que: A) Todas estão incorretas. B) Existe uma alternativa incorreta. C) Existem duas alternativas incorretas. D) Existem três alternativas incorretas. E) Todas estão corretas. 16. Duas distribuições foram estudadas e chegou‑se aos seguintes coeficientes mostrados a seguir: 92 AD M / CC TB - R ev isã o: Ju lia na M ar ia M en de s - D ia gr am aç ão : L uc as M an sin i - d at a 13 /1 2/ 20 13 / / Ex er cí ci os - Ju lia na - D ia gr am aç ão : M ár ci o - 26 /1 2/ 20 13 Unidade II Tabela 52 Distribuição Coeficiente de assimetria Coeficiente de curtose A ‑ 1,34 1,89 B 0,87 ‑1,34 A partir desses coeficientes, não podemos afirmar: A) A distribuição A tem menor média do que se fosse simétrica e é mais achatada do que a mesocúrtica. B) A distribuição B tem menor média do que se fosse simétrica e é mais achatada do que a mesocúrtica. C) Ambas as distribuições não são simétricas nem mesocúrticas. D) A curva A é mais alongada do que a curva B. E) As duas curvas têm assimetrias opostas. 7 TEORIA ELEMENTAR DAS PROBABILIDADES Em Estatística, quando nos referimos a uma previsão de comportamento de uma população a partir do conhecimento de uma amostra, ou, ao contrário, à previsão do comportamento esperado de uma amostra retirada de uma população conhecida, temos o cuidado de utilizar a palavra provavelmente antes de cada informação. Assim, por exemplo, quando após uma pesquisa eleitoral o veículo de comunicação informa que se a eleição fosse naquele momento o candidato X teria 35% dos votos, ele quer dizer que provavelmente o candidato X tivesse essa quantidade de votos. É uma afirmação provável de ocorrer, não quer dizer que certamente ocorrerá. Uma tolerância nessa informação é esperada. Neste tópico veremos o que significa e como são calculadas as probabilidades, ramo de estudo da Matemática, e não exatamente da Estatística. Inicialmente iremos verificar casos absolutamente teóricos e posteriormente evoluiremos para situações mais próximas da realidade. Tentaremos utilizar o raciocínio lógico para resolver as questões e, no final do tópico, faremos uma revisão teórica, apresentando os conceitos e as fórmulas utilizadas na Teoria Elementar das Probabilidades. O importante é você dominar o mecanismo de cálculo da probabilidade. 7.1 Definições de probabilidades Caso você procure a definição de probabilidade em um dicionário, o Houaiss (2009), por exemplo, irá encontrar algo do tipo: 93 AD M / CC TB - R ev isã o: Ju lia na M ar ia M en de s - D ia gr am aç ão : L uc as M an sin i - d at a 13 /1 2/ 20 13 / / Ex er cí ci os - Ju lia na - D ia gr am aç ão : M ár ci o - 26 /1 2/ 20 13 ESTATÍSTICA “Probabilidade: característica do que é provável; perspectiva favorável de que algo venha a ocorrer; possibilidade, chance.” Como é fácil de notar, essa definição não acrescenta nada ao conceito intuitivo que temos de probabilidade; isso porque esse conceito é circular, ou seja, define‑se probabilidade utilizando‑se seus próprios termos. Desenvolve‑se atualmente uma abordagem axiomática na definição de probabilidade, mantendo‑se seu conceito indefinido, algo semelhante ao que acontece em Geometria com as definições de ponto e reta. Estatisticamente, no entanto, adotam‑se três abordagens diferentes na definição de probabilidades: a abordagem clássica, a abordagem como frequência relativa e a abordagem subjetiva. Antes de seguirmos, no entanto, na definição de probabilidade, é necessário definir alguns termos que serão utilizados. • Experimento: significará, para nós, observar ou executar determinado processo sob certas circunstâncias controladas. Todas as nossas questões e problemas trabalhados em estatísticas são experimentos que devem ser corretamente definidos. Podemos citar alguns exemplos para clarear nosso entendimento. O comportamento das ações numa Bolsa de Valores; a produtividade de um processo; a variação de estoques ao longo de determinado período; o controle de qualidade dos produtos recebidos por um empresa; os resultados de um jogo, por exemplo, a Mega‑Sena, entre outros, são exemplos de experimentos. • Experimento aleatório: são aqueles que, apesar de serem repetidos exatamente da mesma maneira, não apresentam resultados obrigatoriamente iguais. Por exemplo: você pode jogar um dado exatamente da mesma maneira duas vezes, e nada garantirá que irá obter o mesmo resultado. Rigorosamente, experimentos aleatórios são, exclusivamente, jogos de azar. Em Administração, vamos trabalhar, normalmente, com experimentos aproximadamente aleatórios, os quais, apesar de apresentarem determinado grau de aleatoriedade, não são exclusivamente aleatórios. Por exemplo, o jogo de cartas conhecido como 21 é aleatório; já o “buraco” é aproximadamente aleatório. Saiba mais A obra a seguir é um interessante estudo sobre o efeito do acaso (aleatoriedade) nas nossas vidas. Vale a pena ler: MLODINOW, L. O andar do bêbado: como o acaso determina nossas vidas. Rio de Janeiro: Zahar, 2009. 94 AD M / CC TB - R ev isã o: Ju lia na M ar ia M en de s - D ia gr am aç ão : L uc as M an sin i - d at a 13 /1 2/ 20 13 / / Ex er cí ci os - Ju lia na - D ia gr am aç ão : M ár ci o - 26 /1 2/ 20 13 Unidade II • Espaço amostral (ou conjunto universoou espaço das probabilidades): é o conjunto formado por todos os resultados possíveis de um experimento aleatório. Por exemplo, o espaço amostral de um jogo de um dado “honesto” é dado por: S = {1, 2, 3, 4, 5, 6}. O dado deve ser “honesto”; se não for, o experimento não será aleatório. • Evento: é um determinado subconjunto formado por um ou mais elementos do espaço amostral. Por exemplo, num jogo de dados, o evento número primo é formado por: E = {1, 2, 3, 5} Observação Por definição, um número positivo será primo se for maior do que 1 e for divisível apenas por 1 e por ele mesmo. Por essa definição, o número 1 seria primo, apesar de que, por conveniência, normalmente não é considerado como tal. Neste material, será incluído entre os números primos. 7.2 Cálculos das probabilidades elementares Usando esses conceitos, podemos determinar estatisticamente o termo probabilidade. • Abordagem clássica: probabilidade é a razão (divisão) entre o número de elementos (ou resultados) favoráveis a um determinado evento e o número total de elementos (ou resultados) do espaço amostral, ou seja: P A n A n S ( ) ( ) ( ) = Sendo: P(A) a probabilidade de ocorrer o evento A. n(A) o número de elementos favoráveis ao evento A. n(S) o número total de elementos do espaço amostral. Por exemplo: Qual é a probabilidade de, ao jogarmos um dado “honesto”, obtermos um número primo? E A n An meros primosú : , , , ( )= { }∴ =12 3 5 4 S n A= { }∴ =12 3 4 5 6 6, , , , , ( ) 95 AD M / CC TB - R ev isã o: Ju lia na M ar ia M en de s - D ia gr am aç ão : L uc as M an sin i - d at a 13 /1 2/ 20 13 / / Ex er cí ci os - Ju lia na - D ia gr am aç ão : M ár ci o - 26 /1 2/ 20 13 ESTATÍSTICA P A n A n S P A( ) ( ) ( ) ( ) , , %= ⇒ = = = 4 6 0 667 66 7 • Abordagem como frequência relativa: probabilidade é a razão entre o número de vezes em que determinado resultado ocorre, quando repetimos o experimento aleatório (ou aproximadamente aleatório) por um número elevado de vezes. Por exemplo: jogamos uma moeda mil vezes, e em 512 dessas vezes saiu cara. Podemos dizer, por esta definição, que a probabilidade de sair cara nessa moeda é de 512/1000, ou seja, 51,2%. Esse raciocínio seria simbolizado da seguinte forma: P A f f f P A fRA A T RA ( ) ( ) , , %= = ⇒ = = = = 512 1000 0 512 512 Esse resultado não é o mesmo que o calculado pela definição anterior (50%). Isso pode decorrer do fato de a moeda usada não ser “honesta” (portanto, com resultados aleatórios), ou do fato de o número de jogadas não ter sido suficientemente grande. Aumentando o número de jogadas, a probabilidade tenderá ao valor teórico de 50%, se a moeda for “honesta”. • Abordagem subjetiva: ao contrário das definições anteriores, nesta, a probabilidade não é um valor objetivo, mas algo que indica a “crença” do analista naquela ocorrência. Evidentemente essa probabilidade não é fruto de um “palpite, um chute”, mas algo embasado em dados objetivos, mas complementados por aspectos pessoais. É o caso, por exemplo, do meteorologista que prevê 80% de chances de ocorrerem chuvas num determinado período. Esse tópico da Estatística é estudado em Análise Bayesiana de Decisão. Durante nosso curso iremos utilizar as duas primeiras abordagens, de acordo com o campo de estudo em que estivermos. Deve‑se notar que a primeira abordagem é eminentemente teórica e pressupõe experimentos aleatórios em que os elementos são equiprováveis. Já na segunda abordagem podem ser introduzidos fatores diversos, característicos de determinadas situações não totalmente aleatórias. Apesar de basicamente o cálculo de probabilidades envolver uma das duas relações descritas, existem axiomas, teoremas e propriedades que devem ser conhecidos para o correto uso da teoria. Antes de nos preocuparmos com a teoria envolvida, porém, iremos nos ater à lógica que permeia o cálculo de probabilidades. Para tanto, analisaremos as questões a seguir. 1. Uma moeda “honesta” é jogada uma única vez; qual é a probabilidade de que o resultado seja cara? Pelo modo como o exercício é proposto, devemos calcular a probabilidade como uma razão entre o número de elementos favoráveis ao evento cara e o número total de elementos possíveis. Número de elementos do evento cara: n(A) = 1, porque A = {cara} Número de elementos total: n(S) = 2, porque S = {cara; coroa} 96 AD M / CC TB - R ev isã o: Ju lia na M ar ia M en de s - D ia gr am aç ão : L uc as M an sin i - d at a 13 /1 2/ 20 13 / / Ex er cí ci os - Ju lia na - D ia gr am aç ão : M ár ci o - 26 /1 2/ 20 13 Unidade II P A n A n S P cara( ) ( ) ( ) ( )= ⇒ = 1 2 2. Duas moedas “honestas” são jogadas simultaneamente; qual é a probabilidade de que pelo menos uma seja cara? Neste caso, o espaço amostral tornou‑se ligeiramente mais complexo: S = {CaraCara; CaraCoroa; CoroaCara; CoroaCoroa) O evento pedido é: E = {CaraCara; CaraCoroa; CoroaCara) Logo, a probabilidade é: P n A n S P( ) ( ) ( ) ( )pelo menos uma cara pelo menos uma cara= ⇒ = = 3 4 00 75 75, %= Observação Do ponto de vista do cálculo de probabilidade, jogar simultaneamente duas moedas é o mesmo que jogar uma, anotar o resultado e depois jogar outra. 7.3 Árvores de decisões O cálculo de probabilidades é, no fundo, um exercício de lógica, característica na qual, muitas vezes, reside sua dificuldade. Para facilitar esse raciocínio lógico, costuma‑se usar a árvore de decisões, que, por meio de uma sistemática de análise e síntese, conduz à compreensão do experimento. Trata‑se de uma ferramenta relativamente trabalhosa, mas costuma ser importante no entendimento de problemas mais complexos ou extensos. Por meio da continuação da sequência de exercícios, aprenderemos o funcionamento dessa ferramenta. 3. Quatro moedas são jogadas simultaneamente; qual é a probabilidade de que se obtenham pelo menos duas caras? Ficou muito mais complexo estabelecer o espaço amostral e o evento solicitado. O princípio é o mesmo dos exercícios anteriores, mas, como o número de moedas aumentou, as dificuldades envolvidas também aumentaram. Para facilitar nosso raciocínio, introduziremos a árvore de decisões e, na sequência, a análise combinatória. 97 AD M / CC TB - R ev isã o: Ju lia na M ar ia M en de s - D ia gr am aç ão : L uc as M an sin i - d at a 13 /1 2/ 20 13 / / Ex er cí ci os - Ju lia na - D ia gr am aç ão : M ár ci o - 26 /1 2/ 20 13 ESTATÍSTICA A árvore de decisões consiste em representar graficamente todas as possibilidades de resultados dos experimentos aleatórios, de modo que não percamos nenhum evento e, ao mesmo tempo, compreendamos a mecânica do experimento. Joga‑se uma moeda “honesta”. Os resultados podem ser: Coroa Cara Figura 27 A seguir está desenhada a árvore de decisões do experimento “jogar quatro moedas ‘honestas’ simultaneamente”. Com certeza, não esquecemos nenhum dos resultados possíveis. Coroa Cara Cara Cara Cara Cara Cara Cara Cara Cara Cara Cara Cara Cara Cara Cara Coroa Coroa Coroa Joga‑se uma moeda “honesta” sucessiva‑ mente 4 vezes Coroa Coroa Coroa Coroa Coroa Coroa Coroa Coroa Coroa Coroa Coroa Caminho 2 Caminho 4 Caminho 6 Caminho 8 Caminho 10 Caminho 12 Caminho 14 Caminho 16 Caminho 1 Resulta‑
Compartilhar