Baixe o app para aproveitar ainda mais
Prévia do material em texto
ESTATÍSTICA APLICADA AULA 4 Profa. Aline Purcote 2 CONVERSA INICIAL Vimos que as medidas de posição representam uma sequência por um único número, dando uma ideia de todo o conjunto, no entanto, estas medidas não descrevem detalhadamente o comportamento do conjunto de dados. Segundo Ribeiro, no estudo na Estatística dispomos de algumas estratégias para verificar se os valores apresentados em um conjunto de dados estão dispersos ou não e o quão distante um do outro eles podem estar. Assim surgem as chamadas medidas de dispersão, que segundo Castanheira, são medidas utilizadas para verificar o quanto os valores encontrados em uma pesquisa estão dispersos ou afastados em relação à média. CONTEXTUALIZANDO Já estudamos algumas situações em que as medidas de posição podem ser utilizadas, mas nem sempre apenas o cálculo da média nos fornece a melhor base para tomada de decisão; desta forma, podemos utilizar as medidas de dispersão para complementar nossa análise e tomar decisões mais assertivas. Por exemplo, vamos considerar as notas de dois alunos na disciplina de Estatística: Aluno A: 6 5 6 5 Aluno B: 8 2 6 6 Se calcularmos a média das notas teremos média igual a 5,5 para os dois alunos. Mas será que o desempenho dos dois foi igual? Qual deles obteve as notas com menor variação? Para responder a estas questões será necessário utilizar as medidas de dispersão, pois apenas as medidas de posição não são conclusivas. (Adaptado de http://alunosonline.uol.com.br/matematica/medidas- de-dispersao.html) Outro exemplo ocorre quando se compra na internet, em que verificamos qual o tempo médio de entrega das compras efetuadas. Ao analisarmos apenas a média, não conseguimos concluir se a empresa realiza as entregas conforme o informado, mas com a análise das medidas de dispersão conseguimos concluir se as entregas são, realmente, realizadas conforme informações dadas no ato 3 da compra. Se a medida de dispersão fornece um valor pequeno significa que a empresa é mais confiável quanto a manter o tempo médio das entregas, caso contrário, ela não é tão confiável quanto à sua pontualidade: por vezes é muito rápida, e em outras vezes demora muito. Desta forma, se no ato da compra for informada uma medida de posição e uma de dispersão, conseguimos analisar e concluir o quão constantemente pontual é a empresa, e se vale a pena realizar a compra com relação a prazos. Com base nos exemplos trabalhados, vamos estudar como calcular as medidas de dispersão e como interpretar os resultados obtidos. TEMA 1 – MEDIDAS DE DISPERSÃO A informação fornecida pelas medidas de tendência central pode ser complementada com a utilização das medidas de dispersão. Segundo Castanheira, as medidas de dispersão servem para verificar com que confiança as medidas de tendência central resumem as informações fornecidas pelos dados obtidos em uma pesquisa. As medidas de dispersão servem para indicar o quanto os dados se apresentam dispersos em torno da região central. Portanto, caracterizam o grau de variação existente em um conjunto de valores e indicam se os valores estão relativamente próximos uns dos outros ou separados e servem para medir a representatividade da média. As principais medidas de dispersão são: amplitude total, desvio médio, variância e desvio padrão. TEMA 2 – AMPLITUDE TOTAL A amplitude total – também conhecida como intervalo total – é calculada pela diferença entre o maior e o menor valor de uma série de dados, e considerada a medida de dispersão mais simples, calculada pela fórmula: A = maior - menor 4 Exemplo 1: Considere os valores: 40, 45, 48, 62 e 70 e calcule a amplitude total. Para encontrar a amplitude precisamos do maior e menor valor para depois realizar a diferença: Maior valor = 70 Menor valor = 40 Amplitude = 70 - 40 = 30 Exemplo 2: Qual a amplitude da série: 10, 12, 20, 22, 25, 33, 38? Maior valor = 38 Menor valor = 10 Amplitude = 38 - 10 = 28 Segundo Castanheira (2010), para o caso de os dados estarem agrupados em classes, o cálculo da amplitude total pode ser realizado de duas formas: 1. Pelos pontos médios das classes: neste caso, a amplitude total é igual ao ponto médio da última classe, menos o ponto médio da primeira classe. 2. Pelos limites das classes: neste caso, a amplitude total é igual ao limite superior da última classe, menos o limite inferior da primeira classe. Exemplo 3: Qual a amplitude da seguinte distribuição? Vamos calcular a amplitude considerando as duas formas citadas anteriormente: 1. Ponto médio das classes: Neste caso, para calcular a amplitude total precisamos encontrar o ponto médio da última classe e o ponto médio da 5 primeira classe para depois realizar a diferença. Lembrando que o ponto médio é calculado pela fórmula: 2 LiLs Pm Ponto médio da última classe: 172 2 344 2 170174 Pm Ponto médio da primeira classe: 152 2 304 2 150154 Pm Amplitude = 172 – 152 = 20 cm 2. Limites das classes: Para calcular a amplitude total precisamos encontrar o limite superior da última classe e o limite inferior da primeira classe para depois realizar a diferença: Limite superior da última classe = 174 Limite inferior da primeira classe = 150 Amplitude = 174 – 150 = 24 cm Se o resultado encontrado para amplitude for um número elevado, significa que os valores da série estão afastados uns dos outros. Caso o valor encontrado seja baixo, os valores da série estarão próximos entre si. A amplitude total apresenta algumas restrições, pois considera apenas os valores extremos da série, desprezando os valores intermediários. Assim, a utilização desta medida de dispersão é limitada e não capta possíveis variações entre seus limites. TEMA 3 – DESVIO MÉDIO O desvio médio é uma medida da dispersão que analisa a média dos desvios em torno da média de cada um dos valores da série e é calculado pela média aritmética dos valores absolutos dos desvios. Chamamos Dm de desvio médio e calculamos pela fórmula: Dm = N f.xx 6 Onde xx é o módulo de cada desvio em relação à média e N é igual a soma das frequências. O módulo (| |) utilizado no cálculo do desvio médio possui a função de tornar o número positivo; assim, se a diferença entre o dado e a média resultar em um número positivo, ao retirar o módulo ele continuará positivo, e se for negativo torna-se positivo. Como o desvio médio verifica o afastamento em relação à média, o primeiro passo é calcular a média para depois calcular o desvio de cada valor da série e aplicar a fórmula encontrando o desvio médio. Exemplo 1: Suponha o conjunto de tempo de serviço de 5 funcionários e determine o desvio médio deste conjunto de dados: 3 7 8 10 11 Para calcular o desvio médio vamos calcular primeiramente a média. Lembrando que para calcular a média em dados não agrupados somamos todos os valores e dividimos pelo número de observações: N X X 8,7 5 39 5 1110873 X O segundo passo é calcular o desvio de cada valor em relação à média, ou seja, cada dado menos a média, que é 7,8. O valor encontrado multiplicaremos pela frequência, que é o número de vezes que o valor aparece. Por exemplo, se considerarmos o primeiro valor – que é 3 – teremos |3 – 7,8|.1, ou seja, o número3 menos a média que é 7,8 vezes 1, pois o número 3 aparece apenas uma vez. Este processo repetimos para cada valor da série: Dm = N f.xx 5 18,71118,71018,7818,7718,73 Dm 5 12,312,212,018,018,4 Dm 7 Agora precisamos retirar os valores do módulo; se o número for positivo, continuará positivo e o número negativo torna-se positivo. Assim: Multiplicamos os valores pela frequência e somamos para após dividir por 5: Este resultado indica que, em média, o tempo de serviço deste grupo de funcionários se desvia em 2,24 anos em torno do tempo médio de serviço que é de 7,8 anos. Exemplo 2: Em um determinado dia, foi registrado o número de veículos negociados por uma amostra de 10 vendedores de uma agência de automóveis, como mostra a tabela abaixo. Calcule o desvio médio. (Adaptado de Shiguti & Shiguti, 2006). Verificamos que neste exemplo temos uma distribuição de frequência e precisamos calcular o desvio médio, logo, o primeiro passo é o cálculo da média. Lembrando que a média em uma distribuição de frequência é calculada pela fórmula: N fX X . 5 1.2,31.2,21.2,01.8,01.8,4 Dm 5 2,32,22,08,08,4 Dm 24,2 5 2,11 Dm 8 6,2 10 26 X Agora vamos calcular o desvio em relação à média. Para facilitar, vamos incluir uma nova coluna na tabela identificando o cálculo |x – média|; assim, para o primeiro valor da tabela temos |1 – 2,6| = |-1,6| = 1,6. Seguimos este mesmo processo para os demais valores da tabela: Encontrados os valores dos desvios, devemos multiplicá-los pelas suas respectivas frequências, assim valor incluir mais uma coluna chamada |x – média|*f. Para o primeiro valor, temos: 1,60 * 1 = 1,60. Seguimos este processo para os demais valores da tabela, e em seguida somamos todos os valores encontrados: 9 Para finalizar, aplicamos a fórmula do desvio médio: Dm = N f.xx A quantidade de veículos negociados por cada vendedor possui uma distância de 0,68 em torno dos 2,6 veículos comercializados em média. Para dados agrupados em classes ou intervalos, substituímos o X na fórmula pelo ponto médio de cada classe (Pm). N fxPm Dm . Desta forma, para calcularmos o desvio médio, seguimos os seguintes passos: 1. Calcular o ponto médio de cada classe; 2. Calcular a média; 3. Calcular o desvio em relação à média: fxPm . 4. Calcular o desvio médio. Exemplo 3: A tabela a seguir representa as notas obtidas por um grupo de 58 alunos matriculados em uma determinada disciplina. Calcule o desvio médio. (Adaptado de Shiguti & Shiguti, 2006). O primeiro passo é calcular o ponto médio de cada classe. Lembrando que para calcular o ponto médio utilizamos a fórmula: 2 LiLs Pm Considerando a primeira classe temos: 40 2 3545 Pm 68,0 10 80,6 Dm 10 Seguindo o mesmo processo para as demais classes temos: No próximo passo calculamos a média da distribuição de frequência utilizando a fórmula: N fPm X . Encontrada a média, precisamos calcular os desvios em relação a este valor: fxPm . Por exemplo, para primeira classe temos: |40 – 62,24|*5 | -22,24|*5 = 22,24*5 = 111. Seguindo este cálculo para as demais classes e somando os valores obtidos temos: 24,62 58 3610 X 11 Agora aplicamos a fórmula do desvio médio: N fxPm Dm . A nota de cada aluno deste grupo possui uma distância de 10,29 pontos em torno do desempenho médio, que foi de 62,24 pontos. TEMA 4 – VARIÂNCIA A dispersão dos dados também pode ser calculada considerando os quadrados dos desvios médios. Segundo Castanheira, à média aritmética dos quadrados dos desvios damos o nome de variância, que pode ser calculada de duas formas, considerando uma população ou uma amostra. Sua fórmula, quando se trata de uma população é: N f.)xx( S 2 2 Já no cálculo da variância de uma amostra, o denominador deverá ser (N- 1), ou seja: 1N f.)xx( S 2 2 Onde x representa os dados, x é a média dos conjunto de dados, f é a frequência com que o dados aparecem e N é a quantidade de observações. A utilização de uma ou outra fórmula dependerá de se os dados representam uma população ou amostra. Como a variância utiliza o quadrado dos desvios médios o primeiro passo é calcular a média para depois aplicar as fórmulas indicadas. Ao analisarmos o resultado da variância, temos que quanto maior for o seu valor, mais distantes da média estarão os valores, ou quanto mais próximos os valores estarão da média. 29,10 58 597 Dm 12 Exemplo 1: Suponha o conjunto de tempo de serviço de 5 funcionários e determine a variância deste conjunto de dados considerando uma amostra. 3 7 8 10 11 O primeiro passo é calcular a média. Lembrando que para dados não agrupados somamos os dados e dividimos pela quantidade de observações: N X X 8,7 5 39 5 1110873 X Depois de encontrado a média vamos calcular a variância verificando que o enunciado solicita a variância considerando uma amostra, assim utilizamos a seguinte fórmula: 1N f.)xx( S 2 2 15 1.)8,711(1.)8,710(1.)8,78(1.)8,77(1.)8,73( 222222 S 4 1.)2,3(1.)2,2(1.)2,0(1.)8,0(1.)8,4( 222222 S 4 1.24,101.84,41.04,01.64,01.04,232 S 4 24,1084,404,064,004,232 S 7,9 4 80,382 S Exemplo 2: Considere os seguintes dados e calcule a variância considerando uma população. 40 45 48 52 54 62 70 Vamos calcular a média deste conjunto de dados: 53 7 371 7 70625452484540 X 13 Depois de encontrada a média, vamos calcular a variância verificando que o enunciado solicita a variância considerando uma população, assim utilizamos a seguinte fórmula: N f.)xx( S 2 2 7 1)².5370(1)².5362(1)².5354(1)².5352(1)².5348(1)².5345(1)².5340(2 S 7 289811125641692 S 90 7 6302 S Exemplo 3: Em um determinado dia foi registrado o número de veículos negociados por uma amostra de 10 vendedores de uma agência de automóveis como mostra a tabela abaixo. Calcule a variância. (Adaptado de Shiguti & Shiguti, 2006). Neste exemplo temos uma distribuição de frequência, e precisamos calcular a variância. Logo, o primeiro passo é o cálculo da média. Lembrando que a média em uma distribuição de frequência é calculada pela fórmula: N fX X . 6,2 10 26 X 14 Após o cálculo da média, calculamos o quadrado dos desvios em relação à média e multiplicamos o valor encontrado pela sua respectiva frequência. Para o primeiro valor temos: (1 – 2,6)². 1 = (-1,6)² . 1 = 2,56 . 1 = 2,56 Seguindo este cálculo, para os demais valores da distribuição temos: Somamos e valor encontrado em (x – x )².f e aplicamos a fórmula da variância para uma amostra encontrando o seguinte valor: 1N f.)xx( S 2 2 71,0 9 4,6 110 4,62 S Para uma distribuição de frequência por classe ou intervalos, substituímos na fórmulada variância o valor de x pelo ponto médio (Pm) de cada classe. Desta forma o primeiro passo será o cálculo do ponto médio, para depois calcular a média e a variância. População: N fxPm S .)( 2 2 Amostra: 1 .)( 2 2 N fxPm S Exemplo 4: A tabela abaixo representa as notas obtidas por um grupo de 58 alunos matriculados em uma determinada disciplina. Calcule a variância da amostra. (Adaptado de Shiguti & Shiguti, 2006). 15 Neste exemplo temos uma distribuição de frequência por classe e iniciamos calculando o ponto médio (Pm) e a média da distribuição: N fPm X . Agora calculamos os desvios: (Pm – x ) ² e o resultado multiplicamos pela frequência. Para a primeira classe temos: (40 – 62,24) ² = (-22,24) ² = 495 495 . 5 = 2.473 Seguindo o mesmo processo para as demais classes e somando os valores obtidos, temos: 24,62 58 3610 X 16 O último passo é calcular a variância solicitada da amostra: 1 .)( 2 2 N fxPm S 158 94092 S 1,165 57 94092 S TEMA 5 – DESVIO PADRÃO O desvio padrão é definido como a raiz quadrada da variância, e é a medida mais utilizada na prática, desta forma, o cálculo da variância é considerado um passo intermediário para o cálculo do desvio padrão. Para o cálculo do desvio padrão de uma população temos: N f.)xx( S 2 A fórmula para o cálculo de desvio padrão de uma amostra é: 1N f.)xx( S 2 Podemos utilizar as fórmulas acima ou calcular a variância e após tirar a raiz quadrada, assim: ²SS Para o cálculo do desvio padrão temos os seguintes passos: 1. Calcular a média; 2. Calcular a variância; 3. Tirar a raiz quadrada da variância. Exemplo 1: Suponha o conjunto de tempo de serviço de 5 funcionários e determine o desvio padrão deste conjunto de dados considerando uma amostra. (Adaptado de Shiguti & Shiguti, 2006). 3 7 8 10 11 1. Calcular a média: 17 8,7 5 39 5 1110873 X 2. Calcular a variância: 15 1.)8,711(1.)8,710(1.)8,78(1.)8,77(1.)8,73( 222222 S 7,9 4 80,382 S 3. Tirar a raiz quadrada da variância. 11,37,92 SS Exemplo 2: Em um determinado dia foi registrado o número de veículos negociados por uma amostra de 10 vendedores de uma agência de automóveis como mostra a tabela abaixo. Calcule o desvio padrão. (Adaptado de Shiguti & Shiguti, 2006). 1. Calcular a média: 6,2 10 26 X 2. Calcular a variância: 71,0 9 4,6 110 4,62 S 18 3. Tirar a raiz quadrada da variância: 84,071,02 SS Exemplo 3: A tabela abaixo representa as notas obtidas por um grupo de 58 alunos matriculados em uma determinada disciplina. Calcule o desvio padrão. (Adaptado de Shiguti & Shiguti, 2006). 1. Calcular a média: 2. Calcular a variância: 1,165 57 94092 S 24,62 58 3610 X 19 3. Tirar a raiz quadrada da variância: 85,121,1652 SS No desvio padrão obtemos valores altos sempre que ocorrem mudanças consideráveis nos dados analisados, e obtemos valores baixos quando os dados são mais estáveis. TROCANDO IDEIAS Nesta aula trabalhamos com as medidas de dispersão que complementam as medidas de posição, e estas podem ser utilizadas em várias situações dentro e fora das organizações. Você se recorda de alguma situação em que tenha ouvido falar ou utilizado algumas das medidas citadas nesta aula? Nas organizações, em quais situações poderíamos utilizar estas medidas? NA PRÁTICA As medidas de dispersão possuem vasta aplicação, pois servem para avaliar o grau de variabilidade do fenômeno estudado. Quando o desvio é pequeno, a amostra é homogênea, ou seja, mais parecidos são os valores da série, e quando o valor é alto, a amostra é heterogênea. Com esta informação podemos definir indicadores, estratégias, comparar valores e realizar análises que geram informações para tomada de decisão dentro das organizações. Vamos analisar algumas situações onde a utilização das medidas de dispersão fornece informações para tomada de decisão: Ferramentas básicas de análise financeira – o desvio-padrão: <https://www.portal-gestao.com/artigos/7343-ferramentas- b%C3%A1sicas-de-an%C3%A1lise-financeira-o-desvio- padr%C3%A3o.html>. 20 Variância e desvio padrão: <http://matemagica10.blogspot.com.br/2015_10_01_archive.html>. Risco e volatilidade: conceitos fundamentais na hora de investir: <http://www.infomoney.com.br/educacao/guias/noticia/480519/risco- volatilidade-conceitos-fundamentais-hora-investir>. A Estatística e sua importância na avaliação de risco e retorno dos investimentos: <http://www.rhportal.com.br/artigos-rh/a-estatistica-e-sua- importncia-na-avaliao-de-risco-e-retorno-dos-investimentos/>. FINALIZANDO Nesta aula apresentamos a diferença entre as medidas de posição e de dispersão, as principais medidas, seus cálculos, aplicações e interpretação dos resultados obtidos. REFERÊNCIAS CASTANHEIRA, N. P. Estatística aplicada a todos os níveis. Curitiba: InterSaberes, 2010. MARTINS, G. de A. Estatística geral e aplicada. 3. ed. São Paulo: Atlas, 2010. LARSON, R.; FARBER, B. Estatística aplicada. 2. ed. São Paulo: Pearson, 2004. RIBEIRO, A. G. Medidas de dispersão: variância e desvio padrão. Brasil Escola. Disponível em <http://brasilescola.uol.com.br/matematica/medidas-dispersao- variancia-desvio-padrao.htm>. Acesso em: 14 mar. 2017. SHIGUTI, W. A.; SHIGUTI, V. da S. C. Apostila de estatística. Brasília: UFSC, 2006. Disponível em: <http://www.inf.ufsc.br/~paulo.s.borges/Download/Apostila5_INE5102_Quimica. pdf>. Acesso em: 24 fev. 2017.
Compartilhar