Buscar

MODÚLO 6 E 7 MEDIDAS DE DISPERSÃO

Prévia do material em texto

Medidas de Dispersão 
 
Objetivos do módulo 
 
 As medidas de dispersão completam a informação contida nas medidas de posição, 
revelando o afastamento ou desvio dos elementos do valor central. Quanto menor for a 
dispersão de uma amostra maior será a qualidade da informação contida na medida de posição, 
ou em outras palavras, menor a margem de erro que será assumido considerando a medida de 
posição como representante de toda a amostra. 
 
 Existem basicamente dois grandes grupos de medidas de dispersão: 
 Medidas de dispersão absolutas – levam em conta a dispersão propriamente dita 
 Medidas de dispersão relativas – levam em conta simultaneamente uma medida de posição e 
a medida de dispersão correspondente. São úteis para efetuarmos comparações entre 
amostras. 
 
O objetivo deste capítulo é tomarmos contato com ambos os grupos. 
 
 
4.1 – Medidas de dispersão absolutas 
 
 
4.1.1 – Amplitude total 
 
A amplitude total (At) já é nossa conhecida e é a mais elementar das medidas de 
dispersão. È extremamente fácil de ser calculada, mas de difícil interpretação, em especial 
quando os dados extremos são muito grandes ou muito pequenos. São mais utilizadas, portanto, 
quando as distribuições apresentam certa homogeneidade. 
 
Por exemplo, suponha que tenhamos as valorizações mensais das ações de duas 
diferentes empresas A e B, com os seguintes valores (em porcentagem): 
 
Empresa A = {21,5; 18,0; 26,3; 32,4; 45,1; 18,6; 37,6} 
Empresa B = {15,3; 19,7; 23,9; 16,7; 25,9; 14,6; 18,9; 25,8} 
 
As amplitudes seriam respectivamente de 45,1 - 18,0 = 27,1% para a s ações da empresa 
A e de 25,9 – 14,6 = 11,3% para a empresa B. Em outras palavras as variações máximas seriam 
de 27,1% para as ações da empresa A e de 11,3% para a empresa B. Logo, o risco de oscilação 
é maior para a empresa A do que para a empresa B. 
 
4.1.2 – Desvio Médio 
É definido como a média aritmética do módulo1 dos desvios dos elementos em relação à 
média dos mesmos. Entende-se por desvio a diferença entre o valor de um elemento da amostra 
para a média dessa mesma amostra: 
Xxd ii 
 
Portanto o desvio médio será dado pela fórmula: 
 
 
1 Define-se módulo ou valor de um número a distância deste número para zero, independente do sinal, ou seja, 
modulo de um número positivo e modulo de um número negativo é o seu simétrico, ou seja, o mesmo número 
positivo. Para efeito do cálculo do desvio médio, consideramos o número sempre positivo seja qual for seu sinal. 
 Mauricio Martins do Fanno 
 
 
 
 
O exemplo abaixo deixará mais claro esse processo. 
 
Exemplo 1 
 
Calcular o desvio médio da amostra {18; 21; 22; 27; 28; 29; 32; 37}. 
 
O primeiro passo será calcular a média aritmética destes valores e em seguida os desvios 
de cada um dos valores. Em seguida somaremos o módulo destes valores dividindo-os pelo 
número total de elementos da amostra. O quadro abaixo mostra passo a passo esses cálculos: 
 
 
 
Observe que a soma dos desvios é zero, o que é evidente. O próprio conceito de média 
(valor eqüidistante de todos os elementos da amostra) nos conduz a isso. O conceito de desvio 
médio só tem sentido quando utilizamos o módulo dos desvios. Para ficar mais claro veja abaixo 
os cálculos feitos, utilizando-se das fórmulas informadas: 
 
Cálculo da média: 
Cálculo do desvio médio: 
 
 
 
Quando trabalhamos com dados agrupados em classes ou não utilizaremos exatamente o 
mesmo processo de cálculo, evidentemente com alterações nas fórmulas de cálculos 
introduzindo-se o conceito de freqüência simples, como se mostra a seguir: 
 
 
27
8
216


 XX
N
x
X i
 Mauricio Martins do Fanno 
 
 
 
Observar que para dados agrupados em classes o cálculo dos desvios é dado por: 
 
Xpmd ii 
 
 
Os exemplos a seguir demonstram esses cálculos. 
 
 
Exemplo 2 
 
Calcular o desvio médio da amostra de distribuição abaixo, relativa ao número de 
acidentes diários numa estrada federal. 
 
 
 
 
 
 
Exemplo 3 
 
Calcular o desvio médio da amostra de distribuição abaixo, relativa ao tempo de mão de 
obra gasto com a manutenção dos aviões de uma empresa aérea 
 
 Mauricio Martins do Fanno 
 
 
 
 
 
 
 
 
4.1.3 – Variância 
 
A definição de desvio médio leva em consideração os desvios dos elementos tomados a 
1ª potencia. Matematicamente demonstra-se que os efeitos de desvio são mais bem 
representados quando tomados ao quadrado. Essa consideração nos leva à definição das duas 
mais importantes medidas de variabilidade absolutas: a variância e o desvio padrão que 
veremos em seguida. 
 
A variância é o somatório dos desvios tomados ao quadrado, ou seja, é basicamente a 
mesma definição do desvio médio alterando-se apenas a potencia dos desvios2: 
 
 
 
 No caso em que estivermos trabalhando com dados agrupados a forma naturalmente 
deverá incluir o conceito de freqüência simples, ou seja: 
 
 
 Os exemplos de 1 a 3 no próximo item mostram o cálculo da variância nos vários casos 
possíveis. 
 
 
4.1.4 – Desvio Padrão 
 
 
2 Observe também uma alteração no denominador da fórmula, ao invés de N é N-1. Essa alteração é importante 
quando tratarmos dos assuntos relativos a Estimação Estatística (no Curso de Estatística para Administradores). A 
rigor utilizaremos a fórmula acima para amostras e a mesma fórmula com denominador igual a N para populações. 
 Mauricio Martins do Fanno 
 
 
O cálculo ou análise da variância tem um grande inconveniente prático: Ela apresenta 
unidades ao quadrado em relação à medida de tendência central. Por exemplo, suponha que 
queremos descrever uma amostra de salários de uma empresa. Poderíamos afirmar que o 
salário médio da empresa é de 1340 reais e a variância de 11025 reais ao quadrado. 
 
Observe a estranheza que causa a unidade: “reais ao quadrado”. Sem falar do número 
extravagante que resultou dos cálculos. Para contornar-se esse problema define-se a mais 
utilizada das medidas de variabilidade: o desvio padrão. 
 
Conceitualmente o desvio padrão é a raiz quadrada da variância e é simbolizado pela 
letra S maiúscula. Dessa forma é calculado pelas fórmulas: 
 
 
Para dados isolados, e 
 
 
 
Para dados agrupados em classes ou não. 
 
 
Nos exemplos de 1 a 3 a seguir são calculados os valores do desvio padrão e da 
variância, de maneira semelhante ao que foi feito anteriormente para o desvio médio. 
Observe que o cálculo segue os seguintes para em ambos os casos: 
1. Calcular a média da distribuição. 
2. Calcular os desvios de cada elemento 
3. Calcular o quadrado dos desvios 
4. Somar o quadrado dos desvios (usando o conceito de freqüência caso sejam 
dados agrupados) 
5. Dividir a soma obtida pelo número de elementos menos 1, obtendo-se a variância, 
e 
6. Extrair a raiz quadrada, obtendo-se o desvio padrão. 
 
 
Exemplo 1 
 
Calcular a média e o desvio padrão da amostra {18; 21; 22; 27; 28; 29; 32; 37}. 
 
 
 Mauricio Martins do Fanno 
 
 
 
 
 
Cálculo da média: 
 
Cálculo da Variância: 
 
 
Cálculo do Desvio Padrão: 
 
 
Exemplo 2 
 
Calcular a variância e o desvio padrão da amostra de distribuição abaixo, relativa ao 
número de acidentes diários numa estrada federal. 
27
8
216


 XX
N
x
X i
 Mauricio Martins do Fanno 
 
 
 
 
Cálculo da variância: 
 
 
Cálculo do Desvio padrão: 
 
 
 
Exemplo 3 
 
Calcular o desvio padrão da amostra de distribuição abaixo, relativa ao tempo de mão de 
obra gasto com a manutenção dos aviões de uma empresa aérea 
 
 Mauricio Martins do Fanno 
 
 
 
 
 
Cálculo da variância: 
 
 
Cálculo do Desvio padrão: 
 
 
O desviopadrão é a mais utilizada medida de dispersão e quando relacionada com a 
média informar a quantidade de elementos da amostra ou da população que se situam em torno 
da média. 
 
O mais comum, na Estatística é que essa relação entre média e desvio padrão seja feita 
pela chamada distribuição normal, a qual nós voltaremos no curso de Estatística para 
Administradores. Nessa relação, valida na maior parte dos casos práticos, segue-se os 
seguintes Intervalos: 
1. Entre a média mais uma vez o desvio padrão e a média menos uma vez o desvio 
padrão estão contidos 68% dos elementos da amostra ou da população. 
2. Entre a média mais duas vezes o desvio padrão e a média menos duas vezes o 
desvio padrão estão contidos 85% dos elementos da amostra ou da população. 
3. Entre a média mais três vezes o desvio padrão e a média menos três vezes o 
desvio padrão estão contidos 99,74% dos elementos da amostra ou da população. 
4. Entre a média mais quatro vezes o desvio padrão e a média menos quatro vezes o 
desvio padrão estão contidos 100% dos elementos da amostra ou da população. 
 
Exemplo: Um estudo estatístico com 4850 alunos de Administração da Produção de uma 
Universidade mostrou que a nota final média deles foi de 5,3 com desvio padrão 1,2. Quantos 
alunos tiveram médias finais entre 4,1 e 6,5? 
 
 Mauricio Martins do Fanno 
 
 
Observe que as notas: 4,1 e 6,5 correspondem exatamente à média menos um desvio 
padrão (5,3 – 1,2 = 4,1) e à média mais um desvio padrão (5,3 + 1,2 = 6,5). Portanto 68% dos 
alunos estão contidos nesse intervalo, ou seja: 68% de 4850 são 3280 alunos. 
 
Podemos, portanto afirmar que 3280 alunos tiveram notas entre 4,1 e 6,5. 
 
 
4.2 – Medidas de dispersão relativas 
 
A maneira mais comum de se informar de maneira sintética (resumida) dados quantitativos é 
através de uma medida de posição (média, mediana ou moda) em conjunto com uma medida de 
dispersão absoluta (desvio médio, variância ou desvio padrão). O mais comum é o par de 
informações: média - desvio padrão. 
 
Freqüentemente, no entanto, é interessante utilizar-se as chamadas medidas de dispersão 
relativas que analisam simultaneamente uma medida de posição e a mediada de dispersão 
correspondente. São especialmente interessantes essas medidas quando fazemos 
comparações entre amostras diferentes. 
 
A rigor podemos obter essas medidas, costumeiramente chamadas de coeficientes de 
variação, dividindo uma medida de dispersão por uma medida de posição, no entanto, as mais 
comuns são: 
 
1. Coeficiente de variação de Pearson: divisão do desvio padrão pela média: 
100ou 
X
S
Cv
X
S
Cv pp
 
 
2. Coeficiente de variação de Thorndike: divisão do desvio padrão pela mediana: 
 
100ou 
Me
S
Cv
Me
S
Cv pp
 
 
O exemplo a seguir mostra uma aplicação dos coeficientes de variação, num caso de 
ordem prática: 
 
Um especialista estudou, estatisticamente, dois tipos de investimentos chegando às 
conclusões do quadro abaixo. Qual é o investimento que apresenta menor risco?3 
 
 
3 Adaptado de GITMAN, Lawrence J. – Princípios de Administração Financeira. São Paulo: Harbra, 2003. 
 
 Mauricio Martins do Fanno 
 
 
X Y
RETORNO ESPERADO 12% 20%
DESVIO PADRÃO 9% 10%
O especialista teria chegado a 
essas conclusões através de um 
estudo estatístico no qual 
pesquisou e resumiu os retornos 
ocorridos no passado, conforme 
vimos no item 3.1
Analogamente o especialista 
teria calculado o devio padrão 
conforme vimos no item 4.1.4
APLICAÇÕES
ESTATÍSTICAS OBSERVAÇÕES
 
 
Observe que se o especialista comparasse as aplicações somente com base em seus 
desvios padrões, ele preferiria a aplicação X, uma vez que essa aplicação tem um desvio padrão 
menor que Y (9% versus 10%). Essa comparação seria baseada no fato de que sendo mais 
homogênea a aplicação A “daria menos sustos”. No entanto, se ele calculasse e comparasse os 
coeficientes de variação, chegaria a conclusões diferentes: 
 X Y
RETORNO ESPERADO 12% 20%
DESVIO PADRÃO 9% 10%
COEFICIENTE DE VARIAÇÃO 
DE PEARSON
75% 50%
APLICAÇÕES
ESTATÍSTICAS
 
 
 
 
 
 
 
 
A Comparação dos coeficientes de variação das aplicações mostra que o especialista 
estaria cometendo um erro sério se escolhesse a aplicação X em vez da aplicação Y, já que a 
dispersão relativa, ou risco, das aplicações, conforme refletida no coeficiente de variação é 
menor para o ativo Y do que para o X (50% versus 75%). Evidentemente, o uso do coeficiente 
de variação para comparar o risco da aplicação é melhor porque este também considera o 
tamanho relativo, ou retornos esperado, das aplicações 
 
 
5.1 – Relações Gráficas entre as medidas estatísticas 
 
Nos estudos e análises estatísticos é interessante e importante visualizar as informações 
contidas nos dados através do uso dos diversos gráficos, assunto esse que tratamos no Modulo 
2. 
 
Quando utilizamos os histogramas é facilmente perceptível que as freqüências dos 
valores mais centrais tendem a serem maiores que as dos valores extremos. Este 
comportamento nos permitirá conclusões importantes no capítulo da Estatística Indutiva, porque, 
via de regra, ocorre de modo repetitivo. 
 
Observações do padrão de comportamento das distribuições mostram que grande parte 
delas tende a se apresentar da maneira conhecida como Distribuição Normal. 
 
 Mauricio Martins do Fanno 
 
 
A figura 5.1 mostra o comportamento estatístico de uma distribuição de freqüências 
relativa aos pesos de um grupo de pessoas qualquer. Observe que os pesos próximos da média 
têm maior freqüência e o longe da média menor. Observe também a curva que se forma pela 
distribuição das colunas. 
 
 
 
 
 
No curso de Estatística para Administradores iremos retornar ao assunto quando diremos, 
por exemplo, que é pouco provável alguém ter peso acima de 100 kg ou abaixo de 35 kg, e 
utilizaremos essa curva para determinar qual é essa probabilidade, se houver. 
 
Por ora iremos nos preocupar com a variação de formatos desse tipo de curva, chamada 
de Curva Normal, ou Curva de Gauss ou ainda de Curva do Sino. Em teoria espera-se que essa 
curva tenha comportamento mostrado nas curvas desenhada em linha continua nas figuras 5.2 e 
5.3. 
 
Mas na prática ocorrem deformações nessas curvas, demonstradas nas curvas 
pontilhadas das mesmas figuras. Essas deformações são chamadas respectivamente de 
Assimetria (figura 5.2) e curtose (figura 5.3). 
 
 Mauricio Martins do Fanno 
 
 
 
 
 
 
5.1.1 Assimetria 
 
A Assimetria mede o quanto a distribuição se afasta da média. Esse afastamento pode 
ocorrer para a direita ou para a esquerda, gerando respectivamente as assimetrias positiva e 
negativa. 
 
O grau de assimetria é dado freqüentemente pelo chamado 1º coeficiente de Pearson4: 
S
MeXAs 
 
Onde: 
 As = coeficiente de assimetria 
X
= Média 
Me = Mediana 
S = Desvio Padrão 
 
4 Existem outras medidas de assimetria, alem do 1º coeficiente de Pearson 
 Mauricio Martins do Fanno 
 
 
Caso: 
 As = 0 a distribuição é simétrica 
 As > 0 a distribuição é assimétrica positiva ou à direita 
As < 0 a distribuição é assimétrica negativa ou à esquerda 
 
Por esse critério costuma-se classificaras distribuições da seguinte maneira: 
 Caso As ≤ -1 : assimétrica negativa forte 
Caso -1 < As < 0 : assimétrica negativa fraca 
Caso As = 0 : simétrica 
Caso 0 < As < 1 : assimétrica positiva fraca 
Caso As ≥ 1 : assimétrica positiva forte 
 
5.1.2 Curtose 
 
A Curtose mede o quanto a distribuição se alonga ou achata em relação à curva teórica.. 
A curva teórica é chamada de mesocúrtica; as mais alongadas de leptocúrtica e as mais 
achatadas de platicúrtica 
 
O grau de curtose é dado freqüentemente pelo coeficiente:5 
 
 
Onde: K = coeficiente de curtose 
 = desvios 
 = Desvio Padrão 
 
Caso: K = 0 a distribuição é mesocúrtica 
 K > 0 a distribuição é leptocúrtica 
K < 0 a distribuição é platicúrtica 
 
O exemplo a seguir demonstra o cálculo da assimetria e da curtose de uma distribuição 
referente ao consumo de energia elétrica entre 1245 famílias de determinada região. 
 
 Observando os cálculos da próxima página notamos que a distribuição (e a curva dela 
decorrente) é assimétrica negativa fraca, ou seja, ligeiramente deslocada para a esquerda e que 
é platicúrtica, ou seja, achatada, A curva teria a aparência aproximada abaixo (a curva 
pontilhada é a do exercício a cheia é a padrão): 
 
 
5 Existem outros coeficientes de curtose, além do apresentado aqui. 
 
 
 
 Cálculo da Média: 
 
 Cálculo do Desvio Padrão: 
 
 Cálculo da Mediana: 
o Elemento Mediano: 
o Mediana: 
 
 Cálculo da Assimetria: 
 
 Cálculo da Curtose: 
Referências Bibliográficas 
 
ANDERSON, D. R.; SWEENEY, D. J.; WILLIAMS, T. A.. Estatística Aplicada à Administração 
e Economia. 2ª. Ed., São Paulo: Thomson Learning, 2007 
 
BRUNI, Adriano B.. Estatística Aplicada à Gestão Empresarial. São Paulo: Atlas, 2007 
 
BUSSAB, W. O., MORETIN, P.A.. Estatística Básica. 3ª ed.. São Paulo: Atual, 1986. 
 
COSTA NETO, P.L.O.. Estatística. São Paulo: Edgard Blücher, 1979. 
 
COSTA NETO, P.L.O.; CYMBALISTA, M.. Probabilidades. São Paulo: Edgard Blücher, 1974. 
 
DOWNING, D.; CLARK, J.. Estatística Aplicada. 1ª ed., São Paulo: Editora Saraiva 1998. 
 
FONSECA, J.S.; MARTINS, G.A.; TOLETO, G.L.. Estatística Aplicada. São Paulo: Atlas, 1995. 
 
GUERRA, M.; GUERRA, M.J.; DONAIRE, D.. Estatística Aplicada. São Paulo: Ciência e 
Tecnologia, 1991. 
 
KAZMIER, L.J.. Estatística Aplicada à Economia e Administração. São Paulo: Makron 
Books, 1982. 
 
KUNE, H.. Métodos Estatísticos para a Melhoria da Qualidade. São Paulo: Gente, 1993. 
 
LAPPONI, J. A.. Estatística Usando Excel. 4ª. Ed., Rio de Janeiro: Elsevier, 2005 
 
MEDEIROS, E.; MEDEIROS, E.; GONÇALVES, V.; MUROLO, A. C. Estatística para os Cursos 
de Economia, Administração e Ciências Contábeis. 2ª ed., v. 1 e 2. São Paulo: Atlas, 1997 
 
MEDEIROS, E.; MEDEIROS, E.; GONÇALVES, V.; MUROLO, A. C. Tabelas de Estatística 
para os Cursos de Economia, Administração e Ciências Contábeis. 2ª ed. São Paulo: Atlas, 
1999.. 
 
MEYER, P.L.. Probabilidade Aplicações à Estatística. 1a. ed. Rio de Janeiro: Livros Técnicos 
e Científicos Editora, 1976 
 
MILONE, G.; ANGELINI, F.. Estatística Aplicada. São Paulo: Atlas, 1995. 
 
MOORE, D.. A Estatística Básica e Sua Prática. 1a. ed. Rio de Janeiro: LTC – Livros Técnicos 
e Científicos Editora, 2000. 
 
MOORE, D; McCABE, G.P.;DUCKWORTH, W. M.;SCLOVE, S.L.. A Prática da Estatística 
empresarial. Como usar dados para tomar decisões. Rio de Janeiro: LTC – Livros Técnicos e 
Científicos Editora, 2006. 
 
SPIEGEl, M.R.. Estatística. São Paulo: Makron Books, 1993. 
 
STEVENSON, W.J.. Estatística Aplicada à Administração. São Paulo: Habra, 1981. 
 
TRIOLA, M. F.. Introdução à Estatística. Rio de Janeiro: LTC – Livros Técnicos e Científicos 
Editora, 2005. 
 Mauricio Martins do Fanno 
 
 
WITTE, R. S.; WITTE, J.S.. Estatística. 7ª. Ed. Rio de Janeiro: LTC – Livros Técnicos e 
Científicos Editora, 2005. 
 
 
 
 
 
 
 
 
 
 
.

Outros materiais

Materiais relacionados

Perguntas relacionadas

Materiais recentes

Perguntas Recentes