Baixe o app para aproveitar ainda mais
Prévia do material em texto
Para avançarmos nossos estudos sobre Desvio Padrão, precisamos enfatizar a ciência responsável pelo seu estudo, a Estatística. A Estatística é parte da Matemática Aplicada que fornece métodos de coleta, organização, descrição, análise e interpretação de dados, úteis nas tomadas de decisão. Se dividem em: Estatística Descritiva: coleta, organização e descrição dos dados. Estatística Indutiva ou Inferencial: análise e interpretação dos dados. Permite obter conclusões que transcendam os dados obtidos inicialmente, objetivo essencial da Estatística. Probabilidade: útil para analisar situações que envolvem o acaso. Ex: a decisão de parar de imunizar pessoas com mais de vinte anos contra determinada doença. Em estatística existem as medidas de posição e de dispersão. As medidas de posição são: - Moda; - Mediana; - Média; - Quartis, Decis e Percentis; As medidas de dispersão são: - Desvio padrão; - Variância; e - Amplitude. O estudo deste material foca nas medidas de dispersão, mais precisamente no desvio padrão. O desvio padrão é uma medida estatística de dispersão que deve ser usada conjuntamente com a média. O desvio padrão nos dá a informação sobre até que ponto os dados de uma determinada amostra se afastam da média. Desvio padrão é uma medida de dispersão dos valores de uma distribuição normal em relação à sua média. Conhecer o desvio padrão é importante, pois alguns indicadores e estratégias se baseiam nele para apresentar seus resultados. Podemos citar como exemplos as Bandas de Bollinger e as estratégias de Long x Short. Vejamos alguns exemplos: Imagine estaturas de homens adultos. É fácil observar que não existe grande variação, por mais que um homem possa ser extremamente alto ou extremamente baixo. Mesmo que esses eventos extraordinários aconteçam, é bastante plausível afirmar que existirá uma média de estatura se forem observadas as alturas de todos os homens do mundo. Isso é uma distribuição normal. Mas será que o mercado, ou os retornos do mercado, seguem uma distribuição normal? Não, os dados históricos nos mostram que não. É mais plausível atribuir uma distribuição log-normal aos retornos do mercado, ou seja, onde o logaritmo das grandezas dos retornos segue uma distribuição normal, mas ainda assim é impossível afirmar que o mercado segue esse tipo de distribuição. Os retornos do mercado são imprevisíveis, mas uma distribuição normal é um bom ponto de partida na tentativa de mensurar os possíveis retornos futuros, mesmo que com algumas falhas. O desvio padrão de uma variável aleatória X é definido como: Em outras palavras, o desvio padrão amostral de uma variável aleatória X pode ser calculado como: Para cada valor calcula-se a diferença entre e o valor médio . Calcula-se o quadrado dessa diferença. No caso dos dados estarem tabelados (com frequências), multiplica-se cada um destes quadrados pela respectiva frequência, ou seja, a soma é a dos produtos dos quadrados das diferenças pela respectiva frequência. Encontra-se a soma dos quadrados das diferenças. Divide-se este resultado por: (número de valores), ou seja, . Esta quantidade é a variância . Tome a raiz quadrática deste resultado. O desvio padrão também pode ser calculado quando não se sabe a média dos dados. O cálculo é feito conforme a fórmula: onde é o valor esperado de X. Nem todas as variáveis aleatórias possuem desvio padrão, porque esses valores esperados não precisam existir. Por exemplo, o desvio padrão de uma variável que flui em uma distribuição de Cauchy é indefinido. Se uma variável aleatória toma os valores então o desvio padrão para esta amostra de números (ou desvio padrão amostral) pode ser calculado da seguinte forma. Primeiro calcula-se a média de através de: Depois, o desvio padrão amostral é calculado como: Disponível em: https://pt.wikipedia.org/wiki/Desvio_padr%C3%A3o Para entendermos melhor o cálculo do desvio padrão, vamos analisar algumas situações hipotéticas: Caso 1) Dois automóveis fazem o mesmo percurso de 500 km em 5 horas, o que dá uma média de 100km/h. Suas velocidades médias em cada hora são apresentadas conforme tabela abaixo: Velocidades médias em km/h Hora Veículo A Veículo B 1 120 95 2 80 105 3 140 99 4 60 100 5 100 101 Qual dos dois veículos apresentou a menor variação de velocidade? Qual veículo manteve a velocidade mais constante? Essas perguntas também podem ser expressadas da seguinte forma: qual veículo apresentou o menor desvio padrão? Apenas observando a tabela percebemos que o veículo apresenta a menor variação de velocidade, mantendo uma velocidade mais constante, portanto é o veículo que apresentou o menor desvio em relação à velocidade média de 100 km/h. O veículo A variou sua velocidade de 60 a 140 km/h enquanto o carro B variou de 95 a 105 km/h. Agora vamos calcular o desvio padrão de cada automóvel: No caso do veículo A, calculamos a diferença em relação à média: 120-100, 80-100, 140-100, 60-100 e 100-100. Em seguida, calculamos o quadrado de cada um destes valores. Continuando o exemplo acima: 20², -20², 40², -40² e 0². Adicionamos cada um destes valores e dividimos pelo número de observações. Continuando o exemplo da empresa A: (400+400+1600+1600+0) / 5 = 800. Por fim calculamos a raiz quadrada desse número. Então teríamos para o mesmo exemplo: √800 = 28,28. O desvio-padrão do carro A é 28,28. No caso do veículo B, calculamos a diferença em relação à média: 95-100, 105-100, 99-100, 100-100 e 101-100. Em seguida, calculamos o quadrado de cada um destes valores. Continuando o exemplo acima: -5², 5², -1², 0² e 1². Adicionamos cada um destes valores e dividimos pelo número de observações. Continuando o exemplo da empresa A: (25+25+1+0+1) / 5 = 10,4. Por fim calculamos a raiz quadrada desse número. Então teríamos para o mesmo exemplo: √10,4 = 3,22. O desvio-padrão do carro B é 3,22. Caso 2) Duas empresas de entregas rápidas, apresentam uma média de tempo de entrega de mercadorias de 20 horas. Uma das empresas apresenta um desvio padrão de 2 horas e 54 minutos e a outra um desvio padrão de 4 horas e meia. Qual das duas empresas tem um desempenho melhor em relação ao tempo de entrega? Conhecendo o significado do desvio padrão, a resposta seria óbvia: a primeira empresa é melhor porque o tempo de entregas é menos disperso em relação à média. Mas vamos ver os exemplos para as amostras destas duas empresas. Na tabela seguinte podemos analisar os tempos de entrega destas empresas (em horas) ao longo de 7 dias: Para calcular a média, já sabemos que basta adicionar os valores e dividir o resultado por 7. O cálculo do desvio-padrão, mesmo sem usar a máquina de calcular ou Excel, é bastante fácil: Para cada valor, calculamos a diferença em relação à média. Por exemplo, para a empresa A, calculamos 15-20, 18-20, 19-20, 20-20, 21-20, 22-20 e 25-20. Em seguida, calculamos o quadrado de cada um destes valores. Continuando o exemplo acima: -5², -2², 1², 0², 1², 2² e 5². Adicionamos cada um destes valores e dividimos pelo número de observações. Continuando o exemplo da empresa A: (25+4+1+0+1+4+25) / 7 = 8,571. Por fim calculamos a raiz quadrada desse número. Então teríamos para o mesmo exemplo: √8,571= 2,9. O desvio-padrão da empresa A é 2,9. Vamos fazer o mesmo para a empresa B: Para cada valor, calculamos a diferença em relação à média. Por exemplo, para a empresa A, calculamos 26-20, 23-20, 15-20, 20-20, 25-20, 17-20 e 14-20. Em seguida, calculamos o quadrado de cada um destes valores. Continuando o exemplo acima: 6², 3², -5², 0², 5², -3², -6². Adicionamos cada um destes valores e dividimos pelo número de observações. Continuando o exemplo da empresa A: (36+9+25+0+25+9+36) / 7 = 20. Por fim calculando a raiz quadrada de √20 = 4,5. O desvio-padrão da empresa B é 4,1. Isto significa que a empresa A é mais confiável quanto a manter o tempo médio de entregas nas 20 horas. Link: https://www.portal-gestao.com/item/7343-ferramentas-b%C3%A1sicas-de-an%C3%A1lise-financeira-o-desvio-padr%C3%A3o.htmlMedidas de Dispersão ou de Variabilidade Amplitude total (AT) a) a amplitude total é a diferença entre o maior valor e o menor valor observado: Exemplo: 40, 45, 48, 52, 54, 62, e 70 AT = 70 - 40 = 30 Quanto maior a amplitude total, maior será a dispersão dos valores da variável em torno da média. Variância (s2) e Desvio Padrão (s) São mais estáveis que a amplitude total, não sofrem tanto a interferência de valores extremos. a) para dados não agrupados A variância é a média aritmética dos quadrados dos desvios: A variância é um número em unidade quadrada em relação à média, por isso, definiu-se o desvio padrão como a raiz quadrada da variância. O desvio padrão é a raiz quadrada da média aritmética dos quadrados dos desvios. Para evitar o acúmulo de erro por arredondamento, simplifica-se o cálculo do desvio padrão com a seguinte fórmula: que resulta em: Observação: Quando calcula-se a variância ou o desvio padrão de uma população através de uma amostra dessa, deve-se substituir o denominador n por n-1. Propriedades: 1a: Somando-se (ou subtraindo-se) uma constante a (de) todos os valores de uma variável, o desvio padrão não se altera. 2a.: Multiplicando-se todos os valores de uma variável por uma constante (diferente de zero), o desvio padrão fica multiplicado por essa constante. Exemplo: Calcule o desvio padrão da seguinte série: i xi xi2 1 8 64 2 10 100 3 11 121 4 15 225 5 16 256 6 18 324 Total 78 1090 b) para dados agrupados sem intervalos de classe: deve-se levar em conta as frequências. Exemplo: i Qtde de filhos que se deseja ter (xi) fi fi . xi fi . xi2 1 0 2 0 0 2 1 6 6 6 3 2 12 24 48 4 3 7 21 63 5 4 3 12 48 Total 30 63 165 Como obter o desvio padrão com o auxílios dos sistemas de informação Para obter os valores de uma distribuição normal precisamos de duas coisas: o cálculo da média e o desvio padrão da distribuição. O desvio padrão nos indica como os valores se comportam quando distantes da média, ou seja, seu grau de dispersão e sua probabilidade de acontecer a certa distância da média. Vejamos: Na tabela temos os valores hipotéticos de um ativo. Calculamos a média dos valores com auxílio da função MÉDIA no Excel e em seguida calculamos o valor do desvio padrão, dessa vez com auxílio da função DESVPAD no Excel. Somando a média com mais um (+1) e menos um (-1) desvio, obtemos a primeira faixa de dispersão dos valores no gráfico. Fazemos o mesmo para dois e três desvios. Veja o significado dos valores no gráfico: Em vermelho tracejado temos a média dos valores do ativo hipotético para o período estudado. Entre as linhas azuis temos os valores encontrados dentro de mais um (+1) e menos um (-1) desvio padrão. Entre as linhas laranja temos os valores encontrados dentro de mais dois (+2) e menos dois (-2) desvios padrão. Entre as linhas verdes temos os valores encontrados dentro de mais três (+3) e menos três (-3) desvios padrão. O ponto mais importante de uma distribuição normal vem a seguir, as probabilidades dos valores acontecerem longe da média. É isso que você deve aprender e ter em mente. Acompanhe: 68,26% dos valores de uma distribuição normal encontram-se dentro da faixa de um desvio padrão, tanto para mais quanto para menos em relação à média. 95,44% dos valores de uma distribuição normal encontram-se dentro da faixa de dois desvios padrão, tanto para mais quanto para menos em relação à média. 99,72% dos valores de uma distribuição normal encontram-se dentro da faixa de três desvios padrão, tanto para mais quanto para menos em relação à média. Esse tipo de relação é representada pelo gráfico a seguir, conhecido como “Bell Curve”, ou curva do sino. Crédito da imagem: Wikimedia Commons Disponível em: http://www.investpedia.com.br/artigo/O+que+e+desvio+padrao.aspx
Compartilhar