Prévia do material em texto
1 Unidade 01 - Medidas Descritivas 1. Estatística - é uma ciência que deriva da matemática. É composta por três ramos que são (Stevenson, 2001): 1.1 Estatística descritiva – é a parte da estatística que se utiliza de números para descrever fatos. Compreende simplificar informações que podem ser muito complexas. 1.2 Probabilidade – analisa situações que envolvem o acaso como jogos de cartas, lançamentos de dados, etc. Conforme Stevenson (2001) a maioria dos jogos esportivos também é influenciada pelo acaso, até certo ponto. Para Zikmund (2006) probabilidade é a freqüência relativa de longo prazo na qual um evento ocorrerá. 1.3 Inferência estatística – está relacionada com a análise e interpretação de dados amostrais, ou seja, “não é preciso comer um bolo inteiro para saber se é bom”. Baseia-se em efetuar uma mensuração sobre uma pequena parcela (amostra) da população e utilizar essa informação para fazer inferência à população toda (Stevenson, 2001). Barbetta (2002) define Inferência estatística como sendo o ato de generalizar resultados da parte (amostra) para o todo (população). Conforme este autor existe duas formas de inferência estatística: 1.3.1 Estimação de parâmetros – avaliam-se certas características dos elementos da população a partir de operações com os dados de uma amostra. É um raciocínio tipicamente indutivo em que se generalizam resultados de uma parte (amostra) para o todo (população). AMOSTRA (dados observados) Estimação POPULAÇÃO (universo em estudo) de parâmetros Fonte: Barbetta (2002, p. 171) 1.3.2 Testes estatísticos de hipóteses ou testes de significância – é quando se tem uma hipótese sobre uma população em estudo e quer se verificar a sua validade, a partir de uma amostra. Em pesquisas empíricas, é fundamental se testar adequadamente as hipóteses formuladas, pois estas, quando comprovadas estatisticamente, passam a servir de suporte para outras pesquisas, construindo-se assim um encadeamento de conhecimentos (Barbetta, 2002 p. 17). Pesquisa Dados Informações Novos conhecimentos Novas hipóteses 1.4 Conceitos importantes – apresentam-se no decorrer do texto alguns conceitos muito importantes e de grande utilidade na estatística. Estes conceitos servirão de suporte ao entendimento dos conteúdos posteriores. 2 a) população alvo – é o conjunto de elementos que queremos abranger em nosso estudo. Este conjunto pode ser composto conforme os elementos de interesse do pesquisador, como por exemplo: funcionários de uma empresa, usuários de um sistema de transporte coletivo, passageiros de uma companhia de aviação, etc. (Barbetta, 2002). b) população ou população acessível ou universo – é o conjunto de elementos que formam o universo de nosso estudo e que são passíveis de serem observados (Barbetta, 2002). Obs: Existe diferença entre os dois conceitos acima. Imagine uma pesquisa envolvendo todos os funcionários de uma fábrica (população alvo). Mas se 10% deles estiverem de férias ou em licença e for feita a pesquisa, neste caso a população que participará será a população acessível. Tem-se que ter cuidado e o pesquisador deve ter consciência desta diferença entre as duas populações. c) amostragem – é o processo que envolve o uso de um pequeno número de unidades ou partes de uma população como base para tirar conclusões sobre a população como um todo (Zikmund, 2006). d) amostra – é o subconjunto ou uma parte de uma população maior. Seu propósito é capacitar alguém a fazer uma estimativa de algumas características desconhecidas da população (Zikmund, 2006). e) Elemento da população – é o indivíduo membro da população (Zikmund, 2006). f) Censo – é uma investigação de todos os elementos individuais que constituem a população, ou seja, abrange todos os elementos da população (Zikmund, 2006). g) proporção – indica o percentual de elementos da população que atendem plenamente um padrão para uma determinada característica. Pode ser expresso em percentagem, fração ou valor decimal (Zikmund, 2006). h) parâmetro – Conforme Barbetta (2002) parâmetro é alguma característica descritiva dos elementos da população. Ex: a média de alguma variável, a proporção (porcentagem) de algum atributo (característica). i) estatística – é todo o cálculo com os dados de uma amostra. Pode ser o cálculo de uma média ou de uma proporção (Barbetta, 2002). j) dados – são os números coletados de uma amostra ou de uma população (censo). Ex: renda anual, vendas mensais, número de peças defeituosas, percentual de respostas favoráveis. (Stevenson, 2001). k) variáveis – são as características que podem ser observadas (medidas) em cada elemento da população, sob as mesmas condições. Ex: tempo de serviço, estado civil, etc. (Barbetta, 2002). 3 1.5 Dados quantitativos e dados categorizados – compões alguns tipos de variáveis que podem ser dos seguintes tipos: discretas, contínuas, nominais e por postos. 1.5.1 Tipos de variáveis – As variáveis podem ser classificadas como discretas, contínuas, nominais e por postos. 0 0 a) Variáveis discretas – são as variáveis que assumem valores inteiros. Ex: n de filhos, n de 0 de funcionários de uma fábrica. Barbetta (2002) afirma que estas variáveis cômodos de uma casa, n são classificadas como quantitativas. b) Variáveis contínuas – são as variáveis que assumem valores reais (Números Reais). Ex: altura, peso, comprimento, temperatura, etc. É lógico que as medidas estão sujeitas a precisão dos equipamentos de medição. Stevenson (2001) coloca que estas variáveis também são classificadas como quantitativas. c) Variáveis nominais – envolvem variáveis que não são inerentemente numéricas (Stevenson, 2001). São variáveis classificadas como qualitativas e devem ser convertidas em valores numéricos antes de serem processadas estatisticamente. Envolvem categorias como sexo (masculino, feminino), cor dos olhos (azuis, castanhos, verdes), campo de estudo (administração, medicina, direito, engenharia), ou seja, sem conotação de ordem. d) Variáveis por postos – consiste em valores relativos atribuídos para denotar ordem: primeiro, segundo, terceiro, e são classificadas como qualitativas (Stevenson, 2001). Exemplo: Tipos de dados Populações Contínuo Discreto Nominal Por Postos Alunos do 2 0 grau Lucro, Cambio n 0 da chamada menino/menina 1 0 grau, 2 0 grau Automóveis Km/h n 0 de defeitos Cores do automóvel Grau de limpeza Fonte: adaptado de Stevenson (2001, p.13) Exercício de sala: classifique as variáveis abaixo em contínua, discreta, nominal e por postos (adaptado de Stevenson, 2001). a) Massa: ____________________________ b) Tempo ______________________________ c) N 0 de cadeiras: ______________________ d) cor dos olhos _________________________ e) Gênero: ____________________________ f) o mais satisfeito: _______________________ g) o mais lento: ________________________ h) Cor da pele: ___________________________ i) N 0 de pessoas: ______________________ j) Altura: _______________________________ 4 1.6 Tipo de Escalas – Segundo Hair et al (2009), os dados podem ser classificados como não- métricos (qualitativos) e métricos (quantitativos). O mesmo ocorre com as escalas de medida que podem ser escalas não-métricas e métricas, a saber: 1.6.1 Escalas de Medidas Não-Métricas – são escalas que medem diferenças em tipo ou natureza (sexo, cor de olhos) indicando a presença ou ausência de uma característica ou propriedade. Estas propriedades são discretas e exaustivamente excluídas (ex: uma pessoa não pode ser do sexo masculino e feminino ao mesmo tempo) e estas variáveis são qualitativas e não quantificáveis (HAIR, et al 2009). Estas medidas não-métricas podem ser obtidas por dois tipos de escalas quesão a escala nominal ou categórica e a escala ordinal. 1.6.1.1 Escalas Nominais ou Categóricas – Segundo Hair et al (2009, p. 24), “designam números para rotular ou identificar indivíduos ou objetos”. Observe que os números associados aos objetos não tem significado quantitativo (não medem quantidade) e só podem oferecer o número de ocorrências de cada classe ou categoria da variável estudada (HAIR, et al 2009). Exemplo: ao classificar sexo, pode-se sugerir: 1 – Masculino; 2 – Feminino. Neste caso a escala irá fornecer somente o número de homens ou de mulheres de uma amostra, sendo somente possível calcular os percentuais de gênero da amostra. Outros exemplos são: filiação partidária, ocupação, religião, etc. 1.6.1.2 Escalas Ordinais – Segundo Hair et al (2009, p. 24), “estas escalas são o próximo nível superior de precisão de medida”. Nestas escalas as variáveis podem ser ranqueadas ou ordenadas em relação à quantia de alguma característica do atributo que está sendo medido. Estas escalas também “não fornecem qualquer medida de quantia ou magnitude real em termos absolutos, mas apenas a ordem dos valores já que todo o indivíduo ou objeto pode ser comparado com outro em termos de uma relação de forma” de “maior que” ou “menor que” (HAIR, et al 2009, p. 24). Estas escalas fornecem a ordem, mas não a quantia da diferença dos valores dos atributos pesquisados. Exemplo: Nada satisfeito Muito satisfeito Produto A Produto B Produto C Observe na escala acima que o produto C satisfez mais que o produto B e que o produto A o cliente,mas não se pode fazer qualquer declaração quantitativa entre as diferenças das satisfações dos produtos ou dos valores absolutos da satisfação, ou seja, não se pode afirmar que o grau de satisfação do cliente em relação ao produto C é o dobro em relação ao produto B e que o grau de 5 5 satisfação do produto B é o dobro em relação ao produto A. Esta escala não possui valores quantitativos. Observação importantíssima: Os Testes Não-Paramétricos além de serem testes livres de distribuição, ou seja, que exigem menos restrições estatísticas, os mesmos são baseados nas escalas apresentadas acima, ou seja, escalas NÃO-MÉTRICAS (MALHOTRA, 2001; STEVENSON, 2001). Observe que estas escalas não-métricas têm a tendência de fornecerem informações menos precisas em relação às medidas dos atributos. Este é mais um motivo que comprova a tendência dos testes não-paramétricos serem mais fracos que os testes paramétricos (que exigem escalas métricas). Conforme Hair et al (2009, p. 25), “as escalas Não-Métricas não admitem de forma alguma operações aritméticas (somas, subtrações, divisões, multiplicações, médias ponderadas, desvio padrão, variância, etc.), tornando assim os dados não métricos bastante limitados”. Neste material (Unidade 09) serão apresentados três testes uni-variados e não-paramétricos que poderão ser utilizados em variáveis de natureza não-métrica (variáveis qualitativas). 1.6.2 Escalas de Medidas Métricas – ao contrário dos dados não-métricos, “os dados métricos são utilizados quando os indivíduos diferem em grau ou quantidade em relação a um atributo em particular” (HAIR et al, 2009, p. 24). Para este autor, “variáveis metricamente medidas refletem quantidade ou grau relativo e são apropriadas para atributos envolvendo quantidades ou magnitude” como nível de satisfação, grau de comprometimento, grau de confiança, etc. Conforme Hair et al, (2009, p. 25), “as Escalas Métricas fornecem o mais alto nível de precisão de medida permitindo com que quase todas as operações matemáticas e têm unidades constantes de medidas”. As escalas métricas são de dois tipos, a saber: 1.6.2.1 Escalas Intervalares – Segundo Hair et al (2009, p. 25), “nestas escalas as diferenças em quaisquer dois pontos da escala são iguais, mas as mesmas têm um ponto zero relativo (arbitrário) e não absoluto. Isto significa que esta escala não tem valor zero absoluto, e se sendo assim, seu valor mínimo é negativo! O melhor exemplo deste tipo de escala são as escalas de temperatura Celsius e Fahrenheit, onde o zero não representa a menor temperatura existente, ou seja, estas escalas apresentam valores negativos (tanto que o zero absoluto corresponde a - 273,15 0 C). Logo neste tipo de escala “NÃO PODEMOS DIZER QUE QUALQUER VALOR É UM MÚLTIPLO DE ALGUM OUTRO VALOR NA ESCALA” (HAIR, et al, 2009, p. 25). Ex: O valor de 40 0 C não corresponde ao dobro do valor de 20 0 C. O valor de 60 0 F não corresponde ao dobro do valor de 30 0 F. 6 1.6.2.2 Escalas Razão – Segundo Hair et al (2009, p. 25), “as escalas razão representam a mais elevada forma de precisão de medida, pois além de terem todas as propriedades anteriores, possuem o zero absoluto”. Todas as operações matemáticas podem ser utilizadas com este tipo de escala sendo Hair et al (2009). Isto significa que esta escala não tem valor negativo e o zero absoluto é o menor valor de medida do atributo que está sendo medido! O melhor exemplo deste tipo de escala é a escala Kelvin, onde o zero representa a menor temperatura existente no universo, ou seja, esta escala não apresenta valores negativos. Logo neste tipo de escala “PODEMOS DIZER QUE QUALQUER VALOR É UM MÚLTIPLO DE ALGUM OUTRO VALOR NA ESCALA”. Ex: O valor de 20K corresponde à metade do valor de 40K. 0C 0F K 100 212 373 0 32 273 -273 - 459 0 Observação importantíssima: Os Testes Paramétricos são testes estatísticos mais fortes que os testes não paramétricos (STEVENSON, 2001) e só podem ser realizados quando se utilizam Escalas Métricas. Observe que estas escalas métricas têm a tendência de fornecerem informações mais precisas em relação às medidas dos atributos. Este é mais um motivo que comprova que os testes paramétricos são “mais fortes” que os testes não-paramétricos. Conforme Hair et al (2009, p. 25), “as escalas Métricas admitem todas as operações aritméticas (somas, subtrações, divisões, multiplicações, médias ponderadas, desvio padrão, variância, etc.), tornando assim os dados métricos bastante precisos”. Neste material (Unidades 07, 08 e 09) serão apresentados três testes uni-variados e paramétricos que poderão ser utilizados em variáveis de natureza métrica (variáveis qualitativas) e também se utilizando as escalas métricas já aqui apresentadas. 7 1 1.7 Medidas descritivas de tendência central - São as medidas denominadas de média aritmética simples, média ponderada, mediana, moda, desvio padrão e variância. No decorrer deste material será descrita a definição de cada uma delas. 1.7.1 Média aritmética simples – é definida pela soma dos valores, dividido pelo número de valores observados (Barbetta, 2002). 1.7.1.1 Definição matemática: xm = xi n m = xi n Para amostras Para populações Onde: x – média aritmética simples da amostra xi – valores observados n – número de observações – média aritmética simples da população xi – valores observados n – número de observações Exemplo: Calcule a média aritmética simples dos valores: 70; 80; 120; xm = 70 + 80 + 120 = 90 3 A média aritmética simples tem propriedades interessantes como afirma Stevenson (2001) e por isto ela é a medida de tendência central mais utilizada. a) a média aritmética simples de um conjunto de números pode sempre ser calculada; b) para um dado conjunto de números a média aritmética simples é única; c) A media aritmética simples é sensível a qualquer medida do conjunto e se algum valor for modificado, a média também será; d) Se multiplicar-se, somar-se, subtrair-se ou dividir-se os valores do conjunto de números que se está calculando a média aritmética simples por uma constante k, sendo(k 0), a média aritmética simples também será multiplicada, somada, subtraída ou dividida por este mesmo valor; e e) a soma dos desvios dos números de um conjunto a contar da média é zero [(xi – x)= 0] Ex: a média dos números 2, 4 e 6 é igual a 4. Os desvios são: 2 – 4 = - 2 ; 4 – 4 = 0 ; 6 – 4 = 2 onde: - 2 + 0 + 2 = 0 8 1.7.1.2 Interpretação da média aritmética simples – pode-se dizer que a média aritmética simples representa o centro de um conjunto de valores considerando o conceito físico de ponto de equilíbrio. Se imaginarmos no exemplo abaixo uma tábua com pesos de massas iguais, o valor da média seria o ponto onde esta tábua ficaria equilibrada. Turmas Notas dos alunos Média da Turma A 4 5 5 6 6 7 7 8 6,00 B 1 2 4 6 6 9 10 10 6,00 C 0 6 6 7 7 7 7,5 7,5 6,00 Fonte: exemplo adaptado de Barbetta (2001) A 0 2 4 5 6 7 8 9 10 B 0 1 2 4 6 9 10 C 0 6 7 7,5 10 Observe que esta medida não informa o comportamento da dispersão dos valores da distribuição em torno da média aritmética. No decorrer da apostila serão descritas medidas definidas como variância e desvio-padrão que estarão relacionadas com a dispersão dos valores observados (Barbetta, 2002). 1.7.2 Média Aritmética Ponderada – no caso da média aritmética simples todos os valores tem a mesma importância. Neste caso de ponderação, os valores observados terão importâncias (pesos) diferentes. Seu cálculo é definido pela soma dos valores observados multiplicados pelos pesos e dividido pela soma dos pesos (Stevenson, 2001). 1.7.2.1 Definição Matemática: xp = wi . xi wi p = wi .xi wi Para amostras Para populações Onde: xp – média ponderada da amostra p–média da população xi – valores observados xi – valores observados wi – pesos dos valores observados wi – pesos dos valores observados 9 Exemplo: Calcule a média final ponderada do aluno abaixo: Exame Nota Peso 1º teste 8,0 0,30 2º teste 9,0 0,30 3º teste 9,6 0,40 Total 1,00 Xp = (0,30)(8,0) + (0,30)(9,0) + (0,4)(9,6) = 9,0 0,3 + 0,3 + 0,4 1.7.3 Mediana – sua principal característica é dividir um conjunto ordenado de dados em dois grupos iguais e a posição do termo do meio pode ser calculado pela seguinte fórmula: (n + 1)/2. Uma metade terá valores inferiores à mediana e a outra metade terá valores superiores à mediana. De acordo com Stevenson (2001), para calcular-se a mediana faz-se o seguinte: a) ordenam-se os valores; b) verificar se há um número par ou ímpar de valores; e c) para um número ímpar de valores, a mediana é o valor do meio. Para um número par de valores, a mediana é a média aritmética simples dos dois valores do meio. Exercício: calcule a mediana dos valores na tabela abaixo: Valores Mediana 5,1 6,5 8,1 9,1 10,1 15,5 18,5 20,3 22,4 1) 9 40 40 50 55 55 70 80 900 2) 0 6 6 7 7 7 7,5 7,5 3) 1.7.4 Comparação entre média aritmética e mediana – a escolha de se utilizar a média aritmética ou a mediana como medida de tendência central de um conjunto de valores depende de vários fatores. A média é sensível a valores extremos o que já não acontece com a mediana. Em compensação a mediana é mais adequada para valores como a renda pessoal ou valor médio de casas de um bairro, porque bastam alguns valores muito altos para inflacionar a média aritmética. A mediana tem a desvantagem de não poder ser determinada por calculadora e também depende da possibilidade de se poder ordenar os valores (Stevenson, 2001). Exemplo: 0 2 3 4 5 6 7 8 9 10 Mediana = 0; 0; 0; 2; 2; 2; 9; 10; 10; 10; 10 = (1 + 11)/2 = 6 – mediana é a posição do número. Média = (0 + 0 + 0 + 2 + 2 + 2 + 9 + 10 + 10 + 10 + 10 ) / 11 = 55 / 11 = 5 10 1.7.5 Moda – a moda é o valor que ocorre com a maior freqüência (é o que maia aparece) em um conjunto de observações (Stevenson, 2001). A moda funciona como medida descritiva quando se trata de contar dados. Esta medida descritiva é a menos útil para problemas estatísticos porque dela não se faz análise matemática, mas em compensação a moda se torna importante quando um, dois ou um grupo de valores ocorre com muito maior frequência do que outros. Quando os valores possuem basicamente a mesma frequência, a moda não se destaca, ou seja, não tem muita utilidade (Stevenson, 2001). 1.7.6 Comparação entre média aritmética simples, mediana e moda – a tabela abaixo mostra uma comparação destas três medidas descritivas. Definição Vantagens Limitações Média x = xi/n Reflete cada valor. É influenciada por Possui propriedades valores extremos. matemáticas atraentes. Mediana Metade dos valores Menos sensível a valores Difícil de determinar menores e metade extremos do que a média. para grande dos valores maiores. quantidade de dados. Moda Valor mais Valor típico: maior Não se presta à freqüente. quantidade de valores análise matemática. concentrada nesse ponto. Fonte: Stevenson (2001, p. 23) 11 Exercícios de Fixação 2 1) Determine a média aritmética e a mediana de cada conjunto de números abaixo. a) 7 9 2 1 5 4,5 7,5 6,2 b) 1 2 10 7 7 9 8 5 2 11 2) Determine a média aritmética e a mediana de cada conjunto de números abaixo. a) 30 2 79 50 38 17 9 b) 0,011 0,032 0,027 0,035 0,042 3) Um órgão do governo do estado está interessado em determinar padrões sobre o investimento em educação, por habitante, realizado pelas prefeituras. De um levantamento de dez cidades, foram obtidos os valores (codificados) da tabela abaixo: Cidade A B C D E F G H I J Investimento 25 16 14 10 19 15 19 16 19 18 (a) Calcule a média das observações. (b) Indique o Valor Modal (c) Indique a Mediana 4) Uma empresa é constituída de 52 funcionários, sendo os seus salários representados pela tabela a seguir: Nº FUNC SALARIO 20 R$ 900 15 R$ 930 8 R$ 1395 4 R$ 2000 5 R$ 4.500 a) Qual o salário médio dos funcionários dessa empresa? 5) Uma empresa de Consultoria decidiu avaliar os seus setores de serviços, decidindo entao, convocar seus principais acionistas para que os mesmos atribuíssem notas pelo desempenho dos setores. A cada acionista, foi atribuído um peso de voto, proporcional a quantidade de ações que possui. Através da media ponderada avalie qual o setor mais eficiente segundo a perspectiva dos sócios. Aluno (a) RH Contabilidade Depart. Pessoal Financeiro Pesos Acionista 1 6,0 8,5 9,5 7,3 1,5 Acionista 2 9,0 6,0 7,0 8,0 2,5 Acionista 3 7,2 9,3 5,4 10,0 3 Acionista 4 10,0 9,1 8,7 5,0 4 Fonte: exercício de Stevenson (2001) e de Barbetta (2002), adaptado pelo Prof. André Barros 12 RESPOSTAS – EXERCÍCIOS DE FIXAÇÃO 1) a) média 5,28 mediana = 5,6 b) média = 6,20 mediana = 7 2) a) média = 32,14 mediana = 30 b) média = 0,0294 mediana = 0,032 3) a) 17,1 b) 19 c) 17 4) R$ 1.415,57 5) RH 8,46 Contabilidade 8,37 D. Pessoal 7,52 Financeiro 7,36 13 Unidade 2 – Medidas de Dispersão 1 2.1 Introduções – tanto a variância quanto o desvio padrão são medidas que medem a dispersão e que fornecem informações adicionais e complementares em relação à média e à mediana. Para calcular-se a variância e o desvio padrão, devem-se considerar os desvios de cada valor em relação a media aritmética da distribuição (Barbetta, 2002). Depois se calcula a média aritmética destes desvios. No caso de uma amostra o denominador será (n – 1), onde n é o número de observações. No caso de uma populaçãoo denominador da fração Será N, onde N é o número de observações. Observe o exemplo abaixo: Descrição Notação Resultados numéricos Valores x 4 5 5 6 6 7 7 8 Média xm 6 Desvios em relação à média x – xm - 2 - 1 - 1 0 0 1 1 2 Desvios quadráticos (x – xm) 2 4 1 1 0 0 1 1 4 Fonte: Barbetta (2002, p. 103) Para evitar os desvios negativos, trabalhar-se-á com os desvios quadráticos. 2.2 Variância – é definida como a média dos quadrados dos desvios das observações a contar da média, calculando-se por n – 1 no lugar de n. Existem duas fórmulas para se calcular a variância. A segunda opção é matematicamente equivalente a primeira e é mais conveniente, pois reduz os erros de arredondamento (Barbetta, 2002). (Sx)²= f.(x – xm)² (Sx)² = (x)² .f – n.(xm)² n – 1 n – 1 Onde: 2 Variância da amostra (Sx) – x – valores observados 2 (x) – quadrado dos valores observados xm – média aritmética simples 2 – quadrado da média aritmética simples (xm) n – número de observações da amostra n – número de observações da amostra f – frequência das observações f – frequência das observações S(X)² - Variância da amostra Importante: como a variância é calculada em função dos desvios quadráticos, sua unidade de medida será a unidade da variável em estudo, elevada ao quadrado. Para simplificar isto, utiliza-se o desvio padrão (Barbetta, 2002). 2.3 Desvio-padrão – é definido como a raiz quadrada positiva da variância da amostra (Stevenson, 2001). 14 Neste caso a segunda expressão também é matematicamente equivalente a primeira e é mais conveniente, pois também reduz os erros de arredondamento (Barbetta, 2002). Sx = f.(x – xm)² n – 1 Onde: Sx – desvio padrão da amostra x – valores observados xm – média aritmética simples n – número de observações da amostra f – frequência das observações Sx = (x)² .f – n.(xm)² n – 1 Sx – desvio padrão da amostra (x) 2 – quadrado dos valores observados (xm) 2 – quadrado da média aritmética simples n – número de observações da amostra f – frequência das observações 15 Importante: ao se comparar o desvio padrão de duas ou mais distribuições, podemos avaliar sua dispersão. O desvio Padrão é sempre não-negativo e quanto maior for seu valor, mais Dispersos serão os valores observados (x). 4.3 Exemplos resolvidos – observe a resolução da variância utilizando as duas expressões acima. Utilizar-se-á os valores do exemplo anterior. Descrição Notação Resultados numéricos Valores x 4 5 5 6 6 7 7 8 Média xm 6 Desvios em relação à média xm - x - 2 - 1 - 1 0 0 1 1 2 Desvios quadráticos (x – xm) 2 4 1 1 0 0 1 1 4 Valores ao quadrado 2 16 25 25 36 36 49 49 64 x Fonte: Barbetta (2002, p. 103) Cálculo da variância: (Sx) ² = (x – xm) ² = 4 + 1 + 1 + 0 + 0 + 1+ 1+ 4 = 1,71 8 – 1 n – 1 Cálculo do desvio padrão: (Sx) = 1,71 = 1,31 Utilizando-se a segunda expressão os cálculos da variância e do desvio padrão ficariam assim: Cálculo da variância: 2 (x) . f = 16 + 2.(25) + 2.(36) + 2.(49) + 64 = 300 n. (xm) 2 = 8 . (6) 2 = 8 . 36 = 288 2 2 (x) . f - n. (xm) = 300 – 288 = 12 12 = 12 = 1,71 S(X)²= (x)² . f – n. (xm)² = n – 1 8 – 1 7 Cálculo do desvio padrão: (Sx) = 1,71 = 1,31 16 5.0 - Coeficiente de Variação Em Estatística, o coeficiente de variação de Pearson é uma medida de dispersão relativa, empregada para estimar a precisão de experimentos e representa o desvio- Padrão expresso como porcentagem da média. Sua principal qualidade é a capacidade de comparação de distribuições diferentes. O coeficiente de é obtido pela razão entre o desvio-padrão e a média. Indica-se a variância por. Como duas distribuições podem ter médias/valores médios diferentes, o desvio-padrão dessas duas distribuições não é comparável. A solução é usar o coeficiente de variação, que é igual ao desvio-padrão dividido pela média: Formula Básica: CV= (S(x) / xm) Cv = Coeficiente de Variação S(x) = Desvio Padrão Xm = Média dos dados Algumas vezes, o coeficiente de variação é ainda multiplicado por 100, assando a ser expresso como percentagem. O coeficiente de variação em uma carteira de ativos serve como medida de risco para cada unidade de ativo. O uso do coeficiente de Variação é usualmente recomendado para variáveis quantitativas do tipo razão (na qual exista um zero absoluto), tais como altura, peso e velocidade. 17 Exercícios de Sala 2 1) Uma empresa apresenta durante um ano os Resultados Operacionais descritos na tabela abaixo. Um analista financeiro pretende investir nessa empresa, somente se o desvio padrão em relação os resultados financeiros forem de no máximo de 10 milhões nos meses ocorridos até o momento. O investimento ocorrerá ou não? Justifique. Resultado Operacional (em Mil) JAN FEV MAR ABR 21 44 5 30 Fonte: exercício de Stevenson (2001) e de Barbetta (2002) Dados em Milhões 2) Uma empresa pretende ter um melhor controle em relação ao custo das peças utilizadas na construção de seus equipamentos de venda. Para tal, elaborou uma seleção das peças mais utilizadas. Custo em R$ Custo Médio Frequência de x . f 2 x . f Uso 00├ 10 (PEÇA1) 5 2 10├ 20 (PEÇA2) 15 10 20├ 30 (PEÇA3) 25 15 30├ 40 (PEÇA4) 35 7 Total - 34 Fonte: exercício de Stevenson (2001) e de Barbetta (2002). a) Calcule a média aritmética (ponderada) da distribuição de frequência. (CUSTO MEDIO PONDERADO) b) Calcule a variância da distribuição de frequência. c) Calcule o desvio padrão da distribuição de frequência. 3) Foram anotados os salários de 5 funcionários por dia (em Dolar) de uma empresa. Os valores são os seguintes (Amostra) Valor do salário por dia (em Euros) da empresa A B C D E Fonte: exercício de Stevenson (2001) e de Barbetta (2002), adaptado. a) Calcule a média aritmética do valor do salário diário dos funcionários. b) Calcule a variância da distribuição de frequência. c) Calcule o desvio padrão da distribuição de frequência. 10 20 30 40 50 18 4) A empresa Alfa possui uma media de lucro liquido anual de R$ 50 Milhões, com um desvio padrão de R$ 5 Milhões. Já a empresa Beta possui um Lucro médio anual de R$ 100 Milhões com o mesmo desvio padrão tambem de R$ 5 milhões. Quem apresenta maior nível de variação em relação à média? GABARITO 1) Não deverá investir, pois a variação em relação a media é de R$14,14 Milhões 2) a) R$ 22,94 b) R$71,39 c) R$ 8,45 3) a) $ 30,00 b) $ 250 d) $ 15,81 5) ALFA