Prévia do material em texto
1 Probabilidade e Estatística Professor André Espíndola 2014 Professor André Espíndola ANÁLISE DE CONJUNTOS DE DADOS NÃO AGRUPADOS Professor André Espíndola INTRODUÇÃO A análise de dados frequentemente segue linhas diferentes, conforme se trate de um grande ou de um pequeno conjunto de dados. � Quando há uma pequena quantidade de dados, utilizam-se os métodos para dados não agrupados; � Para maior quantidade de dados, utiliza-se métodos para dados agrupados. Professor André Espíndola OBJETIVO � Reduzir o conjunto de dados a medidas que resumem todo o conjunto; Professor André Espíndola MEDIDAS DE TENDÊNCIA CENTRAL � Há situações em que não estamos interessados nos padrões de um grupo, mas em caracterizá-lo como um todo. � Qual o salário médio do trabalhador brasileiro? � Qual o tipo sanguíneo mais comum? � Qual a nota que divide os alunos de uma turma em um grupo superior e o outro inferior? Professor André Espíndola MEDIDAS DE TENDÊNCIA CENTRAL � As Medidas de Tendência Central têm como finalidade a representação de um grupo através de sua caracterização por um conjunto de valores que tende a se concentrar no centro do da série. 2 Professor André Espíndola MEDIDAS DE TENDÊNCIA CENTRAL � Média; � Moda; � Mediana; Professor André Espíndola MÉDIAS � A média de um conjunto de números é um valor que, levando em conta a totalidade dos elementos do conjunto, pode substituir a todos sem alterar determinada característica desse conjunto. Professor André Espíndola MÉDIA ARITMÉTICA A média (aritmética) é, de modo geral, a mais importante de todas as mensurações numéricas descritivas. Consiste em adicionar os elementos e dividir a soma pelo número de elementos adicionados. Professor André Espíndola Características da Média � a média de um conjunto de números pode ser sempre calculada; � para um dado conjunto de números, a média é única; � a média é sensível a (ou afetada por) todos os valores do conjunto, assim, se um valor se modifica, a média também se modifica; � somando-se uma constante a cada valor do conjunto, a média ficará aumentada do valor dessa constante. Analogamente, subtraindo-se de cada valor do conjunto uma constante, ou multiplicando-se ou dividindo-se por ela cada valor do conjunto, a média fica reduzida dessa constante, ou multiplicada ou dividida por ela. Professor André Espíndola EXEMPLO � Sabendo-se que o número de peças produzidas por sete máquinas diferentes, num certo dia, foi 10, 17, 13, 15, 16, 18 e 12, temos, para produção média desse dia: Professor André Espíndola MÉDIA ARITMÉTICA PONDERADA � A média aritmética ponderada é aquela resultante de um conjunto de valores, no qual alguns valores têm importância (ou quantidade de ocorrências) maior que a dos outros. 3 Professor André Espíndola EXEMPLO � Os salários médios mensais dos professores de ensino fundamental em três cidades são R$ 1.450,00, R$ 1.620,00 e R$ 1.190. Havendo 720, 660 e 520 professores de ensino elementar nessas cidades, respectivamente, o salário médio será entre as três é: Professor André Espíndola EXEMPLO � Uma pesquisa amostral efetuada junto a estudantes de uma faculdade acusa os seguintes dados sobre o conceito obtido na disciplina de Estatística. Qual o conceito médio dos estudantes? Professor André Espíndola MÉDIA GEOMÉTRICA � A média geométrica de uma amostra é um número que, levando em conta o total dos elementos dessa amostra, pode representar a todos, sem alterar o produto desses elementos. Assim sendo, a média geométrica de uma amostra de tamanho n é igual à raiz de ordem n do produto dos n valores. Professor André Espíndola OBSERVAÇÃO � Ao contrário da média aritmética, a média geométrica não é muito influenciada pelos valores extremos de uma sequência numérica. Ainda, a média geométrica é definida apenas para números positivos. � A média geométrica é usada para médias proporcionais de crescimento quando uma medida subsequente depende de medidas prévias. Professor André Espíndola EXEMPLO � O crescimento do Brasil foi de 2,8% em 1996, 3,7% em 1997 e 0,5% em 1998. Determine a taxa média de crescimento do Brasil nesses três anos. Professor André Espíndola Média geométrica ponderada ∑ ⋅⋅⋅= i np p n ppp G xxxxx K 321 321 4 Professor André Espíndola MÉDIA HARMÔNICA Professor André Espíndola EXEMPLO � Um investidor compra R$ 18.000 em ações de uma companhia a R$ 45,00 a ação. Num segundo momento, compra R$ 18.000 a R$ 36,00 a ação e, por fim, numa terceira aplicação, compra R$ 18.000 a R$ 30,00 a ação. Assim, descubra o preço médio por ação pago pelo investidor. Professor André Espíndola Média harmônica ponderada Professor André Espíndola MEDIANA (Md) � A mediana é aquele valor que ocupa a posição central da listagem, estando a amostra com seus valores ordenados e com todos os valores repetidos também incluídos, individualmente, na lista. A mediana da amostra divide o conjunto total em duas partes iguais, com metade (50%) dos valores acima da mediana da amostra e metade (50%) abaixo dela. A mediana da amostra pode não pertencer ao conjunto original de valores. Professor André Espíndola EXEMPLO Dada uma série de valores, como, por exemplo: 5, 13, 10, 2, 18, 15, 6, 16, 9, de acordo com a definição de mediana, o primeiro passo a ser dado é o de ordenação (crescente ou decrescente) dos valores: 2 - 5 - 6 - 9 - 10 - 13 - 15 - 16 - 18 Md = 10 Professor André Espíndola EXEMPLO Se a lista de valores tiver número par de termos, a mediana será, por definição, qualquer número compreendido entre os dois valores centrais da série. Convencionaremos utilizar o ponto médio. Dada a lista: 2, 6, 7, 10, 12, 13, 18, 21 tem , para mediana, a média aritmética entre 10 e 12. Md = 11 5 Professor André Espíndola OBSERVAÇÕES � 1) A média e a mediana não têm, necessariamente, o mesmo valor. � 2) A mediana não, necessariamente, coincide com um elemento da série. Professor André Espíndola Características da mediana 1) Não depende de todos os valores da série, podendo se manter inalterável com a modificação de alguns deles. 2) Não é influenciada pelos valores extremos da distribuição; por isso é particularmente indicada quando existem dados discrepantes. 3) Pode ser calculada quando os valores mais altos e mais baixos de uma série não podem ser exatamente definidos. Professor André Espíndola MODA( Mo) � A denominação moda torna-se coerente na medida em que é (são) o(s) evento(s) que mais se destaca(m), isto é, que ocorre(m) com maior frequência no fenômeno estudado. Professor André Espíndola EXEMPLOS � Quando queremos informações sobre o tipo de sangue mais comum, estamos interessados na moda. � Se um comerciante pretende abrir uma loja de calçados e quer saber quais os números de sapatos femininos que deve encomendar em maior quantidade, a medida de tendência que ele necessita para um bom planejamento administrativo é a moda. � Numa eleição, o candidato que tem o maior número de votos representa a moda. Professor André Espíndola OBSERVAÇÕES SOBRE A MODA a) amodal, quando não tem distinção entre todas as frequências que aparecem; b) unimodal , quando há apenas uma moda; c) bimodal, quando há duas modas; d) multimodal, quando há três ou mais modas. Professor André Espíndola EXEMPLO Encontre a moda das amostras abaixo: a) 2, 7, 5, 4, 3, 1 b) 1, 3, 9, 2, 9, 5 c) 7,1 ; 8,4 ; 7,1 ; 7,1 ; 9,5 ; 8,4 ; 9,4 ; 8,4 6 Professor André Espíndola Observação � Comparada com a média e com a mediana, a moda é a menos útil das medidas paraproblemas estatísticos, porque não se presta à análise matemática, ao contrário do que ocorre com as outras duas medidas. A utilidade da moda se acentua quando um ou dois valores, ou um grupo de valores, ocorrem com muito maior freqüência que outros. Professor André Espíndola SEPARATRIZES � A mediana é apenas um dentre os muitos quantis que dividem os dados em duas ou mais partes tão aproximadamente iguais quanto possível. Entre eles, destacam-se os quartis, os decis e os percentis, que dividem os dados em 4, 10 e 100 partes, respectivamente. Professor André Espíndola QUARTIS � As medidas estatísticas criadas com a finalidade de dividir o conjunto de dados em quatro partes aproximadamente iguais, onde dizemos “aproximadamente iguais” porque não há maneira de dividir em quatro partes iguais um conjunto com n = 27 ou n = 33, por exemplo. Estas medidas são tradicionalmente conhecidas como quartis, Q1, Q2 e Q3. Sem dúvida, Q2 é simplesmente a mediana. Professor André Espíndola PERCENTIS � Medida estatística utilizada para dividir um conjunto dados em cem partes aproximadamente iguais, onde dizemos “aproximadamente iguais” porque não há maneira de dividir em cem partes iguais um conjunto com n=328, por exemplo. As medidas estatísticas criadas com esta finalidade são tradicionalmente conhecidas como percentis, P1, P2 , ... P81, ... , P98 e P99. Professor André Espíndola DISPERSÃO OU VARIABILIDADE � Medidas utilizadas para medir a dispersão do conjunto, avaliando a heterogeneidade ou a homogeneidade do mesmo. � A dispersão mede quão próximos uns dos outros estão os valores de um grupo. Professor André Espíndola MEDIDAS � AMPLITUDE � VARIÂNCIA � DESVIO PADRÃO � COEFICIENTE DE VARIAÇÃO 7 Professor André Espíndola AMPLITUDE � A amplitude (ou intervalo total) de um conjunto de dados é igual à diferença entre o maior e o menor valor. Professor André Espíndola EXEMPLO � Em um hospital, onde se mede a pulsação de cada paciente três vezes por dia, o paciente A acusou as taxas de 72, 76 e 74, e o paciente B acusou 72, 91 e 59. A taxa média de ambos é a mesma, 74; observe, entretanto, a diferença na variabilidade. Enquanto a pulsação de A é estável, a de B apresenta grande flutuação. Professor André Espíndola OBSERVAÇÕES � A vantagem: relativamente fácil de calcular, mesmo para um grande conjunto de números. � Desvantagem: levar em conta somente os dois valores extremos de um conjunto, nada informando quanto aos outros valores. Professor André Espíndola VARIÂNCIA � A variância é a medida de dispersão que mede a média dos quadrados dos desvios dos valores, de um conjunto numérico em relação a sua média. AMOSTRAL POPULACIONAL Professor André Espíndola EXEMPLO Calcular a variância da produção dos dois funcionários. Professor André Espíndola EXEMPLO � Calcule a variância da tabela a seguir 8 Professor André Espíndola OBSERVAÇÃO � A variância é expressa na unidade de medida do conjunto numérico. Como ela é um valor ao quadrado, torna-se difícil a interpretação prática, motivo pelo qual surge outra medida de dispersão o desvio padrão. Professor André Espíndola DESVIO PADRÃO � O desvio padrão é simplesmente a raiz quadrada positiva da variância. AMOSTRAL POPULACIONAL Professor André Espíndola EXEMPLO � Calcular o desvio padrão das tabelas anteriores. Professor André Espíndola OBSERRVAÇÃO � O desvio padrão é uma das medidas mais comumente usadas para distribuições, e desempenha papel relevante em toda a estatística. Cabe notar que a unidade do desvio padrão é a mesma da média. Por exemplo, se a média é em reais, o desvio padrão também se exprime em reais. A variância, por sua vez, se exprime em quadrados de unidades Professor André Espíndola Fórmula alternativa para o cálculo de variância e desvio padrão: Professor André Espíndola EXEMPLO 9 Professor André Espíndola COEFICIENTE DE VARIAÇÃO � O coeficiente de variação é dado pelo quociente entre o desvio padrão e a média de um conjunto. Professor André Espíndola EXEMPLO � Determinar os coeficientes de variação da tabela anterior. Professor André Espíndola EXERCÍCIOS � Páginas: 27, 28, 34 e 35 Professor André Espíndola Referências � SCHIFFMAN, L. & KANUK, L. Comportamento do consumidor. LTC Editora. 6a ed. 2000. P. 27) � DEVORE, J. L. Probabilidade e Estatística para Engenharia e Ciências. 6.ed. São Paulo: Pioneira Thomson Learning, 2006. � MORETTIN, P.A., BUSSAB, W. O. Estatística Básica. 5.ed. São Paulo: Ed. Saraiva, 2002. � SPIEGEL, M. R. Estatística. 2.ed. Rio de Janeiro: Ao Livro Técnico S.A., 1969. SPIEGEL, M. R.. Manual de fórmulas, métodos e tabelas de matemática. São Paulo: Ed. Makron Books do Brasil, 1992. � BUSSAB, Wilton O., MORETTIN, Pedro A. Estatística Básica. 5 ed. São Paulo: Saraiva, 2002. � DOWNING, Douglas. Estatística Aplicada.2.ed São Paulo: Saraiva, 2002. � TRIOLA, Mario Introdução à Estatística. 7.ed. Rio de Janeiro: LTC, 1999.