Baixe o app para aproveitar ainda mais
Prévia do material em texto
Estatística Aplicada Autor: Ivonete Melo de Carvalho Tema 02 Introdução à Estatística e Estatística Descritiva. Parte II: Medidas de Tendência Central e Medidas de Dispersão seç ões Tema 02 Introdução à Estatística e Estatística Descritiva. Parte II: Medidas de Tendência Central e Medidas de Dispersão Como citar este material: CARVALHO, Ivonete Melo de. Estatística Aplicada: Introdução à Estatística e Estatística Descritiva. Parte II: Medidas de Tendência Central e Medidas de Dispersão. Caderno de Atividades. Valinhos: Anhanguera Educacional, 2014. SeçõesSeções Tema 02 Introdução à Estatística e Estatística Descritiva. Parte II: Medidas de Tendência Central e Medidas de Dispersão 5 Conteúdo Nessa aula você estudará: • Medidas de tendência central: média, moda e mediana. • Medidas de dispersão: amplitude total, desvio, variância, desvio padrão, coeficiente de variação. • Em que tipo de variáveis as diferentes medidas são aplicadas. conteúdosEhabilidades 6 conteúdosEhabilidades leituraobrIgATórIA Habilidades Ao final, você deverá ser capaz de responder as seguintes questões: • O que são e para que servem as medidas de tendência central? • O que são e para que servem as medidas de dispersão? • Média e desvio padrão devem ser sempre calculados? • Por que variáveis qualitativas não apresentam as medidas de tendência central (exceto moda) e as medidas de dispersão? Introdução à Estatística e Estatística Descritiva. Parte II: Medidas de Tendência Central e Medidas de Dispersão Medidas de Tendência Central As medidas de tendência central são: • Medidas que representam um conjunto de dados relativos à observação de um determinado fenômeno (fato). • Medidas que servem para orientar quanto à posição da distribuição dos dados no eixo das abscissas. • Medidas que permitem a comparação de séries de dados entre si pelo confronto desses dados. As principais medidas de tendência central são: média, mediana e moda. 7 leituraobrIgATórIA São sinônimos de média: • Esperança. • Esperança matemática. • Valor esperado. • Expectância de uma variável aleatória. Existem também os decis, quartis e percentis, que são chamados de separatrizes. As separatrizes não serão trabalhadas em detalhes neste caderno. Para tanto, consulte o Livro-Texto. No entanto, as suas definições serão apresentadas em seguida. Por definição, o percentil divide uma distribuição de frequência em 100 partes iguais, ou seja, ( ) iP in iPi F hf P 100 *∑−+= , em que: iP = limite inferior da classe Pi, em que i = 1,2,3,...,99 n = tamanho da amostra ∑ f = soma das frequências anteriores à classe Pi h = amplitude da classe FPi = frequência da classe Pi Por definição, o decil divide uma distribuição de frequência em 10 partes iguais, isto é, ( ) iD in iDi F hf D 0 1 *∑−+= , em que: iD = limite inferior da classe Pi, em que i = 1,2,3,...,99 n = tamanho da amostra ∑ f = soma das frequências anteriores à classe Di h = amplitude da classe FDi = frequência da classe Di 8 O quartil, por definição, divide uma distribuição de frequência em 4 partes iguais. Para calcular os quartis, deve-se fazer: ( ) 1 1 *4 1 Q ni Q F hf Q ∑−+= , em que: 1Q = limite inferior da classe do primeiro quartil n = tamanho da amostra ∑ f = soma das frequências anteriores à classe quartílica h = amplitude da classe quartílica FQ1 = frequência da primeira classe quartílica Coeficiente de Curtose Para que se determine o grau de achatamento da curva de distribuição de frequência de uma série de dados (coeficiente de curtose = k) é preciso determinar o terceiro e o primeiro quartis e o nonagésimo e o décimo percentis, por meio da seguinte fórmula: )(*2 0 10 9 13 PP QQK − − = (K = coeficiente de curtose) • Q3 e Q1 – terceiro e primeiro quartis, respectivamente. • P90 e P10 – nonagésimo e décimo percentis, respectivamente. • Se K = 0,263 então a curva da distribuição é mesocúrtica (achatamento normal). • Se K > 0,263 então a curva da distribuição é platicúrtica (mais achatada). • Se K < 0,263 então a curva da distribuição é leptocúrtica (mais alongada). Agora que você sabe o que são e para que servem os percentis, quartis e decis, é preciso apresentar a você a média, a mediana e a moda. Média: Média aritmética simples por definição é a soma de todos os valores xi observados (dados isolados) dividida pelo número de observações: n x x n 1i i∑ == leituraobrIgATórIA 9 Exemplo: calcule a média aritmética simples do seguinte conjunto de valores: 7, 14, e 21. Nesse caso: 4 1 3 1 24 17 = ++ =x Por definição, para dados agrupados, a média será dada pela soma do produto dos valores observados pela frequência absoluta com que estes ocorrem, dividida pela soma das frequências absolutas da distribuição, ou seja: ∑ ∑ = == n 1i i n 1i ii f xf x Exemplo: dada a tabela de distribuição a seguir: ix 11 8 10 12 if 1 4 3 2 Calcule a média aritmética simples: 7 1 1 7 7 1 1 4 20 32 11 1 2342 2*2 13*0 14*81*1 1 1 1 == +++ = +++ +++ == ∑ ∑ = = n i i n i ii f xf x Por definição, para dados agrupados em intervalos de classe, deve-se considerar xi o ponto médio do intervalo de classe. Propriedades da média: 1) A média de uma constante é a própria constante. 2) Multiplicando uma variável aleatória x por uma constante, sua média ficará multiplicada por esta constante. 3) A média da soma ou da diferença de duas variáveis aleatórias é a soma ou a diferença das médias. 4) Somando ou subtraindo uma constante a uma variável aleatória, a sua média ficará somada ou subtraída da mesma constante. 5) A média do produto de duas variáveis aleatórias independentes é o produto das médias. leituraobrIgATórIA 10 Mediana: Por definição: 1. Em uma série de n-observações ordenada de forma crescente, a mediana é o valor da observação que divide essa série em duas metades iguais: uma delas com valores inferiores e outra com valores superiores ao valor da mediana. 2. Se a série possuir um número par de termos (ou observações), não existirá um termo central, logo, para calcular o valor da mediana, basta dividir por dois o valor da soma dos termos centrais. Moda: Por definição, moda (ou modo) é o valor que mais aparece ou o de maior frequência simples (absoluta ou relativa) numa distribuição de frequência. A moda pode não existir, e, existindo, pode não ser única. Uma distribuição pode ser: • Amodal (quando não existe moda). • Unimodal (uma só moda). • Bimodal (quando tem duas modas). • Multimodal (tem várias modas). Diferenças entre média, mediana e moda: Medida Vantagens Desvantagens Média Reflete cada valor observado na distribuição É influenciada por valores extremos Mediana Menos sensível a valores extremos se comparada à média Difícil de se determinar para grande quantidade de dados Moda Maior quantidade de valores concentrados neste ponto Não se adequa à análise matemática leituraobrIgATórIA 11 O valor da mediana tem de estar em algum ponto localizado entre o valor da média e o valor da moda, podendo ser igual à moda e/ou à média. Essas três medidas podem definir a assimetria da curva de distribuição de frequência. Então: Se Média = Mediana = Moda Então, a curva de distribuição é: Simétrica Média < Mediana < Moda Assimetria negativa Média > Mediana > Moda Assimetria positiva Medidas de Dispersão Medidas de dispersão são medidas cuja função é avaliar o quanto estão afastados ou concentrados os valores observados numa distribuiçãode frequência ou de probabilidades. As principais medidas de dispersão são: • Amplitude total (ou range). • Desvio médio absoluto. • Variância. • Desvio padrão. • Coeficiente de variação. Amplitude total Por definição, amplitude total é a diferença entre o maior e o menor valor observados, não dando a noção de quanto os valores intermediários estão afastados ou concentrados. Observe a distribuição A: 2; 3; 4; 13; 18. A amplitude total de A será: AT = 18 – 2 = 16 A amplitude total diz pouco a respeito de uma série de dados; para melhor avaliá-la, outros conceitos precisam ser agregados ao seu estudo. O primeiro conceito a ser criado é o de desvio, ou seja, a distância que cada um dos valores observados apresenta em relação à média ( xxi − ). leituraobrIgATórIA 12 Distribuição A Desvio i xi xxi − 1 2 2 - 8 = -6 2 3 3 - 8 = -5 3 4 4 - 8 = -4 4 13 13 - 8 = 5 5 18 18 - 8 = 10 Σ 40 0 Observe que o somatório dos desvios em relação à média aritmética é igual a zero. Isso acontecerá em toda série de observações, pois “a soma dos desvios em relação à média aritmética sempre será nula”. Você, então, deve estar se perguntando: “como avaliar a dispersão entre os valores observados em tal distribuição?”. Uma das formas de resolver este problema é calculando a variância. Variância: Por definição, a variância é o somatório dos quadrados dos desvios dividido pelo número de observações (se população) ou número de observações menos um (se amostra). No exemplo considerado: Distribuição A Valores dos desvios elevados ao quadrado i xi xxi − 1 2 2 - 8 = -6 = 36 2 3 3 - 8 = -5 = 25 3 4 4 - 8 = -4 = 16 4 13 13 - 8 =5 = 25 5 18 18 - 8 = 10 = 100 Σ 40 202 leituraobrIgATórIA 13 Valor obtido para a variância ( 2σ ): 4,0 4 5 202 2 12 == − = ∑ = n xx n i i Aσ Lembre-se sempre de que, se houver uma distribuição para dados agrupados, você terá de multiplicar o quadrado de cada desvio pela respectiva frequência, fazendo a seguir a divisão pela soma das frequências. E, se os dados se apresentarem em intervalos de classe, será o ponto médio do intervalo de classe. Assim, a fórmula para cálculo da variância será: ∑ ∑ = = − =σ n 1i i i 2n 1i i 2 F F*xx Para dados agrupados, considera-se a frequência no cálculo da variância, e quando os dados se apresentarem em intervalos de classe, xi será o ponto médio do intervalo de classe. Logo, a fórmula será: • Para a variância populacional: n SQD2 =σ • Para a variância amostral: 1n SQD2 − =σ Desvio Padrão Por definição, o desvio padrão é a raiz quadrada positiva da variância, isto é, 2σ=σ é o desvio padrão para a população e 2ss = é o desvio padrão para uma amostra. No exemplo dado, teremos: 6 3,64,0 4 ==Aσ Coeficiente de Variação Por definição, coeficiente de variação é expresso como o resultado da divisão do desvio padrão pela média. Corresponde a uma medida relativa de dispersão, útil para a comparação (em termos relativos) do grau de concentração em torno da média de séries distintas. Essa medida serve para avaliar a homogeneidade de séries estatísticas e pode ser expressa na forma unitária ou percentual. leituraobrIgATórIA 14 Retornando ao nosso exemplo: %5,9 7 8 6 3,6 ==Avc Utilizar-se-á como referência neste caderno a tabela para Coeficientes de Variação, de Jairo Simon da Fonseca e José Afonso Mazzon1. 1 Disponível na internet para consulta no seguinte site: <http://www.google.com.br/url?sa=t&rct=j&q=& esrc=s&source=web&cd=4&ved=0CEUQFjAD&url=http%3A%2F%2Fwww.rausp.usp.br%2Fdownload. asp%3Ffile%3D1201017.pdf&ei=TgYdU6nPA8SrkAfW8oGIBg&usg=AFQjCNFmRlUxGd2cG7vvNRscp YuQ9t0whQ&sig2=oL4N-psJGAB8UloClSJBUw&bvm=bv.62578216,d.eW0>. Acesso em: 10 mar. 2014. linksIMPorTAnTEs Quer saber mais sobre o assunto? Então: Sites Teste os seus conhecimentos: resolva exercícios a respeito de medidas de tendência central e medidas de dispersão e consulte a resolução comentada. Acesse o site “Exercícios – Brasil Escola”. Disponível em: <http://exercicios.brasilescola.com/matematica/exercicios-sobre-estatistica.htm>. Acesso em: 3 mar. 2014. Nele você poderá testar seus conhecimentos fazendo exercícios e consultando a resolução comentada. Acesse o site “Portal Action”. Disponível em: <http://www.portalaction.com.br/1414-4-exerc%C3%ADcios>. Acesso em: 3 mar. 2014. Nele você poderá testar seus conhecimentos fazendo exercícios dos principais vestibulares ainda existentes no PAÍS e consultar a resolução comentada. leituraobrIgATórIA 15 linksIMPorTAnTEs Acesse o site “Exercícios – Professor Cardy”. Disponível em: <http://www.profcardy.com/exercicios/area.php?area=ESTAT%CDSTICA>. Acesso em: 3 mar. 2014. Nele você poderá testar seus conhecimentos fazendo exercícios apresentados pelo Enem e Enade em diversas edições destes exames e consultar a resolução comentada. Acesse o site “Matematiquês”. Disponível em: <http://www.matematiques.com.br/download.php?tabela=documentos&id=436>. Acesso em: 3 mar. 2014. Nele você poderá testar seus conhecimentos fazendo exercícios e consultando a resolução comentada. Vídeos Assista aos vídeos com exercícios comentados. Disponíveis em: <http://video-aulas.com/listing/Matem%C3%A1tica/Ensino_M%C3%A9dio/ Estat%C3%ADstica/estatistica--exercicios-resolvidos--media-moda-mediana-variancia- desvio-padrao--pre-enem-abril-educacao-2013--video-aula-1217>. Acesso em: 3 mar. 2014. Os exercícios são bastante variados, com linguagem bem acessível uma vez que se trata de produção da Editora Abril Cultural voltada para o público que prestará o Enem (Exame Nacional do Ensino Médio). 16 Instruções: Chegou a hora de você exercitar seu aprendizado por meio das resoluções das questões deste Caderno de Atividades. Essas atividades auxiliarão você no preparo para a avaliação desta disciplina. Leia cuidadosamente os enunciados e atente-se para o que está sendo pedido e para o modo de resolução de cada questão. Lembre-se: você pode consultar o Livro-Texto e fazer outras pesquisas relacionadas ao tema. Questão 1: Um produto subiu de R$ 35,00 para R$ 40,00 no primeiro mês e de R$ 40,00 para R$ 52,00 no segundo mês. Qual o crescimento mensal médio, em reais, desse produto? Questão 2: Suponha que, numa sala com 25 pessoas, as idades, em anos, sejam as seguintes: 24 - 24 - 24 - 25 - 25 - 30 - 32 - 32 - 32 - 35 - 36 - 36 - 40 - 40 - 40 - 40 - 46 - 48 - 48 - 50 - 54 - 54 - 60 - 60 - 65. A média das idades observadas, em anos, é igual a: a) 35,18. b) 35,12. c) 40,00. d) 40,13. e) 42,15. Questão 3: Suponha que, numa sala com 25 pessoas, as idades, em anos, sejam as seguintes: 24 - 24 - 24 - 25 - 25 - 30 - 32 - 32 - 32 - 35 - 36 - 36 - 40 - 40 - 40 - 40 - 46 - 48 - 48 - 50 - 54 - 54 - 60 - 60 - 65. A mediana das idades observadas, em anos, é igual a: agoraéasuAvez 17 a) 36. b) 38. c) 40. d) 42. e) 44. Questão 4: Determinada empresa observou que seus funcionários gastam em média 6 horas por semana cuidando de seus e-mails pesso- ais durante o dia de trabalho. O desvio pa- drão observado foi de 4 horas semanais. Com base nas informações da situação hipotética anteriormente descrita, pode-se afirmar que o coeficiente de variação, de acordo com a classificação, é: a) Baixo, próximo de zero. b) Baixo, próximo de 15%. c) Mediano, próximo de 15%. d) Mediano, próximo de 30%. e) Alto, acima de 50%. Questão 5: Num grupo de 16 alunos, as notas das pro- vas de Estatística foram todas iguais ou superiores a sete pontos. A mediana das notas do grupo é igual a 8,0 e a média 8,2. Afirmação I: nessas condições, pode-se afirmar que a maior parte das notas foi in- feriora 8,0. Afirmação II: nessas condições, pode-se afirmar que a maior parte das notas foi su- perior a 8,0. a) Somente a afirmação I está correta. b) Somente a afirmação II está correta. c) Ambas as afirmações estão corretas. d) Ambas as afirmações estão erradas. e) As informações se complementam. Questão 6: Calcule a média aritmética entre: 10, 15, 16, 23, 49, 50 e 60. Texto para as questões 7 a 10: Ao entrevistar um grupo de alunos, obtêm- se as seguintes respostas a respeito de suas idades: 20 21 22 20 22 23 25 20 25 24 20 24 25 23 23 22 21 22 20 25 Com bases nesses dados, calcule o que se pede nos exercícios seguintes. agoraéasuAvez 18 Questão 7: Calcule a idade média dos alunos e a me- diana entre as idades. Questão 8: Identifique a moda entre as idades dos alunos. Questão 9: Calcule a variância e o desvio padrão entre os dados apresentados. Questão 10: Calcule o coeficiente de variação e analise o resultado. agoraéasuAvez Neste tema, você aprendeu a trabalhar com medidas importantes para a estatística descritiva: medidas de tendência central e medidas de dispersão. Dê especial atenção ao cálculo da média e do desvio padrão. Observe também que essas medidas são aplicáveis para dados quantitativos. Dados qualitativos – expressos em categorias – não permitem tal cálculo; para estes, a única medida que se aplica é a observação da moda. Caro aluno, agora que o conteúdo dessa aula foi concluído, não se esqueça de acessar sua ATPS e verificar a etapa que deverá ser realizada. Bons estudos! finalizando 19 CRESPO, Antonio Arnot. Estatística Fácil. 19. ed. atual. São Paulo: Saraiva, 2009. CUNHA, M. V. Análise Multidimensional de Dados Categóricos. In: PPGA, UFRGS, 16, Porto Alegre, 1997. FONSECA, J. S, MARTINS, G. Curso de Estatística. São Paulo: Atlas, 1996. FREITAS & CUNHA CONSULTORES LTDA. Guia do Usuário – Sphinx Léxica 2.08 for Windows®. Porto Alegre, 1998. KOTLER, P. Administração de Marketing: Análise, planejamento, implementação e contro- le. São Paulo: Atlas, 1996. LABES, E. M. Questionário: do planejamento à aplicação na pesquisa. Chapecó: Grifos, 1998. LARSON, Ron; FARBER, Betsy. Estatística e Métodos Quantitativos. 2. ed. São Paulo: Pearson Prentice Hall, 2007. Livro-Texto 136. MATTAR, F. N. Pesquisa de Marketing. São Paulo: Atlas, 1996. ROSSI, C. A. V.; SLONGO, L. A. Pesquisa de satisfação de clientes: o estado-da-arte pro- posição de um método Brasileiro. In: ENCONTRO ANUAL DA ANPAD, 21., Anais... 1997, Rio das Pedras, p.124. SLACK, N. Administração da produção. São Paulo: Atlas, 1997. referências 20 Dispersão: proximidade ou distanciamento observado em um conjunto de dados numéricos. Homogêneo: grupo que apresenta características comuns, por exemplo, notas próximas no caso de uma avaliação. Heterogêneo: grupo que apresenta características distintas, por exemplo, notas distantes no caso de uma avaliação. Série: conjunto de dados. SQD: soma dos quadrados dos desvios. Questão 1 Resposta: Os aumentos foram de R$ 5,00 e R$ 12,00, portanto houve um aumento total de R$ 17,00. Dividindo R$ 17,00 por 2 (= número de aumentos) você obterá R$ 8,50. Questão 2 Resposta: Alternativa C. Questão 3 Resposta: Alternativa A. glossário gabarito 21 Questão 4 Resposta: Alternativa E. Questão 5 Resposta: Alternativa B. Questão 6 Resposta: Substituindo os valores na fórmula da média: 6 8,1 3 7 223 6 0 60 59 43 26 15 10 1 ≅= ++++++ =x Questão 7 Resposta: Calculando a média e a mediana: Média: 5 3,2 2 0 2 4*5 22*4 23*3 24*2 22*1 25*0 2 = +++++ =x Mediana: 2 2 2 2 22 2 = + =med Questão 8 Resposta: Lembrando que ela corresponde ao valor mais repetido, a moda entre as idades do grupo estudado é 20 anos. Questão 9 Resposta: Para calcular o desvio padrão, é necessário, antes, calcular a variância: ix x )xx( i − 2i )xx( − 20 22,35 -2,35 5,5225 20 22,35 -2,35 5,5225 20 22,35 -2,35 5,5225 20 22,35 -2,35 5,5225 20 22,35 -2,35 5,5225 21 22,35 -1,35 1,8225 gabarito 22 ix x )xx( i − 2i )xx( − 21 22,35 -1,35 1,8225 22 22,35 -0,35 0,1225 22 22,35 -0,35 0,1225 22 22,35 -0,35 0,1225 22 22,35 -0,35 0,1225 23 22,35 0,65 0,4225 23 22,35 0,65 0,4225 23 22,35 0,65 0,4225 24 22,35 1,65 2,7225 24 22,35 1,65 2,7225 25 22,35 2,65 7,0225 25 22,35 2,65 7,0225 25 22,35 2,65 7,0225 25 22,35 2,65 7,0225 66,55 Cálculo da variância: 0 5,3 9 1 5 2,6 62 ==σ Cálculo do desvio padrão: 7 8,10 5,3 ==σ Questão 10 Resposta: Calculando o desvio padrão, tem-se: %7 3,8100* 5 3,2 2 7 8,1 ==vc O coeficiente de variação é baixo, indicando que os dados são bem agrupados, isto é, próximos da média. gabarito
Compartilhar