Baixe o app para aproveitar ainda mais
Prévia do material em texto
CADERNO DE ATIVIDADES Disciplina: Estatística Aplicada . Tema 01 Introdução à Estatística e Estatística Descritiva. Parte I: Levantamento e Apresentação de Dados s e ç õ e s Como citar este material: CARVALHO, Ivonete Melo de. Estatística Aplicada: Introdução à Estatística e Estatística Descritiva. Parte I: Levantamento e Apresentação de Dados. Caderno de Atividades. Valinhos: Anhanguera Educacional, 2014. Tema 01 Introdução à Estatística e Estatística Descritiva. Parte I: Levantamento e Apresentação de Dados 4 Introdução ao Estudo da Disciplina Caro(a) aluno(a). Este Caderno de Atividades foi elaborado com base no livro Estatística e Métodos Quantitativos, dos autores Ron Larson e Betsy Farber, Editora Pearson Prentice Hall, 2007. Livro-Texto 136. Roteiro de Estudo: Estatística Aplicada Ivonete Melo de Carvalho conteúdosehabilidades Conteúdo Nessa aula você estudará: • Uma visão geral da Estatística. • Distribuição de frequências. • Classificação de dados e variáveis. • Construção de gráficos. 5 conteúdosehabilidades Habilidades Ao final, você deverá ser capaz de responder as seguintes questões: • O que é e para que serve a estatística? • Como obter, tabular, representar e realizar análise numérica de dados? • O que são e para que servem as variáveis qualitativas? • O que são e para que servem as variáveis quantitativas? leituraobrigatória Introdução à Estatística e Estatística Descritiva. Parte I: Levantamento e Apresentação de Dados A estatística é a arte ou a ciência que se ocupa em levantar, tabular e analisar dados. Para compreendê-la, você precisa adaptar-se a algumas definições. Os termos apresentados precisam ser incorporados por você. Definições: População = conjunto formado por todos os elementos cuja característica o investigador deseja conhecer. Amostra = subconjunto da população. Variável = a característica que se pretende conhecer. Dado = informação (característica) a ser tratada. 6 leituraobrigatória Um exemplo: a professora Ivonete deseja conhecer a faixa etária de seus alunos EAD. Aqui, a população é formada por todos os alunos de Ivonete; a variável (característica) a ser estudada é a faixa etária dos alunos. Seguindo com o exemplo: Ivonete possui vinte mil alunos. “20.000” é um número muito grande de pessoas a ser analisado. A demanda de tempo seria imensa. Para resolver essa questão, em vez de estudar toda a população, uma amostra dela (parte da população) poderá ser determinada. Veja como: Cálculo do tamanho da amostra: Considerando uma população de tamanho N e uma margem de erro e (em porcentagem) deve-se calcular o número índice n1: n = 1 2 1 e Conhecido o número índice, o tamanho da amostra n será dado por: n = N * n1 N + n1 No exemplo, se Ivonete admitir um erro de 2% sobre uma população de 20 mil alunos, ela terá: n1 1 2 1 2 = 5 0 2 = 2.500 = = 0,0 2 e n = N * n1 = 2 0.000 * 2.500 = 5 0.000.000 = 2.222,2 ,isto é, n = 2.223. N + n 2 0.000 + 2.500 2 ,500 1 Em bom português, Ivonete precisa obter 2.223 respostas à questão “qual sua idade?” para que sua investigação não apresente erro superior a 2%. Importante: o tamanho de uma amostra será sempre dado por um número inteiro e positivo. Existem outras formas de determinar o tamanho de uma amostra. Uma delas é calcular 10% do tamanho da população. Outra diz que para populações pequenas não é necessário determinar amostra. Outro conceito será apresentado a você depois de estudar probabilidade. 7 leituraobrigatória De volta ao exemplo, o problema de Ivonete agora é obter a amostra. Para isso, ela poderá utilizar diferentes meios para coletar as respostas, mas, antes disso, será necessário determinar o tipo de amostra. Os principais tipos de amostragem utilizados são os probabilísticos (todos os indivíduos da população têm a mesma chance de serem selecionados). Os métodos mais comuns de amostragem probabilística são: • Amostragem aleatória simples: os elementos de uma população são escolhidos de tal forma que todos tenham a mesma chance de serem escolhidos. Pode-se utilizar uma tabela de números aleatórios ou um programa de geração de números aleatórios [veja como no Livro-Texto]. • Amostragem estratificada: subdivide-se a população em, no mínimo, dois estratos (subpopulações) que compartilham a mesma característica e em seguida escolhe-se uma amostra de cada. Exemplo: homens e mulheres. • Amostragem sistemática: escolhe-se um ponto de partida e então, sistematicamente, selecionam-se os outros. Por exemplo: o [5°, 15°, 25°, 35°] (etc.) indivíduos. • Amostragem por conglomerados: divide-se a população em conglomerados (áreas), em seguida sorteiam-se algumas áreas e analisam-se todos os elementos dos conglomerados escolhidos. Por exemplo: bairros [de uma cidade]. (GIACOMELLO, 2012, p. 2, grifos nossos). Bem, agora que você entendeu esses elementos essenciais, certamente vai compreender porque seguirei com exemplos que apresentam números menores (para simplificação de cálculos). Para dar sequência ao estudo, suponha que o tamanho da amostra calculada por Ivonete fosse n = 40. Para obter as respostas (dados) necessárias para conhecer a variável idade (em anos) de seus alunos, Ivonete postou a pergunta na área acadêmica e colheu as 50 primeiras respostas válidas. As idades estão apresentadas no quadro a seguir: 8 leituraobrigatória 18 23 25 30 22 32 44 35 23 41 30 28 32 23 44 37 44 27 32 30 32 30 30 18 35 23 25 28 25 30 30 30 26 25 25 23 32 44 23 30 Os dados coletados são quantitativos porque se referem a uma medida. Dados quantitativos podem ser contínuos (por exemplo: quanto dinheiro você tem na carteira) ou discretos (o número de filhos que você tem). Caso Ivonete tivesse perguntado: “sexo – feminino ou masculino?”, as respostas não seriam uma medida, mas sim uma característica. Variáveis desse tipo são chamadas de qualitativas. Uma variável qualitativa pode ser nominal (feminino, masculino) ou ordinal (classe social). Suponha que, entre as respostas coletadas, Ivonete tivesse obtido 24 respostas “masculino” e 16 respostas “feminino”. Veja bem, você tem dois exemplos de variáveis para analisar: qualitativas e quantitativas. Qualquer estudo estatístico (qualitativo ou quantitativo) deve começar pela construção de uma tabela. No caso da variável “sexo”, organizarei a tabela em ordem alfabética, ou seja, construindo um ROL. As opções “feminino” e “masculino” são chamadas de categorias. Variável: sexo Feminino 16 Masculino 24 Total: 40 A tabela de coleta de dados pode ser transformada em uma tabela de frequências (frequência é o número de vezes que uma determinada resposta é obtida).9 leituraobrigatória A tabela de frequências apresenta: frequência simples – f – (número absoluto); frequência relativa – fr – (na forma decimal) e frequência percentual – f%. Em estatística, trabalhar com porcentagens é essencial. Veja como fica a tabela de frequências da variável “sexo”. Sexo f f r f % Feminino 16 0,4 40% Masculino 24 0,6 60% Total: 40 1,0 100% Elaborada a tabela, podem-se representar os dados graficamente. No caso das variáveis qualitativas os tipos de gráficos mais comumente utilizados são: colunas, barras, setores circulares (formato de pizza) e pictóricos (figuras). Veja as ilustrações na figura a seguir: Figura 1.1: Tipos de gráficos para variáveis qualitativas Barras Colunas Setores Circulares Pictóricos 30 25 M 20 15 Femini no Masculino F 10 5 0 0 5 10 15 20 25 30 F M Fonte: Elaboração da autora. Agora, você aprenderá a tratar dados quantitativos. Assim como nos dados qualitativos, a primeira providência é colocar os elementos em ordem (em rol). Como são medidas, devem ser colocadas em ordem numérica crescente. 10 leituraobrigatória A lista de dados obtidos era assim: 18 23 25 30 22 32 44 35 23 41 30 28 32 23 44 37 44 27 32 30 32 30 30 18 35 23 25 28 25 30 30 30 26 25 25 23 32 46 23 30 Ordenando os dados do menor para o maior, a tabela ficará assim: 18 23 25 27 30 30 32 41 18 23 25 28 30 30 32 44 22 23 25 28 30 32 35 44 23 23 25 30 30 32 35 44 23 25 26 30 30 32 37 46 Na tabela ordenada, é fácil verificar que algumas idades se repetem e outras não. Assim que obter o rol (quando estiver trabalhando com dados quantitativos), o próximo passo é determinar a amplitude total dos dados em estudo. Não se assuste, é fácil. Para calcular a amplitude total basta subtrair, do maior valor obtido, o menor valor. No exemplo, você deverá fazer: AT = 46 - 18 = 28 Depois da amplitude, você deverá calcular o número de classes (categorias) que comporá a tabela. Para determinar o número de classes é preciso estar atento ao tamanho da amostra. Para amostras com até 50 elementos, o número de classes é dado por: k = n . Para amostras com mais de 50 elementos, você deverá utilizar a regra de Sturges: k = 1 + 3,3 * log(n) . No exemplo, a amostra n = 40 deverá conter k = 4 0 ≅ 6,3 ≅ 7 classes (o número de classes é sempre inteiro e positivo). 11 leituraobrigatória Isso feito, você deverá calcular a amplitude das classes. A amplitude das classes é dada por: A k = A K T . No exemplo: A k = 2 7 8 ⇒ A k = 4 . Depois disso, chega o momento de construir a tabela de frequências. No caso de variável quantitativa, além de calcular frequência simples – f; frequência relativa – fr – e frequência percentual – f%; também será preciso calcular a frequência acumulada – F; a frequência acumulada relativa – Fr – e a frequência acumulada percentual – F%. Contudo, antes de contar as frequências, você deverá construir as classes. A primeira classe começa com o menor valor obtido entre os dados tabelados; a esse valor adiciona-se a amplitude da classe: 18 + 4 = 22. A segunda classe começará no 22 e terminará no 26 e assim por diante até chegar na sétima classe que começará na 42 e terminará em 46. Veja como fica a tabela de frequências da variável idade. Idade f fr f% F Fr F% 18 |— 22 02 0,050 05,0 02 0,050 05,0 22 |— 26 12 0,300 30,0 14 0,350 35,0 26 |— 30 04 0,100 10,0 18 0,450 45,0 30 |— 34 14 0,350 35,0 32 0,800 80,0 34 |— 38 03 0,075 7,50 35 0,875 87,5 38 |— 42 01 0,025 2,50 36 0,900 90,0 42 |—| 46 04 0,100 10,0 40 1,000 100,0 Total: 40 1,000 100,0 O símbolo “ι—“ significa que o início do intervalo faz parte dele e o final somente o limita (em linguagem matemática: intervalo fechado à esquerda e aberto à direita). Para obter a frequência de cada classe é preciso contar quantos elementos fazem parte dela. Por exemplo, na primeira classe estariam os números 18, 19, 20 e 21 No nosso exemplo, aparece somente o 18, duas vezes. Na segunda classe, deveriam aparecer os números 22, 23, 24 e 25 que aparecem 1 vez, 6 vezes, nenhuma vez e 5 vezes, respectivamente, portanto, a frequência simples é 12. Confira os demais valores tabelados. 12 leituraobrigatória A ideia de acumular frequências também é simples. A primeira frequência acumulada (relativa ou percentual) é sempre igual à primeira frequência simples (relativa ou percentual). Da segunda frequência acumulada em diante, basta que você adicione o valor da frequência simples da próxima classe ao valor acumulado: 2 + 12 = 14. Para representar graficamente dados quantitativos, os gráficos utilizados são o histograma, o polígono de frequências (simples) e a ogiva (frequências acumuladas). Vejas os gráficos na figura seguinte: Figura 1.2: Tipos de gráficos para variáveis quantitativas Histograma Polígono de frequências Ogiva 45 45 14 40 40 12 35 35 10 30 30 8 25 25 6 20 20 4 15 15 2 10 10 0 5 5 18 ι— 2 2 2 2 ι— 26 26 ι— 30 30 ι— 34 34 ι— 38 38 ι— 42 4 2 ι— 4 6 0 18 ι— 22 22 ι— 26 26 ι— 30 30 ι— 34 34 ι— 38 38 ι— 42 42 ι— 46 0 18 ι— 22 22 ι— 26 26 ι— 30 30 ι— 34 34 ι— 38 38 ι— 42 42 ι— 46 Fonte: Elaboração da autora. Comentários: Histograma é bem parecido com o gráfico de colunas, contudo, suas colunas são colaterais com todas as bases com a mesma dimensão. O polígono de frequências é obtido considerando-se os valores médios de cada classe e a frequência relativa à classe estudada. A ogiva também considera os pontos médios de cada classe em correspondência ao valor nela acumulado. Leia no Livro-Texto, se possível, como tratar dados agrupados. 13 linksimportantes Quer saber mais sobre o assunto? Então: Sites Teste os seus conhecimentos: faça exercícios sobre estatística e veja a resolução comentada. Acesse o site “Exercícios – Brasil Escola”. Disponível em: <http://exercicios.brasilescola.com/matematica/exercicios-sobre-estatistica.htm>. Acesso em: 3 mar. 2014. Nele você poderá testar seus conhecimentosfazendo exercícios e consultando a resolução comentada. Acesse o site “Portal Action”. Disponível em: <http://www.portalaction.com.br/1414-4-exerc%C3%ADcios>. Acesso em: 3 mar. 2014. Nele você poderá testar seus conhecimentos fazendo exercícios dos principais vestibulares ainda existentes no País e consultar a resolução comentada. Acesse o site “Exercícios – Professor Cardy”. Disponível em: <http://www.profcardy.com/exercicios/area.php?area=ESTAT%CDSTICA>. Acesso em: 3 mar. 2014. Nele você poderá testar seus conhecimentos fazendo exercícios apresentados pelo Enem e Enade em diversas edições desses exames e consultar a resolução comentada. 14 LINKSIMPORTANTES Acesse o site “Matematiquês”. Disponível em: <http://www.matematiques.com.br/download.php?tabela=documentos&id=436>. Acesso em: 3 mar. 2014. Nele você poderá testar seus conhecimentos fazendo exercícios e consultando a resolução comentada. Vídeos Assista aos vídeos com exercícios comentados. Disponíveis em: <http://video-aulas.com/listing/Matem%C3%A1tica/Ensino_M%C3%A9dio/ Estat%C3%ADstica/estatistica--exercicios-resolvidos--media-moda-mediana-variancia-desvio- padrao--pre-enem-abril-educacao-2013--video-aula-1217>. Acesso em: 3 mar. 2014. Os exercícios são bastante variados, com linguagem bem acessível uma vez que se trata de produção da Editora Abril Cultural voltada para o público que prestará o ENEM. 15 agoraéasuavez Instruções: Chegou a hora de você exercitar seu aprendizado por meio das resoluções das questões deste Caderno de Atividades. Essas atividades auxiliarão você no preparo para a avaliação desta disciplina. Leia cuidadosamente os enunciados e atente-se para o que está sendo pedido e para o modo de resolução de cada questão. Lembre-se: você pode consultar o Livro-Texto e fazer outras pesquisas relacionadas ao tema. Questão 1: Foi encomendado um estudo para ava- liação do curso “A” em uma Instituição de Ensino Superior. Para isso, aplicou-se um questionário e obtiveram-se respostas de 110 alunos. Indique: a) A variável em estudo. b) A população em estudo. c) A amostra escolhida. Questão 2: A variável “salário” é classificada como: a) Qualitativa nominal. b) Qualitativa ordinal. c) Quantitativa contínua. d) Quantitativa discreta. e) Quantitativa ordinal. Questão 3: Uma população cuja característica deseja-se estudar apresenta 50 mil elementos. A margem de erro admitida pelo pesquisador é de 1%. Nessas condições, o tamanho da amostra será: 16 AGORAÉaSUAVEZ a) n = 50.000. b) n = 10.000. c) n = 8.334. d) n = 5.000. e) n = 500. Questão 4: Para tabelar uma amostra de dados quan- titativos de tamanho n = 100 elementos, o examinador deverá elaborar: a) 10 classes. b) 8 classes. c) 7 classes. d) 5 classes. e) 4 classes. Questão 5: Chama-se questão aberta àquela cuja res- posta é livre. Uma questão é de múltipla escolha quando o investigador oferece as respostas a serem escolhidas pelo elemen- to pesquisado. Indique, entre as alternati- vas apresentadas, aquela cuja resposta deve ser obrigatoriamente livre: a) Quantos livros você leu no último ano? b) Quantos filhos você tem? c) O bairro onde você mora é considerado um lugar tranquilo? d) A que classe social você pertence? e) Qual o título do último livro que você leu? Texto para as questões de 6 a 10: Considere os dados quantitativos representados na tabela. Com base nas orientações do item “Leitura Obrigatória” responda ao que se pede em seguida. 6 157 223 98 189 119 142 99 75 241 128 137 172 22 167 115 29 217 29 142 134 38 32 36 230 Questão 6: Elabore uma tabela de frequências con- siderando cinco classes assim definidas: 0 ι— 50; 51 ι— 100; 101 ι— 150; 151 ι— 200; 201 ι— 250 Questão 7: Elabore o histograma dos dados estudados. Questão 8: Elabore o polígono de frequência dos da- dos estudados. 17 AGORAÉaSUAVEZ Questão 9: Questão 10: Elabore a ogiva dos dados estudados. Que informação você extrai ao analisar a ogiva? finalizando Neste tema, você conheceu as definições iniciais da estatística e sua utilidade. Aprendeu como obter e classificar dados; construir tabelas e gráficos. Aprendeu, principalmente, que a estatística permite ao investigador conhecer qualquer elemento que componha sua área de atuação. Caro aluno, agora que o conteúdo dessa aula foi concluído, não se esqueça de acessar sua ATPS e verificar a etapa que deverá ser realizada. Bons estudos! referências CRESPO, Antonio Arnot. Estatística Fácil. 19. ed. atual. São Paulo: Saraiva, 2009. CUNHA, M. V. Análise Multidimensional de Dados Categóricos. PPGA, UFRGS, Porto Alegre 16, 1997. FONSECA, J. S, MARTINS, G. Curso de Estatística. São Paulo: Atlas, 1996. FREITAS & CUNHA CONSULTORES LTDA. Guia do Usuário – Sphinx Léxica 2.08 for Windows®. Porto Alegre, 1998. 18 referências GIACOMELLO, C. P. Probabilidade e estatística. Centro de Ciências Exatas, da Natureza e de Tecnologia, Universidade de Caxias do Sul. Rio Grande do Sul, 2012. KOTLER, P. Administração de Marketing: Análise, Planejamento, Implementação e con- trole. São Paulo: Atlas, 1996. LABES, E. M. Questionário: do planejamento à aplicação na pesquisa. Chapecó: Grifos, 1998. LARSON, Ron; FARBER, Betsy. Estatística e Métodos Quantitativos. 2. ed. São Paulo: Pearson Prentice Hall, 2007. Livro-Texto 136. MATTAR, F. N. Pesquisa de Marketing. São Paulo: Atlas, 1996. ROSSI, C. A. V.; SLONGO, L. A. Pesquisa de satisfação de clientes: o estado-da-arte pro- posição de um método Brasileiro. In: ENCONTRO ANUAL DA ANPAD, 21., Anais... 1997, Rio das Pedras, RJ. p.124. SLACK, N. Administração da produção. São Paulo: Atlas, 1997. glossário Amostra: subconjunto da população. Dado: informação (característica) a ser tratada. População: conjunto formado por todos os elementos cuja característica o investigador deseja conhecer. Respostas válidas: são aquelas que não se desviam da pergunta elaborada. Exemplo: se, ao se perguntar “qual sua cor preferida?”, a resposta for “verde”, esta será válida. Variável: a característica que se pretende conhecer. 19 gabarito Questão 1 Resposta: Observando os detalhes do texto, as respostas serão: (a) qualidade de ensino; (b) Instituição de Ensino Superior; (c) 110 alunos. Questão 2 Resposta: Alternativa C. Questão 3 Resposta: Alternativa C. Questão 4 Resposta: Alternativa B. Questão 5 Resposta: Alternativa E. Questão 6 Resposta: Após elaborar o rol, e com o auxílio de uma calculadora, você deverá obter: Classes f fr f% F Fr F% 0 ι— 50 7 0,28 28 7 0,28 28 51 ι— 100 3 0,12 12 10 0,40 40 101 ι— 150 7 0,28 28 17 0,68 68 151 ι— 200 4 0,16 16 21 0,84 84 201 ι— 250 40,16 16 25 1,00 100 total 25 1,00 100 20 Tema 02 Introdução à Estatística e Estatística Descritiva. Parte II: Medidas de Tendência Central e Medidas de Dispersão 4 Introdução ao Estudo da Disciplina Caro(a) aluno(a). Este Caderno de Atividades foi elaborado com base no livro Estatística e Métodos Quantitativos, dos autores Ron Larson e Betsy Farber, Editora Pearson Prentice Hall, 2007. Livro-Texto 136. Roteiro de Estudo: Estatística Aplicada Ivonete Melo de Carvalho conteúdosehabilidades Conteúdo Nessa aula você estudará: • Medidas de tendência central: média, moda e mediana. • Medidas de dispersão: amplitude total, desvio, variância, desvio padrão, coeficiente de variação. • Em que tipo de variáveis as diferentes medidas são aplicadas. 5 conteúdosehabilidades Habilidades Ao final, você deverá ser capaz de responder as seguintes questões: • O que são e para que servem as medidas de tendência central? • O que são e para que servem as medidas de dispersão? • Média e desvio padrão devem ser sempre calculados? • Por que variáveis qualitativas não apresentam as medidas de tendência central (exceto moda) e as medidas de dispersão? leituraobrigatória Introdução à Estatística e Estatística Descritiva. Parte II: Medidas de Tendência Central e Medidas de Dispersão Medidas de Tendência Central As medidas de tendência central são: o Medidas que representam um conjunto de dados relativos à observação de um determinado fenômeno (fato). p Medidas que servem para orientar quanto à posição da distribuição dos dados no eixo das abscissas. q Medidas que permitem a comparação de séries de dados entre si pelo confronto desses dados. As principais medidas de tendência central são: média, mediana e moda. 6 leituraobrigatória São sinônimos de média: o Esperança. p Esperança matemática. q Valor esperado. r Expectância de uma variável aleatória. Existem também os decis, quartis e percentis, que são chamados de separatrizes. As separatrizes não serão trabalhadas em detalhes neste caderno. Para tanto, consulte o Livro-Texto. No entanto, as suas definições serão apresentadas em seguida. Por definição, o percentil divide uma distribuição de frequência em 100 partes iguais, ou seja, P = + ( in − ∑ f )* h , em que: P i 100 i F P i P i = limite inferior da classe Pi, em que i = 1,2,3,...,99 n = tamanho da amostra \endash f = soma das frequências anteriores à classe Pi h = amplitude da classe FPi = frequência da classe Pi Por definição, o decil divide uma distribuição de frequência em 10 partes iguais, isto é, ( in − ∑ f )* h , em que: Di = D i + 1 0 F D i D i = limite inferior da classe Pi, em que i = 1,2,3,...,99 n = tamanho da amostra f) f = soma das frequências anteriores à classe Di h = amplitude da classe FDi = frequência da classe Di 7 leituraobrigatória O quartil, por definição, divide uma distribuição de frequência em 4 partes iguais. Para calcular os quartis, deve-se fazer: Q1 = Q + ( i n − ∑ f )* h , em que: 4 FQ 1 1 Q1 = limite inferior da classe do primeiro quartil n = tamanho da amostra f) f = soma das frequências anteriores à classe quartílica h = amplitude da classe quartílica FQ1 = frequência da primeira classe quartílica Coeficiente de Curtose Para que se determine o grau de achatamento da curva de distribuição de frequência de uma série de dados (coeficiente de curtose = k) é preciso determinar o terceiro e o primeiro quartis e o nonagésimo e o décimo percentis, por meio da seguinte fórmula: K = Q3 − Q1 (K = coeficiente de curtose) 2 * (P − P ) 9 0 1 0 f) Q3 e Q1 – terceiro e primeiro quartis, respectivamente. g) P90 e P10 – nonagésimo e décimo percentis, respectivamente. h) Se K = 0,263 então a curva da distribuição é mesocúrtica (achatamento normal). i) Se K > 0,263 então a curva da distribuição é platicúrtica (mais achatada). j) Se K < 0,263 então a curva da distribuição é leptocúrtica (mais alongada). Agora que você sabe o que são e para que servem os percentis, quartis e decis, é preciso apresentar a você a média, a mediana e a moda. Média: Média aritmética simples por definição é a soma de todos os valores xi observados (dados isolados) dividida pelo número de observações: n ∑xi x = i=1 n 8 leituraobrigatória Exemplo: calcule a média aritmética simples do seguinte conjunto de valores: 7, 14, e 21. Nesse caso: x = 7 +1 4 + 2 1 = 1 4 3 Por definição, para dados agrupados, a média será dada pela soma do produto dos valores observados pela frequência absoluta com que estes ocorrem, dividida pela soma das frequências absolutas da distribuição, ou seja: n ∑fixi c) = i=1 n fi i=1 Exemplo: dada a tabela de distribuição a seguir: xi 11 8 10 12 fi 1 4 3 2 Calcule a média aritmética simples: n = ∑ fi xi = 11*1 + 8 * 4 +1 0 * 3 +1 2 * 2 = 11 +1 2 + 3 0 + 2 4 = 7 7 = 7 x i=1 n 2 + 4 + 3 + 2 11 11 ∑ fi f) =1 Por definição, para dados agrupados em intervalos de classe, deve-se considerar xi o ponto médio do intervalo de classe. Propriedades da média: 1) A média de uma constante é a própria constante. 2) Multiplicando uma variável aleatória x por uma constante, sua média ficará multiplicada por esta constante. 3) A média da soma ou da diferença de duas variáveis aleatórias é a soma ou a diferença das médias. 4) Somando ou subtraindo uma constante a uma variável aleatória, a sua média ficará somada ou subtraída da mesma constante. 5) A média do produto de duas variáveis aleatórias independentes é o produto das médias. 9 leituraobrigatória Mediana: Por definição: 1. Em uma série de n-observações ordenada de forma crescente, a mediana é o valor da observação que divide essa série em duas metades iguais: uma delas com valores inferiores e outra com valores superiores ao valor da mediana. 2. Se a série possuir um número par de termos (ou observações), não existirá um termo central, logo, para calcular o valor da mediana, basta dividir por dois o valor da soma dos termos centrais. Moda: Por definição, moda (ou modo) é o valor que mais aparece ou o de maior frequência simples (absoluta ou relativa) numa distribuição de frequência. A moda pode não existir, e, existindo, pode não ser única. Uma distribuição pode ser: • Amodal (quando não existe moda). • Unimodal (uma só moda). • Bimodal (quando tem duas modas). • Multimodal (tem várias modas). Diferenças entre média, mediana e moda: Medida Vantagens Desvantagens Média Reflete cada valor É influenciada por valores observado na distribuição extremos Menos sensível a valores Difícil de se determinar para Mediana extremos se comparada à grande quantidade de dados média Moda Maior quantidade de valores Não se adequa à análiseconcentrados neste ponto matemática 10 leituraobrigatória O valor da mediana tem de estar em algum ponto localizado entre o valor da média e o valor da moda, podendo ser igual à moda e/ou à média. Essas três medidas podem definir a assimetria da curva de distribuição de frequência. Então: Média = Mediana = Moda Então, a curva Simétrica Se Média < Mediana < Moda Assimetria negativa de distribuição é: Média > Mediana > Moda Assimetria positiva Medidas de Dispersão Medidas de dispersão são medidas cuja função é avaliar o quanto estão afastados ou concentrados os valores observados numa distribuição de frequência ou de probabilidades. As principais medidas de dispersão são: • Amplitude total (ou range). • Desvio médio absoluto. • Variância. • Desvio padrão. • Coeficiente de variação. Amplitude total Por definição, amplitude total é a diferença entre o maior e o menor valor observados, não dando a noção de quanto os valores intermediários estão afastados ou concentrados. Observe a distribuição A: 2; 3; 4; 13; 18. A amplitude total de A será: AT = 18 – 2 = 16 A amplitude total diz pouco a respeito de uma série de dados; para melhor avaliá-la, outros conceitos precisam ser agregados ao seu estudo. O primeiro conceito a ser criado é o de desvio, ou seja, a distância que cada um dos valores observados apresenta em relação à média ( xi − x ). 11 leituraobrigatória Distribuição A Desvio i xi xi − x 1 2 2 - 8 = -6 2 3 3 - 8 = -5 3 4 4 - 8 = -4 4 13 13 - 8 = 5 5 18 18 - 8 = 10 Σ 40 0 Observe que o somatório dos desvios em relação à média aritmética é igual a zero. Isso acontecerá em toda série de observações, pois “a soma dos desvios em relação à média aritmética sempre será nula”. Você, então, deve estar se perguntando: “como avaliar a dispersão entre os valores observados em tal distribuição?”. Uma das formas de resolver este problema é calculando a variância. Variância: Por definição, a variância é o somatório dos quadrados dos desvios dividido pelo número de observações (se população) ou número de observações menos um (se amostra). No exemplo considerado: Distribuição A Valores dos desvios elevados ao quadrado i xi xi − x 1 2 2 - 8 = -6 = 36 2 3 3 - 8 = -5 = 25 3 4 4 - 8 = -4 = 16 4 13 13 - 8 =5 = 25 5 18 18 - 8 = 10 = 100 Σ 40 202 12 leituraobrigatória Valor obtido para a variância ( σ2 ): n 2 ∑ xi − x 202 σ A 2 = i=1 = = 4 0,4 n 5 Lembre-se sempre de que, se houver uma distribuição para dados agrupados, você terá de multiplicar o quadrado de cada desvio pela respectiva frequência, fazendo a seguir a divisão pela soma das frequências. E, se os dados se apresentarem em intervalos de classe, será o ponto médio do intervalo de classe. Assim, a fórmula para cálculo da variância será: n 2 ∑ xi − * Fi x σ 2 = i=1 n ∑Fi i=1 Para dados agrupados, considera-se a frequência no cálculo da variância, e quando os dados se apresentarem em intervalos de classe, xi será o ponto médio do intervalo de classe. Logo, a fórmula será: • Para a variância populacional: σ2 = SQD n • Para a variância amostral: σ2 = SQD n − 1 Desvio Padrão Por definição, o desvio padrão é a raiz quadrada positiva da variância, isto é, σ = σ2 é o desvio padrão para a população e s = s2 é o desvio padrão para uma amostra. No exemplo dado, teremos: σ A = 4 0,4 = 6,3 6 Coeficiente de Variação Por definição, coeficiente de variação é expresso como o resultado da divisão do desvio padrão pela média. Corresponde a uma medida relativa de dispersão, útil para a comparação (em termos relativos) do grau de concentração em torno da média de séries distintas. Essa medida serve para avaliar a homogeneidade de séries estatísticas e pode ser expressa na forma unitária ou percentual. 13 leituraobrigatória Retornando ao nosso exemplo: c vA = 6,3 8 6 = 7 9,5% Utilizar-se-á como referência neste caderno a tabela para Coeficientes de Variação, de Jairo Simon da Fonseca e José Afonso Mazzon1. linksimportantes Quer saber mais sobre o assunto? Então: Sites Teste os seus conhecimentos: resolva exercícios a respeito de medidas de tendência central e medidas de dispersão e consulte a resolução comentada. Acesse o site “Exercícios – Brasil Escola”. Disponível em: <http://exercicios.brasilescola.com/matematica/exercicios-sobre-estatistica.htm>. Acesso em: 3 mar. 2014. Nele você poderá testar seus conhecimentos fazendo exercícios e consultando a resolução comentada. Acesse o site “Portal Action”. Disponível em: <http://www.portalaction.com.br/1414-4-exerc%C3%ADcios>. Acesso em: 3 mar. 2014. Nele você poderá testar seus conhecimentos fazendo exercícios dos principais vestibulares ainda existentes no PAÍS e consultar a resolução comentada. 1 Disponível na internet para consulta no seguinte site: <http://www.google.com.br/url?sa=t&rct=j&q=& esrc=s&source=web&cd=4&ved=0CEUQFjAD&url=http%3A%2F%2Fwww.rausp.usp.br%2Fdownload. asp%3Ffile%3D1201017.pdf&ei=TgYdU6nPA8SrkAfW8oGIBg&usg=AFQjCNFmRlUxGd2cG7vvNRscp YuQ9t0whQ&sig2=oL4N-psJGAB8UloClSJBUw&bvm=bv.62578216,d.eW0>. Acesso em: 10 mar. 2014. 14 LINKSIMPORTANTES Acesse o site “Exercícios – Professor Cardy”. Disponível em: <http://www.profcardy.com/exercicios/area.php?area=ESTAT%CDSTICA>. Acesso em: 3 mar. 2014. Nele você poderá testar seus conhecimentos fazendo exercícios apresentados pelo Enem e Enade em diversas edições destes exames e consultar a resolução comentada. Acesse o site “Matematiquês”. Disponível em: <http://www.matematiques.com.br/download.php?tabela=documentos&id=436>. Acesso em: 3 mar. 2014. Nele você poderá testar seus conhecimentos fazendo exercícios e consultando a resolução comentada. Vídeos Assista aos vídeos com exercícios comentados. Disponíveis em: <http://video-aulas.com/listing/Matem%C3%A1tica/Ensino_M%C3%A9dio/ Estat%C3%ADstica/estatistica--exercicios-resolvidos--media-moda-mediana-variancia-desvio- padrao--pre-enem-abril-educacao-2013--video-aula-1217>. Acesso em: 3 mar. 2014. Os exercícios são bastante variados, com linguagem bem acessível uma vez que se trata de produção da Editora Abril Cultural voltada para o público que prestará o Enem (Exame Nacional do Ensino Médio). 15 agoraéasuavez Instruções: Chegou a hora de você exercitar seu aprendizado por meio das resoluções das questões deste Caderno de Atividades. Essas atividades auxiliarão você no preparo para a avaliação desta disciplina. Leia cuidadosamente os enunciados e atente-se para o que está sendo pedido e para o modo de resolução de cada questão. Lembre-se: você pode consultar o Livro-Texto e fazer outras pesquisas relacionadas ao tema. Questão 1: Um produto subiu de R$ 35,00 para R$ 40,00 no primeiro mês e de R$ 40,00 para R$ 52,00 no segundo mês. Qual o crescimento mensal médio, em reais, desse produto? Questão 2: Suponha que, numa sala com 25 pessoas,as idades, em anos, sejam as seguintes: 24 - 24 - 24 - 25 - 25 - 30 - 32 - 32 - 32 - 35 - 36 - 36 - 40 - 40 - 40 - 40 - 46 - 48 - 48 - 50 - 54 - 54 - 60 - 60 - 65. A média das idades observadas, em anos, é igual a: a) 35,18. b) 35,12. c) 40,00. d) 40,13. e) 42,15. Questão 3: Suponha que, numa sala com 25 pessoas, as idades, em anos, sejam as seguintes: 24 - 24 - 24 - 25 - 25 - 30 - 32 - 32 - 32 - 35 - 36 - 36 - 40 - 40 - 40 - 40 - 46 - 48 - 48 - 50 - 54 - 54 - 60 - 60 - 65. A mediana das idades observadas, em anos, é igual a: 16 AGORAÉaSUAVEZ a) 36. b) 38. c) 40. d) 42. e) 44. Questão 4: Determinada empresa observou que seus funcionários gastam em média 6 horas por semana cuidando de seus e-mails pesso- ais durante o dia de trabalho. O desvio pa- drão observado foi de 4 horas semanais. Com base nas informações da situação hipotética anteriormente descrita, pode-se afirmar que o coeficiente de variação, de acordo com a classificação, é: a) Baixo, próximo de zero. b) Baixo, próximo de 15%. c) Mediano, próximo de 15%. d) Mediano, próximo de 30%. e) Alto, acima de 50%. Questão 5: Num grupo de 16 alunos, as notas das pro- vas de Estatística foram todas iguais ou superiores a sete pontos. A mediana das notas do grupo é igual a 8,0 e a média 8,2. Afirmação I: nessas condições, pode-se afirmar que a maior parte das notas foi in- ferior a 8,0. Afirmação II: nessas condições, pode-se afirmar que a maior parte das notas foi su- perior a 8,0. a) Somente a afirmação I está correta. b) Somente a afirmação II está correta. c) Ambas as afirmações estão corretas. d) Ambas as afirmações estão erradas. e) As informações se complementam. Questão 6: Calcule a média aritmética entre: 10, 15, 16, 23, 49, 50 e 60. Texto para as questões 7 a 10: Ao entrevistar um grupo de alunos, obtêm- se as seguintes respostas a respeito de suas idades: 20 21 22 20 22 23 25 20 25 24 20 24 25 23 23 22 21 22 20 25 Com bases nesses dados, calcule o que se pede nos exercícios seguintes. 17 AGORAÉaSUAVEZ Questão 7: Questão 9: Calcule a idade média dos alunos e a me- Calcule a variância e o desvio padrão entre diana entre as idades. os dados apresentados. Questão 8: Questão 10: Identifique a moda entre as idades dos Calcule o coeficiente de variação e analise alunos. o resultado. finalizando Neste tema, você aprendeu a trabalhar com medidas importantes para a estatística descritiva: medidas de tendência central e medidas de dispersão. Dê especial atenção ao cálculo da média e do desvio padrão. Observe também que essas medidas são aplicáveis para dados quantitativos. Dados qualitativos – expressos em categorias – não permitem tal cálculo; para estes, a única medida que se aplica é a observação da moda. Caro aluno, agora que o conteúdo dessa aula foi concluído, não se esqueça de acessar sua ATPS e verificar a etapa que deverá ser realizada. Bons estudos! 18 referências CRESPO, Antonio Arnot. Estatística Fácil. 19. ed. atual. São Paulo: Saraiva, 2009. CUNHA, M. V. Análise Multidimensional de Dados Categóricos. In: PPGA, UFRGS, 16, Porto Alegre, 1997. FONSECA, J. S, MARTINS, G. Curso de Estatística. São Paulo: Atlas, 1996. FREITAS & CUNHA CONSULTORES LTDA. Guia do Usuário – Sphinx Léxica 2.08 for Windows®. Porto Alegre, 1998. KOTLER, P. Administração de Marketing: Análise, planejamento, implementação e contro- le. São Paulo: Atlas, 1996. LABES, E. M. Questionário: do planejamento à aplicação na pesquisa. Chapecó: Grifos, 1998. LARSON, Ron; FARBER, Betsy. Estatística e Métodos Quantitativos. 2. ed. São Paulo: Pearson Prentice Hall, 2007. Livro-Texto 136. MATTAR, F. N. Pesquisa de Marketing. São Paulo: Atlas, 1996. ROSSI, C. A. V.; SLONGO, L. A. Pesquisa de satisfação de clientes: o estado-da-arte pro- posição de um método Brasileiro. In: ENCONTRO ANUAL DA ANPAD, 21., Anais... 1997, Rio das Pedras, p.124. SLACK, N. Administração da produção. São Paulo: Atlas, 1997. 19 glossário Dispersão: proximidade ou distanciamento observado em um conjunto de dados numéricos. Homogêneo: grupo que apresenta características comuns, por exemplo, notas próximas no caso de uma avaliação. Heterogêneo: grupo que apresenta características distintas, por exemplo, notas distantes no caso de uma avaliação. Série: conjunto de dados. SQD: soma dos quadrados dos desvios. gabarito Questão 1 Resposta: Os aumentos foram de R$ 5,00 e R$ 12,00, portanto houve um aumento total de R$ 17,00. Dividindo R$ 17,00 por 2 (= número de aumentos) você obterá R$ 8,50. Questão 2 Resposta: Alternativa C. Questão 3 Resposta: Alternativa A. 20 gabarito Questão 4 Resposta: Alternativa E. Questão 5 Resposta: Alternativa B. Questão 6 Resposta: Substituindo os valores na fórmula da média: x = 1 0 +1 5 +1 6 + 2 3 + 4 9 + 5 0 + 6 0 = 223 ≅ 3 1,8 6 67 Questão 7 Resposta: Calculando a média e a mediana: Média: x = 2 0 *5 + 2 1* 2 + 2 2 * 4 + 2 3*3 + 2 4 * 2 + 2 5* 4 = 2 2,3 5 2 0 Mediana: med = 2 2 + 2 2 = 2 2 2 Questão 8 Resposta: Lembrando que ela corresponde ao valor mais repetido, a moda entre as idades do grupo estudado é 20 anos. Questão 9 Resposta: Para calcular o desvio padrão, é necessário, antes, calcular a variância: xi (xi − (xi − x) x) 2 x 20 22,35 -2,35 5,5225 20 22,35 -2,35 5,5225 20 22,35 -2,35 5,5225 20 22,35 -2,35 5,5225 20 22,35 -2,35 5,5225 21 22,35 -1,35 1,8225 21 gabarito xi (xi − (xi − x) x) 2 x 21 22,35 -1,35 1,8225 22 22,35 -0,35 0,1225 22 22,35 -0,35 0,1225 22 22,35 -0,35 0,1225 22 22,35 -0,35 0,1225 23 22,35 0,65 0,4225 23 22,35 0,65 0,4225 23 22,35 0,65 0,4225 24 22,35 1,65 2,7225 24 22,35 1,65 2,7225 25 22,35 2,65 7,0225 25 22,35 2,65 7,0225 25 22,35 2,65 7,0225 25 22,35 2,65 7,0225 66,55 Cálculo da variância: σ 2 = 6 6,2 5 = 3,5 0 1 9 Cálculo do desvio padrão: σ = 3,5 0 = 1,8 7 Questão 10 Resposta: Calculando o desvio padrão, tem-se: c v = 2 1,8 2,3 7 5 *100 = 8,3 7% O coeficiente de variação é baixo, indicando que os dados são bem agrupados, isto é, próximos da média. 22 Tema 03 Assimetria e Curtose s e ç õ e s Como citar este material: CARVALHO, Ivonete Melo de. Estatística Aplicada: Assimetria e Curtose. Caderno deAtividades. Valinhos: Anhanguera Educacional, 2014. Tema 03 Assimetria e Curtose 4 Introdução ao Estudo da Disciplina Caro(a) aluno(a). Este Caderno de Atividades foi elaborado com base no livro Estatística e Métodos Quantitativos, dos autores Ron Larson e Betsy Farber, Editora Pearson Prentice Hall, 2007. Livro-Texto 136. Roteiro de Estudo: Estatística Aplicada Ivonete Melo de Carvalho CONTEÚDOSEHABILIDADES Conteúdo Nessa aula você estudará: • O conceito de simetria e sua importância para a estatística. • Gráfico em forma de sino (curva normal). • Afastamentos do centro de simetria (grau de simetria). • Grau de assimetria. 5 CONTEÚDOSEHABILIDADES Habilidades Ao final, você deverá ser capaz de responder as seguintes questões: • O que é e para que serve o conceito de simetria? • Construção do gráfico – curva normal? • O que é e para que serve a assimetria? • O que é e para que serve a medida denominada curtose? LEITURAOBRIGATÓRIA Assimetria e Curtose Para um conjunto de dados que esteja sendo analisado, além dos gráficos que você já estudou (histograma, polígono de frequência e ogiva), outro tipo de curva que pode ser elaborado recebe o nome de curva de frequência ou curva polida. Os estudiosos em estatística costumam dizer que o polígono de frequência determina ou mostra ao leitor (pesquisador) a imagem real do fenômeno estudado, ao passo que a curva de frequência demonstra a tendência do estudo em elaboração. Crespo (2009) é muito feliz quando afirma que depois do traçado de um polígono de frequência, é desejável, muitas vezes, que se lhe faça um polimento, a fim de mostrar o que seria tal polígono com um número maior de dados. Ao resultado deste “polimento” chama- se curva polida, isto é, a curva polida é a resultante de um grande número de dados, sem os vértices da linha poligonal. Para que o “polimento” ocorra, é preciso que a partir das frequências reais seja elaborada uma tabela de frequências calculadas. A fórmula que você deve utilizar para esse fim é: 6 LEITURAOBRIGATÓRIA f ci = f i −1 + 2 f i + f i +1 em que: 4 fci é a frequência considerada da classe calculada. fi é a frequência simples da classe considerada. fi-1 é a frequência simples da classe anterior à classe considerada. fi+1 é a frequência simples da classe posterior à classe considerada. Para que você compreenda bem, retornemos a um exemplo estudado na aula número 1 deste caderno. Trata-se das idades dos alunos de Ivonete. A tabela obtida naquela ocasião dizia: I Idade f i fci 1 18 ι— 22 02 4,0 2 22 ι— 26 12 7,5 3 26 ι— 30 04 7,3 4 30 ι— 34 09 7,3 5 34 ι— 38 07 6,3 6 38 ι— 42 02 3,8 7 42 ι— 46 04 2,5 Total 40 Como obter a frequência calculada: f ci = f i −1 + 2 f i + f i +1 = 0 + 2 * 2 +1 2 = 1 6 = 4 4 4 4 Calcule os demais elementos da tabela para ter certeza a respeito dos valores apresentados a você. 7 LEITURAOBRIGATÓRIA Os gráficos seriam: Pontos médios em destaque Curva polida A linha azul representa o polígono de frequências. A linha vermelha mostra a curva polida que aproxima os dados apresentados no polígono de frequência. Observe que não se trata de uma curva “centralizada” no plano cartesiano. Ela é deslocada para o lado esquerdo de quem lê a figura. Por esse motivo dizemos que ela é uma figura assimétrica. Para relembrar o que é simetria, pense numa parábola. Uma parábola é simétrica pelo vértice, isto é, suas “metades” (consideradas em torno do vértice) são iguais. Veja a figura seguinte: Figura 3.1: Parábola Fonte: Elaboração da autora. 8 LEITURAOBRIGATÓRIA Simetria é uma propriedade geométrica dos elementos, contudo para a Estatística, assimetria nada mais é do que o grau de desvio (afastamento da simetria) de uma distribuição de dados. Para distribuições assimétricas, a média tende a situar-se do mesmo lado da moda (na cauda mais longa). Observe com muita atenção as seguintes figuras: Figura 3.2: Distribuição Assimétrica à Direita (ou Assimetria Positiva) Fonte: Elaboração da autora. Figura 3.3: Distribuição Assimétrica à Esquerda (ou Assimetria Negativa) Fonte: Elaboração da autora. Figura 3.4: Distribuição Simétrica Fonte: Elaboração da autora. 9 LEITURAOBRIGATÓRIA Uma medida de assimetria é proporcionada pela diferença entre a média e a moda. Ela pode ser tomada sem dimensão por meio de uma divisão por uma medida de dispersão, como o desvio padrão. Veja: assimetria = 3 * (x − moda) (coeficiente de assimetria de Pearson) s No exemplo das idades dos alunos de Ivonete, a assimetria seria dada por: Cálculo da média: r = 2 0 * 2 + 2 4 *1 2 + 2 8 * 4 + 3 2 * 9 + 3 6 * 7 + 4 0 * 2 + 4 4 * 4 4 0 x = 1. 4 236 0 = 3 0,9 Cálculo da variância e do desvio padrão: I Idade fi xi fi * xi fi * xi2 1 18 ι— 22 02 20 40 800 2 22 ι— 26 12 24 288 6.912 3 26 ι— 30 04 28 112 3.136 4 30 ι— 34 09 32 288 9.216 5 34 ι— 38 07 36 252 9.072 6 38 ι— 42 02 40 80 3.200 7 42 ι— 46 04 44 176 7.744 Total: 40 1.236 40.080 4 0.080 1.236 2 σ = − = 6,8 7 4 0 4 0 Portanto, assimetria = 3 * (3 0,9 − 2 4) ≅ 3,0 1 6,8 7 10 LEITURAOBRIGATÓRIA Em capítulo anterior, você verificou que o valor da mediana (que ocupa a posição central numa distribuição de frequência) deve estar em algum ponto entre o valor da média e o valor da moda, porém, pode ser igual à moda e/ou à média. Você já sabe que com essas três medidas de posição, você pode determinar a assimetria da curva de distribuição de frequência. Também sabe que três casos podem ocorrer (ilustrados nas figuras anteriores): s Média = Mediana = Moda: distribuição simétrica. t Média < Mediana < Moda: distribuição assimétrica negativa. u Média > Mediana > Moda: distribuição assimétrica positiva. No exemplo de Ivonete: moda = 24; mediana = 30,89 e média = 30,9 de onde se pode concluir que a distribuição de frequência é assimétrica positiva. Curtose Ao desenhar um gráfico, a curva pode ser mais ampla ou mais compacta assim como pode ser mais alongada ou mais achatada. Interessa à estatística estudar o quanto uma curva poder ser alongada. Curtose é, então, o grau de achatamento de uma distribuição, e é considerado muitas vezes em relação a uma distribuição normal. Em tema anterior, quando o texto referiu-se ao estudo dosquartis, você aprendeu que conhecendo os valores dos quartis e dos percentis, pode-se determinar o coeficiente de curtose, que dá o grau de achatamento da curva de uma distribuição, por meio da seguinte fórmula: k = Q3 − Q1 2 * (P − P ) 9 0 1 0 Em que: k = coeficiente de curtose; Q3 e Q1 terceiro e primeiro quartis, respectivamente; P90 e P10 nonagésimo e décimo percentis, respectivamente. Se K = 0,263, então podemos dizer que a curva da distribuição é mesocúrtica (achatamento normal). Se K > 0,263, então podemos dizer que a curva da distribuição é platicúrtica (mais achatada). Se K < 0,263, então podemos dizer que a curva da distribuição é leptocúrtica (mais alongada). 11 LEITURAOBRIGATÓRIA Graficamente: Para desenhar a curva normal (curva em formato de sino), a equação utilizada é: x −µ 2 1 −0,5* σ em que: y = σ * e 2π y representa a ordenada (altura da curva para um determinado valor da variável x); e = 2,71828 (base do logaritmo neperiano). = 3,1416. • = representa a média da população. \endash = representa o desvio padrão. O gráfico (curva normal) dos valores recolhidos por Ivonete ficaria assim 12 LEITURAOBRIGATÓRIA Para calcular a curtose dos dados referentes às idades de seus alunos, Ivonete deveria seguir os passos descritos a seguir: 111 Calcular os valores do primeiro e do terceiro quartis, que, no caso de dados agrupados, ficariam assim: g) fi = 4 0 = 1 0 44 Q = 2 8 + (1 0 −1 8) * 4 = 2 4,4 1 9 3 * ∑ fi = 120 = 3 0 4 4 Q = 3 4 + (3 0 − 2 7) * 4 = 3 2,3 3 7 é Calcular os valores do décimo e do nonagésimo percentis que, no caso de dados agrupados, ficariam assim: 1 0 * ∑ fi = 4 0 = 4 100 1 0 P = 2 8 + (4 −1 8) * 4 = 2 1,8 1 0 9 9 0 * ∑ fi = 9 0 * 4 0 = 3 6 100 100 P = 3 4 + (3 6 − 2 7) * 4 = 3 9,1 9 0 7 (3) Por último, calcular o coeficiente de curtose: k = Q3 − Q1 = 3 2,3 − 2 4,4 = 0,228 2 * (P − P ) 2 * (3 9,1 − 2 1,8) 9 0 1 0 Observe que, como 0,228 < 0,263, a curva obtida por Ivonete é leptocúrtica. Busque, no Livro-Texto, mais exemplos como este discutido no caderno e, em seguida, resolva os exercícios propostos a você. 13 LINKSIMPORTANTES Quer saber mais sobre o assunto? Então: Sites Teste os seus conhecimentos: faça exercícios sobre estatística e veja a resolução comentada. Acesse o site “Exercícios – Brasil Escola”. Disponível em: <http://exercicios.brasilescola.com/matematica/exercicios-sobre-estatistica.htm>. Acesso em: 3 mar. 2014. Nele você poderá testar seus conhecimentos fazendo exercícios e consultando a resolução comentada. Acesse o site “Portal Action”. Disponível em: <http://www.portalaction.com.br/1414-4-exerc%C3%ADcios>. Acesso em: 3 mar. 2014. Nele você poderá testar seus conhecimentos fazendo exercícios dos principais vestibulares ainda existentes no País e consultar a resolução comentada. Acesse o site “Exercícios – Professor Cardy”. Disponível em: <http://www.profcardy.com/exercicios/area.php?area=ESTAT%CDSTICA>. Acesso em: 3 mar. 2014. Nele você poderá testar seus conhecimentos fazendo exercícios apresentados pelo Enem e Enade em diversas edições destes exames e consultar a resolução comentada. 14 LINKSIMPORTANTES Acesse o site “Matematiquês”. Disponível em: <http://www.matematiques.com.br/download.php?tabela=documentos&id=436>. Acesso em: 3 mar. 2014. Nele você poderá testar seus conhecimentos fazendo exercícios e consultando a resolução comentada. Vídeos Assista aos vídeos com exercícios comentados e disponíveis no endereço a seguir a respeito de confecção de gráficos. Eles, certamente, esclarecerão muitas de suas dúvidas, inclusive a respeito de como confeccioná-los. Disponíveis em: <http://video-aulas.com/listing/Matem%C3%A1tica/Ensino_M%C3%A9dio/ Estat%C3%ADstica/estatistica--exercicios-resolvidos--media-moda-mediana-variancia-desvio- padrao--pre-enem-abril-educacao-2013--video-aula-1217>. Acesso em: 3 mar. 2014. Os exercícios são bastante variados, com linguagem bem acessível, uma vez que se trata de produção da Editora Abril Cultural voltada para o público que prestará o Enem. 15 AGORAÉASUAVEZ Instruções: Chegou a hora de você exercitar seu aprendizado por meio das resoluções das questões deste Caderno de Atividades. Essas atividades auxiliarão você no preparo para a avaliação desta disciplina. Leia cuidadosamente os enunciados e atente-se para o que está sendo pedido e para o modo de resolução de cada questão. Lembre-se: você pode consultar o Livro-Texto e fazer outras pesquisas relacionadas ao tema. Questão 1: Em seguida serão apresentadas a média e a moda de três diferentes distribuições de frequência. Determine o tipo de assimetria de cada uma delas e explique o significado de assimetria. Distribuição Média Moda A 52 52 B 45 50 C 48 46 Texto para as questões de 2 a 4: Observe os dados apresentados na distri- buição de frequência em seguida: Pontos de um Pessoas que acertaram teste 4 ι— 8 10 8 ι— 12 25 12 ι— 16 35 16 ι— 20 40 20 ι— 24 25 24 ι— 28 10 28 ι— 32 5 Questão 2: Nesse caso, o valor 16,5 (pontos no teste) é: g) A mediana. h) A média aritmética. 16 AGORAÉASUAVEZ k) A moda. l) A variância. m) O desvio padrão. Questão 3: Qual o percentual de valores que se locali- za entre o último quartil e o P81? d) 6 e) 19 f) 56 g) 77 h) 81 Questão 4: O sexagésimo percentil divide a área de uma distribuição em quantas partes? g) 2 h) 6 i) 40 j) 60 k) 100 Questão 5: Se numa distribuição há 500 valores, então entre o segundo quartil e o quinquagésimo percentil quantos valores haverá? 6) 7 7) 13 8) 42 9) 48 10) Não haverá valores. Texto para as questões 6 e 7: Em uma distribuição de frequências foram encontradas as seguintes medidas: 3. Média = 343,18. 4. Moda = 27,50. 5. Mediana = 31,67. 6. Desvio padrão = 12,45. Nessas condições, calcule o que pedem os exercícios 6 e 7. Questão 6: Classifique o tipo de assimetria. Questão 7: Calcule o coeficiente de assimetria. 17 AGORAÉASUAVEZ Questão 8: Considere a distribuição de frequências re- lativa às massas corporais (aos pesos) de cem operários de uma fábrica: Massa (kg) No de operários 50 58 10 58 66 15 66 74 25 74 82 24 82 90 16 90 98 10 Determine o grau de assimetria. Texto para as questões 9 e 10: Considere as seguintes medidas, relativas a três distribuições de frequências:Distribuições Q1 Q2 P 10 P 90 A 814 935 772 1.012 B 63,7 80,3 55,0 86,6 C 28,8 45,6 20,5 49,8 Questão 9: Calcule os respectivos graus de curtose. Questão 10: Classifique cada uma das distribuições em relação à curva normal. 18 FINALIZANDO Neste tema, você conheceu as definições de assimetria e curtose e sua utilidade. Aprendeu, principalmente, que estes elementos ampliam sua percepção acerca de uma série de dados estatísticos. Caro aluno, agora que o conteúdo dessa aula foi concluído, não se esqueça de acessar sua ATPS e verificar a etapa que deverá ser realizada. Bons estudos! REFERÊNCIAS CRESPO, Antonio Arnot. Estatística Fácil. 19. ed. atual. São Paulo: Saraiva, 2009. CUNHA, M.V. Análise Multidimensional de Dados Categóricos. PPGA, UFRGS, 16, Porto Alegre, 1997. FONSECA, J. S, MARTINS, G. Curso de Estatística. São Paulo: Atlas, 1996. FREITAS & CUNHA CONSULTORES LTDA. Guia do Usuário – Sphinx Léxica 2.08 for Windows®. Porto Alegre, 1998. KOTLER, P. Administração de Marketing: Análise, Planejamento, Implementação e con- trole. São Paulo: Atlas, 1996. LABES, E. M. Questionário: do planejamento à aplicação na pesquisa. Chapecó: Grifos, 1998. LARSON, Ron; FARBER, Betsy. Estatística e Métodos Quantitativos. 2. ed. São Paulo: Pearson Prentice Hall, 2007. Livro-Texto 136. 19 REFERÊNCIAS MATTAR, F. N. Pesquisa de Marketing. São Paulo: Atlas, 1996. ROSSI, C. A. V.; SLONGO, L. A. Pesquisa de satisfação de clientes: o estado-da-arte pro- posição de um método Brasileiro. In: ENCONTRO ANUAL DA ANPAD, 21., Anais... 1997, Rio das Pedras, RJ. p. 124. SLACK, N. Administração da produção. São Paulo: Atlas, 1997. GLOSSÁRIO Amostra: subconjunto da população. Assimetria: condição da figura que não é simétrica. Coeficiente: número que multiplica uma variável ou incógnita. Curtose: grau de achatamento de uma curva. Grau: medida, referência. Simetria: condição da figura cujas partes são espelhos umas das outras. 20 GABARITO Questão 1 Resposta: Observando os detalhes da tabela, você deverá obter a seguinte a análise: simétrica; assimétrica negativa e assimétrica positiva. Questão 2 Resposta: Alternativa A. Questão 3 Resposta: Alternativa A. Questão 4 Resposta: Alternativa A. Questão 5 Resposta: Alternativa A. Questão 6 Resposta: Aplicando corretamente as fórmulas, você deverá obter: assimetria positiva. Questão 7 Resposta: Aplicando corretamente as fórmulas, você deverá obter: 0,364. Questão 8 Resposta: Aplicando corretamente as fórmulas, você deverá obter: 0,021. Questão 9 Resposta: Aplicando corretamente as fórmulas, você deverá obter: (A) 0,2532, (B) 0,263 e • 0,287. Questão 10 Resposta: Analisando o posicionamento das curvas, você deverá obter: (A) leptocúrtica, (B) mesocúrtica e (C) platicúrtica. 2 1 Tema 04 Probabilidade s e ç õ e s Como citar este material: CARVALHO, Ivonete Melo de. Estatística Aplicada: Probabilidade. Caderno de Atividades. Valinhos: Anhanguera Educacional, 2014. Tema 04 Probabilidade 4 Introdução ao Estudo da Disciplina Caro(a) aluno(a). Este Caderno de Atividades foi elaborado com base no livro Estatística e Métodos Quantitativos, dos autores Ron Larson e Betsy Farber, Editora Pearson Prentice Hall, 2007. Livro-Texto 136. Roteiro de Estudo: Estatística Aplicada Ivonete Melo de Carvalho CONTEÚDOSEHABILIDADES Conteúdo Nessa aula você estudará: • A definição geral de probabilidade e os conceitos elementares de probabilidade. • A utilidade da probabilidade. • As fórmulas para calcular os diferentes tipos de probabilidades. 5 CONTEÚDOSEHABILIDADES Habilidades Ao final, você deverá ser capaz de responder as seguintes questões: • O que é e para que serve a teoria das probabilidades? • O que são e para que servem os diferentes tipos de eventos? • Por que a probabilidade é medida em porcentagem? • Qual a importância da probabilidade no mundo atual? LEITURAOBRIGATÓRIA Probabilidade Existem diferentes formas de se definir probabilidade. Pode-se definir probabilidade a partir da frequência relativa (uma frequência relativa é uma estimativa de probabilidade). Então, probabilidade é uma proporção em uma sequência muito grande de experimentos (FREITAS, 2003). Segundo Paccola e Bianchini (1989, p. 143): “Um experimento que pode apresentar resultados diferentes, quando repetido nas mesmas condições, é chamado experimento aleatório. Chamamos de espaço amostral ao conjunto de todos os resultados possíveis de um experimento aleatório”. O exemplo mais comum de experimento aleatório é o jogo de um dado não viciado; nesse caso, ao se jogar o dado, poderá ocorrer na face superior qualquer um dos números 1 a 6. 6 LEITURAOBRIGATÓRIA Então, o espaço amostral (representado por S) será dado por: S = {1, 2, 3, 4, 5, 6} n(S) = 6 Outro exemplo comum é o lançamento de uma moeda: S = {cara, coroa} n(S) = 2 Sobre o assunto, Paccola e Bianchini (1989, p. 144) dizem: Chama-se evento (E)1 a qualquer subconjunto de um espaço amostral. Evento Elementar é aquele que possui um único elemento [...] Evento impossível s aquele que não possui nenhum elemento [...] Evento Certo é aquele que possui todos os elementos do espaço amostral [...] Evento complementar t o evento formado pelos elementos de S que não pertencem a E. O evento complementar é indicado por E . Veja os exemplos: No lançamento de uma moeda, os eventos possíveis de ocorrer são ou cara ou coroa. Dizer “as faces que não são cara” determina um evento elementar: coroa (se não é cara só pode ser coroa). Se fosse escolhida a face 12 de uma moeda, observa-se um evento impossível uma vez que não existe moeda com um a face 12. No caso da moeda, o exemplo de evento certo seria: sai cara ou sai coroa. Já o evento complementar seria: se saiu cara, o evento complementar seria sair coroa e vice-versa. De forma geral, todos os autores concordam que num experimento aleatório, sendo S um espaço equiprovável (espaço amostral onde todos os eventos têm a mesma chance de ocorrer), a probabilidade de ocorrer um evento (E) qualquer será dada por: p(E) = n(S) n(E) v (E ) inclusão do símbolo no texto original realizado pela autora do caderno. 7 LEITURAOBRIGATÓRIA Propriedades: Se E = φ então p(E) = 0 (0%) Se E = S então p(E) = 1 (100%) Em outras palavras, a probabilidade de ocorrer um evento qualquer E é dada por: 0 ≤ p(E) ≤ 1 o u 0 % ≤ p(E) ≤ 100%. No exemplo das moedas, a probabilidade de ocorrer a face “cara” no lançamentode uma moeda é dada por: S = {cara, coroa} → n(S) = 2 E = {cara} → n(E) = 1 p(E) = n n ( ( E S) ) = 1 2 = 0,5 = 5 0% Também são pontos pacíficos entre os diversos autores as seguintes definições: A probabilidade da união de dois eventos A e B é igual à soma das probabilidades desses eventos menos a probabilidade da intersecção de A com B, isto é p(A B ) = p(A) + p(B) - p(A B ) A soma da probabilidade de ocorrer um evento A com a probabilidade de não ocorrer o evento A (ocorrer o complementar de A) será sempre igual a 1, ou seja, p(A) + p (A) = 1 Veja os exemplos: No lançamento de um dado, qual é a probabilidade de se obter o número 3 ou um número ímpar? (BIANCHINI ; PACCOLA, 1989, p. 147). 8 LEITURAOBRIGATÓRIA S = {1, 2, 3, 4, 5, 6} → n(S) = 6 A = {3} → n(A) = 1 B = {1, 3, 5} → n(B) = 3 A B = {3} {1, 3 , 5 } = {3} ⇒ n(A B ) = 1 1 3 1 3 1 Exemplo de probabilidade do evento complementar: uma urna contém 5 bolas brancas, 4 amarelas e 3 verdes. Escolhendo-se duas bolas ao acaso, determine a probabilidade de que: (a) ambas sejam brancas (b) ambas não sejam brancas (BIANCHINI; PACCOLA, 1989, p. 149). • Passo 1: calcular de quantas maneiras pode-se escolher duas bolas quaisquer: n(S) = C2 1 2 = 1 2! = 1 2 *11*1 0! = 132 = 6 6 2!*(1 2 − 2) ! 2! *1 0! 2 \endash Passo 2: calcular o número de maneiras de se escolher duas bolas brancas: n( A) = C25 = 5! = 5 * 4 * 3! = 2 0 = 1 0 2!*(5 − 2) ! 2 2! * 3! p( A) = n( A) = 1 0 = 5 = 1 5,2% n(S) 6 6 3 3 112 Passo 3: calcular o número de maneiras de se escolher duas bolas que não sejam brancas: p( A) = 1 − p( A) = 1 − 0,152 = 8 4,8% 9 LEITURAOBRIGATÓRIA Em Bianchini e Paccola (1989, p. 150) encontram-se o exemplo e a definição: No sorteio de um número natural e 1 a 10, alguém aposta que vai sair um múltiplo de 3. A probabilidade de acerto é, pois, a de ocorrer o evento A = {3, 6, 9}, ou seja, p( A) = 1 3 0 . Para causar suspense, a pessoa que realiza o sorteio anuncia que o número sorteado é ímpar. Constitui-se assim o evento B = {1, 3, 5, 7, 9}. Após essa informação, a probabilidade de acertos passou a ser a de ocorrer o evento A ∩B = {3, 9} , tendo agora como espaço amostral o conjunto B. Indicando a probabilidade de ocorrer o evento A tendo ocorrido o evento B por P(A/B) (Lê- se P de A dado B), ter-se-á: P(A /B) = n(A ∩ B) (n(B) > 0) n(B) Nesse caso: P(A / B) = n(A ∩ B) = 2 n(B) 5 A esse tipo de probabilidade, em que ocorre um evento A tendo ocorrido um evento B, dá- se o nome de probabilidade condicional de A dado B. Mais um exemplo, também de Bianchini e Paccola (1989, p. 150): No lançamento de dois dados, a soma dos pontos obtidos resultou em 5. Qual a probabilidade de um desses dados ter apresentado o número 2? Para resolver o exercício: O evento B “soma dos pontos obtidos resultou em 5” é: B = {(1, 4); (2, 3); (3, 2); (4, 1)} O evento A ∩B “dar a soma 5 e um dos dados apresentar o número 2” é: A ∩B = {(2, 3); (3, 2)} Nessas condições: P( A / B) = n( A ∩ B) = 1 = 5 0% n(B) 2 10 LEITURAOBRIGATÓRIA Os matemáticos também concordam com a definição de que a probabilidade da intersecção de dois eventos A e B é igual à probabilidade de A multiplicada pela probabilidade condicional de B, dado A, isto é: p(A ∩B) = p(A) * p(B / A) Veja o exemplo de Bianchini e Paccola (1989, p. 151): Retira-se ao acaso uma bola de uma urna que contém 6 bolas brancas numeradas de 1 a 6 e 4 bolas amarelas numeradas de 7 a 10. Se a bola retirada é branca, qual é a probabilidade de ter saído um número par? Solução: O número de elementos do espaço amostral é n(S) = 10. Indicando por A o evento “retirar uma bola branca” e por B “retirar uma bola com número par”, é evidente que desejamos calcular p(A ∩B) , ou seja, a probabilidade de retirar uma bola branca com um número par. Temos: p( A) = 1 6 0 = 5 3 P(B / A) = n(A ∩ B) = 3 = 1 n(A) 6 2 Logo, p( A ∩ B) = p( A) * p(B / A) = 5 3 * 1 2 = 1 3 0 Dois eventos são ditos independentes quando o fato de ocorrer um deles não influi na possibilidade de ocorrência do outro. Se A e B são eventos independentes, pode-se dizer que: p(A ∩B) = P(A) * P(B / A) p(A ∩B) = p(A) * p(B) Os exemplos são de Bianchini e Paccola (1989, p. 152-153): Exemplo 1 Uma urna contém 6 bolas brancas e 4 bolas pretas. Retirando-se sucessivamente duas bolas ao acaso, com reposição da primeira, qual é a probabilidade de ambas serem brancas? Solução: Como a 1ª bola retirada foi recolocada na urna, os eventos A e B tornam-se independentes, pois o evento “retirar uma bola branca na 2ª vez” não depende do que ocorreu na 1ª retirada. Assim temos: p( A ∩ B) = p( A) * p(B) = 1 6 0 * 1 6 0 = 100 36 = 3 6% 11 LEITURAOBRIGATÓRIA Exemplo 2: Lançando-se um dado três vezes, qual é a probabilidade de se obter: h) O número 4 somente no terceiro lançamento? i) Somente uma vez o número 4? Solução: 1 A probabilidade de se obter o número 4 no primeiro lançamento é 6 . Então a probabilidade de não se obter o número 4 no primeiro lançamento é 1− 6 1 = 56 . 1 A probabilidade de se obter o número 4 no primeiro lançamento também é 6 . Então a probabilidade de não se obter o número 4 no primeiro lançamento é 1− 6 1 = 56 . 1 A probabilidade de se obter o número 4 no primeiro lançamento também é 6 . Então, a probabilidade do número 4 ocorrer somente no terceiro lançamento é: p = 5 6 * 5 6 * 1 6 = 216 25 O número 4 será obtido somente ou no primeiro ou no segundo ou no terceiro lançamento. Então, a probabilidade será igual a três vezes a probabilidade anterior: p = 3* 216 25 = 7 2 5 2 Pra finalizar, dois ou mais eventos são mutuamente exclusivos quando a realização de um excluía a realização de outro(s). Se os eventos são mutuamente exclusivos, a probabilidade de que um ou outro se realize é igual à soma das probabilidades de ocorrência de cada evento em estudo: p = p1 + p2. No exemplo da moeda, os eventos “cara” e “coroa” são mutuamente exclusivos. No exemplo dos dados, a probabilidade de se tirar a face 2 ou a face 5 é de: p = 1 6 + 1 6 = 6 2 = 1 3 = 3 3,3% 12 LINKSIMPORTANTES Quer saber mais sobre o assunto? Então: Sites Teste os seus conhecimentos: resolva exercícios de estatística e consulte a resolução comentada. Acesse o site “Exercícios – Brasil Escola”. Disponível em: <http://exercicios.brasilescola.com/matematica/exercicios-sobre-estatistica.htm>. Acesso em: 3 mar. 2014. Nele você poderá testar seus conhecimentos fazendo exercícios e consultando a resolução comentada. Acesse o site “Portal Action”. Disponível em: <http://www.portalaction.com.br/1414-4-exerc%C3%ADcios>. Acesso em: 3 mar. 2014. Nele você poderá testar seus conhecimentos fazendo exercícios dos principais vestibulares ainda existentes no País e consultar a resolução comentada. Acesse o site
Compartilhar