Baixe o app para aproveitar ainda mais
Prévia do material em texto
ESTATÍSTICA TEORIA E APLICAÇÕES PROF. DR. WALTER PAULETTE 0 10 20 30 40 50 60 70 80 90 PREFÁCIO OBJETIVOS GERAIS A estatística desempenha papel importante em quase todas as fases da pesquisa de trabalhos acadêmicos. O objetivo da Estatística, Teoria e Aplicações, é apresentar uma introdução à estatística para alunos do curso de Administração, Ciências contábeis e Economia, que estejam cursando pela primeira vez a disciplina. Foi planejado para ser utilizado com livro texto de um curso regular de estatística. Como estratégia de ensino e aprendizagem usamos a metodologia de ensino aprendizagem via resolução de problemas, a qual foi considerada parte integrante da disciplina. Inserimos numerosos exemplos, espalhados por todos os capítulos e exercícios de aplicação. CONTEUDO DOS CAPÍTULOS Capítulo 1: Estatística descritiva Esse capítulo trata da análise da distribuição de frequência nas variáveis discreta e contínua. Estuda as medidas de tendência central, de dispersão e gráficos, levando o estudante a compreender e manusear cálculos estatísticos. Capítulo 2,3 e 4: Análise combinatória, probabilidade e teorema de Bayes Aqui são apresentadas as noções de Combinatória, probabilidades e o teorema de Bayes, com suas aplicações. Capítulo 5: Distribuição Binomial e de Poisson Estudamos neste capítulo as distribuições de probabilidade discretas, Bernoulli, Binomial e Poisson. Capítulo 6: Distribuição normal ou de Gauss Neste capítulo apresentamos o modelo fundamental na teoria das probabilidades e na inferência estatística que é a distribuição normal ou Gaussiana. Capítulo 7: Variável aleatória Estudamos aqui as distribuições de probabilidade definidas por expressões matemáticas na variável discreta e contínua. Estão novamente presentes as noções de média ou esperança e variância. Capítulo 8: Estimação por intervalos São tratadas aqui as estimativas de intervalos de confiança para a média populacional, conhecendo ou não o desvio padrão populacional. Capítulo 9: Testes de significância ou testes de hipótese Neste capítulo discutimos quando se faz uma determinada afirmação sobre um parâmetro da população e desejamos saber os resultados experimentais provenientes de uma amostra contrária ou não a tal afirmação. Capítulo 10: Ajustamento de curvas: Regressão linear e correlação Estudamos como a variação de uma grandeza acarreta a variação da outra. Comentários e sugestões. Apesar dos nossos melhores esforços é inevitável que surjam erros no texto. Assim, são bem-vindas as comunicações de correções e sugestões. Os leitores podem encaminhar as críticas e sugestões para walterpaulette@uol.com.br ESTATÍSTICA TEORIA E APLICAÇÕES SOBRE O AUTOR Walter Paulette, licenciado e bacharel em matemática pela Pontifícia Universidade de São Paulo, (PUC-SP), mestre em matemática pela PUC-SP e doutorado pela UNESP de Rio Claro. Professor titular pela ESAGS, Escola Superior de Administração e Gestão de Santo André e Fatec São Paulo. BIBLIOGRAFIA 1) BUSSAB, W. de O.; MORETTIN, P. A. Estatística Básica, 5a. ed. São Paulo: Saraiva, 2004. 2) LEVIN, J. e FOX, J.A. Estatística para Ciências Humanas. 9ª. Edição. São Paulo Pearson-Prentice Hall. 3) LEVINE, D. M., BERENSON, M. L. STEPHAN, D. Estatística: Teoria e Aplicações. 3ª. ed. Rio de Janeiro: LTC.2005 4) ANDERSON, D.R.;SWEENEY,D.J.;WILLIANS, T. A. Estatística Aplicada à Economia e Administração. 2ª ed. São Paulo: Pioneira Thomson Learning.2002 5) KAZMIER, Leonard. Estatística Aplicada à Economia e Administração. São Paulo: McGraw Hill.1982. 6) MARTINS, G.A. Estatística Geral e Aplicada. 2a. Ed. São Paulo: Editora Atlas. 2002. 1 CAPÍTULO 1 ESTATÍSTICA DESCRITIVA 1. Dados históricos Podemos considerar a Estatística como a ciência que se preocupa com a organização, descrição, análise e interpretação dos dados experimentais. Essa conceituação é absolutamente geral e engloba o conceito usual do que seja a Estatística. Esse conceito usual e popular relaciona a Estatística com tabelas e gráficos nos quais os dados experimentalmente obtidos são representados. Exemplos: Estatística do movimento da Bolsa de Valores; estatística da loteria esportiva; estatística da Saúde Púbica: Crescimento do número de infectados pela gripe suína, acidentes de transito com vítimas nas estradas Estaduais; estatística do crescimento da população nos estados; estatística do movimento bancário; cheques devolvidos; cheques sem fundo; tabelas do campeonato de futebol; pesquisa eleitoral, etc. Essa noção refere-se apenas à parte de organização e descrição dos dados observados. Há ainda um campo de atuação da ciência Estatística que é a análise e interpretação desses dados. Desde a antiguidade observa-se a utilização da Estatística para descrever em números as condições econômicas, na agricultura, na indústria e no comércio. Assim, se lê no livro sagrado de Confúcio (551 a.C. a 479 a.C.) (CHOUKING). No quarto livro de Moisés, chamado NÚMEROS, Moisés faz o recenseamento de todas as tribos de Israel, no deserto de Sinai, isso ocorreu após dois anos da saída do Egito (Cap. 1, vs. 1 a 46). O imperador romano César Augusto ordenou o recenseamento em todo império romano no ano de nascimento de Jesus. Portanto, podemos dizer que na antiguidade a Estatística preocupava-se com Registro dos dados, é uma Estatística Administrativa, pois ela se interessava em contar o número de homens aptos para a guerra e de produtos agropecuários. A palavra estatística é derivada da palavra latina “STATUS”, com o significado de Estado, Governo, atribuindo o significado “Ciência das coisas que pertencem ao Estado”. Como disciplina autônoma ela aparece no século XVII na Alemanha, tendo como objeto a descrição das coisas notáveis do estado. Para essa autonomia muito contribuiu o alemão Herman Conring (1606-1681) introduzindo a estatística com disciplina na Universidade de Helmstadt. Na Inglaterra surgem os chamados Aritméticos políticos, denominação atribuída a William Petty, aos que tinham interesse especial pelas tabelas de mortalidades em virtude de suas aplicações nos seguros de vida. Na França desenvolve-se a partir do século XVII, o cálculo de probabilidades como disciplina científica. Sua origem atribui-se a questões postas a Blaise Pascal (1623-1662) por Cavaleiro de Nére, para alguns autores 2 jogador inveterado, para outros um filósofo e homem de letras. Mas a maior contribuição aparece nas cartas entre Pascal e Pierre Fermat (1601-1665) em que ambos chegam a uma solução correta do problema dos jogos de azar. Foi Jacques Bernoulli (1654-1705) que aperfeiçoou a teoria das probabilidades escrevendo a sua grande obra “Ars Conjectandi”, publicada oito anos após sua morte. Pode-se dizer que foi devido as contribuições de Bernoulli que o cálculo de probabilidades adquiriu o estatus de ciência. São fundamentais as contribuições de Pierre Laplace (1749-1827) com as publicações da “Teoria Analítica da Probabilidade” e a definição clássica da probabilidade (Quociente entre o número de casos favoráveis e o número de casos possíveis). Gauss (1777-1855) apresentou em 1809 a “Theoria Combinationis Observatorium Erroribus Minimis Obnoxia” que mostra uma teoria sobre a análise de observações, que pode ser aplicável a qualquer ramo da ciência. Podemos citar outros grandes estatísticos como: Francis Galton (1822-1911) da escola de estatística inglesa que criou a teoria da regressão linear. Karl Pearson (1857-1936) físico matemático dedicou-se a teoria da correlação. Ronald Aylmer Fisher, suas contribuições para a moderna estatística são as mais importantes de todas, sendo a figura de maior destaque de todos os tempos, desenvolveu e estruturou de forma rigorosa a Teoriada Inferência Estatística. William S. Gosset, com pseudônimo de “Student”, devido ao fato de trabalhar para uma fábrica de cerveja , desenvolveu em 1908 a Teoria da Amostragem Assim, podemos dizer que a estatística atual passou a ter um caráter mais científico, deixou de ser uma simples técnica de coleta de dados e de apresentação de dados, para se tornar um ramo de conhecimento humano que procura tirar conclusões a partir de fatos numéricos de observação. São muitas as definições de Estatística, citamos aqui algumas: A Estatística é a parte da Matemática Aplicada que se preocupa em obter conclusões a partir de dados observados”. (Rui Aguiar da Silva Leme). A Estatística é o estudo numérico dos fatos sociais”. (Levasser) Conjunto de processos que tem por objetivo a observação, a classificação formal e a análise dos fenômenos coletivos ou de massa e, por fim, a indução das leis a que tais fenômenos obedecem globalmente”. (Milton da Silva Rodrigues) É um ramo da Matemática Aplicada e pode ser considerada como a Matemática Aplicada a dados observados” (R. A. Fisher) A Estatística é a coleta, apresentação, análise e interpretação de dados numéricos”. (Croxton e Cowden) 3 Assim, podemos concluir que a Estatística é ciência, quando estuda populações e é método, quando serve de instrumento a uma outra ciência. Existem três ramos da estatística: A estatística descritiva; O cálculo das probabilidades e Inferência estatística. É importante enfatizar que a estatística descritiva começou antes do aparecimento do cálculo das probabilidades, sendo seu estudo concebível sem os conceitos probabilísticos. As probabilidades são ferramentas para a inferência estatística. A inferência estatística é interpretada de duas maneiras: ou fazendo uma estimação a respeito de uma característica da população cujo o valor se desconhece; ou realizando um teste sobre essa característica, da qual se afirma ter um determinado valor. São três áreas de interesses para a estatística: a) descrição e resumo de dados, b) teoria da probabilidade e c) análise e interpretação de dados. Essas três áreas da estatística não são separadas ou distintas, ao contrário, elas tendem a se entrelaçar. 2. Ramos da Estatística 2.1. Estatística descritiva A palavra estatística lembra sempre: taxas mensais de acidentes, índices de mortalidade infantil por estados, consumo de combustível por quilômetro rodado, etc. Essa parte da estatística que utiliza números para descrever fatos é chamada estatística descritiva. Estatística descritiva é o ramo da estatística que envolve a organização, o resumo e a representação dos dados. 2.2. Probabilidade O conhecimento das probabilidades associadas a uma situação fornece a base para o desenvolvimento das técnicas de tomada de decisão, explica o funcionamento dessas técnicas e indica de que modo as conclusões podem ser apresentadas e interpretadas corretamente. 2.3. Inferência estatística Consiste em métodos que generalizam para a população, aquilo que se observa na amostra. A palavra inferência é utilizada em Estatística com dois significados: conclusões tiradas a partir de valores ou de evidências; processo utilizado para se chegar a essas conclusões. 4 3. População – Amostra Se a estatística se preocupa com registro de fatos, então a população tem o significado de conjunto dos habitantes de uma determinada região. Modernamente população é qualquer coleção de objetos, seres ou entes que apresentam pelo menos uma característica em comum. Exemplo 1: Vazão do rio Tietê de 1950 a 2015; Acidentes da Via Dutra de 2000 a 2015; Inflação brasileira de 1995 a 2015; Notas de Matemática dos alunos do Ensino médio. Medidas das alturas dos alunos de uma faculdade. A população pode ter um número finito de elementos ou ter um número ilimitado, isto é, população infinita. Quando se estuda uma população com um número muito grande de elementos, somos obrigados a examinar uma parte, a amostra. Entendemos por amostra, parte da população retirada segundo uma regra conveniente, probabilística ou aleatória. A amostra é sempre finita. Uma pesquisa que estuda todos os membros de uma população denomina-se censo e quando se toma uma parcela da população denomina-se pesquisa por amostragem. A seguir mostramos um exemplo de fenômeno aleatório. A figura que segue mostra esferas de mesmo diâmetro, caindo de um reservatório superior e passando por uma série de obstáculos, que em cada obstáculo a probabilidade da esfera se desviar para a esquerda ou para a direita é 1/2. As esferas são colhidas em reservatório abaixo e observa-se que elas se acumulam na parte central e tornam-se mais raras nas extremidades. O gráfico observado tem a forma de um sino, com a boca voltada para baixo. A essa distribuição denominamos de Distribuição Normal ou de Gauss. (Figura 1) Figura 1 5 Exemplos de retirada de amostras de uma população por meio da tabela de números aleatórios. Exemplo 2: Um candidato a prefeito de uma Capital contrata uma empresa de pesquisa de dados para avaliar sua posição entre os candidatos, a quinze dias das eleições. Sabemos que a população da Capital é formada por milhões de eleitores e como o órgão de pesquisa trabalha com tempo e recursos econômicos limitados, ele não estuda individualmente todos os eleitores do município e sim uma amostra, que deve ser retirada convenientemente da população e que apresente as mesmas informações da população. Assim, se o candidato A é o preferido por 40% dos eleitores da amostra, isso equivale a ser também o preferido por 40% da população. Para essa pesquisa, os eleitores são consultados aleatoriamente por meio de sorteios de bairros, ruas, casas e classes sociais A, B, C, D e E. Para retirar uma amostra de uma população aleatoriamente, usamos a tábua de números Aleatórios ou Randômicos, a expressão números Randômicos provém da palavra inglesa random que significa “casual, aleatório”. A tabela 1 é parte de uma tabela de números aleatórios. Tabela 1 TABELA DE NÚMEROS ALEATÓRIOS 575 862 053 359 191 045 078 892 944 508 844 129 063 558 334 157 151 189 770 246 377 362 560 634 666 181 029 348 396 735 984 632 383 737 532 259 387 297 267 470 545 549 719 531 099 784 959 438 716 262 928 273 326 161 742 884 879 184 627 953 931 443 459 268 505 364 789 838 178 892 645 618 087 370 911 952 595 863 589 024 276 605 317 913 285 852 975 574 503 355 339 907 655 998 807 058 283 133 568 029 147 973 759 205 690 763 953 361 919 386 487 101 360 500 001 045 364 436 862 234 374 415 513 773 874 046 443 549 905 554 962 432 903 090 386 175 422 490 435 185 447 429 756 170 813 435 050 845 473 381 242 597 581 435 931 122 845 507 797 223 001 740 233 067 235 969 218 915 6 102 184 165 787 207 250 416 874 144 175 850 230 092 829 185 336 538 837 596 690 702 096 328 284 737 467 011 721 389 114 950 528 794 431 632 741 076 069 066 346 180 043 526 035 712 099 962 866 292 571 795 223 885 774 366 679 414 386 928 425 052 614 848 560 449 017 870 690 721 335 499 249 Exemplo 3: O professor de Educação Física do Ensino Médio faz uma pesquisa para estudar as alturas de seus alunos do sexo masculino, envolvendo 999 alunos e deseja retirar uma amostra de 100 alunos seguindo a tabela de números aleatórios. Para construirmos essa amostra, podemos numerar os 999 alunos, atribuindo a cada aluno um número de três dígitos como os da sequência: 001, 002, 003, ... , 998 e 999. Para a escolha dos 100 elementos dentre os 999 alunos, podemos iniciar a consulta à tabela dos números aleatórios a partir de qualquer número da tabela randômica, por exemplo: tomamos três a três os números a partir do número 884 que estána quinta linha e na oitava coluna, e em seguida tomamos a medida da altura dos alunos cujos números são: 879; 184; 627; 953; 931; 443;..., até o encontrarmos o centésimo aluno. Assim, retiramos de uma população de 999 elementos uma amostra de 100 elementos, de maneira aleatória, por meio da tabela de números randômicos. Se a população é maior ou menor que 999 elementos, desenvolvemos um novo processo para a retirada da amostra. Exemplo 4: Retirar da população da tabela 2 uma amostra de 100 elementos, por meio de amostragem simples ao acaso, consultando a tabela 1 de números aleatórios. Por exemplo, inicie a retirada dos números começando pelo número aleatório da tabela, localizado na sexta linha, primeira coluna, número (931) em seguida 443 e sempre três a três. Tabela 2 8,8 15,6 15,3 12,7 5,9 3,3 3,5 7,2 16,7 14,7 7,7 13,4 15,5 14,5 7,0 10,8 11,8 2,7 3,8 9,0 11,6 9,5 8,6 7,0 7,5 10,9 7,2 9,5 8,4 12,9 14,9 4,1 13,1 10,6 17,0 4,2 3,8 10,6 4,5 11,8 6,4 8,4 7,3 13,1 16,5 5,5 15,3 13,7 9,7 11,5 11,2 9,6 8,8 11,7 3,1 6,5 1,9 6,9 10,2 8,3 7 16,0 7,5 8,6 9,0 6,9 12,4 6,4 11,9 3,5 5,1 16,6 6,1 8,7 3,9 11,2 8,5 9,4 5,7 12,4 11,6 9,2 10,9 8,4 3,8 7,6 2,2 10,0 2,7 6,9 8,5 12,9 8,1 9,4 7,8 17,0 12,1 9,4 4,7 9,0 11,2 13,8 16,4 14,3 5,9 9,8 9,8 7,7 8,7 6,8 10,7 9,1 5,1 16,7 6,2 14,4 14,0 9,8 10,5 9,3 7,8 12,3 13,2 6,5 4,1 11,8 5,3 14,4 10,9 14,2 7,2 10,0 14,1 8,6 7,9 6,8 14,7 12,2 10,0 2,0 3,5 5,5 13,1 15,1 5,1 10,6 8,3 6,3 12,2 15,1 5,5 14,0 7,6 16,6 2,6 8,4 5,7 9,9 9,9 9,0 13,7 16,6 6,3 3,2 10,8 5,8 3,7 14,0 11,3 16,8 9,7 8,7 6,4 8,1 10,7 8,3 10,2 11,7 7,9 11,8 10,5 11,2 5,9 5,2 15,7 10,2 2,2 10,7 9,0 4,7 10,3 2,8 11,4 11,1 3,0 7,9 12,0 6,9 12,2 14,0 9,8 Resolução: Os números aleatórios na tabela 1 foram colocados de três em três algarismos para facilitar nossa visualização. No exemplo 3 a tabela 2 é formada por 200 números. Devemos transformar essa tabela 2 em 1000 números para corresponder aos elementos da tabela de números randômicos. Para isso adotamos que cada número dado na tabela 2 seja considerado como 5 números iguais. Por exemplo, o primeiro número da tabela é 8,8 deve ser considerado como 8,8 – 8,8 – 8,8 – 8,8 – 8,8. Dessa forma passaremos a ter 1000 números. A tabela a seguir indica esses números. Tabela 3 De 01-5 6-10 11-15 16-20 21-25 26-30 31-35 36-40 41-45 46-50 0 8,8 15,6 15,3 12,7 5,9 3,3 3,5 7,2 16,7 14,7 50 7,7 13,4 15,5 14,5 7,0 10,8 11,8 2,7 3,8 9,0 100 11,6 9,5 8,6 7,0 7,5 10,9 7,2 9,5 8,4 12,9 150 14,9 4,1 13,1 10,6 17,0 4,2 3,8 10,6 4,5 11,8 200 6,4 8,4 7,3 13,1 16,5 5,5 15,3 13,7 9,7 11,5 250 11,2 9,6 8,8 11,7 3,1 6,5 1,9 6,9 10,2 8,3 8 300 16,0 7,5 8,6 9,0 6,9 12,4 6,4 11,9 3,5 5,1 350 16,6 6,1 8,7 3,9 11,2 8,5 9,4 5,7 12,4 11,6 400 9,2 10,9 8,4 3,8 7,6 2,2 10,0 2,7 6,9 8,5 450 12,9 8,1 9,4 7,8 17,0 12,1 9,4 4,7 9,0 11,2 500 13,8 16,4 14,3 5,9 9,8 9,8 7,7 8,7 6,8 10,7 550 9,1 5,1 16,7 6,2 14,4 14,0 9,8 10,5 9,3 7,8 600 12,3 13,2 6,5 4,1 11,8 5,3 14,4 10,9 14,2 7,2 650 10,0 14,1 8,6 7,9 6,8 14,7 12,2 10,0 2,0 3,5 700 5,5 13,1 15,1 5,1 10,6 8,3 6,3 12,2 15,1 5,5 750 14,0 7,6 16,6 2,6 8,4 5,7 9,9 9,9 9,0 13,7 800 16,6 6,3 3,2 10,8 5,8 3,7 14,0 11,3 16,8 9,7 850 8,7 6,4 8,1 10,7 8,3 10,2 11,7 7,9 11,8 10,5 900 11,2 5,9 5,2 15,7 10,2 2,2 10,7 9,0 4,7 10,3 950 2,8 11,4 11,1 3,0 7,9 12,0 6,9 12,2 14,0 9,8 Portanto, os 100 números que seguem foram retirados aleatoriamente e são os dados brutos. 10,7 6,9 8,1 8,8 13,8 8,7 9,9 11,3 4,2 11,8 14,2 4,1 2,7 9,0 5,2 2,8 6,8 8,1 10,5 5,9 6,5 12,3 9,0 5,2 1,9 8,7 7,9 14,4 13,8 16,6 11,9 5,9 10,0 9,8 6,3 13,4 1,9 7,2 6,2 3,3 12,9 7,9 7,6 6,4 10,0 16,6 2,8 8,6 15,7 5,7 4,7 11,6 6,1 11,2 8,8 16,7 8,7 2,7 3,2 15,3 11,9 8,4 14,3 8,3 14,7 9,0 10,7 11,2 9,1 11,1 10,0 11,2 2,7 11,9 17,0 7,6 4,7 17,0 3,8 8,5 2,2 7,6 10,6 3,2 10,0 14,7 16,8 17,0 9,4 9,7 7,8 9,8 10,0 10,7 7,5 16,8 5,1 13,7 16,5 8,4 Tabela 4 9 4. Tipos de Variáveis Em Estatística variável é uma atribuição de um número a cada característica da unidade de observação, ou seja, é uma função matemática definida na população ou ainda, uma variável corresponde a uma característica de um item ou de um individuo. As variáveis são classificadas como qualitativas e quantitativas. 4.1. Variável qualitativa Quando uma característica ou variável é não numérica, denomina-se variável qualitativa ou atributo. Exemplo 5: São variáveis qualitativas: sexo, religião, naturalidade, cor dos olhos e faixa etária. 4.2. Variável quantitativa Quando uma característica ou uma variável é numérica, denomina-se variável quantitativa. As variáveis quantitativas se classificam em dois grupos: 4.2.1. Variáveis discretas a) As variáveis quantitativas discretas são aquelas cujos possíveis valores formam um conjunto finito ou enumerável de números que resultam frequentemente de contagem. Exemplo 6: a) Quantidade de alunos de uma disciplina. b) Quantidade de apartamentos de um prédio. c) O número de crianças em uma família. 4.2.2. Variáveis contínuas As variáveis cujos valores pertencem a um intervalo de números reais e que resultam frequentemente de medidas, são denominadas variáveis quantitativas contínuas. Exemplo 7: a) Tempo de duração das provas de matemática. b) Tempo duração de baterias de carros. c) As alturas dos alunos de uma classe da disciplina de Estatística. Nas Variáveis contínuas quando feitas por medidas, por exemplo, as alturas dos alunos, e dependendo da unidade de medida podemos obter 1,65 m, ou 165,2cm ou 1652,7mm conforme a precisão da medida. 4.3. Níveis de mensuração e escalas de mensuração São quatro os níveis de mensuração: Nominal, ordinal, intervalar e de razão. 10 1) Escala nominal de mensuração envolve simplesmente o ato de nomear ou rotular, não esta explícito nenhum tipo de classificação. Exemplo 8: a) Possui computador: sim ___ não____. b) Sexo: masculino ____ feminino ____. c) Religião: católica ____ crente _____. d) Estado civil: casado ____ solteiro___. 2) Escala ordinal de mensuração ocorre quando se procura ordenar seus elementos ou classificar. Exemplo 9: a) Classificação sócio econômica: Classe baixa, classe média e classe alta. b) Satisfação de um produto: Insatisfeito, satisfeito e muito satisfeito. c) Classificação docente: Assistente e titular. 3) Escala intervalar consiste numa escala ordenada a qual podemos afirmar se uma medida é igual ou diferente, maior e quanto maior que outra, mas não tem origem. Exemplo 10: a) Temperatura de um indivíduo: [36C°, 40C°]. b) Temperatura da cidade de São Paulo: [12C° a 30C°]. 4) Escala de razão é uma escala ordenada que envolve medidas nessa escala. Se for medida em cm tem-se o 0 (zero) como origem e a unidade 1 cm. Tem origem fixa. Exemplo 11: a) Altura dos alunos em cm. b) Peso dos alunos em Kg. c) Idade em anos. d) Salários dos funcionários da faculdade. 5. Distribuições de frequência na variável discreta 5.1. Dados brutos Dados brutos são aqueles que ainda não foram numericamente organizados. Um exemplo é o conjunto das alturas de 100 estudantes do sexo masculino, tirado de uma lista alfabética do registro de alunos de uma Faculdade. 5.2. Rol Um rol é um arranjo numérico bruto em ordem crescente ou decrescente de grandeza. A diferença entre o maior e o menor número do rol chama-se amplitude total dos dados. Por exemplo, se a maior altura dos 100 estudantes do sexo masculino é 188 cm e a menor 152 cm, a amplitude total será de R = 36 cm. 11 5.3. Distribuição de frequência Uma vez coletados os dados é comum ordená-los,dando origem ao rol. A tabulação desses dados junto com as frequências correspondentes obtém-se a chamada distribuição de frequências. Exemplo 12: A tabela que segue é um exemplo de distribuição de frequência discreta e apresenta as idades de alunos da disciplina de estatística e suas frequências. ix if 18 19 20 21 22 8 10 7 5 4 ix : Idade dos alunos que cursam a disciplina de estatística if : número de alunos com a respectiva idade 5.4. Frequência absoluta Frequência absoluta de uma variável ix é o numero total de dados que se repete em ix e representamos por if . 5.5. Frequência relativa Frequência relativa é a razão entre cada frequência absoluta if e o total n das frequências absolutas. 1,2,3,...,ir f f com i n n . 5.6. Frequência acumulada Colocando-se os valores em ordem crescente da variável ix , obtém-se a frequência acumulada adicionando-se as frequências absolutas dos valores anteriores. Tomando os valores do quadro anterior, podemos escrever: ix if rf ac f 18 19 20 21 22 8 10 7 5 4 8/34=0,235 10/34=0,294 7/34=0,205 5/34=0,147 4/34=0,117 8 18 25 30 34 Total 34 1 12 5.7. Gráfico de frequências Gráficos são representações de dados para melhor visualização dos resultados. Colocando os valores dos dados no eixo horizontal e as frequências no eixo vertical. Tipos de gráficos: a) Gráfico de barras ou colunas b) Gráfico de setores (pizza) Servem para representar séries categóricas ou nominais, utiliza-se um círculo feito em fatias que representam as categorias usando a porcentagem de cada categoria que será transformada em graus. Exemplo 13: Gastos mensais de uma família formada pelos e dois filhos que estudam em colégio pago. GASTOS Educação 19% 68º Alimentação 30% 108º Transportes 20% 72º Moradia 15% 54º Gerais 16% 58º 0 1 2 3 4 5 6 Categoria 1 Categoria 2 Categoria 3 Categoria 4 Série 1 Série 2 Série 3 Gastos Educação Alimentação Transportes Moradia Gerais 13 Seguem os gráficos correspondentes ao exemplo 12. Mostram os valores dos dados ix no eixo horizontal e as frequências no eixo vertical c) Gráfico da frequência absoluta d) Gráfico da frequência acumulada Exemplo 14: Uma clínica dentária relacionou os tempos de atendimento em minutos, de seus clientes e apresentou a tabela de atendimento do mês de maio. 10 12 13 10 11 12 11 13 11 10 11 12 12 11 12 10 14 12 14 12 13 10 13 11 13 11 12 14 12 13 12 14 a) Construir a tabela da distribuição de frequência. b) Mostre as frequências acumuladas. c) Mostre as frequências relativas. Resolução: Chamamos de ix os valores dos tempos de atendimento e por if as suas frequências e seguem as frequências relativas e acumuladas. ix if rf ac f 10 11 12 13 14 5 7 10 6 4 0,16 0,22 0,31 0,19 0,12 5 12 22 28 32 Total 32 1 Exemplo 15: A pesquisa que segue foi feita pelo Instituto Gallup com mulheres com mais de 15 anos de idade em 147 países e que responderam à pergunta: Como as mulheres avaliam suas vidas. Construir um gráfico de pizza para essa tabela. 18 19 20 21 22 8 10 7 5 4 9 6 3 2 1 0 f i xi 18 19 20 21 22 10 25 5 35 20 30 15 0 f ac x i 14 Sofrendo 13% Prosperando 24% Batalhando para sobreviver 63% Solução: Devemos encontrar para as porcentagens indicadas os valores em graus e representar no círculo. Assim: 0 0 0 0 13% 13 100% 360 , logo 360 46,8 47 100 x x 0 0 0 0 24% 24 100% 360 , logo 360 86,4 86 100 x x 0 0 0 0 63% 63 100% 360 , logo 360 226,8 227 100 x x 6. Medidas de tendência central ou de posição A média é um valor típico ou representativo de um conjunto de dados, sendo a medida de posição mais importante de uma variável. Como esses valores típicos tendem a se localizar em um ponto central de um conjunto de dados ordenados segundo suas grandezas, as medidas também são denominadas medidas da tendência central. Vários tipos de médias podem ser definidas: a média, a média geométrica e a média harmônica, sendo a mais comum a média aritmética ou, abreviadamente média. Cada uma delas apresenta vantagens e desvantagens, dependendo dos dados e dos fins desejados. Como as mulheres avaliam suas vidas 63% 13% 24% 15 6.1. Média Aritmética Situação-problema: Um professor de matemática aplicou sua prova bimestral a 20 alunos e no momento da entrega das provas pelos alunos, as corrigia, não comunicando as notas para que não houvesse tumulto. Durante a correção foi anotando ao lado as notas e na saída da sala disse a todos que a média obtida pela classe era 6. Levou para casa as provas e as perdeu. a) Como deve o professor atribuir as notas de cada aluno? b) O professor recuperou as notas que foram dadas: 6 5 6 4 6 5 7 6 6 7 7 6 5 7 8 4 6 5 8 6 Com as notas recuperadas determine a média aritmética. Resposta: a) Se o professor perdeu as provas, mas conhece a média, deve atribuir a média 6 para todos os alunos, pois, podemos observar que a soma de todas as notas da tabela é igual a soma de 20 notas de valor 6. Assim, substituímos todas as notas dos alunos pelo valor 6. 6+5+6+4+6+...+8+6 = 6+6+6+6+6+...+6+6 ou ainda 120 120 20 6 6 20 b) Para definir média devemos ter o conceito de somatório. Escrevemos uma soma da seguinte maneira ( A letra indica somatório ). n 1 = i n321i x......xxxx Exemplo 16: Sendo 10x ,5x ,7x ,3x ,1x 54321 Calcular a) 5 1 = i ix b) 5 1 = i 2 ix Solução: a) 26105731x 5 1 = i i b) 184100254991105731x 22222 5 1 = i 2 i Exercícios de aplicação 01: 1) Verifique se as igualdades são verdadeiras. a) 3 ok 2 )7k( = 42 16 b) 4 2i 1i i = 29/6 c) 2 1j 2 )1jj( = 6 2) Sejam os valores de ix e if dados pela tabela ix 1 2 3 4 5 6 7 Determinar: if 2 3 5 7 4 3 1 a) xi i = 1 7 b) 7 1 = i if A resolução é mais simples se montarmos a tabela na forma indicada e na última linha colocamos a soma das colunas. ix if 1 2 2 3 3 5 4 7 5 4 6 3 7 1 Definição de média aritmética Média Aritmética, ou média de um conjunto de n números 1 2, ,...., nx x x é representada por x (leia-se “x barra”) e é definida por: 1 2 1 ... n i n i x x n n x x x Exemplo 17: Sejam as notas obtidas por um aluno de matemática 9x ,5x ,6x ,4x 4321 , determinar a média x . A média é dada por x 4 = 1 1 2 3 4 4 6 5 9 24 6 n n 4 4 i i x x x x x Quando ix apresentar elementos repetidos, a média aritmética dos valores de x é dada por: 17 1 n n i i i x f x ou por comodidade, deixaremos de colocar os índices do somatório e escrevemos: n i ix f x Voltando ao item b) da situação problema, montamos a tabela de notas dos alunos ix if i ix f 4 2 8 5 4 20 6 8 48 7 4 28 8 2 16 20 120 n i ix f x = 120 6 20 . Portanto, a média aritmética é 6. 6.2. Média Aritmética Ponderada Se os números ocorrem f1, f2, f3, ..., fn vezes, respectivamente, isto é, ocorrem para cada número uma frequência f1, f2, f3, .......fn , a média aritmética será definida por: n i ix f x Exemplo 18: Se o exame final de um cursotem peso 3 e as 2 provas mensais peso 1, um estudante que obteve 70 e 90 pontos nas provas e 85 no exame final, então a média é dada por: 1 . 70 1 . 90 3 . 85 83 pontos. 1 1 3 x Exercícios de aplicação 02: Calcular a média aritmética simples ou ponderada. 1) Notas na disciplina de Economia. 3; 5; 7; 6; 4; 2; 5; 2; 4; 5; 7; 6; 4; 6; 2; 3; 7 e 5. 2) Notas na disciplina de estatística. 1; 2; 3; 4; 5; 6; 7 e 8. 18 3) Medidas de diâmetros de parafusos. 1,2; 1,4; 1,4; 1,4; 1,6; 1,6; 1,6; 1,6; 1,6; 1,8; 1,8; 1,8; 1,8; 2 e 2. 4) As notas de 9 alunos de estatística são:4,5; 4,8; 5,7; 7,1; 7,5; 7,9; 8,3; 9,5; 9,7. Sabe-se Pedro é o 10º aluno e a média da turma incluindo a nota de Pedro é 7,2. Determinar a sua nota. 6.3. Mediana - Md(X) A mediana é outra medida de posição central de uma variável. Dados um conjunto de números ordenados em ordem crescente a mediana é o valor central. Exemplo 19: O conjunto dos números 3,4,4,5,6,8,8,8,10 tem mediana Md(X) = 6, pois, ocupa a 5ª posição. Se o número de observações é ímpar, então para localizar a mediana é só aplicar a fórmula 1 2 n , portanto, Md(X) é o elemento que ocupa a posição 1 2 n . Se o número de observações é par, então existem dois elementos centrais: Md1(X) é o elemento que ocupa a posição 2 n e Md2(X) é o elemento que ocupa a posição 1 2 n . Uma vez obtidos esses valores, a mediana é definida como a média aritmética Md (X)= 1 2 2 Md Md . Exemplo 20: No conjunto dos números 5,5,7,9,11,12,15,18 determinar a mediana. Como n é par procuramos os elementos que ocupam a posição 8 4º 2 2 n ,logo Md1(X)=9 e 8 1 1 5º 2 2 n e Md2(X)=11. Assim, a mediana é definida por: Md(X) = 10 2 119 6.4. Moda - Mo(X) A moda é outra medida de posição central, sendo o valor que ocorre com maior frequência na distribuição. Se dois valores tem maior frequência então a distribuição é bimodal. No exemplo 20 acima 5 representa a moda. 6.5. Separatrizes Separatriz de um conjunto de dados ordenados em ordem crescente ou (decrescente) é o elemento da série dos dados que divide em partes. As principais separatrizes são: A mediana, os quartis, os decis e os percentis. 19 Os quartis, decis e percentis são as separatrizes que dividem a série respectivamente em quatro, dez e cem partes iguais. A mediana é uma separatriz que divide a série em duas partes iguais. Os quartis dividem a série em quatro partes iguais e são representados por: 1 2 3, e q q q , sendo denominados, respectivamente, primeiro, segundo e terceiro quartil, sendo o valor 2q = Md(X). Os decis são os valores que dividem a série de dados em dez partes iguais e são representados por 1 2 9, ,...,d d d . Percentis. Da mesma forma como estudamos mediana, quartis e decis, os valores que dividem a série em 100 partes iguais denominam-se percentis e são representados por 1 2 99, ,...,p p p . Notação: Quando escrevemos ( )ip Q indicamos a posição do quartil iq . Quando escrevemos ( )ip D indicamos a posição do centil id . Quando escrevemos ( )ip P indicamos a posição do percentil ip . Exemplo 21: Determinar os quartis para a amostra A: 6, 8, 4, 3, 9, 8, 5, 4, 7, 5, 8, 2, 7, 8 e 4. Solução: Colocando os valores da amostra em ordem crescente, tem-se: 2 3 4 4 4 5 5 6 7 7 8 8 8 8 9 1º 2º 3º 4º 5º 6º 7º 8º 9º 10º 11º 12º 13º 14º 15º O número de elementos n é ímpar, logo: Primeiro quartil é o elemento que ocupa a posição: 1 15 1 ( ) .1 4 p Q = 4º elemento, portanto, 1 4q . Segundo quartil é o elemento que ocupa a posição: 2 15 1 ( ) .2 4 p Q = 8º elemento, portanto, 2 6 ( )q Md X . Terceiro quartil é o elemento que ocupa a posição: 3 15 1 ( ) .3 4 p Q = 12º elemento, portanto, 3 8q . Decis. Para determinarmos o decil quando n é ímpar devemos utilizar o seguinte procedimento. O i-ésimo decil ocupa a posição: ( )ip D = ( 1) . 10 n i , assim o 7º decil ocupa a posição 7( )p D = ( 1) .7 10 n Exemplo 22: A tabela que segue apresenta uma amostra de 36 elementos com suas frequências. Determinar: a) Mediana. b) Quartis. c) 4ºDecil. 20 Da tabela escrevemos xi fi fac 5,01 4 4 7,03 7 11 9,05 11 22 11,07 8 30 13,09 6 36 36 Mediana: como n =36 (par) temos dois valores centrais 18º sendo 1( )Md X 9,05 e 19º como 2( ) 9,05Md X , logo, a mediana é ( ) 9,05Md X . Quartil: 1 36 ( ) .1 9º 4 p Q e 10º elementos, logo 1 7,03q 2 36 ( ) .2 18º 4 p Q e 19º elementos, logo, 2 9,05q 3 36 ( ) .3 27º 4 p Q e 28ºelementos, logo, 3 11,07q Decil: 4 36 ( ) .4 14,4 14º 10 p D e 15º elementos, logo, 4 9,05d Observação1: De maneira análoga são obtidas as soluções para os percentis. 7. Box Plot ou diagrama de caixa O gráfico denominado Box plot é obtido por meio dos quartis. Obtidos os quartis 1 2 3, e q q q , determinamos a amplitude interquartílica, definida por: 3 1,qI q q isto é, a distância entre o maior e o menor quartil. O quartil 2q ou mediana fica representado no interior da caixa. O extremo inferior da cauda é denominado limite inferior e é determinado por 1 1,5 qLI q I e o limite superior 3 1,5 .qLS q I Os valores que se situam fora dos limites da distribuição são denominados outliers. Utilizando os dados do exemplo 20 temos: 1 7,03q , 2 9,05q e 3 11,07q . Nesse caso o intervalo interquartílico é dado por 3 1 11,07 7,03 4,04qI q q e tem como limites: 1 1,5 qLI q I =7,03-1,5.(4,04)=0,97. 3 1,5 qLS q I 11,07+1,5.(4,04)=17,13. O gráfico Box plot é dado por: 1 7,03q 2 9,05q 3 11,07q LI=0,97 L S=17,13 21 8. Medidas de tendência lateral ou de dispersão Quando propusemos substituir todas as notas perdidas pelo professor pela nota (média) 6x , os alunos cujas notas eram superiores à média 6 reclamaram, porém, os de notas inferiores não. Na ótica do professor atribuir nota 6 a todos os alunos não mostra a performam-se da turma, pois todos recebem a mesma nota, mas ao atribuir as notas verdadeiras se observa a variabilidade da turma. Estudemos a variabilidade para as amostras que seguem: Amostra A: 2,3,4,8,9,10, tem seis elementos e média 6x Amostra B: 5,5,6,6,7,7, tem seis elementos e média 6x . Adotando a média como o valor mais representativo da distribuição, observamos que os valores da amostra A estão mais dispersos em relação à média, enquanto a amostra B os valores estão mais próximos da média. As medidas que avaliam dispersão são denominadas de desvios. 8.1 Desvio médio: dm(X) Definimos desvio com o resultado da diferença entre o valor de cada observação e o valor da média. Observação 2: 1) A soma dos desvios calculados em relação à media é sempre igual a zero, isto é, ( ) 0ix x 2) Como a soma é sempre nula tomamos cada parcela da soma em módulo e definimos desvio médio da amostra em relação à média por: | | ( ) i ix x f dm X n 8.2 Variância ou desvio quadrático médio da amostra Outra maneira para calcular o desvio é elevar ao quadrado cada uma de suas parcelas, pois, teremos também soma diferente de zero, dessa maneira definimos desvioquadrático médio ou variância por: 2 2 ( ) ( ) ar( ) i ix x f S X V X n 8.3 Desvio padrão da amostra Sendo a variância uma medida de dimensão igual ao quadrado da dimensão dos dados, isso pode causar problemas de interpretação, portanto, costuma-se usar o desvio padrão que é definido como raiz quadrada da variância. Utilizamos dois tipos de desvios padrões: a) Desvio padrão da amostra: 2( ) ( ) ar( ) i ix x f S X V X n b) Desvio padrão da amostra: dp(X)= 2( ) ar( ) 1 i ix x f V X n (Essa definição é a mais usada) 22 Observação 3: Para valores de n grandes é indiferente o uso de uma ou outra fórmula. Exemplo 23: Dar as medidas de tendência central e as de dispersão para as amostras A e B. Resolução: Montando primeiramente a distribuição para os valores da tabela A, segue: xi fi xi fi || xxi || xxi fi 2( ) i x x fi 2 1 2 4 4 16 3 1 3 3 3 9 4 1 4 2 2 4 8 1 8 2 2 4 9 1 9 3 3 9 10 1 10 4 4 16 6 36 18 58 Com o uso das fórmulas dadas calculamos os valores desejados: a) Média: 36 6 6 i ix f x n b) Desvio médio: | | ( ) i ix x f dm X n 18 3 6 c) Desvio quadrático médio ou variância da amostra: 2( ) ar( ) 1 i ix x f V X n 58 11,6 5 d) Desvio padrão da amostra: dp(X)= 2( ) ar( ) 1 i ix x f V X n 11,6 3,40587 Para a amostra B, tem-se: xi fi xi fi || xxi || xxi fi 2|| xxi fi 5 2 10 1 2 2 6 2 12 0 0 0 7 2 14 1 2 2 6 36 4 4 23 Como fizemos para a amostra A, calculamos com o uso das fórmulas os valores: a) Média. 36 6 6 i ix f x n , logo, se vê que a média das duas amostras são iguais. b) Desvio médio | | ( ) i ix x f dm X n 4 0,7 6 , valor bem menor que da amostra A igual a 3. c) Desvio quadrático médio ou variância da amostra 2 2 ( ) ( ) ( ) 1 i ix x f S X Var X n 4 0,8 5 d) Desvio padrão da amostra 2( ) ( ) ( ) 1 i ix x f S X Var X n 0,8 0,894 . Conclusão: Comparando as duas amostras vê-se que os valores obtidos pelo desvio padrão são: da amostra A, ( ( ) 3,40587S X ) e da amostra B, ( ( ) 0,894S X ). Assim concluímos que a amostra A tem maior dispersão que a amostra B, isto é, os valores da amostra B estão mais próximos da média. 9. Coeficiente de Variação de Pearson O coeficiente de Variação de Pearson mede a dispersão em relação à média e é dado por: ( ) ( ) dp X CV X x = desvio padrão média A maior utilidade do coeficiente de variação é permitir a comparação da variabilidade de diferentes distribuições. Se o valor obtido for menor que 20%, dizemos que a distribuição pode ser considerada homogênea. Se ( ) 15%CV X tem-se baixa dispersão. Se 15% ( ) 30%CV X tem-se média dispersão. Se ( ) 30%CV X tem-se elevada dispersão. Exemplo 24: Utilizando os dados do exemplo anterior, determinar o coeficiente de Variação de Pearson: Para a amostra A, segue ( ) ( ) dp X CV X x = 3,40587 0,5676 56% 6 24 Para a amostra B, segue ( ) ( ) dp X CV X x = 0,894 0,149 15% 6 . Analisando os valores obtidos vê-se que a amostra B é mais homogênea que A. Exemplos usando a distribuição de frequência na Variável Discreta Exemplo 25: Com o uso da tabela que segue, determinar as medidas de tendência central e as de dispersão. a) Média b) Moda c) Mediana d) Desvio Médio e) Variância f) Desvio Padrão g) Gráfico de frequência absoluta h) Coeficiente de variação 5,01 5,01 5,01 5,01 7,03 7,03 7,03 7,03 7,03 7,03 7,03 9,05 9,05 9,05 9,05 9,05 9,05 9,05 9,05 9,05 9,05 9,05 11,07 11,07 11,07 11,07 11,07 11,07 11,07 11,07 13,09 13,09 13,09 13,09 13,09 13,09 Com os valores dados construímos a distribuição de frequência colocando os valores em ordem crescente e calculamos as medidas com uso da tabela que segue. xi fi xi fi fac || xxi || xxi fi 2( ) i x x fi 5,01 4 20,04 4 4,32 17,28 74,6842 7,03 7 49,21 11 2,30 16,11 37,0622 9,05 11 99,55 22 0,28 3,09 0,8686 11,07 8 88,56 30 1,74 13,91 24,1930 13,09 6 78,54 36 3,76 22,55 84,7805 36 335,90 72,94 221,5885 Usando os valores determinados na tabela temos: 25 a) Média. (Tomamos a média com uma casa decimal a mais que xi ) 335,9 9,331 36 i ix f x n b) Moda O elemento de maior frequência na tabela é a moda: ( ) 9,05Mo X c) Mediana se n é par, então 0 1 0 2 18 .......... 9,05 2 1 19 ..... 9,05 2 n Md n Md portanto, ( )Md X 9,05 d)Desvio médio | | ( ) i ix x f dm X n 72,94 2,03 36 e) Desvio quadrático médio ou variância 2( ) ar( ) 1 i ix x f V X n 221,5885 6,3311 35 f) Desvio padrão 2( ) ( ) ar( ) 1 i ix x f S X V X n 6,3311 2,516168 Se a distribuição de frequência tem a forma de um sino ela é simétrica, então aproximadamente 68% das medições estão contidas no intervalo ] ( ), ( )[x S X x S X . g) Gráfico da frequência absoluta h) Coeficiente de variação ( ) ( ) dp X CV X x = 2,516168 9,331 =0,2696568 27% (não é homogênea, e tem média dispersão ) 5,01 7,03 9,05 11,07 13,09 8 10 7 5 4 9 6 3 2 1 0 fi xi 11 26 Exercícios Aplicativos 03: Exercício 1: A tabela a seguir apresenta as notas de matemática da primeira prova bimestral, determinar a) as medidas de tendência central e as de dispersão. b) gráfico da frequência absoluta e da acumulada. 6 7,5 8 8,5 6,5 7,5 8 7,5 9,5 6 7 7 7 9 7 9,5 7 6 7 7 8 8,5 7,5 5,5 7,5 7 5,5 7 7 8 6,5 7,5 9 6,5 8,5 7,5 6,5 9,5 8,5 8 xi fi fac xi fi || xxi || xxi fi 2( )ix x fi 1) Média: n fx x ii 2) Moda: ( )Mo X Mediana: ( )Md X 3) Desvio Médio: | | ( ) i ix x f dm X n 4) Desvio quadrático Médio ou variância: 2 ( )S X 2( ) 1 i i x x f n 27 5) Desvio Padrão: dp(X) = 2( ) ( ) ( ) 1 i ix x f S X Var X n 6) Coeficiente de variação. 7) Construir o gráfico da frequência e representar a média e o desvio padrão. 9) Construir o gráfico da frequência acumulada. 28 Exercício 2: Foram coletados os seguintes dados de uma pesquisa, determinar as medidas de tendência central, as de dispersão, box plot e o gráfico da frequência absoluta. 1,2 – 1,8 – 2,0 – 1,4 – 1,6 – 1,8 – 1,4 – 1,8 – 2,0 – 1,6 –1,6 – 1,2 – 1,6 – 1,8 –1,4 – 1,6 – 1,8 – 1,4 – 2,0 – 1,4 – 1,8 – 1,6 – 1,2 – 1,6 – 2.0 –1,4 – 1,6 – 1,6 –1,4 xi fi fac xi fi || xxi || xxi fi 2( )ix x fi 1) Média: n fx x ii 2)Moda: ( )Mo X 3) Mediana: ( )Md X 4)Desvio Médio: | | ( ) i ix x f dm X n 5)Desvio quadrático Médio ou variância: 2 ( )S X 2( ) 1 i i x x f n 6)Desvio Padrão: 29 dp(X) = 2( ) ( ) ( ) 1 i ix x f S X Var X n 7) Coeficiente de variação 8) Box plot 9) Construir o gráfico da frequência absoluta e representar a média e o desvio padrão. Exercício 3: Idem. Dada a tabela, determinar as medidas de tendência central e as de dispersão. 22,3 23,0 22,3 21,0 22,3 22,4 23,2 23,0 20,1 23,5 23,0 23,5 21,0 23,2 22,3 23,2 22,3 23,0 22,3 22,4 21,0 22,3 23,5 23,0 22,4 22,3 23,0 23,0 22,4 21,0 30 xi fi fac xi fi || xxi || xxi fi 2( )ix x fi 1) Média: n fx x ii 2)Moda: ( )Mo X 3) Mediana: ( )Md X 4)Desvio Médio: | | ( ) i ix x f dm X n 5)Desvio quadrático Médio ou variância: 2( ) ar( ) 1 i ix x f V X n 6)Desvio Padrão: dp(X) = 2( ) ( ) ( ) 1 i ix x f S X Var X n 7) Coeficiente de variação 8) Box plot 31 9) Construir o gráfico da frequência absoluta e representar a média e o desvio padrão 10. Distribuições de frequência na variável contínua A variável contínua é na maioria das vezes obtida por meio de medidas, e os dados têm frequência absoluta praticamente unitária (os dados são quase todos distintos) e neste caso, a tabela de distribuição se torna longa, trabalhosa e pouco eficiente, desta maneira se usa a distribuição na variável contínua. Exemplo 26: O professor de Educação Física do Colégio Estadual João Felipe, coletou as idades de seus alunos e as apresentou por meio da tabela. 15,6 7,8 13,8 5,1 12,4 9,5 12,2 10,3 13,8 5,5 7,7 6,5 6,4 10,0 2,2 9,3 6,4 10,0 8,5 13,1 11,8 12,7 15,5 2,7 6,4 6,8 5,1 11,2 16,6 3,6 8,3 12,4 6,4 7,2 10,5 4,7 14,0 17,0 6,8 15,1 12,2 13,2 4,7 8,4 14,1 10,8 17,0 14,0 13,1 10,7 9,8 6,2 7,7 9,0 17,0 12,2 9,0 12,1 9,8 6,2 8,7 6,5 13,7 11,8 7,7 15,5 5,7 5,1 10,2 7,7 5,9 3,9 3,3 12,2 8,4 9,3 16,6 3,7 9,4 12,2 14,0 6,9 10,8 8,5 6,4 8,6 10,0 10,0 10,9 9,3 17,0 10,9 12,7 14,0 15,6 11,2 15,6 12,4 6,4 9,4 Essa tabela nos diz que seus elementos são quase todos distintos, portanto, trata-se de uma variável contínua. Neste caso trabalharemos com dados agrupados e seguiremos os seguintes passos para o estudo dessa distribuição. 10.1. Amplitude da amostra. A amplitude da amostra é dada pela diferença entre as observações de maior valor numérico e a de menor valor, neste caso max minR x x = 17,0-2,2=14,8. 32 10.2. Número de classes Queremos dividir R = 14,8 em classes, todas com mesma amplitude. Não existe regra única para escolher o número destas classes, é recomendável que se n é o número de elementos da amostra, então o número de classes K é dado por: a) Critério da raiz: [ ]K n , sendo K o maior número inteiro menor ou igual a n ou b) Critério de Sturge: K 1 3,322logn , sendo K o maior número inteiro menor que 1 3,322logn . Por simplicidade adotaremos o critério da raiz, logo [ ]K n =[ 100] 10 10.3. Amplitude de cada classe A amplitude de cada classe é dada por: 14,8 1,48 10 R r K . Os limites das classes devem ser escolhidos de modo que cada um dos valores pertença somente a uma classe, se o valor coincidir com o extremo da classe, ele deve ser contado como elemento da classe posterior, com exceção da última classe. Definindo xi como ponto médio da classe, isto é, a soma do limite superior da classe com o limite inferior da classe dividindo por 2 e fazendo a contagem dos elementos (idades dos alunos) em cada classe, segue a tabela. classes xi fi xi fi acf || xxi || xxi fi 2( ) i x x fi 2,20 |— 3,68 2,94 4 11,76 4 6,882 27,528 189,447696 3,68 |— 5,16 4,42 7 30,94 11 5,402 37,814 204,271228 5,16 |— 6,64 5,90 13 76,70 24 3,922 50,986 199,967092 6,64 |— 8,12 7,38 9 66,42 33 2,442 21,978 53,670276 8,12 |— 9,60 8,86 15 132,90 48 0,962 14,430 13,881660 9,60 |— 11,08 10,34 14 144,76 62 0,518 7,252 3,756536 11,08 |— 12,56 11,82 13 153,66 75 1,998 25,974 51,896052 12,56 |— 14,04 13,30 12 159,60 87 3,478 41,736 145,157808 14,04 |— 15,52 14,78 4 59,12 91 4,958 19,832 98,327056 15,52 |—| 17,00 16,26 9 146,34 100 6,438 57,942 373,030596 100 982,20 305,47 1333,4060 Completada a tabela podemos calcular 33 a) Média (Adotamos a média com uma casa decimal a mais que xi ) 982,2 9,822 100 i ix f x n c) Moda: Classe modal é a classe de maior frequência 8,12 |— 9,60. Utilizamos para a determinação da moda a fórmula de Czuber, a qual é obtida por semelhança de triângulos. Fórmula de Czuber: ( )Mo X Os triângulos AOB e COD são semelhantes, então H AB h CD ou H AB H h AB CD 1 1 2 MoMo l r H: altura do triângulo AOB. h: altura do triângulo COD. Mol : limite inferior da classe modal. r : amplitude da classe modal. 1 : diferença da frequência superior e da inferior da classe que antecede a classe modal. 2 : diferença da frequência superior e inferior da classe posterior da classe modal. Substituindo os valores em 1 1 2 moMo l r , segue 8,12 6 1,48 6 1 Mo e o valor da moda é ( )Mo X = 8,12 +1,2685 = 9,3885 c) Mediana O cálculo da mediana para a variável contínua difere do modelo de variável discreta, neste caso a mediana esta localizada na classe mediana, porém, o valor do elemento da série não é identificável. Sabemos que a mediana é o valor que ocupa a posição central de uma distribuição ordenada. Se o número de elementos for ímpar, então a mediana é o elemento que ocupa a posição 1 2 n . Voltando ao exemplo verificamos que o número de elementos é par, logo classes r Mo 2 1 9 14 15 6,64 8,12 9,6 11,08 fi C 0 A B D 34 se n é par, então a mediana ocupa a posição 100 50º 2 2 100 1 1 51º 2 2 n n e, devemos encontrar o elemento que ocupa 0(50,5) . Tomamos para isso a classe mediana e os elementos da frequência acumulada anterior e posterior do elemento 0(50,5) . Usando semelhança de triângulos podemos escrever: Os triângulos ABC e ADE são semelhantes, então AC BC AE DE , substituindo, segue: 9,6 50,5 48 11,08 9,6 62 48 9,6 2,5 1,48 14 Md Md 9,6 (1,48 2,5) :14 ( ) 9,8642857 Md Md X d) 1º quartil A determinação do 1º quartil se faz analogamente à mediana, determinamos primeiramente a posição 1( )p Q e como o número de elementos é par segue: 100 .1 25º 4 4 100 .1 1 1 26º 4 4 n n , assim, devemos determinar 25,5 e a classe do 1º quartil é [6,64;8,12]. De maneira semelhante a construção da mediana, segue 1 6,64 25,5 24 8,12 6,64 33 24 q 1 6,64 1.48 q 1,5 0,1666 9 , então o 1º quartil é 1 6,886568q Observação 4: Analogamente encontramos o 2º e 3º quartil. e) Desvio médio | | ( ) i ix x f dm X n 305,472 3,05472 100 A B C D E48 50,5 62 9,6 11,08Md classes f ac classes f ac 24 25,5 33 6,64 8,12 A B C D E q 1 35 xi fi 2,20 3,68 5,16 6,64 8,12 9,60 11,08 12,56 14,04 15,52 17,00 classe 0 mo Histograma com Moda, Média, e Mediana f) Desvio quadrático médio ou variância S(X)= 2( ) ar( ) 1 i ix x f V X n 1333,4059 13,468746 99 g) Desvio padrão dp(X)= 2( ) ( ) ar( ) 1 i ix x f S X V X n 13,46874717 3,669979179 h) Gráficos. O gráfico da frequência é denominado histograma, é um gráficono qual as classes são marcadas no eixo horizontal e as frequências no eixo vertical representando as alturas por meio de barras. As barras são desenhadas de forma adjacentes uma em relação a outra. Ligando os pontos médio das classes tem-se o polígono de frequência. 9.4 Formatos de histogramas 1) Simétrico Um histograma simétrico tem o gráfico idêntico em ambos os lados do ponto central onde se localizam a moda a média e a mediana. x imédia=moda=mediana ( )if x 36 2) Assimétrico Um histograma assimétrico quando seu formato não é simétrico. a) Assimétrico à direita. Quando possui uma cauda mais longa à direita e neste caso as medidas de tendência central estão localizadas na ordem: moda, mediana e média. b) Assimétrico à esquerda. Quando possui uma cauda mais longa à esquerda e neste caso as medidas de tendência central estão localizadas na ordem: média, mediana e moda. Exercícios aplicativos 04: Exercício 1: A experiência com trabalhadores de uma indústria indica que o tempo requerido em minutos para que um operário aleatoriamente selecionado realize uma tarefa, esta indicado na tabela. Montar a tabela e determinar o que se pede: 31 29 20 31 22 22 32 41 21 29 30 25 35 40 31 32 21 36 38 39 32 21 36 38 39 28 36 23 36 31 27 41 29 22 41 25 40 37 24 27 34 37 28 28 31 36 20 30 22 35 24 25 23 33 34 32 27 28 34 30 1) Amplitude da Amostra: R = xmax - xmin = 2) Número de Classes: K =[ n ] = moda mediana média x i média mediana moda ( )if x ix ( )if x ix 37 3) Amplitude da Classe: r = R/K = classes xi fi fac xi fi || xxi || xxi fi 2( ) i x x fi 4)Média: n fx x ii 5)Moda: ( )Mo X 6) Mediana: ( )Md X 7)Desvio Médio: | | ( ) i ix x f dm X n 8) Variância : 2 ( )S X 2( ) 1 i ix x f n 9) Desvio Padrão: 38 dp(X)= 2( ) ( ) Var( ) 1 i ix x f S X X n 10) Coeficiente de variação: 11) Construir o Histograma e o polígono da frequência e representar a média e o desvio padrão. Exercício 2: Foram coletados os dados de uma pesquisa e obteve-se a distribuição na variável contínua. Determinar as medidas de tendência central e as de dispersão. classes xi fi fac xi fi || xxi || xxi fi 2( )ix x fi 2,1 |—— 3,1 3 3,1 |—— 4,1 7 4,1 |—— 5,1 10 5,1 |—— 6,1 6 6,1 |—— 7,1 3 1) Média: n fx x ii 2) Moda: ( )Mo X 39 3) Mediana: ( )Md X 4) 3º quartil 5) Desvio Médio: | | ( ) i ix x f dm X n 6)Variância : 2 ( )S X 2( ) 1 i i x x f n 7)Desvio Padrão: dp(X)= 2( ) ( ) Var( ) 1 i ix x f S X X n 8) Coeficiente de variação: 9) Construir o Histograma, o polígono de frequência e representar a média e o desvio padrão. 40 Exercícios aplicativos 05: 1. A tabela a seguir apresenta as notas ix e as frequências if obtidas pelos alunos na prova de geografia. A partir destes dados podemos dizer que ix if i ix f 5 2 6 4 7 8 8 4 9 2 (A) A moda corresponde a nota 8. (B) A mediana corresponde a nota 8. (C) A média é 7. (D) A quantidade de alunos da amostra é 5. (E) nda. 2. Seja a amostra X: 4,5,5,3,3,5,7,6,6,7,8,8, então sua mediana é dada por (A) 5 (B) 6 (C) 5,5 (D) 6,5 (E) nda 3. A tabela a seguir é uma distribuição na variável contínua e apresenta as classes e suas respectivas frequências. Nestas condições podemos dizer que a mediana é classes if 0 |—— 2 3 2 |—— 4 7 4 |—— 6 10 6 |—— 8 6 8 |—— 10 3 (A) 1 (B) 2 (C) 3 (D) 4 (E) 5 41 4. Sejam as seguintes informações das amostras; Amostra A tem média 6 e desvio padrão 1 e a amostra B tem média 6,5 e desvio padrão 0,5. Então podemos afirmar que (A) A amostra A tem menor dispersão que a amostra B (B) A amostra A tem maior dispersão que a amostra B (C) As duas amostras têm a mesma dispersão (D) Não da para comparar as duas amostras quanto a dispersão (E) nda 5. Após a análise dos dados de uma amostra, segue a representação gráfica da distribuição na forma de Box plot, sendo 1 2 3, eq q q os seus quartis. Então a distribuição é (A) Simétrica à direita (B) Simétrica à esquerda (C) Assimétrica positiva (D) Assimétrica negativa (E) nda 6. A tabela a seguir apresenta o número de acidentes por dia ( ix ) em uma rodovia, durante os primeiros 23 dias do mês de janeiro de 2015. ix if 0 9 1 7 2 5 3 2 A partir destes dados afirmamos que (A) o primeiro quartil é de 1 acidente por dia. (B) a moda é de 9 acidentes por dia. (C) a mediana é de 2 acidentes por dia. (D) a média é de 1 acidente por dia. (E) o terceiro quartil é de 3 acidentes por dia. 42 7. A tabela a seguir representa uma distribuição na variável discreta e seus quartis 1 2 3, eq q q são respectivamente ix if 2 5 5 1 8 7 10 2 12 4 (A) 5, 8 e 10 (B) 1, 7 e 13 (C) 2, 8 e 10 (D) 2, 8 e 12 (E) 2, 5 e 12 8. Após a análise dos dados de uma amostra que tem distribuição na variável discreta, obtiveram-se os seguintes valores para os quartis: 1 2 33, 8 e 10q q q . Nestas condições a distribuição é (A) Simétrica. (B) Assimétrica à esquerda. (C) Assimétrica positiva (D) Assimétrica à direita (E) Não é Simétrica e nem Assimétrica 9. A tabela a seguir é uma distribuição na variável contínua e apresenta as classes e suas respectivas frequências. Nestas condições dizemos que a mediana é classes if 2,1 |—— 4,1 5 4,1 |—— 6,1 9 6,1 |—— 8,1 14 8,1 |—— 10,1 9 10,1|—— 12,1 4 (A) 6,1 (B) 7,1 (C) 7,3 (D) 8,1 (E) 10,1 43 10. Se uma distribuição na variável contínua é perfeitamente simétrica (em forma de sino) em relação a média, então o intervalo [ , ]x x contém aproximadamente (A) 95% dos elementos da distribuição. (B) 75% dos elementos da distribuição. (C) 68% dos elementos da distribuição. (D) 34% dos elementos da distribuição. (E) 14% dos elementos da distribuição 11. Se uma variável X tem 10 e ( ) 2x S X e uma variável Y tem 10 e ( ) 5y S Y então (A) X tem maior dispersão que Y. (B) Y tem maior dispersão que X. (C) as duas variáveis têm a mesma dispersão. (D) não é possível comparar as duas variáveis. (E) X tem dispersão infinita. 12. Quando queremos verificar a questão de uma prova que apresentou maior número de erros, utilizamos: (A) A mediana. (B) O desvio padrão. (C) A moda. (D) A média geométrica. (E) A variância. 13. O coeficiente de variação é uma medida que expressa a razão entre: (A) o desvio padrão e a variância. (B) o desvio padrão e a mediana. (C) o desvio padrão e a moda. (D) o desvio padrão e o terceiro quartil. (E) o desvio padrão e a média. 44 14. A tabela a seguir apresenta as notas ix e as frequências if obtidas pelos alunos na prova de matemática. A partir destes dados podemosdizer que ix if 1 6 3 3 5 5 7 10 9 7 (A) A moda corresponde a nota 9. (B) A mediana corresponde a nota 5. (C) A média é 5,6. (D) A quantidade de alunos da amostra é 10. (E) A soma de todas as frequências é 30. Exercícios aplicativos 06: 1. A tabela a seguir é uma distribuição na variável contínua e apresenta as classes e suas respectivas frequências. Nestas condições, podemos dizer que a média será: Classes 150 a 200 200 a 250 250 a 300 300 a 350 350 a 400 400 a 450 450 a 500 if 5 16 21 28 19 8 3 (A) 352 (B) 353 (C) 315 (D) 314 (E) 313 45 2. A tabela a seguir apresenta as notas atribuídas aos ginastas de uma modalidade esportiva. ix if 4,0 6 4,2 5 4,4 9 4,6 6 4,8 4 A partir destes dados afirmamos que (A) o primeiro quartil é de 3,9. (B) a moda é de 9. (C) a mediana é de 4,5. (D) a média é 4,38. (E) o terceiro quartil é 4,7. 3. Os dados que seguem representam o índice de precipitação pluviométrica em uma cidade no ano de 2014. Meses Janeiro Fevereiro Março Abril Índices (mm) 68,5 35,1 332,2 92,8 Assim, podemos dizer que os dados estão mais apropriados para o nível de medidas na variável (A) nominal. (B) ordinal. (C) intervalar. (D) de razão. (E) irracional. 4. A experiência com trabalhadores de uma indústria indica o tempo em minutos requerido para que um operário realize uma tarefa. Segue tabela da distribuição na variável contínua dessa experiência. classes i f 23 |— 26 6 26 |— 29 7 29 |— 32 11 32 |— 35 8 Nestas condições a moda obtida pela fórmula de Czuber é (A) 29,85 (B) 30,02 (C) 30,71 (D) 31,24 (E) 31,65 46 5. Os alunos do terceiro ano do Ensino Médio do Colégio ABC apresentaram os seguintes resultados das avaliações em: Geografia: Média 5,0 e desvio padrão 1,6. Matemática: Média 6,4 e desvio padrão 1,5. Nessas condições podemos afirmar que (A) As notas de Geografia e Matemática apresentam baixa dispersão. (B) Só as notas de Matemática apresentam baixa dispersão. (C) As notas de Geografia apresentam alta dispersão. (D) As notas de Geografia apresentam menor dispersão que as de matemática. (E) Não é possível avaliar as notas usando o conceito de coeficiente de dispersão. 6. A tabela a seguir apresenta as notas ix e as frequências if obtidas pelos alunos na prova de matemática. A partir destes dados podemos dizer que ix if 2,5 3 5,0 7 6,5 10 8,0 6 10,0 5 (A) A moda é10 (B) A mediana é 5 (C) A média é 6,63 (D) A quantidade de alunos da amostra é 30 (E) A soma de todas as frequências é 29. 7. A tabela a seguir é uma distribuição na variável contínua e apresenta os dados de uma loja de presentes ao final da semana, contendo o número de clientes e seus gastos em presentes. Nestas condições podemos dizer que a moda segundo Czuber é classes if 0 |—— 50 7 50 |—— 100 8 100 |—— 150 10 150 |—— 200 6 200 |—— 250 4 (A) 116,6. (B)126,6. (C) 15,6. (D) 117,6. (E) 118,6. 47 8. A tabela a seguir apresenta as idades dos alunos do primeiro ano de Administração. Nessas condições o 3º quartil é classes if 17|—— 19 4 19|—— 21 12 21|—— 23 16 23|—— 25 8 25|—— 27 3 (A) 23,20. (B) 23,25. (C) 23,45. (D) 23,55. (E) 23,65. 9. A turma A de estatística I formada de 25 alunos tiveram média 7 na prova P1e a turma B formada por 30 alunos tiveram média 6. Então a média combinada dos 55 alunos nas duas provas foi (A) 6,25. (B) 6,35 (C) 6,45 (D) 6,55. (E) 6,65 10. Analise as afirmativas referentes a uma série na variável discreta ímpar de dados: I. A Moda sempre é um dos dados da série. II. A Média sempre é um dos dados da série. III. A Mediana sempre é um dos dados da série. Podemos afirmar que: (A) Somente a afirmativa II está correta. (B) Nenhuma afirmativa está correta. (C) Todas as afirmativas estão corretas. (D) Somente a afirmativa III está correta. (E) Somente a afirmativa I está correta 48 11. Em recente pesquisa perguntou-se ao corpo discente qual o tempo semanal (em horas) destinado ao estudo extraclasse da disciplina Estatística I. As respostas forneceram um tempo médio de 5,5 horas e uma mediana de 6 horas. Podemos considerar que essa distribuição dos tempos é do tipo: (A) Simétrica negativa. (B) Assimétrica negativa. (C) Assimétrica positiva. (D) Desviada à direita. (E) Simétrica. 12. Melhorar a infraestrutura é essencial para ter competividade e incentivar outros investimentos e permitir o crescimento do PIB. A tabela a seguir mostra a taxa de crescimento da infraestrutura no setor de geração de eletricidade (% a.a.). Anos if 1931 |—— 1950 4,5 1951 |—— 1963 9,8 1964 |—— 1980 9,8 1981 |—— 1993 4,1 1994 |—— 2002 3,8 Nestas condições, o ano em que ocorreu a taxa média de crescimento da infraestrutura no setor de geração de energia foi (A) 1968. (B) 1972. (C) 1974. (D) 1976. (E) 1978. 49 CAPÍTULO 2 ANÁLISE COMBINATÓRIA A análise combinatória é um ramo da matemática, que tem por fim estudar as propriedades dos agrupamentos que podemos formar, segundo certas leis, com os elementos de um conjunto finito. 1. Conceitos Seja , , , .A a b c d Aos subconjuntos de três elementos, denominaremos de agrupamentos simples de classe 3 e escrevemos como: ; ; eabc abd acd bcd . Aos conjuntos ; ;abb aab acc , denominamos de agrupamentos repetidos de classe 3. Aos subconjuntos com dois elementos, agrupamentos simples de classe 2 e escrevemos: ; ; ; ; eab ac ad bc bd cd . Exemplo 1: Seja 1,2,3,4A , quantos números distintos (sem repetição) de classe 3 podemos formar com esses algarismos? Solução: Escrevemos os agrupamentos de classe 3 distintos e observamos que mudando a ordem dos algarismos de cada agrupamento,ocorrem novos números distintos. Assim com 4 algarismos podemos formar 6 4 24 números distintos de 3 dígitos. 123 134 124 234 132 143 142 243 213 314 214 324 (6) 6 (6) (6) 231 341 241 342 312 413 412 423 321 431 421 432 Observação 1: Os números acima são formados de três dígitos sendo que na primeira casa aparecem os quatro dígitos e como não há repetição dos dígitos, na segunda casa aparecem três dígitos distintos e finalmente na última casa dois dígitos. Portanto podemos escrever 4 3 2 24 . Exemplo 2: Numa sala há 3 rapazes e 4 moças. Quantos casais rapaz-moça podem formar? Solução: Chamando os rapazes de 1 2 3, ,r r r e as moças de 1 2 3 4, , , ,m m m m é fácil ver que para o rapaz 1r podemos formar 4 casais e mais 4 casais para o rapaz 2r e outros 4 para o rapaz 3r . Portanto o número de casais é dado por: 4+4+4=3.4=12. 50 2. Princípio Fundamental de Contagem. Os exemplos dados ilustram o Princípio Fundamental de Contagem. Se um acontecimento é composto de duas etapas sucessivas, independentes uma da outra, e: Se na 1ª etapa ocorrer de m modos, Se na 2ª etapa ocorrer de n modos, então, o número de possibilidades de ocorrência do acontecimento é o produto de m.n. Exemplo 3: Quatro ciclistas participam de uma corrida. Quantos resultados existem para o 1º, 2º e 3º lugares? Solução: Cada resultado é formado por uma terna do tipo (a,b,c), sendo que a representa o ciclista que chegou em primeiro lugar, b representa o ciclista que chegou em segundo lugar e c o ciclista que chegou em terceiro lugar,então o número total dos resultados possíveis é dado pelo princípio fundamental de contagem 4.3.2=24. São dois os principais tipos de agrupamentos: Arranjos e combinações. 3. Arranjos Dado um conjunto A de n elementos, dele retiramos agrupamentos de classe p distintos com 1 p n . Chama-se arranjos de n elementos tomados p a p, ao número de agrupamentos ordenados de classe p. 3.1 Notação: ,n pA Exemplo 4: Seja 1,2,3A . Quantos arranjos desses 3 dígitos dois a dois podemos obter? Solução: Os arranjos são: 12, 21, 13, 31, 23 e 32, isto é 3,2 3.2 6A . 3.2. Cálculo do número de Arranjos. Para a dedução da fórmula dos Arranjos usamos o Princípio Fundamental de Contagem. Seja o conjunto 1 2 3, , ,..., nA a a a a com n elementos. i) Os arranjos de n elementos tomados um a um de A, são: 1 2 3( ),( ),( ),...( )na a a a e, portanto ,1nA n ii) Os arranjos de n elementos tomados dois a dois de A, são: 1 2 1 3 1 4 1 2 1 2 3 2 1, , ,..., , , ,..., ,...,n n n na a a a a a a a a a a a a a a a , portanto ,2 .( 1)nA n n . iii) Arranjos de n elementos tomados três a três são obtidos analogamente por: ,3 .( 1)( 2)nA n n n . Generalizando: 51 ,1nA n .......................... para classe 1p ,2 .( 1)nA n n ............... para classe 2p ,3 .( 1)( 2)nA n n n ..... para classe 3p e, portanto ..................... , ( 1)( 2)...( ( 1))n pA n n n n p ( 1)( 2)...( 1)n n n n p , para classe p Exemplo 5: Calcular os arranjos a) 5,3A =5.4.3=60 b) 6,2A =6.5=30 Exemplo 6: Determinar o valor de 2x de modo que ,2 56xA ,2 ( )( 1) 56xA x x , logo 8x Exemplo 7: Seja 1,2,3,4,5A . Quantos números pares de 3 dígitos podemos escrever? Solução: São pares os números terminados por 2 e 4, portanto o dígito das unidades só pode ser 2 ou 4. Fixando em primeiro lugar o dígito 2 na casa das unidades, as duas primeiras casas podem ser ocupadas por quaisquer dos arranjos com os dígitos restantes, isto é, 4,2A =4.3=12 e o mesmo ocorre para o dígito 4 na casa das unidades. Portanto, 2 4,2A =24 4. Fatorial A fim de simplificar os cálculos definimos fatorial de n, sendo n número natural. Chama-se fatorial de n e se indica por n! o número natural definido por ! ( 1)( 2)...3.2.1n n n n para 2.n 1!= 1 0!= 1 Exemplo 8: Calcular os fatorias indicados. 3!=3.2.1=6 4!=4.3.2.1=24 6!=6.5.4.3.2.1=720 5. Fórmula dos Arranjos usando fatorial Exemplo 9: Escrever 7,3A na forma de fatorial. 5,2 7.6.5.4.3.2.1 7! 7.6.5 4.3.2.1 3! A Generalizando: , ! ( )! n p n A n p 52 Exemplo 10: Escrever em termos de fatorial. a) 5,2A = 5! 5! 5.4.3! 5.4 20 (5 2)! 3! 3! b) 5,0 5! 5! 1 (5 0)! 5! A 6. Permutações Definimos permutações de n elementos por: ,n n nP A ! .( 1)( 2)...3.2.1n n n n Exemplo 11: Calcular 5P . 5 5,5 5! 5.4.3.2.1 120P A Exercícios de aplicação 7: 1. Um automóvel modelo 2016 é oferecido pelo fabricante em 5 cores diferentes, podendo o comprador optar entre os motores 1.0 e 1.8. Sabendo-se que os automóveis são fabricados nas versões “Standart”, “Luxo” e “Super-Luxo”. De quantas maneiras são as alternativas para o comprador? 2. Há 5 linhas de ônibus ligando a cidade Santo André a cidade São Bernardo e 4 linhas ligando a cidade São Bernardo a cidade São Caetano. Não há nenhuma linha de ônibus ligando a cidade Santo André à cidade São Caetano. Uma pessoa quer fazer uma viagem de ida e volta entre as cidades Santo André e São Caetano de modo que na volta não utilize nenhuma linha de ônibus utilizado na ida. De quantos modos diferentes pode essa pessoa fazer a viagem? 3. Das 9 pessoas presentes a uma reunião devem ser eleitos um presidente, um secretário e um tesoureiro. Quantas escolhas são possíveis? 53 4. Dados os dígitos 1, 2, 3, 4, 5, 8, formamos números com 5 algarismos distintos. a) Quantos não contêm o digito 4? b) Quantos não começam pelo número 4? 5. Com os algarismos 2, 3, 5, 6, 9, vamos formar números de algarismos distintos. Deste modo podemos formar quantos números a) de 3 algarismos? b) de 4 algarismos começados por 6? c) de 4 algarismos começados por 6 e terminados por 5? d) ímpares de 4 algarismos? e) de 5 algarismos em que o 6 e o 3 aparecem juntos, nessa ordem? 54 6. Formados e dispostos em ordem crescente todos os números que se obtém permutando os algarismos 1, 2, 3, 4, 5, 6, em que lugar estará o número 564213? 7. Numa corrida de automóveis, participaram 10 carros. Sabe-se que 3 deles pertencem à fábrica “A” e os outros à fábricas diferentes. Quantas disposições de chegada podem ter (todos terminam a prova), sabendo-se que um representante de “A” vence e os outros dois de “A” chegam a colocações seguidas? 8. Cada linha telefônica nova é formada por 8 dígitos, divididos em dois grupos: um formado pelos primeiros quatro algarismos que distingue os centros telefônicos e outro com 4 algarismos que distingue as linhas de um mesmo centro. Suponha que os algarismos de cada grupo são todos distintos. Quantas linhas telefônicas começando com o algarismo “2” poderiam ser lançadas? 9. Com 7 cores queremos pintar uma bandeira de 5 listas, cada listra com uma cor. De quantas formas isso pode ser feito? 55 10. Calcular n sabendo-se que ! 30 ( 2)! n n 7. Combinações Em muitas situações interessará apenas retirar subconjuntos de um determinado conjunto e, determinar o número desses conjuntos. Seja A um conjunto de n elementos, isto é, 1 2 3, , ,..., nA a a a a . Chamamos de combinações de n elementos tomados p a p, ao número de subconjuntos de A formados de p elementos. Notação: , ou nn p pC Exemplo 12: Seja , , ,A a b c d , quantos subconjuntos de 3 elementos podemos formar? São eles: , , , , , , , , , , ,a b c a b d a c d b c d , então 43 4 7.1 Cálculo do número de combinações No exemplo 12 encontramos o número de combinações de 4 elementos tomados 3 a 3, isto é, 44,3 3 4C . Façamos para cada uma das combinações todas as permutações possíveis, assim: (6 3!) (6 3!) 6 3! (6 3!) abc abd acd bcd acb adb adc bdc bac bad cad cbd bca bda cda cdb cab dab dac dcb cba dba dca dbc , dessa maneira, encontramos arranjos de 4 elementos tomados 3 a 3 ( 4,3 4 6 4 3! 24A ) e não combinações. Logo para obtermos as combinações devemos dividir por 6=3! assim: 56 44,3 3 4C = 4,3 24 24 6 3! 3! A 4,34,3 3! A C e generalizando para n elementos tomados p a p, segue: , , ! ! ( )! ! n p n p A n C p n p p 7.2 Triângulo de Pascal Os números binomiais podem ser dispostos ordenadamente na forma de um triângulo, com seus resultados. Observe que a soma de dois números da linha de cima reproduz o elemento da linha de baixo 0 0 1 1 0 1 2 2 2 0 1 2 3 3 3 3 0 1 2 3 4 4 4 4 4 0 1 2 3 4 1 1 1 1 2 1 1 3 3 1 1 4 6 4 1 Exemplo 13: A prova de geografia consta de 10 questões e a professora pede que os alunos escolham 6 questões. Quantos são os modelos de provas? Solução: Notemos que a ordem em que o aluno escolher as 6 questões não
Compartilhar