Baixe o app para aproveitar ainda mais
Prévia do material em texto
www.profrichard.com.br Estatística Descritiva 1 Aluno: _____________________________________________ _____________________________________________ Instituição de Ensino: _____________________________________________ Curso: _____________________________________________ www.profrichard.com.br Estatística Descritiva 2 “Sem entusiasmo não há matemática.” Novalis “OS SINAIS + E - MODIFICAM A QUANTIDADE DIANTE DA QUAL SÃO COLOCADOS COMO O ADJETIVO MODIFICA O SUBSTANTIVO.” (CAUCHY) Módulo 1 – I N T R O D U Ç Ã O A E S T A T Í S T I C A Estatística é a parte da Matemática Aplicada que fornece métodos para a coleta, organização, apresentação, análise e interpretação de dados para a tomada de decisões. Aplicações da estatística: _ Um professor comunica que a nota média da classe foi 7; _ O meteorologista informa que a probabilidade de chover hoje é de 30%; _ Um fabricante testa a resistência à ruptura, de cintos de segurança de automóveis, sem destruir toda a sua produção. População: em estatística, é o conjunto formado por todos os elementos (pessoas, objetos, etc.) que contém pelo menos uma característica comum a qual temos interesse em estudar. Amostra: em estatística, é uma parte da população retirada para ser analisada, a qual permite que se conheça tal população. Variáveis ou Dados: os dados ou variáveis são as informações obtidas através de observações, medidas, respostas de pesquisas ou contagens em geral. Esses dados ou variáveis podem ser classificados em: _ numéricos ou QUANTITAVIVOS; _ categóricos ou QUALITATIVOS. As variáveis quantitativas podem ser contínuas ou discretas. E as variáveis qualitativas podem ser nominais ou ordinais. Variáveis Quantitativas Contínuas (QC): podem assumir qualquer valor numérico num intervalo contínuo. Os dados referentes a tais variáveis dizem-se dados contínuos. Ou seja, quando pode assumir qualquer valor dentro de dois limites definidos, números “quebrados”, por exemplo: pesos de peças fabricadas, temperatura do corpo humano, etc. Variáveis Quantitativas Discretas (QD): assumem valores numéricos inteiros. Os dados discretos são o resultado da contagem do número de itens. Ou seja, quando só pode assumir valores pertencentes a um conjunto enumerável, números inteiros, como por exemplo, quantidade de peças fabricadas, número de filhos, etc. Variáveis Qualitativas Ordinais (QO): consistem de valores relativos (numéricos ou não) atribuídos para denotar ordem. Os dados referentes a tais variáveis dizem-se dados ordinais. Ou seja, apresenta uma ordenação, por exemplo: grau de escolaridade (Fundamental, Médio, Superior), nota obtida numa prova (de ZERO a DEZ ou de A até E ou de MB até I), etc. Variáveis Qualitativas Nominais (QN): referem-se a avaliações subjetivas. Os dados referentes a tais variáveis dizem-se dados nominais. Ou seja, não apresentam ordem, nem estrutura numérica, como por exemplo, religião, sexo, cor da pele, etc. A dificuldade para classificar dados, se dá em função da fácil confusão gerada entre uma variável quantitativa discreta e uma variável qualitativa ordinal. Por exemplo, num questionário estatístico, a pergunta: grau de importância que você dá ao seu curso (de 0 a 10) é uma variável qualitativa ordinal QO. Outro exemplo: soma da renda www.profrichard.com.br Estatística Descritiva 3 familiar (até $ 1.000,00, entre $ 1.000,00 e $ 2.000,00, acima de $ 2.000,00), é variável numérica, mas quando se pede para encaixar numa categoria, é classificada como variável qualitativa ordinal QO. Exemplo 1: Considere as afirmações a seguir e assinale a alternativa correta. I. A qualidade de um produto, defeituoso ou não defeituoso, trata de um dado qualitativo. II. A altura dos atletas do time de basquetebol da escola “Aprender”, trata de um dado qualitativo. III. O diâmetro dos parafusos produzidos por certa máquina trata de um dado quantitativo. a) Todas as afirmações estão corretas. b) Apenas a afirmação I está correta. c) Apenas as afirmações I e III estão corretas. d) Todas as afirmações estão incorretas. e) Apenas a afirmação III está correta. Resposta Correta: C a altura dos atletas do time de basquetebol da escola “Aprender” trata de um dado QUANTITATIVO e não QUALITATIVO. Exemplo 2: Classifique as variáveis abaixo em Qualitativa Nominal (N), Qualitativa Ordinal (O), Quantitativa Discreta (D) e Quantitativa Contínua (C). a) sexo (masculino ou feminino); b) idade; c) tempo de vida; d) peso; e) estado civil; f) tipo de escola (pública/particular); g) número de alunos numa classe; h) disciplina que mais gosta; i) rua de uma residência; j) número de uma residência. Respostas: a)N b)D c)C d)C e)N f)N g)D h)N i)N j)O E X E R C Í C I O S 1. Pela definição estatística, população é um conjunto de: a) Pessoas. b) Elementos quaisquer. c) Pessoas com uma característica comum. d) Elementos com pelo menos uma característica em comum. e) Indivíduos de um mesmo município, estado ou país. 2. Pela definição estatística, uma parte da população retirada para ser analisada denomina- se: a) Universo. b) Parte. c) Pedaço. d) Dados brutos. e) Amostra. 3. As variáveis estatísticas podem ser: a) População e amostra. b) Amostra e amostragem. c) Descritiva e inferencial. d) Qualitativas e quantitativas. e) Probabilística e aleatória. 4. A variável, cor dos olhos, pode ser classificada como: a) Qualitativa nominal. b) Quantitativa discreta. c) Quantitativa contínua. d) Qualitativa discreta. e) Qualitativa contínua. 5. A variável, número de filhos, pode ser classificada como: a) Qualitativa ordinal. b) Quantitativa discreta. c) Quantitativa contínua. d) Qualitativa discreta. e) Qualitativa contínua. 6. A variável, peso, pode ser classificada como: a) Qualitativa nominal. b) Quantitativa discreta. c) Quantitativa contínua. d) Qualitativa discreta. e) Qualitativa contínua. 7. A variável, tipo sanguíneo, pode ser classificada como: a) Qualitativa nominal. b) Quantitativa discreta. c) Quantitativa contínua. d) Qualitativa discreta. e) Qualitativa contínua. www.profrichard.com.br Estatística Descritiva 4 8. A variável, sexo, pode ser classificada como: a) Qualitativa nominal. b) Quantitativa discreta. c) Quantitativa contínua. d) Qualitativa discreta. e) Qualitativa contínua. 9. Identifique nos exemplos abaixo, qual o de tipo de dado (variável): a) nº de defeitos num carro. b) Salário (R$). c) Cor azul. d) muito dispendioso. 10. Numa empresa, para estudar a preferência em relação a sabores de sucos naturais, sorteiam-se 150 funcionários, entre os 850 funcionários próprios (não terceirizados). Responda: a) Qual a população envolvida na pesquisa? b) Qual é a amostra considerada? Gabarito: 1)D 2)E 3)D 4)A 5)B 6)C 7)A 8)A 9)a)discreto b)contínuo c)nominal d)ordinal 10)a)850funcionários b)150funcionários. “Toda a educação científica que não se inicia com a Matemática é, naturalmente, imperfeita na sua base.” (Auguste Conte) “O CÉU DEVE SER NECESSARIAMENTE ESFÉRICO, POIS A ESFERA, SENDO GERADA PELA ROTAÇÃO DO CÍRCULO, É, DE TODOS OS CORPOS, O MAIS PERFEITO.” (ARISTÓTELES) Módulo 2 – O R G A N I Z A Ç Ã O D E D A D O S Quando os dados são coletados para uma pesquisa, são chamados de dados brutos. Um exemplo de dado bruto corresponde ao valor médio (em dólares) de comercialização nos últimos 10 meses da saca de soja, na Bolsa de Cereais, conforme apresentado abaixo: 9,0 - 8,0 - 8,0 - 2,0 - 6,3 - 6,5 - 6,8 - 7,0 - 7,1 - 7,1 Geralmente, este tipo de dado traz pouca ou nenhuma informação ao leitor, sendo necessário organizar os dados, com o intuito de aumentar sua capacidade de informação.Rol: A primeira forma de organização que vamos estudar é o Rol, que são os dados organizados em ordem crescente ou decrescente. 2,0 – 6,3 – 6,5 – 6,8 – 7,0 – 7,1 – 7,1 – 8,0 – 8,0 – 9,0 Como podemos observar, a simples organização dos dados em um rol aumenta muito a capacidade de informação destes. Pode-se verificar facilmente que o menor preço observado foi 2 dólares e o maior, 9 dólares, o que nos fornece uma amplitude total de variação da ordem de 7 dólares. Amplitude total corresponde à diferença entre o maior e o menor valor observado em um conjunto de dados, simbolizado por A. Outra informação que podemos obter nos dados por meio da organização em rol crescente, é que alguns preços, como 7,1 e 8,0, foram os mais freqüentes, ou seja, os mais citados na pesquisa. Tabela: Para organizar os dados de uma forma mais eficiente, na qual se possa apresentar uma quantidade maior de informações, podemos usar as tabelas. Os elementos básicos de uma tabela são: o título, o corpo e a fonte. Quando temos poucos valores, podemos agrupá-los numa tabela simples. Por exemplo: Valor Médio da saca de soja Valor Frequência 2,0 1 6,3 1 6,5 1 6,8 1 7,0 1 www.profrichard.com.br Estatística Descritiva 5 7,1 2 8,0 2 9,0 1 Fonte: Bolsa de Cereais Quando temos muitos valores, fica inviável a tabela simples, dessa forma, os agrupamos numa tabela com intervalos de classe. Classes são intervalos nos quais os valores da variável analisada são agrupados (linhas da tabela). Distribuindo-se os dados observados em classes e contando-se o número de observações contidas em cada classe, obtém-se a freqüência de classe. A disposição tabular dos dados agrupados em classes, juntamente com as freqüências correspondentes, se denomina distribuição de freqüências. A partir dos dados do exemplo relativo ao preço da saca de soja, vamos construir uma distribuição de freqüência: Valor Médio da saca de soja CLASSES FREQUÊNCIA 2 ├ 4 1 4 ├ 6 0 6 ├ 8 6 8 ├ 10 3 Fonte: Bolsa de Cereais Na tabela acima, dizemos que o limite inferior e o superior da segunda classe são 4 e 6. O ponto médio (PM) da primeira classe é 3. O ponto médio é a média aritmética entre o Li: Limite inferior; e o Ls: Limite superior. T I P O S D E F R E Q U Ê N C I A Como já vimos, após a coleta dos dados, não temos informações claras. Ou seja, na tabela abaixo, temos os dados brutos ou uma tabela primitiva, pois os dados não estão organizados. 5,1 4,9 4,9 5,1 4,7 5,0 5,0 5,0 5,1 5,4 5,2 5,2 4,9 5,3 5,0 4,5 5,4 5,1 4,7 5,5 4,8 5,1 5,3 5,3 5,0 Na tabela anterior, é difícil averiguar, qual o Menor valor, o Maior valor, a Faixa de valores, a Amplitude, etc. Por isso, é melhor organizarmos a tabela acima, num rol. 4,5 4,7 4,7 4,8 4,9 4,9 4,9 5,0 5,0 5,0 5,0 5,0 5,1 5,1 5,1 5,1 5,1 5,2 5,2 5,3 5,3 5,3 5,4 5,4 5,5 Através do Rol, fica fácil averiguar, o Menor valor (4,5), o Maior valor (5,5), a Faixa de valores (4,5 a 5,5) e a Amplitude (1). Freqüência simples ou absoluta (f): É a quantidade de vezes que um dado aparece, ou seja, a frequência absoluta, ou apenas frequência, de um valor é o número de vezes que uma determinada variável assume esse valor. Ao conjunto das frequências dos diferentes valores da variável dá-se o nome de distribuição da frequência (ou apenas distribuição). conforme tabela abaixo: valor f 4,5 1 4,6 0 www.profrichard.com.br Estatística Descritiva 6 4,7 2 4,8 1 4,9 3 5,0 5 5,1 5 5,2 2 5,3 3 5,4 2 5,5 1 total 25 Na tabela acima, temos uma observação direta, do número de vezes (frequência) que cada valor aparece. Quando uma tabela possui muitas linhas, podemos transformá-la de simples em intervalos de classe, conforme abaixo: Valor frequência (f) 4,5 ├ 4,9 4 4,9 ├ 5,3 15 5,3 ├ 5,7 6 Total 25 OBS.: _ A escolha do intervalo de classe (0,4) geralmente é arbitrário, embora possa ser definido por diferentes métodos de cálculo, como o método de Sturges. _ O símbolo significa intervalo fechado à esquerda e aberto à direita, ou seja: 4,5 4,9 significa 4,5 x < 4,9 ou [ 4,5 ; 4,9 [ _ Na tabela simples, percebe-se que não há nenhum resultado com 4,6, mas na tabela com intervalos de classe, não observamos este detalhe. Ou seja, a tabela simples é mais detalhada que a tabela com intervalos de classe. Frequência relativa (fr): São os valores das razões entre as frequências simples e a frequência total fr = f / f . Ou seja, a frequência relativa, é a porcentagem relativa à frequência. O propósito das freqüências relativas é o de permitir a análise ou facilitar as comparações, pois multiplicando a freqüência relativa por cem, temos o percentual de cada dado. fr = f / f ↔ fr = 1 / 25 ↔ fr = 0,04 valor f fr 4,5 1 0,04 4,6 0 0 4,7 2 0,08 4,8 1 0,04 4,9 3 0,12 5,0 5 0,20 5,1 5 0,20 5,2 2 0,08 5,3 3 0,12 5,4 2 0,08 5,5 1 0,04 total 25 1 www.profrichard.com.br Estatística Descritiva 7 Através da tabela acima e análise de dados, 8% das amostras apresentam o valor 5,2. Frequência acumulada (F): também chamada de fa, é o total das freqüências de todos os valores inferiores ao limite superior do intervalo de uma dada classe F = f . Ou seja, a frequência acumulada de um valor, é o numero de vezes que uma variável assume um valor inferior ou igual a esse valor. F3 = f ↔ F = 1 + 0 + 2 ↔ F = 3 F6 = 1 + 0 + 2 + 1 + 3 + 5 ↔ F = 12 valor f fr F 4,5 1 0,04 1 4,6 0 0 1 4,7 2 0,08 3 4,8 1 0,04 4 4,9 3 0,12 7 5,0 5 0,20 12 5,1 5 0,20 17 5,2 2 0,08 19 5,3 3 0,12 22 5,4 2 0,08 24 5,5 1 0,04 25 total 25 1 - Através da tabela acima e análise de dados, há 3 resultados com valores 4,7, há 12 resultados com valores 5. Frequência acumulada relativa (Fr): É a porcentagem relativa à frequência acumulada. Ou seja, a frequência relativa acumulada de uma classe é a freqüência acumulada da classe, dividida pela freqüência total da distribuição Fr = F / f. Fr1 = F / f ↔ Fr = 1 / 25 ↔ Fr = 0,04 Fr4 = 4 / 25 ↔ Fr = 0,16 valor f fr F Fr 4,5 1 0,04 1 0,04 4,6 0 0 1 0,04 4,7 2 0,08 3 0,12 4,8 1 0,04 4 0,16 4,9 3 0,12 7 0,28 5,0 5 0,20 12 0,48 5,1 5 0,20 17 0,68 5,2 2 0,08 19 0,76 5,3 3 0,12 22 0,88 5,4 2 0,08 24 0,96 5,5 1 0,04 25 1 total 25 1 - - Através da tabela acima e análise de dados, 96% das amostras apresentam valores 5,4. C O N T R I B U I Ç Õ E S P E R C E N T U A I S www.profrichard.com.br Estatística Descritiva 8 Note que f% = fr • 100 e F% = Fr • 100, pois se multiplicarmos a freqüência relativa por 100, obtemos a mesma na forma percentual. Uma tabela de freqüências, para variáveis quantitativas, apresenta, porém, outros conceitos que permitem uma maior profundidade para análise e devem ser adicionadas. São eles o PONTO MÉDIO (PM) e a FREQUENCIA PERCENTUAL ACUMULADA (F%). PM é o valor médio de cada classe, ou intervalo, é o ponto médio de cada classe. Torna-se o valor representativo de cada classe. F% é a freqüência percentual acumulada, obtida repetindo-se o primeiro valor de f% e somando aos demais. Veja como exemplo, uma tabela de freqüências para a variável quantitativa “idades” de forma completa: Classes PM f f% F% 12 ├ 14 13 3 15 15 14 ├ 16 15 5 25 40 16 ├ 18 17 5 25 65 18 ├ 20 19 7 35 100 Total - 20 100 - Amplitude em tabelas de freqüências: a amplitude de um rol é a diferença entre o maior e o menor valor. Numa tabela de freqüências, temos a amplitude de cada classe, a amplitude total das classes, a amplitude dos pontos médios e a amplitude das freqüências. Por exemplo, na tabela acima, temos que a amplitude de cada classe é 14 – 12 = 2, a amplitude total das Classes ou amplitude da distribuição é 20 – 12 = 8, a amplitude dos pontos médios é 19 – 13 = 6 e a amplitude das freqüências é 7 – 3 = 4. Exemplo: um grupo de alunos foi consultado sobre o time paulistade sua preferência, e os votos foram registrados assim: Santos: I I, Palmeiras: I I I I, Corinthians: I I I I I I I I, São Paulo: I I I I I I. Construa a tabela de freqüência correspondente a essa pesquisa. Times Contagem f f% F% Santos I I 2 10 10 Palmeiras I I I I 4 20 30 Corinthians I I I I I I I I 8 40 70 São Paulo I I I I I I 6 30 100 Total 20 100 - E X E R C Í C I O S 1) O que é rol? a) sequência desordenada gerada a partir dos dados brutos. b) sequência dos dados brutos. c) dados brutos. d) dados gerados a partir da pesquisa. e) sequência ordenada gerada a partir dos dados brutos. 2) O que é frequência? a) dados apresentados em sequência. b) fato que acontece em uma determinada coleta de dados. c) quantidade de vezes que a pesquisa é realizada. d) quantidade de vezes que um elemento ou fato acontece em uma determinada coleta de dados. e) coleta de dados. www.profrichard.com.br Estatística Descritiva 9 3) De acordo com a tabela dada, responda: a) Qual o número de classes. b) Qual é o intervalo de classe. c) Qual o intervalo que aparece a maior freqüência? d) A estatura 176 cm ou 1,76 m, está na classe de qual freqüência? ESTATURA DE 100 FUNCIONÁRIOS DE UMA EMPRESA Estatura (cm) nº de funcionários (f) 150 ├ 155 2 155 ├ 160 5 160 ├ 165 11 165 ├ 170 39 170 ├ 175 32 175 ├ 180 10 180 ├ 185 1 4) Organizando os valores 89, 54, 34, 56, 56, 34, 80, 28 em um rol, temos: a) 89, 54, 34, 56, 80, 28 b) 28, 34, 34, 54, 56, 56, 80, 89 c) 89, 80, 56, 54, 34, 28 d) 28, 34, 54, 34, 80, 56, 56, 89 5) Nas séries de valores: A: 2; 4; 5; 8; 9 B: 35; 17; 22; 46; 15; 26 C: 16,1; 21,3; 25,6; 45,2 Assinale a alternativa correta: a) A maior amplitude é da seqüência C. b) A maior amplitude é da seqüência A. c) A maior amplitude é da seqüência B. d) As seqüências A e B possuem amplitudes iguais. e) As seqüências A e C possuem amplitudes iguais. 6) Calcule a amplitude total dos conjuntos de dados: a) 1, 3, 5, 9 b) 20, 14, 15, 19, 21, 24, 20 c) 17,9; 22,5; 13,3; 16,8; 15,4; 14,2 d) 100 |— 150, 150 |— 200, 200 |— 250, 250 |— 300, 300 |— 350, 350 |— 400 e) -2, -1, 0, 1, 2, 3 7) Os dados a seguir referem-se ao número de livros adquiridos, no ano passado, pelos 40 alunos de uma turma de curso técnico, em São José do Rio Pardo: 4 2 1 0 3 1 2 0 2 1 0 2 1 1 0 4 3 2 3 5 8 0 1 6 5 3 2 1 6 4 3 4 3 2 1 0 2 1 0 3 Com relação a esses valores, pede-se: a) Organize os dados em uma tabela sem intervalos de classe. b) Responda: qual o percentual de alunos que adquiriram menos de 4 livros? 8) A tabela abaixo apresenta a comissão recebida pelos funcionários de uma empresa. Comissões (R$) nº de funcionários 100 ├ 150 4 150 ├ 200 8 200 ├ 250 16 www.profrichard.com.br Estatística Descritiva 10 250 ├ 300 24 300 ├ 350 20 350 ├ 400 8 Total 80 Quantos funcionários ganham comissão inferior a R$ 300,00? a) 20 funcionários b) 28 funcionários c) 52 funcionários d) 38 funcionários 9) Os dados da tabela a seguir, referem-se ao consumo familiar anual (kg) de um gênero alimentício. Complete a tabela. Peso F f% 42 ├ 54 6 9 19 11 5 Total 10) Em um escritório trabalham 40 pessoas cujas idades, em anos, são dadas em ordem crescente: 18 - 19 - 20 - 20 - 20 - 24 - 24 - 24 - 24 – 24 - 28 - 28 - 28 - 30 - 30 - 30 - 30 - 30 - 32 - 32 - 35 - 35 - 35 - 35 - 36 - 36 - 36 - 36 - 36 – 40 - 40 - 40 - 42 - 45 - 45 - 48 - 48 - 50 - 50 – 60 Observe que a tabela seguinte está parcialmente preenchida com as idades agrupadas em intervalos (classes) que devem ter o mesmo comprimento Idade (anos) nº de funcionários (f) 18 ├ 25 10 25 ├ 32 8 ? 11 ? 6 ? 4 53 Ͱ˧ 60 1 Total 40 Pergunta-se: a) A classe que corresponde a 6 funcionários é: a) 35 ├ 42 b) 37 ├ 45 c) 39 ├ 46 d) 46 ├ 49 e) 50 ├ 60 b) Relativamente ao total de funcionários desse escritório, a porcentagem dos que têm idades inferiores a 32 anos é: a) 45% b) 38% c) 37,5% d) 25% e) 12% 11) Ao se lançar 24 vezes um dado de 10 lados (decaedro), obteve-se os seguintes resultados: 4 2 6 1 2 3 5 6 3 4 2 1 1 6 5 4 5 6 8 7 10 9 7 8 Para os valores acima, construa uma tabela sem intervalos de classe e outra com intervalos de classe de amplitude 2. 12) Complete a tabela abaixo: Nacionalidade f fr f% F Fr F% Brasileira 6 Espanhola 3 Argentina 1 Total - - - Gabarito: 1)e 2)d 3)a)7 b)5 c)165├170 d)10 4)b 5)c 6)a)8 b)10 c)9,2 d)300 e)5 www.profrichard.com.br Estatística Descritiva 11 7)a) valor 0 1 2 3 4 5 6 7 8 total f 7 9 8 7 4 2 2 0 1 40 b)77,5%. 8)c 9) Peso f f% 42 ├ 54 6 12 54 ├ 66 9 18 66 ├ 78 19 38 78 ├ 90 11 22 90 ├ 102 5 10 Total 50 100 10)a)C b)A 11) VALORES FREQUÊNCIA 1 3 2 3 3 2 4 3 5 3 6 4 7 2 8 2 9 1 10 1 VALORES FREQUÊNCIA 1 ├ 3 6 3 ├ 5 5 5 ├ 7 7 7 ├ 9 4 9 ├ 11 2 12) Nacionalidade f fr f% F Fr F% Brasileira 6 0,6 60 6 0,6 60 Espanhola 3 0,3 30 9 0,9 90 Argentina 1 0,1 10 10 1 100 Total 10 1 100 - - - “O ESPAÇO É O OBJETO QUE O GEÔMETRA DEVE ESTUDAR.” (POINCARÉ) “A natureza está escrita em linguagem matemática.” (Galileu) Módulo 3 – R E P R E S E N T A Ç Õ E S G R Á F I C A S Os resultados de uma pesquisa estatística podem ser apresentados em forma de ROL, de TABELA ou de GRÁFICO. Os Gráficos Estatísticos são importantes ferramentas para analisar e interpretar dados numéricos relativos a uma pesquisa, possibilitando melhor visualização. Uma tabela de distribuição de frequência pode ser representada através de um gráfico chamado Histograma, conforme abaixo: valor frequência (f) 4,5 ├ 4,9 4 4,9 ├ 5,3 15 5,3 ├ 5,7 6 total 25 Polígono de frequências: é um gráfico em linha, obtido unindo-se por segmentos de reta os pontos médios das bases superiores dos retângulos de um histograma. Para realmente www.profrichard.com.br Estatística Descritiva 12 obtermos um polígono (linha poligonal fechada) devemos completar a figura, ligando os extremos da linha obtida aos pontos médios da classe anterior à primeira e da posterior à última, da distribuição. O polígono do histograma será usado em assuntos posteriores. Principais Tipos de Gráficos Estatísticos: os principais tipos de gráficos são: _ Gráfico em linha ou em curva; _ Gráfico em colunas ou em barras; _ Gráfico em colunas ou em barras múltiplas; _ Gráfico em setores. Veja os exemplos a seguir: Em linha: Em colunas: Em barras: Em colunas múltiplas: Em barras múltiplas: Em setores circulares: www.profrichard.com.br Estatística Descritiva 13 E X E R C Í C I O S 1) Com a tabela de distribuição de frequência abaixo, foi construído ao lado o histograma dessa distribuição. Complete no eixo nº de estudantes (f), os valores correspondentes às classes. Altura (cm) frequência [ 150 ; 157 [ 3 [ 157 ; 164 [ 9 [ 164 ; 171 [ 15 [ 171 ; 178 [ 7 [1 78 ; 185 ] 6 2) O gráfico representativo ao lado é um gráfico: a) de setores; b) de barras; c) de colunas; d) em forma de histograma; e) em forma de polígono de freqüência. 3) O gráfico representativo ao lado é um gráfico: a) de setores; b) de barras; c) de colunas; d) em forma de histograma; e) em forma de polígono de freqüência. 4) De acordo com o gráfico ao lado e sabendo que a região total descrita por ele equivale a uma área de 100 km², responda qual a área ocupada por Matas. www.profrichard.com.br EstatísticaDescritiva 14 5) Em 1995, o controle acionário da empresa Estatal CPFL (Companhia Paulista de Força e Luz), encontra- se descrito no gráfico de setores (pizza), ao lado. Sabendo-se que a área total de concessão da companhia era de 90.691 Km, determine qual era a área de concessão, sob responsabilidade das prefeituras. 6) O gráfico a seguir, mostra as porcentagens, investidas em cada uma das Áreas de atuação da ex-Estatal e atualmente empresa privada CPFL, em 1995. Sabendo-se que o total anual da verba destinada a investimentos era de 8 bilhões de reais, determine quanto a empresa investia anualmente em usinas de geração de energia elétrica. 7) O dono de uma loja de artigos para costureiras fez o levantamento dos botões em estoque e organizou os dados obtidos na tabela seguinte. O gráfico que melhor representa os dados dessa tabela é: 8) Numa determinada cidade, pesquisou- se durante um ano a ocorrência do número de casos de certa doença, encontrando-se os dados representados no gráfico ao lado. É verdade que: (A) O total de casos registrados no 2º semestre foi de 4000. (B) A maior variação entre dois meses consecutivos ocorreu de Agosto a Setembro. (C) No último trimestre, o número de casos registrados foi de 2500. (D) Os períodos de crescimento e os períodos de decrescimento do número de casos registrados foram sempre crescentes. www.profrichard.com.br Estatística Descritiva 15 9) O gráfico abaixo, apresenta dados referentes a faltas por dia em uma classe, durante um certo período de tempo. De acordo com o gráfico, no período observado, ocorreram: (A) 15 faltas em 8 dias. (B) 2 faltas por dia. (C) 6 faltas no terceiro dia. (D) 52 faltas em 27 dias. (E) 2 faltas a cada quatro dias. Gabarito: 1)3-6-7-9-15 2)c 3)b 4)10 5)816,22 6)160.000.000 7)d 8)c 9)d “A NOÇÃO DE INFINITO, DE QUE É PRECISO SE FAZER UM MISTÉRIO EM MATEMÁTICA, RESUME-SE NO SEGUINTE PRINCÍPIO: DEPOIS DE CADA NÚMERO INTEIRO EXISTE SEMPRE UM OUTRO.” (TANNERY) “Tudo são números.” (Ditos Pitagóricos) Módulo 4 – M E D I D A S D E T E N D Ê N C I A C E N T R A L As Medidas de Posição, também denominadas de medidas de tendência central, são as medidas que representam os fenômenos pelos seus valores médios, em torno dos quais tendem a concentrar- se os dados. São usadas para indicar um valor que resume um conjunto de números. As mais utilizadas são a média, a mediana e a moda. Média Aritmética (µ ou �̅�): É a soma de todos os resultados obtidos dividido pela quantidade de valores. Utiliza-se a letra grega mu “µ” (leia-se “mi”) para a média de uma população de N elementos. E, a média de uma amostra de n elementos é representada pelo símbolo “�̅�” (leia-se “xis barra”). Fórmulas: �̅� = ∑ 𝑥 𝑛 𝜇 = ∑ 𝑥 𝑁 Quando o exercício não mencionar se os dados são amostrais ou populacionais, usaremos o símbolo �̅�, pois quase a totalidade das estatísticas são feitas através de dados amostrais. A média possui várias propriedades matemáticas, a que considero mais interessante é: “somando-se uma constante a cada valor, a média ficará aumentada do valor dessa constante. O mesmo ocorre com as operações de subtração, multiplicação e divisão.” Exemplo 1: Determinar a média aritmética dos valores amostrais: 5, 8, 10, 12 e 15. → Exemplo 2: Em uma empresa de componentes eletrônicos, a exportação nos últimos 4 anos, em milhares de dólares, foi US$ 800,00; US$ 880,00; US$ 760,00 e US$ 984,00. Determine a média de exportações dessa empresa. www.profrichard.com.br Estatística Descritiva 16 → Média Aritmética Ponderada (µp ou �̅�p): A fórmula anterior para calcular a média aritmética supõe que cada observação tem a mesma importância. A Média ponderada é uma média aritmética na qual será atribuído um peso a cada valor da série. = == n i i n i ii p p px X 1 1 . Exemplo 1: Um professor de Matemática adotou para 2013 os seguintes pesos para as notas bimestrais: 1° bimestre: peso 1 3° bimestre: peso 3 2° bimestre: peso 2 4° bimestre: peso 4 Qual será a média de um aluno que obteve as seguintes notas: 5, 4, 3 e 2 nos respectivos bimestres? ( ) ( ) ( ) ( ) 3 10 30 10 8985 10 4.23.32.41.5 == +++ = +++ =pX Mediana (Me ou Md): É o valor que ocupa a posição central de um conjunto de dados, desde que estejam colocados ordenadamente, seja em ordem crescente ou em ordem decrescente. Exemplo 1: Calcular a mediana dos dados: 5 ; 8 ; 4 ; 6 ; 7 ; 3 ; 4. OBS.: Quando a quantidade de dados for ímpar, o valor da mediana será dado pelo valor central da série de dados. . Exemplo 2: Calcular a mediana dos dados: 8 – 0 – 7 – 4 – 7 – 10 – 6 – 5. OBS.: Quando a quantidade de dados for par, o valor da mediana será dado pela média dos dois valores centrais da série de dados. www.profrichard.com.br Estatística Descritiva 17 Moda (Mo): É o valor que ocorre com maior freqüência nos dados de uma pesquisa. Ou seja, É o valor que aparece a maior quantidade de vezes. É a única que pode ser usada para dados nominais. Exemplos 1: Determinar a moda dos dados: 4 4 5 5 5 6 7 8 9 No grupo de dados acima, o valor que mais aparece é o valor 5, então, a moda vale 5. Mo = 5, nesse caso dizemos que a série é unimodal. Exemplos 2: Determinar a moda dos dados: 10 10 10 15 15 15 17 18 19 19 No grupo de dados acima, os valores que mais aparecem são o 10 e o 15, então, a moda vale 10 e 15. Mo = 10 e 15, nesse caso dizemos que a série é bimodal. Exemplos 3: Determinar a moda dos dados: 100 200 300 400 500 600 700 No grupo de dados acima, não há repetição de valores, então não existe moda, nesse caso dizemos que a série é amodal. OBS.: Uma série pode ser: amodal, unimodal, bimodal, trimodal e acima disso, polimodal. C O M P A R A Ç Ã O Medida Central Vantagens Limitações Média Reflete todos os valores. É influenciada por valores extremos. Mediana Insensível a valores extremos. Difícil de determinar para grandes quantidades de valores. Moda Indica o valor “típico” em termos da maior ocorrência. Quando todos ou quase todos os valores ocorrem aproximadamente com a mesma frequência, a moda nada acrescenta. Das três medidas, a média é a mais utilizada e a moda é a menos utilizada. Dados sobre renda pessoal ou valor de residências tem na mediana um valor mais adequado que na média, pois basta um valor muito alto, para inflacionar a média. Exercício Resolvido: um empresário realiza uma determinada operação comercial que, em função de suas especificidades, pode apresentar três resultados possíveis: sucesso absoluto, sucesso parcial e insucesso. Quando ele obtém sucesso absoluto, a operação rende para ele R$ 2.500,00 de lucro; quando o sucesso é parcial, o lucro cai para R$ 1.200,00; e o fracasso lhe traz um prejuízo de R$ 1.800,00. A tabela de frequências a seguir relaciona o número de ocorrências de cada tipo ao longo do último ano. Qual é o lucro médio do empresário nesse ano? Ocorrências Lucro Número de operações comerciais fi . xi Classes Valor frequencia simples Xi fi Sucesso absoluto 2.500,00 42 105.000,00 Sucesso parcial 1.200,00 24 28.800,00 Fracasso - 1.800,00 12 - 21.600,00 Totais 78 112.200,00 Ou seja, lucro de R$ 112.200,00 em 78 prestações, portanto o lucro médio foi de: �̅� = ∑ 𝑥 𝑛 = 112200 78 = 1438,46 www.profrichard.com.br Estatística Descritiva 18 E X E R C Í C I O S 1) Dados os valores a seguir, 9 – 6 – 5 – 4 – 8 – 9 – 10 – 4 – 7 – 8 – 5 – 6 – 10, determinar a média aritmética dos mesmos. 2) Dados os valores a seguir, 10 – 10 – 11 – 11 – 11 – 11 – 12 – 12 – 12 – 13 – 13 – 13 – 14, determinar a moda dos mesmos. 3) Dados os valores a seguir, 9 – 6 – 5 – 4– 8 – 9 – 10 – 4 – 7 – 8 – 5 – 6 – 10, determinar a mediana dos mesmos. 4) Dados os valores a seguir, 9 – 5 – 4 – 9 – 10 - 7 – 4 – 5 – 10 – 3 - 3 – 9 – 10 - 6, determinar a mediana dos mesmos. 5) Para a série de valores abaixo, calcule a média, a moda e a mediana. 50 60 40 70 60 40 70 40 60 50 60 50 6) A moda para a seqüência numérica 4, 8, 8, 4, 9, 10, 8, 10, 4 e 11 é: 7) Um aluno, nos três primeiros bimestres letivos do ano, obteve as seguintes notas em matemática: 4,5; 8,0 e 6,5. Quanto precisará de nota no 4° bimestre, para alcançar a média final 7,0 ? 8) Considere os dados apresentados na tabela e assinale a alternativa correta: Peça Massa (kg) A 1,9 B 1,8 C 1,5 D 1,5 E 2,2 F 1,8 G 1,8 H 2,0 I 1,1 J 1,7 a) A média amostral é de 1,7 kg. b) A série é bimodal. c)O valor da mediana é 3,6 kg. d) O valor da moda é 1,5 kg. e) O valor da mediana é 1,8 kg. 9) Considere os aspectos teóricos envolvidos nas medidas de tendência central e assinale a alternativa correta: a) A média aritmética amostral é indicada pela letra µ. b) O valor da média sempre coincide com o valor da mediana. c) A mediana é indicada por Mo. d) A moda é o valor mais freqüente. e) O valor da moda sempre coincide com o valor da mediana. 10) A média das idades dos 11 funcionários de uma empresa era de 40 anos. Um dos funcionários se aposentou com 60 anos, saindo da empresa. A média de idade dos 10 funcionários restantes passou a ser de quanto? 11) Num colégio, a nota de Matemática do 2º ano é obtida calculando a média ponderada das notas de Álgebra, Geometria e Trigonometria com pesos 3, 2 e 2, respectivamente. Qual a nota obtida por um aluno que teve 7,5 em Álgebra, 6,0 em Geometria e 5,5 em Trigonometria? www.profrichard.com.br Estatística Descritiva 19 Gabarito: 1)7 2)11 3)7 4)6,5 5)X = 54,17; Me = 55 e Mo = 60 6)4 e 8 7)9,0 8)E 9)D 10)38 anos 11)6,5 “Um belo Teorema vale uma bela obra de arte.” Amoroso Costa “Aquele que deseja estudar ou exercer a Magia deve cultivar a Matemática.” (Matila Ghyka) Módulo 5 – Medidas Centrais (Dados Agrupados SEM Intervalos de Classes) Moda: A Moda para dados agrupados sem intervalos de classes, é calculada observando-se o maior valor da freqüência. Exemplo: Calcular a moda dos valores representados na distribuição de freqüências: Média: A Média para dados agrupados sem intervalos de classes, é calculada de maneira análoga a média ponderada. Exemplo: Calcular a média das idades representadas na distribuição de freqüências: Mediana: Para dados agrupados sem intervalos de classe, identifica-se a freqüência acumulada imediatamente superior à metade da soma das freqüências. A mediana será o valor da variável que corresponde a tal freqüência acumulada. Exemplo: Calcular o valor da mediana da distribuição dada: www.profrichard.com.br Estatística Descritiva 20 Como existem 34 valores, a mediana é calculada através do 17° e do 18° valor, observe que ambos aparecem na variável 2, logo Me = 2 . Para facilitar a compreensão, vou detalhar o procedimento: Medidas Centrais (Dados Agrupados COM Intervalos de Classes) Média: A média para dados agrupados com intervalos de classes é calculada de maneira análoga a média ponderada, utilizando-se os pontos médios. Exemplo:Calcular a média das idades representadas na distribuição de frequências: www.profrichard.com.br Estatística Descritiva 21 Moda Bruta e Classe Modal: A classe que apresenta a maior freqüência é denominada classe modal, uma vez agrupados os dados, é possível determinar imediatamente a classe modal, basta fixar o valor da variável de maior freqüência. Exemplo: A tabela abaixo mostra os pesos das crianças em uma classe. Usando esta informação, encontre a classe modal e a moda bruta. Kg de massa (m) Freqüência 30 ≤ m < 40 7 40 ≤ m < 50 6 50 ≤ m < 60 8 60 ≤ m < 70 4 A classe modal é a classe que tem a maior freqüência. Neste caso a classe modal é 50 ≤ m < 60. O método mais simples para o cálculo da moda consiste em tomar o ponto médio da classe modal. Damos a esse valor a denominação de moda bruta, no caso, Mo = 55. Mediana Bruta e Classe Mediana: A classe que apresenta o valor central das freqüências é denominada classe mediana, uma vez agrupados os dados, é possível determinar imediatamente a classe mediana, por observação e contagem das freqüências acumuladas, conforme já foi visto. Exemplo: A tabela abaixo mostra os pesos das crianças em uma classe. Usando esta informação, encontre a classe mediana e a mediana bruta. Kg de massa (m) Freqüência 30 ≤ m < 40 7 40 ≤ m < 50 6 50 ≤ m < 60 8 60 ≤ m < 70 4 Como o total de crianças é 25, a classe mediana é a classe que tem o 13° valor de freqüência. Neste caso a classe mediana é 40 ≤ m < 50. O método mais simples para o cálculo da mediana consiste em tomar o ponto médio da classe mediana. Damos a esse valor a denominação de mediana bruta, no caso, Me = 45. A moda bruta é o ponto médio da classe de maior freqüência e a mediana bruta é o ponto médio da classe da frequência mediana. Para se obter uma moda e uma mediana mais precisa, para dados agrupados, existem várias fórmulas, de matemáticos como KING e CZUBER, essas fórmulas não serão estudadas nesse curso. E X E R C Í C I O S 1) Calcular o valor da mediana da distribuição dada ao lado: 2) (UFPel-RS) Na busca de solução para o problema da gravidez na adolescência, uma equipe de orientadores educacionais de uma instituição de ensino pesquisou um grupo de adolescentes de uma comunidade próxima a essa escola e obteve os seguintes dados: www.profrichard.com.br Estatística Descritiva 22 Com base nos textos e em seus conhecimentos, é correto afirmar, em relação às idades das adolescentes grávidas, que: a) a média é 15 anos. b) a mediana é 15,3 anos. c) a mediana 16,1 anos. d) a moda é 16 anos. e) a média é 15,3 anos. 3) (Unimontes-MG) O serviço meteorológico registrou, em alguns estados brasileiros, as seguintes temperaturas: A moda e a mediana dessas temperaturas são, respectivamente, a) 39ºC e 24ºC b) 8ºC e 39ºC c) 8ºC e 21ºC d) 21ºC e 8ºC 4) Considere os faturamentos mensais das seguintes filiais de uma grande empresa (em milhares de Reais) Utilize a medida de posição MEDIANA para comparar o desempenho das filiais. 5) Na linha de produção de uma grande montadora de veículos, existem 7 diferentes testes no controle de qualidade. Sorteamos alguns dias e observamos 6.934 automóveis, anotando o número de aprovações que cada veículo recebeu. Determine o número médio de aprovações por automóvel produzido. 6) Em uma pesquisa realizada numa Empresa quanto aos salários médios de seus funcionários, verificou-se o seguinte resultado: www.profrichard.com.br Estatística Descritiva 23 Baseado nesses resultados determine o salário médio desses funcionários. 7) Considere a tabela de distribuição das alturas, em cm, de 40 alunos de uma sala de aula. Calcule a média das alturas. 8) Calcule a Moda da tabela ao lado para o dado qualitativo tipo sanguíneo de alguns indivíduos. 9) Calcule a moda nas tabelas abaixo e diga qual o tipo de série modal. a) b) c) 10) Calcule a média, a moda bruta e a mediana bruta da tabela de distribuição das alturas, em cm, de 40 alunos de uma classe. CLASSE (cm) FREQUÊNCIA 140 ├ 150 3 150 ├ 160 3 160 ├ 170 11 170 ├ 180 6 180 ├ 190 11 190 ├ 200 6 www.profrichard.com.br Estatística Descritiva 24 Gabarito: 1) 15,5 2) E 3) C 4) 24 e 39,5 5)X = 6,6 6) 830,40 7) 170,50 8) Mo = tipo O 9) a) Mo = 4,5 (série unimodal) b) Mo = 4,5 e Mo = 4,6 (série bimodal) c) Não há Mo (série amodal) 10)Ẍ = 174,25; Me = 175 e Mo = 165 e 185“Arquimedes será lembrado enquanto Ésquilo foi esquecido, porque os idiomas morrem mas as idéias matemáticas permanecem. "Imortalidade" pode ser uma idéia tola, mas provavelmente um matemático tem a melhor chance que pode existir de obtê-la.” (G.H.Hardy) Módulo 6 – Moda e Mediana através de fórmulas Se os dados de uma variável quantitativa estão dispostos em uma tabela agrupada em classes, e não há acesso aos dados originais, é possível encontrar a moda e a mediana por vários procedimentos. Já vimos que a moda e a mediana bruta são simplesmente o ponto médio da classe de maior freqüência, ou seja, a classe modal ou a classe mediana. No entanto, para se obter uma moda mais exata, existem várias fórmulas. Normalmente o cálculo através de fórmulas, é feito por três recomendações diferentes, que são as formulas de Czuber, King e Pearson. O termo recomendação, é usado por se tratar de resultados aproximados, diferente de equacionamento matemático, pois decorre de estudos, normalmente empíricos, que apresentam validade prática, mas não exatidão matemática. Moda de King: O cálculo da moda, através da recomendação de king leva em conta a influência das classes adjacentes à classe modal, "deslocando" a moda em direção aquelas. A fórmula para cálculo da moda de King é: Li é o limite inferior da classe modal; Aclasses é a amplitude das classes; fpost é a freqüência da classe imediatamente posterior à classe modal; fant é a freqüência da classe imediatamente anterior à classe modal. Observações: _ Quando a classe modal for a primeira basta fazer fant = 0 e, quando for a última devemos fazer fpost = 0 e aplicar a fórmula; _ A série pode ser plurimodal, para evitar esta ocorrência, o que deve ser bem recebido, é tentar mudar a amplitude h dos intervalos e recalcular as novas frequências quando se tem o rol. Exemplo: www.profrichard.com.br Estatística Descritiva 25 OBS.: Repare que o valor da moda bruta (28,5) foi deslocado para cima (28,7143) porque a freqüência da classe imediatamente posterior à modal é maior do que a da classe imediatamente anterior. Fórmula da Mediana para Dados Agrupados com Intervalos de Classe Se os dados de uma variável quantitativa estão dispostos em uma tabela agrupada em classes, e não há acesso aos dados originais, é possível encontrar a mediana através de uma fórmula. 𝑀𝑒 = 169 + (25 − 22) ∙ 3 9 = 𝟏𝟕𝟎 Atividades do Módulo: 6 – Moda e Mediana através de fórmulas 1) Determinar, pela fórmula, a moda da distribuição apresentada a seguir. www.profrichard.com.br Estatística Descritiva 26 2) Determinar, pela fórmula, a moda da distribuição apresentada a seguir. 3) Determinar, pela fórmula, a mediana da distribuição apresentada a seguir. 4) Determinar, pela fórmula, a mediana da distribuição apresentada a seguir. Respostas do Módulo 6: 1) 828,00 2) 35,45 3) 824,00 4) 34,29 “DEUS É O GEÔMETRA ONIPOTENTE PARA QUEM O MUNDO É IMENSO PROBLEMA MATEMÁTICO.” (LEIBNIZ) “Zero, esse nada que é tudo.” (LAISANT) Módulo 7 – M E D I D A S D E D I S P E R S à O Vimos que um conjunto de valores pode ser convenientemente sintetizado, por meio de procedimentos matemáticos, em poucos valores representativos, tais como: média aritmética, mediana e moda. www.profrichard.com.br Estatística Descritiva 27 No entanto, quando se trata de interpretar dados estatísticos, mesmo aqueles já convenientemente simplificados, é necessário ter-se uma idéia retrospectiva de como se apresentavam esses mesmos dados nas tabelas. Para qualificar os valores de uma dada variável, ressaltando a maior ou menor dispersão ou variabilidade entre esses valores e a sua medida de posição, a Estatística recorre às medidas de dispersão ou de variabilidade. Pois são necessários dois tipos de medidas para descrever adequadamente um conjunto de dados. Além da informação quanto ao “meio” de um conjunto de números (estudado em medidas de tendência central), precisamos saber também a dispersão desses dados. As medidas de dispersão indicam se os valores estão relativamente próximos uns dos outros, ou separados. Essas dispersões tem como ponto de referência as medidas de tendência central. O valor zero indica a ausência de dispersão e quanto maior o valor, maior a dispersão. Ou seja, as medidas de dispersão ou de afastamento são medidas estatísticas utilizadas para verificar o quanto os valores encontrados em uma pesquisa estão dispersos ou afastados em relação à média ou em relação à mediana. Para avaliar o grau de variabilidade ou de dispersão são utilizadas as chamadas medidas de dispersão. Dessas medidas, estudaremos a amplitude, a variância, o desvio padrão e o coeficiente de variação. Amplitude Total (A): é a diferença entre o maior e o menor valor de uma série de dados. Quanto maior a amplitude total, maior a dispersão ou variabilidade dos valores da variável. Exemplo: No conjunto de números 4 , 6 , 8 , 9 , 12 , 17, 20, calcule a Amplitude. A = maior valor – menor valor A = 20 – 4 A = 16 Alternativamente, pode-se dizer que o intervalo de valores vai de 4 a 20. No caso de termos uma distribuição de frequência com intervalos de classe, calculamos a Amplitude total, pela diferença entre o limite superior da última classe e o limite inferior da primeira classe. O fato do intervalo só levar em conta dois valores extremos de um conjunto, nada informando quanto aos outros valores, torna sua utilização bastante limitada. Variância: É a média dos quadrados dos desvios dos valores a contar da média. Utiliza-se a letra grega sigma minúsculo elevado a 2 “σ²” para a variância de uma população de N elementos. E, a variância de uma amostra de n elementos é representada pela letra esse minúscula elevado a 2 “s²”. O símbolo da variância é elevado a 2, porque essa medida de dispersão exprime em quadrados de www.profrichard.com.br Estatística Descritiva 28 unidades os valores observados e a média deles, ou seja, se estivermos calculando uma dispersão de comprimento em cm, a variância será obtida em cm². Por isso, também não é muito utilizada como medida de dispersão, mas o cálculo da variância é usado para se obter o desvio padrão, que é a medida de dispersão mais utilizada. Fórmula para a variância amostral: 𝑠2 = ∑(𝑥𝑖 − �̅�) 2 𝑛 − 1 Substitui-se “n-1” por “n” no denominador para a variância da população, ou quando a finalidade é apenas descrever os dados e não fazer uma inferência sobre uma população. Nesse curso, usaremos “n”, somente quando o exercício mencionar que os dados são populacionais, ou seja, quando o exercício não mencionar se os dados são populacionais ou amostrais, vamos considerá-los amostrais e usar n-1. Exemplo 1: Calcule a variância para os valores amostrais 5; 7 e 9. Primeiro calculamos a média aritmética entre os valores: �̅� = ∑ 𝑥 𝑛 → �̅� = 5+7+9 3 = 7 Em seguida aplicamos a fórmula da variância: 𝑠2 = ∑(𝑥𝑖 − �̅�) 2 𝑛 − 1 = (5 − 7)2 + (7 − 7)2 + (9 − 7)2 3 − 1 = 4 + 0 + 4 2 = 8 2 = 4 Resposta: A variância entre os valores 5; 7 e 9 é 4. Exemplo 2: Calcule a variância para a distribuição de frequência abaixo: Valor f 3 6 5 11 9 3 Total 20 Primeiro calculamos a média aritmética entre os valores: �̅� = ∑(𝑥𝑖∙𝑓𝑖) ∑ 𝑓𝑖 → �̅� = (3∙6)+(5∙11)+(9∙3) 20 = 18+55+27 20 = 100 20 = 5 Em seguida aplicamos a fórmula da variância para a distribuição de frequência: 𝑠2 = ∑(𝑥𝑖 − �̅�) 2𝐹𝑖 ∑ 𝑓𝑖 − 1 = (3 − 5)2 ∙ 6 + (5 − 5)2 ∙ 11 + (9 − 5)2 ∙ 3 20 − 1 = 4 ∙ 6 + 0 ∙ 11 + 16 ∙ 3 19 = 24 + 0 + 48 19 = 72 19 = 3,79 Se a tabela for com intervalo de classe, basta usar os valores dos pontos médios. Exemplo 3: Calcule a variância para a distribuição de frequência abaixo: Valor f 1 ├ 5 6 5 ├ 9 11 9 ├ 13 3 Total 20 Primeiro calculamos a média: �̅� = ∑(𝑃𝑀∙𝑓𝑖)∑ 𝑓𝑖 → �̅� = (3∙6)+(7∙11)+(11∙3) 20 = 18+77+33 20 = 128 20 = 6,4 Em seguida, calculamos a variância: www.profrichard.com.br Estatística Descritiva 29 𝑠2 = ∑(𝑃𝑀 − �̅�)2𝐹𝑖 ∑ 𝑓𝑖 − 1 = (3 − 6,4)2 ∙ 6 + (7 − 6,4)2 ∙ 11 + (11 − 6,4)2 ∙ 3 20 − 1 = 69,36 + 3,96 + 63,48 19 = 136,8 19 = 7,2 A variância baseia-se nos desvios em torno da média aritmética, porém determinando a média aritmética dos quadrados dos desvios. Ela é um número em unidade quadrada em relação à variável em questão, o que, sob o ponto de vista prático, é um inconveniente. Por isso, imaginou-se uma nova medida que tem utilidade e interpretação práticas, denominada desvio padrão. Desvio Padrão: Utiliza-se a letra grega sigma minúsculo “σ” para o desvio padrão de uma população de N elementos. E, o desvio padrão de uma amostra de n elementos é representada pela letra esse minúscula “s”. O desvio padrão é simplesmente a raiz quadrada da variância. 𝑠 = √𝑠2 O desvio padrão é a medida de dispersão mais utilizada, desempenha papel relevante em toda a estatística e a sua unidade é a mesma da média. O desvio padrão dá uma idéia de como os valores de uma amostra estão dispersos em relação à média. Quanto maior o desvio padrão, maior é a dispersão dos valores em relação à média. Um desvio padrão igual a zero indica que todos os valores são iguais à média. Se você já leu um artigo científico com certeza deve ter percebido que os resultados geralmente são apresentados por meio da média aritmética. E logo em seguida a média, é apresentado um outro número, que curiosamente é precedido pelo símbolo de "mais ou menos". Exatamente como na tabela abaixo: Pois bem, este número depois do "mais ou menos" é o Desvio Padrão, que indica a dispersão dos dados dentro da amostra. Isto é: o quanto os resultados diferem da média. Por isso que ele sempre é apresentado junto da média. Um não faz sentido sem o outro. É importante ter em mente que quanto menor o desvio padrão, mais homogênea é a minha amostra. Em termos de pesquisas científicas, é isso que desejamos em nossos resultados. Na tabela acima, a média da velocidade da marcha dos homens foi de 1,1m/s e o Desvio Padrão foi de 0,13m/s. Isso significa que, no geral, boa parte da minha amostra caminha com uma velocidade entre 0,97 m/s e 1,23 m/s. Enfim, quando eu adiciono o Desvio Padrão a interpretação dos meus números, eu tenho idéia de quanto a velocidade da minha amostra varia em torno da média. Assumindo que nossa amostra possui uma distribuição normal e simétrica, (estudaremos isso em distribuição normal de probabilidades), o desvio padrão dá uma ideia de quanto os valores da amostra variam em torno da média, da seguinte maneira: Se calcularmos 1 desvio padrão acima e abaixo da média da tabela: média = 1,1 m/s; 1 desvio padrão abaixo da média = 0,97m/s e 1 desvio padrão acima da média = 1,23m/s, Podemos www.profrichard.com.br Estatística Descritiva 30 afirmar que aproximadamente 68% da minha amostra terá a velocidade da marcha dentro deste intervalo. Se eu quiser ir mais longe e calcular 2 desvios padrões, a porcentagem da minha amostra que se encontra dentro do intervalo subirá para 95%. Se eu calcular 3 desvios, esse valor sobre para 99%, veja na figura abaixo. A linha central simboliza a média e as áreas rachuradas os respectivos desvios padrão: A figura acima da curva normal ou curva de Gauss será estudada na próxima aula. Coeficiente de Variação (CV): O Índice de Variabilidade (IV) ou o Coeficiente de Variação (CV) é a razão entre o desvio padrão e a média, o resultado normalmente é multiplicado por 100 para que o coeficiente seja dado em porcentagem. O CV é utilizado quando dois grupos apresentam mesmo desvio padrão e médias diferentes, ou para se comparar duas ou mais séries de valores, quanto a sua dispersão ou variabilidade, quando expressas em unidades diferentes, ou ainda quando duas médias forem muito distantes. O Coeficiente de Variação (CV), é uma medida relativa de dispersão, onde a variabilidade, através do desvio padrão, é comparada com sua média, através da relação abaixo: CV= 𝑠 �̅� ∙ 100 Onde s é o desvio padrão, �̅� é a média aritmética e o fator 100 é utilizado para apresentar a resposta na forma percentual. Normalmente, dizemos que um CV abaixo de 15% indica um grupo de dados com baixa dispersão. Um CV acima de 30% representa uma alta dispersão dos dados e, entre esses valores, o CV representa uma dispersão média. Exemplo 1: A análise de dois grupos diferentes de dados foi realizada e eles apresentaram o mesmo desvio padrão, mas valores médios diferentes: Grupo 1: (3; 1 e 5) → �̅� = 3; s² = 4 e s = 2 www.profrichard.com.br Estatística Descritiva 31 Grupo 2: (55; 57 e 53) → �̅� = 55; s² = 4 e s = 2 Qual deles possui maior dispersão? Vamos obter as variabilidades com relação as médias, através do cálculo dos coeficientes de variação para cada grupo: Grupo 1: 𝐶𝑉 = 2 3 ∙ 100 = 66,7% (o desvio padrão é um percentual grande, comparado com o valor médio) Grupo 2: 𝐶𝑉 = 2 55 ∙ 100 = 3,64% (o desvio padrão é um percentual pequeno, comparado com o valor médio) Observe que: _ Para o Grupo 1, o desvio padrão corresponde a 66,7% da média; _ Para o Grupo 2, o desvio padrão corresponde a 3,64% da média; Podemos concluir que: O Grupo 1 possui maior dispersão do que o Grupo 2 Exemplo 2: (Grupos com unidades diferentes) Ao medir a variabilidade das alturas em cm e comparar com a variabilidade das massas em kg dos alunos. Os resultados foram: Alturas: s = 15 cm e �̅� = 165 cm Massas: s = 10 kg e �̅� = 65 kg Pela comparação direta dos desvios chegaríamos a conclusão que as alturas tem mais variabilidade do que as massas. Mas obtendo o CV: Alturas: CV = 9,1% Massas: CV = 15,4% Concluímos que: As massas tem maior variabilidade que as alturas. Exemplo 3: (Grupos com mesmas unidades, porém com médias distantes) Imagine que desejamos comparar a variabilidade das massas de adultos com as de recém-nascidos: Adultos: s = 10 kg , �̅� = 65 kg e CV = 15,4% Recém-nascidos: s = 1 kg , �̅� = 3 kg e CV = 33,3% Analogamente ao exemplo 2, a comparação das variabilidades através do desvio nos levaria a decisão contrária, pois a maior variabilidade ocorreu entre os recém-nascidos. E X E R C Í C I O S 1) Calcule a amplitude, a variância e o desvio padrão dos valores: 4, 5, 6, 8, 9, 10 2) Calcule o desvio padrão para a tabela abaixo: Idade 14 15 16 17 18 19 20 Freqüência 7 6 1 2 1 0 4 www.profrichard.com.br Estatística Descritiva 32 3) Calcule a amplitude e o desvio padrão da tabela abaixo: Estaturas (cm) Frequência 150 ├ 154 9 154 ├ 158 9 158 ├ 162 11 162 ├ 166 8 166 ├ 170 5 170 ├ 174 3 4) Em um treinamento de salto em altura, os atletas realizaram 4 saltos cada um. Veja as marcas obtidas por três atletas e responda: * atleta A: 148cm, 170cm, 155cm, 131cm. * atleta B: 145cm, 151cm, 150cm, 152cm. * atleta C: 146cm, 151cm, 143cm, 160cm. a) Qual deles obteve a melhor média? b) Qual deles foi o mais regular? 5) Calcule o CV das medidas das estaturas e dos pesos do grupo de indivíduos abaixo e responda qual apresenta o maior grau de dispersão. Média Desvio Padrão ESTATURAS 175 cm 5 cm MASSAS 68 kg 2 kg 6) Um grupo de 100 estudantes tem uma estatura média de 163,8 cm, com um coeficiente de variação de 3,3%. Qual o desvio padrão desse grupo? 7) Uma distribuição apresenta as seguintes estatísticas: s = 1,5 e CV = 2,9%. Determine a média da distribuição. Gabarito: 1)A = 6, s² = 5,6 e s = 2,36 2)2,28 3)24 e 6,03 4)O atleta A obteve a maior média, 151 cm. O atleta B foi o mais regular, pois seu desvio padrão é o menor, aproximadamente 3,1 cm. 5)As massas apresentam maior grau de dispersão 2,94%, sendo o das estaturas de 2,86% 6)5,41 7)51,72 “A MATEMÁTICAÉ A RAINHA DAS CIÊNCIAS. A ARITMÉTICA É A RAINHA DA MATEMÁTICA.” FRIDRICH GAUSS “Os cálculos substituem o pensamento, enquanto a geometria o estimula.” Jacob Steiner Módulo 8 – P R O B A B I L I D A D E S A probabilidade serve para calcular a chance de algo acontecer. Seu estudo, assim como o da Análise Combinatória, teve origem nos jogos de azar, onde as pessoas queriam saber qual o melhor modo de jogar, para aumentar sua chance de vitória. Devido a essa origem, os exemplos e exercícios de probabilidade que encontramos nos livros didáticos, envolvem moedas, dados e baralhos. Infelizmente ainda faltam livros com boa quantidade de exercícios contextualizados nas situações reais do nosso dia a dia. Mas, as regras aqui ensinadas através de exercícios de jogos de azar, são as mesmas utilizadas em cálculos das áreas de Exatas, Biológicas e até de Humanas. Os modelos probabilísticos são úteis em várias áreas do conhecimento humano e, atualmente a probabilidade desempenha papel importante em muitas situações que envolvam uma tomada de decisão. www.profrichard.com.br Estatística Descritiva 33 Aleatoriedade: Ao jogarmos uma moeda, não podemos prever o resultado, mas, ainda assim, há um certo padrão regular nos resultados, padrão este que se evidencia somente após muitas repetições. Por exemplo, a proporção de jogadas de uma moeda que dão “cara” varia quando fazemos mais e mais jogadas, mas tende para 50% (0,5), que é a probabilidade de “cara”. Este fato notável é o fundamento da idéia de probabilidade, veja: _ O naturalista francês Conde de Buffon (1707-1788) jogou uma moeda 4.040 vezes. Resultado: 2.048 caras, ou seja uma proporção de 2.048/4.040 = 0,5069 caras; _ Quando estava prisioneiro dos alemães durante a 2ª guerra mundial, o matemático John Kerrich jogou uma moeda 10.000 vezes. Resultado: 5.067 caras, ou seja uma proporção de 0,5067; _ Por volta de 1900, o estatístico inglês Karl Pearson heroicamente jogou uma moeda 24.000 vezes. Resultado: 12.012 caras, ou seja uma proporção de 0,5005. A teoria da probabilidade surgiu para tentar medir a “chance” de ocorrer um determinado resultado, num experimento aleatório. Numa experiência com vários resultados possíveis, todos com a “mesma chance”, dizemos que: _ Ponto Amostral: é qualquer um dos resultados possíveis. _ Espaço Amostral (S): é o conjunto de todos os resultados possíveis. _ Evento (E): é qualquer subconjunto do espaço amostral. Também dizemos que n(S) é o número de elementos de S. E n(E) é o número de elementos de E. Em quase tudo, em maior ou menor grau, vislumbramos o acaso. Fenômenos onde o resultado final depende do acaso são chamados fenômenos aleatórios ou experimentos aleatórios. Experimentos ou fenômenos aleatórios são aqueles que, mesmo repetidos várias vezes sob condições semelhantes, apresentam resultados imprevisíveis, como por exemplo, o lançamento de um mesmo dado repetidas vezes. Espaço Amostral: A cada experimento correspondem, em geral, vários resultados possíveis. Assim, ao lançarmos uma moeda, há dois resultados possíveis: ocorrer cara ou ocorrer coroa. Já ao lançarmos um dado, há seis resultados possíveis: 1, 2, 3, 4, 5 ou 6. Os dois experimentos citados têm os seguintes espaços amostrais: - lançamento de uma moeda: S = {Ca, Co}; - lançamento de um dado: S = {1,2,3,4,5,6}. Cálculo da Probabilidade: A probabilidade de ocorrer o evento E, representada por P(E), de um espaço amostral S ≠ ᴓ, é o quociente entre o número de elementos de E e o número de elementos de S. Simbolicamente: 𝑷(𝑬) = 𝒏(𝑬) 𝒏(𝑺) Ou seja, 𝑷𝒓𝒐𝒃𝒂𝒃𝒊𝒍𝒊𝒅𝒂𝒅𝒆 𝒅𝒆 𝒐𝒄𝒐𝒓𝒓𝒆𝒓 𝑬 = 𝒏ú𝒎𝒆𝒓𝒐 𝒅𝒆 𝒄𝒂𝒔𝒐𝒔 𝒇𝒂𝒗𝒐𝒓á𝒗𝒆𝒊𝒔 𝒂 𝑬 𝒏ú𝒎𝒆𝒓𝒐 𝒅𝒆 𝒄𝒂𝒔𝒐𝒔 𝒑𝒐𝒔𝒔í𝒗𝒆𝒊𝒔 𝑺 Cada elemento de S que corresponde a um resultado recebe o nome de ponto amostral. Probabilidade é a possibilidade de que certo caso aconteça, a qual é calculada em matemática pela razão entre o número de casos favoráveis e o número total de casos possíveis. www.profrichard.com.br Estatística Descritiva 34 Exemplo 1: No lançamento de um dado cúbico, com lados numerados de 1 a 6, qual a probabilidade de obtermos resultado igual a 5? 𝑷(𝟓) = 𝟏 𝟔 ≅ 𝟎, 𝟏𝟔𝟕 ≅ 𝟏𝟔, 𝟕% Exemplo 2: No lançamento de um dado cúbico, com lados numerados de 1 a 6, qual a probabilidade de obtermos resultado maior que 4? 𝑷(𝒏ú𝒎𝒆𝒓𝒐 𝒎𝒂𝒊𝒐𝒓 𝒒𝒖𝒆 𝟒) = 𝟐 𝟔 = 𝟏 𝟑 ≅ 𝟎, 𝟑𝟑𝟑𝟑 ≅ 𝟑𝟑, 𝟑𝟑% Exemplo 3: No lançamento de dois dados cúbicos, com lados numerados de 1 a 6, qual a probabilidade de obtermos soma dos resultados igual a 8? 𝑷(𝒔𝒐𝒎𝒂 𝒊𝒈𝒖𝒂𝒍 𝒂 𝟖) = 𝟓 𝟑𝟔 ≅ 𝟎, 𝟏𝟑𝟖𝟗 ≅ 𝟏𝟑, 𝟖𝟗% Eventos Complementares: Sabemos que um evento pode ocorrer ou não. Sendo A a probabilidade de que ele ocorra (sucesso) e Ā a probabilidade de que ele não ocorra (fracasso), para um mesmo evento existe sempre a relação: P(A) + P(Ā) = 1 ➔ P(Ā) = 1 – P(A) Assim, se a probabilidade de se realizar o evento é P(A) = 1/5, a probabilidade de que ele não ocorra é P(Ā) = 4/5. Exemplo 4: No lançamento de um dado cúbico, com lados numerados de 1 a 6, sabemos que a probabilidade de sair o número 4 é P(A) = 1/6. Qual a probabilidade de não sair o número 4? A probabilidade de não sair o 4 no lançamento de um dado é: P(Ā) = 1 – 1/6 = 5/6, nesse caso, não há necessidade de fazer o cálculo: 𝑷(𝒏ã𝒐 𝒔𝒂𝒊𝒓 𝒐 𝟒) = 𝟓 𝟔 ≅ 𝟎, 𝟖𝟑𝟑𝟑 ≅ 𝟖𝟑, 𝟑𝟑% Eventos Independentes: Dizemos que dois eventos são independentes quando a realização ou a não-realização de um dos eventos não afeta a probabilidade de realização do outro e vice-versa. Por exemplo, quando lançamos dois dados, o resultado obtido em um deles independe do resultado obtido no outro. Se dois eventos são independentes, a probabilidade de que eles se realizem simultaneamente é igual ao produto das probabilidades de realização dos dois eventos. 𝐏(𝐀 ∩ 𝐁) = P(A) • P(B) Exemplo 5: No lançamento de dois dados cúbicos, com lados numerados de 1 a 6, qual a probabilidade de obtermos 4 no primeiro dado e número ímpar no segundo dado? A probabilidade de obtermos, simultaneamente, 4 no primeiro e número ímpar no segundo é: 𝑷(𝒔𝒂𝒊𝒓 𝒐 𝟒 𝒆 𝒔𝒂𝒊𝒓 𝒏º í𝒎𝒑𝒂𝒓) = 𝟏 𝟔 ∙ 𝟑 𝟔 = 𝟑 𝟑𝟔 = 𝟏 𝟏𝟐 ≅ 𝟎, 𝟎𝟖𝟑𝟑𝟑 ≅ 𝟖, 𝟑𝟑% www.profrichard.com.br Estatística Descritiva 35 A probabilidade de que um e outro se realize é igual ao produto das probabilidades de que cada um deles se realize. Eventos mutuamente exclusivos: Dizemos que dois ou mais eventos são mutuamente exclusivos quando a realização de um exclui a realização do(s) outro(s). Assim, no lançamento de uma moeda, o evento “tirar cara” e o evento “tirar coroa” são mutuamente exclusivos, já que, ao se realizar um deles, o outro não se realiza. Se dois eventos são mutuamente exclusivos, a probabilidade de que um ou outro se realize é igual à soma das probabilidades de que cada um deles se realize: P(A U B) = P(A) + P(B) Exemplo 6: No lançamento de um dado cúbico, com lados numerados de 1 a 6, qual a probabilidade de sair o 6 ou sair um número menor que 4? 𝑷(𝒔𝒂𝒊𝒓 𝒐 𝟔 𝒐𝒖 𝒔𝒂𝒊𝒓 𝒏º 𝒎𝒆𝒏𝒐𝒓 𝒒𝒖𝒆 𝟒) = 𝟏 𝟔 + 𝟑 𝟔 = 𝟒 𝟔 = 𝟐 𝟑 ≅ 𝟎, 𝟔𝟔𝟔𝟕 ≅ 𝟔𝟔, 𝟔𝟕% Eventos não mutuamente exclusivos: Como vimos anteriormente em Eventos mutuamente exclusivos “ou” P(A U B) = P(A) + P(B), não existem elementos, que pertençam simultaneamente a P(A) e a P(B). Quando existirem elementos que pertencerem simultaneamente a P(A) e a P(B), devemos subtrair esses elementos (essa intersecção), para não contá-los duas vezes, ou seja: 𝐏(𝐀 ∪ 𝐁) = 𝐏(𝐀) + 𝐏(𝐁) − 𝐏(𝐀 ∩ 𝐁) Exemplo 7: No lançamento simultâneo de dois dados cúbicos, com lados numerados de 1 a 6, observando as possibilidades de resultados de ambos os dados, qual é a probabilidade de ocorrer números iguais nos dois dados ou soma dos resultados igual a 6?Se A for o evento “números iguais nos dois dados” e B o evento “soma dos resultados igual a 6”, temos: n(A) = 6, n(B) = 5, n(𝐀 ∩ 𝐁) = 1, pois existe o evento (3; 3), o qual está sendo contado duas vezes, como n(S) = 36, temos: 𝐏(𝐀 ∪ 𝐁) = 𝐏(𝐀) + 𝐏(𝐁) − 𝐏(𝐀 ∩ 𝐁) 𝐏(𝐀 ∪ 𝐁) = 𝟔 𝟑𝟔 + 𝟓 𝟑𝟔 − 𝟏 𝟑𝟔 = 𝟏𝟎 𝟑𝟔 = 𝟓 𝟏𝟖 Probabilidade condicional: Dados dois eventos, A e B, a probabilidade de que o evento B ocorra, dado que o evento A já ocorreu, é a probabilidade condicionada de B, escrita por P(B/A). Similarmente, escrevemos a probabilidade da ocorrência de A, condicionada a ocorrência de B, como P(A/B) (lê-se: probabilidade de A dado que B tenha ocorrido, ou probabilidade A condicionada à ocorrência B). Exemplo 8: No lançamento de um dado cúbico, com lados numerados de 1 a 6, qual a probabilidade de obtermos resultado igual a 5, sabendo que o resultado é um número maior que 4? 𝑷(𝟓 / 𝒏º 𝒎𝒂𝒊𝒐𝒓 𝒒𝒖𝒆 𝟒) = 𝟏 𝟐 = 𝟎, 𝟓 = 𝟓𝟎% www.profrichard.com.br Estatística Descritiva 36 R E S U M O G E R A L D A S R E G R A S D E P R O B A B I L I D A D E ▪ Regra da Adição “ou”: _ Para eventos mutuamente exclusivos (quando a realização de um exclui a realização do outro): P(A ou B ocorrerá) → P(A U B) = P(A) + P(B) _ Para eventos NÃO mutuamente exclusivos (é possível a realização conjunta de ambos “A e B”): P(A ou B ou ambos ocorrerão) → 𝐏(𝐀 ∪ 𝐁) = 𝐏(𝐀) + 𝐏(𝐁) − 𝐏(𝐀 ∩ 𝐁) ▪ Regra da Multiplicação “e”: _ Para eventos independentes (quando a ocorrência ou não de um evento, não influencia na ocorrência do outro): P(A e B ocorrerá) → 𝐏(𝐀 ∩ 𝐁) = P(A) • P(B) ▪ Regra para eventos dependentes “probabilidade condicional” (a probabilidade de que o evento A ocorra, dado que o evento B já ocorreu) → 𝑃(𝐴 /𝐵) = 𝑃(𝐴∩𝐵) 𝑃(𝐵) E X E R C Í C I O S R E S O L V I D O S 1) Numa empresa, 5 pessoas trabalham na área administrativa, 10 trabalham na área técnica e 35 trabalham na produção. Um brinde será sorteado entre os funcionários, qual a probabilidade de um funcionário da área técnica ganhar? Podemos chamar de P(técnica) a probabilidade em questão, ou apenas P. 𝑷 = 𝟏𝟎 𝟓𝟎 A resposta final, pode ser dada na forma acima, ou através de fração simplificada: 𝑷 = 𝟏 𝟓 Ou através de um número decimal: 𝑷 = 𝟎, 𝟐 Ou através de porcentagem: 𝑷 = 𝟐𝟎% 2) Considerando as informações do exercício anterior, calcule a probabilidade do brinde não sair para um funcionário da área técnica. No exercício 1, descobrimos que a probabilidade de um funcionário da área técnica ganhar é 20%, logo a probabilidade dos funcionários dessa área não ganharem, é 80%. Uma vez que o total equivale a 100%. Isso é chamado de evento complementar. Mas, podemos fazer o cálculo: 𝑷 = 𝟒𝟎 𝟓𝟎 = 𝟖𝟎% 3) Numa empresa, 5 pessoas trabalham na área administrativa, 10 trabalham na área técnica e 35 trabalham na produção. a) Dois brindes serão sorteados entre os funcionários, qual a probabilidade dos brindes saírem para o setor de produção? 𝑷 = 𝟏° 𝒔𝒐𝒓𝒕𝒆𝒊𝒐 (𝒑𝒓𝒐𝒅𝒖çã𝒐) 𝒆 𝟐° 𝒔𝒐𝒓𝒕𝒆𝒊𝒐(𝒑𝒓𝒐𝒅𝒖çã𝒐) www.profrichard.com.br Estatística Descritiva 37 𝑷 = 𝟑𝟓 𝟓𝟎 ∙ 𝟑𝟓 𝟓𝟎 = 𝟑𝟓 ∙ 𝟑𝟓 𝟓𝟎 ∙ 𝟓𝟎 = 𝟏𝟐𝟐𝟓 𝟐𝟓𝟎𝟎 = 𝟒𝟗% Aqui temos dois sorteios, o primeiro e o segundo. O e, indica multiplicação. Isso é chamado de eventos independentes. b) Dois brindes serão sorteados entre os funcionários, de modo que um mesmo funcionário, não possa ganhar os dois brindes, qual a probabilidade dos brindes saírem para funcionários da produção? 𝑷 = 𝟏° 𝒔𝒐𝒓𝒕𝒆𝒊𝒐 (𝒑𝒓𝒐𝒅𝒖çã𝒐: 𝒕𝒐𝒅𝒐𝒔) 𝒆 𝟐° 𝒔𝒐𝒓𝒕𝒆𝒊𝒐 (𝒑𝒓𝒐𝒅𝒖çã𝒐: 𝒎𝒆𝒏𝒐𝒔 𝒐 𝒒𝒖𝒆 𝒋á 𝒇𝒐𝒊 𝒔𝒐𝒓𝒕𝒆𝒂𝒅𝒐) 𝑷 = 𝟑𝟓 𝟓𝟎 ∙ 𝟑𝟒 𝟒𝟗 = 𝟑𝟓 ∙ 𝟑𝟒 𝟓𝟎 ∙ 𝟒𝟗 = 𝟏𝟏𝟗𝟎 𝟐𝟒𝟓𝟎 = 𝟒𝟖, 𝟓𝟕% A primeira fração, refere-se ao primeiro sorteio e o funcionário que ganhou, deve ser retirado da fração do segundo sorteio. 4) Numa empresa, 5 pessoas trabalham na área administrativa, 10 trabalham na área técnica e 35 trabalham na produção. Dois brindes serão sorteados entre os funcionários, qual a probabilidade de o primeiro brinde sair para um funcionário da área administrativa e o segundo sair para um funcionário da produção? 𝑷 = 𝟏° 𝒔𝒐𝒓𝒕𝒆𝒊𝒐 (𝒂𝒅𝒎) 𝒆 𝟐° 𝒔𝒐𝒓𝒕𝒆𝒊𝒐 (𝒑𝒓𝒐𝒅𝒖çã𝒐) 𝑷 = 𝟓 𝟓𝟎 ∙ 𝟑𝟓 𝟓𝟎 = 𝟓 ∙ 𝟑𝟓 𝟓𝟎 ∙ 𝟓𝟎 = 𝟏𝟕𝟓 𝟐𝟓𝟎𝟎 = 𝟕% A probabilidade de que um e outro se realize é igual ao produto das probabilidades de que cada um deles se realize. Isso é chamado de eventos independentes. 5) Numa empresa, 5 pessoas trabalham na área administrativa, 10 trabalham na área técnica e 35 trabalham na produção. Um brinde será sorteado entre os funcionários, qual a probabilidade do ganhador ser um funcionário da área técnica ou da produção? 𝑷 = 𝑷(𝒕é𝒄𝒏𝒊𝒄𝒂) 𝒐𝒖 𝑷(𝒑𝒓𝒐𝒅𝒖çã𝒐) 𝑷 = 𝟏𝟎 𝟓𝟎 + 𝟑𝟓 𝟓𝟎 = 𝟏𝟎 + 𝟑𝟓 𝟓𝟎 = 𝟒𝟓 𝟓𝟎 = 𝟗𝟎% Aqui temos a preposição ou, que indica adição. A probabilidade de que um ou outro se realize é igual à soma das probabilidades de que cada um deles se realize. Isso é chamado de eventos mutuamente exclusivos. 6) Numa pesquisa com 400 jovens, verificou-se que 200 estudam e 180 trabalham, sendo que dentre esses jovens, 130 estudam e trabalham, qual a probabilidade de que um desses jovens, escolhido ao acaso, estude ou trabalhe? 𝑷 = 𝟐𝟎𝟎 𝟒𝟎𝟎 + 𝟏𝟖𝟎 𝟒𝟎𝟎 − 𝟏𝟑𝟎 𝟒𝟎𝟎 = 𝟐𝟓𝟎 𝟒𝟎𝟎 = 𝟔𝟐, 𝟓% Nesse exemplo, os jovens que estudam e trabalham foram contados 2 vezes (na primeira fração daqueles que estudam e na segunda fração, daqueles que trabalham), por isso devem ser subtraídos. Quando temos a preposição ou (soma), temos que verificar se algo está sendo contado 2 vezes e então subtrair. Isso é chamado de eventos NÃO mutuamente exclusivos. 7) Numa turma de 100 alunos do 1º semestre de uma Universidade, 30 são homens. Dentre esses 100 alunos, 40 cursarão contabilidade, sendo 25 deles homens. Um aluno é sorteado www.profrichard.com.br Estatística Descritiva 38 ao acaso, qual é a probabilidade dele cursar contabilidade, sabendo que foi sorteado uma mulher? 𝑷 = 𝟏𝟓 𝟕𝟎 = 𝟑 𝟏𝟒 = 𝟐𝟏, 𝟒𝟑% No exemplo acima, como o exercício informa que o aluno sorteado é mulher, o total de possibilidades se reduz de 100 para 70, ou seja, refere-se à probabilidade de ocorrer um evento, sabendo que um outro evento já ocorreu. Isso é chamado de Probabilidade condicional. E X E R C Í C I O S P R O P O S T O S 1) O departamento de controle de qualidade de uma fábrica de eletrodomésticos constatou que 17 liquidificadores de um lote de 100, enviados para uma mesma loja, poderiam apresentar falhas no motor. Qual a probabilidade de um cliente dessa loja adquirir um dos liquidificadores com defeito? 2) Em um lote de 12 peças, 4 são defeituosas. Sendo retirada uma peça, calcule: a) a probabilidade dessa peça ser defeituosa. b) a probabilidade dessa peça não ser defeituosa. 3) Num lote de 12 peças, quatro são defeituosas. Nesse caso, considerando que 3 peças são retiradas aleatoriamente, uma após a outra, sem reposição, encontre a probabilidade de todas essas peças retiradas serem não defeituosas. 4) Uma loja dispõe de 12 geladeiras do mesmo tipo, das quais 4 apresentam defeitos. a) Se um freguês comprar uma geladeira, qual a probabilidade de levar uma geladeira defeituosa? b) Se um freguês comprar duas geladeiras, qual a probabilidade de levar as duas defeituosas? c) Se um freguês vai comprar duas geladeiras, qual a probabilidade de levar pelo menos uma defeituosa? 5) Num conjunto de 100 parafusos, 90 deles estão em boas condições. Dois deles são retirados, sucessivamente, ao acaso, sem reposição. Qual é a probabilidade de que o 1º parafusodefeituoso seja encontrado na 2ª retirada? 6) Um lote de peças para automóveis contém 60 peças novas e 10 usadas. Escolhe-se uma peça ao acaso e, em seguida, sem reposição da primeira, uma outra é retirada. Determine a probabilidade de: a) as duas peças serem usadas; b) a primeira ser nova e a segunda usada. 7) O departamento de controle de qualidade de uma metalúrgica avaliou 400 peças do tipo A e 600 do tipo B, concluindo que 72 do tipo A e 113 do tipo B apresentaram medidas fora da especificação; 48 do tipo A e 67 do tipo B apresentaram avarias; e 280 do tipo A e 420 do tipo B estavam perfeitas. Após essa avaliação, o chefe do departamento escolheu, ao acaso, uma dessas peças, constatando que era perfeita. Qual é a probabilidade de que a peça escolhida seja do tipo B. Medidas fora de especificação Avarias Perfeitas Peça do tipo A 72 48 280 Peça do tipo B 113 67 420 www.profrichard.com.br Estatística Descritiva 39 8) Uma urna A contém 3 bolas brancas, 4 pretas e 2 verdes. Uma urna B contém 5 bolas brancas, 2 pretas e uma verde. Uma urna C contém 2 bolas brancas, 3 pretas e 4 verdes. Uma bola é retirada de cada urna. Qual é a probabilidade de as 3 bolas retiradas da primeira, segunda e terceira urnas serem, respectivamente, branca, preta e verde? 9) Uma urna possui 10 bolas, sendo 3 brancas, 2 vermelhas e 5 verdes, retira-se ao acaso duas bolas sem reposição. Qual é a probabilidade da primeira bola ser branca e da segunda bola ser verde? 10) Uma urna contém 5 bolas brancas e 3 vermelhas; uma outra urna contém 4 bolas brancas e 5 vermelhas. É retirada uma bola de cada urna. Encontre a probabilidade delas serem da mesma cor. 11) Numa universidade, 20% dos alunos é constituído de mulheres que cursam contabilidade. Sabendo que 56% dos alunos são mulheres, qual é a probabilidade de que uma mulher selecionada ao acaso estude contabilidade? 12) Numa urna, existem 10 rótulos de papel, numerados de 1 a 10, os rótulos numerados por 1, 2 e 3, são amarelos e os restantes, brancos. Após o sorteio de um rótulo, verifica-se que ele é amarelo, qual a probabilidade de ser o número 1? 13) Uma indústria possui 100 máquinas, algumas são elétricas, enquanto outras são manuais; e algumas são novas, enquanto outras são usadas. Uma pessoa pega uma dessas máquinas e descobre que é nova. Qual a probabilidade de que ela seja elétrica? 14) Em uma classe há 16 homens e 20 mulheres, sendo que metade dos homens e metade das mulheres têm cabelos castanhos. Ao escolher um aluno ao acaso, qual é a probabilidade de que seja homem ou tenha cabelos castanhos? 15) Em uma população de 500 pessoas, 280 são mulheres e 60 exercem a profissão de advogado, sendo 20 do sexo feminino. Tomando ao acaso uma dessas pessoas, qual é a probabilidade de que, sendo mulher, seja advogada? RESPOSTAS: 1)17% 2)a)33,33% b)66,67% 3)25,45% 4)a)33,33% b)9,09% c)57,58% 5)9,09% 6)a)1,86% b)12,42% 7)60% 8)3,7% 9)16,67% 10)20,83% 11)36% 12)33,33% 13)57,14% 14)72,22% 15)7,14% O orgulho do ofício obriga os matemáticos de uma geração a desembaraçar-se do trabalho inacabado dos seus antecessores.” (E. T. Bell) “NA MATEMÁTICA, PARA SABOREAR COM PRAZER O FRUTO É PRECISO CONHECER BEM AS SUAS RAÍZES.” (Ditos Pitagóricos) Módulo 9 – D I S T R I B U I Ç Ã O D E P R O B A B I L I D A D E S Uma distribuição de probabilidades é um modelo matemático que estabelece a forma como os valores de uma variável aleatória se distribuem no respectivo espaço amostral. Possibilitam a obtenção de probabilidades associadas a valores obtidos em “n” testes, ou em intervalos de tempo ou ainda ocorridos dentro de espaços. Os tipos de distribuição de probabilidade mais usados são a Normal, a Poisson e a Binomial, para cada problema, precisamos decidir qual a distribuição mais adequada, sendo que o resultado final não difere muito de uma para outra e, essa diferença diminui, conforme n aumenta. D I S T R I B U I Ç Ã O B I N O M I A L www.profrichard.com.br Estatística Descritiva 40 O nome Binomial deve-se a utilização do Binômio de Newton, visto em Análise Combinatória no Ensino Médio, conforme abaixo: ( 𝒏 𝒌 ) = 𝒏! 𝒌! (𝒏 − 𝒌)! Recordando o Ensino Médio, o ponto de exclamação é o símbolo que denota o produto de números naturais consecutivos, chamado fatorial (!). O fatorial de um número natural n, representado pelo símbolo n! (lê-se: ene fatorial ou fatorial de ene), é um número definido por recorrência, ou seja, cada fatorial é calculado com a utilização do fatorial anterior. Não existe fatorial de número negativo, dessa forma, dado um número natural qualquer n, sendo n ≥ 0, temos: 0! = 1 (por definição) 1! = 1 2! = 2 ∙ 1 = 2 3! = 3 ∙ 2 ∙ 1 = 6 4! = 4 ∙ 3 ∙ 2 ∙ 1 = 24 e assim sucessivamente. Ao desenvolver um fatorial, colocando os fatores em ordem decrescente, podemos parar onde for conveniente, indicando os últimos fatores também na notação de fatorial. Ou seja: 8! = 8 ∙ 7 ∙ 6 ∙ 5 ∙ 4 ∙ 3 ∙ 2 ∙ 1 ou 8! = 8 ∙ 7! ou 8! = 8 ∙ 7 ∙ 6 ∙ 5!, etc... Combinações Simples: Uma combinação simples de n elementos tomados k a k é dado por: 𝑪𝒏,𝒌 = ( 𝒏 𝒌 ) = 𝒏! 𝒌! (𝒏 − 𝒌)! Exemplificando combinação, vamos calcular o número de combinações possíveis para o sorteio da Mega-Sena. Observe que para calcular as probabilidades em loterias, usamos a fórmula das combinações, pois não importa a ordem que os números são sorteados. Para acertar as 6 dezenas da Mega-Sena no universo {1; 2; 3; ...; 58; 59; 60}, temos: 𝐶60,6 = ( 60 6 ) = 60! 6! (60 − 6)! = 60 ∙ 59 ∙ 58 ∙ 57 ∙ 56 ∙ 55 ∙ 54! 6! ∙ 54! = 36.045.979.200 720 = 50.063.860 Distribuição Binomial de Probabilidades: descreve o comportamento de uma variável em amostras aleatórias. O sexo, o tipo Rh, ser saudável ou doente, são exemplos de aplicações dessa distribuição, onde há somente dois resultados possíveis que são classificados como sucesso ou fracasso, o que se deve aos primeiros estudos feitos sobre probabilidades, que envolviam ganhos e perdas em jogos de azar. Como macete, podemos pensar no termo Binomial de Bi (dois) “sucesso ou fracasso” de acontecer algo. Logo, a distribuição binomial de probabilidades é adequada aos experimentos que apresentam apenas dois resultados possíveis: sucesso ou fracasso. Em geral, considera-se como sucesso o resultado de interesse do pesquisador, nem sempre representando, este resultado, um sucesso social ou biológico, por exemplo, se o interesse é estudar um tipo de alergia, considera-se "ser alérgico" como o sucesso. www.profrichard.com.br Estatística Descritiva 41 Costuma-se denominar p a probabilidade do sucesso e q a do fracasso. Sabe-se então que p + q = 1, portanto, q = 1 – p. Para poder utilizar este processo os experimentos devem satisfazer as condições abaixo: 1. O experimento é testado n vezes nas mesmas condições; 2. Os resultados dos testes são independentes, ou seja, o resultado de um não afeta o do outro; 3. Cada teste admite apenas dois resultados: sucesso ou fracasso (mutuamente exclusivos). 4. As probabilidades de sucesso “p” e de insucesso “q” (q = 1 – p) se mantêm constantes durante os testes, ou seja, o processo é estacionário. A probabilidade de acontecer um evento x em n tentativas, isto é, de que haja x sucessos e n – x insucessos, é dada por: 𝑷(𝒙) = ( 𝒏 𝒙 ) ∙ 𝒑𝒙 ∙ (𝟏 − 𝒑)𝒏−𝒙 ou 𝑷(𝒙) = 𝑪𝒏,𝒙 ∙ 𝒑 𝒙 ∙ 𝒒𝒏−𝒙 Onde: p = probabilidade de sucesso; q = probabilidade de insucesso ou fracasso; Cn,x = possibilidades do evento: ocorrer x vezes em n tentativas. Propriedades da Distribuição Binomial: conhecendo-se os valores de n, p e q; é possível calcular a média, a variância e o desvio padrão da distribuição, através das fórmulas: �̅� = 𝑛 ∙ 𝑝 𝑠2 = 𝑛 ∙ 𝑝 ∙ 𝑞 𝑠 = √𝑠2 Exemplo 1: Uma moeda é lançada 5 vezes
Compartilhar