Baixe o app para aproveitar ainda mais
Prévia do material em texto
46 Unidade II Re vi sã o: J ul ia na - D ia gr am aç ão : F ab io - 1 7- 08 -1 2 Unidade II 5 CONCEITOS BÁSICOS DE PROBABILIDADE 5.1 Conceitos fundamentais Em um experimento aleatório, isto é, sujeito às leis do acaso, podemos conceituar: Espaço Amostral (S) é o conjunto de todos os resultados possíveis, enquanto n(S) é o número de elementos do espaço amostral. Exemplos: a) No lançamento de uma moeda, temos S = {cara,coroa}. n(S) = 2 b) No lançamento de um dado, temos S = {1, 2, 3, 4, 5, 6}. n(S) = 6 c) Ao retirar uma carta de um baralho convencional, temos S = {A, 2, 3,.., K}. n(S) = 52 Evento (E): é qualquer subconjunto de um espaço amostral. Está relacionado com o experimento aleatório em questão. n(E) é o número de resultados possíveis do evento. Exemplos: a) No lançamento de uma moeda, o evento é sair coroa na face superior. Logo, E = {coroa}. n(E) = 1 b) No lançamento de um dado, o evento é sair um número par na face superior. Logo, E = {2,4,6}. n(E) = 3 c) Ao retirar uma carta de um baralho convencional, o evento é sair a carta Ás de Espadas (A ♠). Logo, E ={ A ♠}. n(E) = 1 47 Re vi sã o: J ul ia na - D ia gr am aç ão : F ab io - 1 7- 08 -1 2 ESTATÍSTICA Probabilidade (P): é a razão (divisão) entre o número de elementos (ou resultados) favoráveis a um determinado evento (E) e o número total de elementos (ou resultados) do espaço amostral (S). P n E n S = ( ) ( ) Exemplos: 1. Considere o lançamento de um dado. Calcule a probabilidade de: • sair o número 3: S = {1, 2, 3, 4, 5, 6} n(S) = 6 E = {3} n(E) = 1 P = 1 6 • sair um número par: S = {1, 2, 3, 4, 5, 6} n(S) = 6 E = {2, 4, 6} n(E) = 3 P = = 3 6 1 2 • sair um múltiplo de 3: S = {1, 2, 3, 4, 5, 6} n(S) = 6 E = {3, 6} n(E) = 2 P = = 2 6 1 3 • sair um número menor ou igual a 4: S = {1, 2, 3, 4, 5, 6} 48 Unidade II Re vi sã o: J ul ia na - D ia gr am aç ão : F ab io - 1 7- 08 -1 2 n(S) = 6 E = {1, 2, 3, 4} n(E) = 4 P = = 4 6 2 3 • sair um número maior que 6: S = {1, 2, 3, 4, 5, 6} n(S) = 6 E = {Ø} = vazio n(E) = 0 P = = 0 6 0 (Evento impossível) • sair um número menor ou igual a 6: S = {1, 2, 3, 4, 5, 6} n(S) = 6 E = {1, 2, 3, 4, 5, 6} n(E) = 6 P Evento certo= = = 6 6 1 100% ( ) 2. Considere um baralho comum de 52 cartas. Calcule a probabilidade de, ao retirar uma carta aleatoriamente, sair uma carta do naipe copas (♥). n(S) = 52 Observação: Em um baralho convencional, são treze cartas para cada naipe. n(E) = 13 P = = 13 52 1 4 3. Considere o lançamento dois dados simultaneamente. Calcule a probabilidade de: • sair um par de pontos iguais: Observação: Se para um dado n(S) = 6 49 Re vi sã o: J ul ia na - D ia gr am aç ão : F ab io - 1 7- 08 -1 2 ESTATÍSTICA Para 2 dados n(s) = 62 = 36 Para 3 dados n(s) = 63 = 216 n(S) = 36 E = {1,1 2,2 3,3 4,4 5,5 6,6} n(E) = 6 P = = 6 36 1 6 • sair a soma 8: n(S) = 36 E = {2,6 6,2 4,4 3,5 5,3} n(E) = 5 P = 5 36 • sair a soma 12: n(S) = 36 E = {6,6} n(E) = 1 P = 1 36 4. Uma urna possui 6 bolas azuis, 10 bolas vermelhas e 4 bolas amarelas. Tirando-se uma bola, calcule a probabilidade de: • sair bola azul: n(S) = 6 + 10 + 4 = 20 (total de bolas da urna) n(E) = 6 P = = 6 20 3 10 • sair bola vermelha: n(S) = 6 + 10 + 4 = 20 (total de bolas da urna) n(E) = 10 50 Unidade II Re vi sã o: J ul ia na - D ia gr am aç ão : F ab io - 1 7- 08 -1 2 P = = 10 20 1 2 • sair bola amarela: n(S) = 6 + 10 + 4 = 20 (total de bolas da urna) n(E) = 4 P = = 4 20 1 5 Observação O cálculo de probabilidade pode ficar tanto na forma fracionária quanto na decimal. Na fracionária, mantemos a fração simplificada, e na decimal dividimos a fração. Assim, após a divisão, se o quociente for multiplicado por 100, teremos a probabilidade percentual de o evento ocorrer. 5.2 Eventos complementares Se P é a probabilidade de um evento ocorrer (sucesso), Q é a probabilidade de que o mesmo evento não ocorra (insucesso). Para obter Q, que é complementar de P, temos: P + Q = 1 (100%) Logo: Q = 1 - P Exemplo: se a probabilidade de um evento ocorrer é de 1/5, a probabilidade de o mesmo evento não ocorrer é calculada por: Q = −1 1 5 Para resolver a expressão, pode-se utilizar o cálculo do MMC ou proceder da maneira a seguir (mais simples) para o resultado Q. • Manter o denominador da probabilidade (P = 1/5). No caso, o valor 5. Q = 5 51 Re vi sã o: J ul ia na - D ia gr am aç ão : F ab io - 1 7- 08 -1 2 ESTATÍSTICA • No numerador, colocar o número que falta para que o numerador e o denominador tenham os mesmos valores. No caso, o numerador é igual a 1. É preciso adicionar mais 4 unidades para que o numerador fique igual a 5. Logo: Q = 4 5 Esse exercício também pode ser resolvido sob a forma de porcentagem (que também é muito simples, porém requer o uso de calculadora), conforme já lembrado: P Q Q x = = = − = = = 1 5 0 20 1 0 20 0 80 0 80 100 80 , , , , % 5.3 Eventos independentes Dois eventos são independentes quando a realização de um deles não afeta a probabilidade de realização do outro, e vice-versa. A probabilidade de os eventos se realizarem simultaneamente é dada por: P = P1 x P2 Onde P1 e P2 são os eventos independentes (também chamados de eventos produto). Exemplos: a) Lançando dois dados, qual é a probabilidade de obtermos 1 no primeiro dado e um número par no segundo dado? P P P 1 1 6 2 3 6 1 6 3 6 3 36 1 12 = = = ⋅ = = 52 Unidade II Re vi sã o: J ul ia na - D ia gr am aç ão : F ab io - 1 7- 08 -1 2 b) Temos duas caixas com bolinhas nas seguintes quantidades: Caixa A: 10 bolinhas azuis, 15 bolinhas brancas e 30 bolinhas vermelhas. Totalizando 55 bolinhas. Caixa B: 20 bolinhas azuis, 18 bolinhas brancas e 22 bolinhas vermelhas. Totalizando 60 bolinhas. Retiramos uma bolinha de cada caixa. Qual é a probabilidade de ambas as bolinhas retiradas serem azuis? Caixa A: probabilidade de uma bolinha retirada ser azul: P1 10 55 = Caixa B: probabilidade de uma bolinha retirada ser azul: P2 20 60 = Logo, a probabilidade de ambas serem azuis é: P = ⋅ = = = 10 55 20 60 200 3300 0 0606 6 06, , % 5.4 Eventos mutuamente exclusivos Dois eventos são mutuamente exclusivos quando a realização de um interfere na realização do outro. Por exemplo, no lançamento de uma moeda, o evento tirar cara e o tirar coroa são mutuamente exclusivos, pois, se um deles for realizado, o outro não será. A probabilidade de que um ou outro evento se realize é dada por: P = P1 + P2 Onde: P1 e P2 são os eventos mutuamente exclusivos (também chamados de eventos soma). Exemplos: a) Lançando um dado, qual é a probabilidade de tirar 3 ou 5 na face superior? P P P 1 1 6 2 1 6 1 6 1 6 2 6 1 3 = = = + = = 53 Re vi sã o: J ul ia na - D ia gr am aç ão : F ab io - 1 7- 08 -1 2 ESTATÍSTICA b) Numa caixa existem dez bolinhas idênticas, numeradas de 1 a 10. Qual a probabilidade de, ao se retirar uma bolinha, ela ser múltiplo de 2 ou de 5? Espaço amostral: S = {1,2,3,4,5,6,7,8,9,10} -> n(S) = 10 Evento A – múltiplos de 2: A = {2, 4, 6, 8, 10} -> n(A)= 5 Evento B – múltiplos de 5: B= {5,10} -> n(B) = 2 Elemento comum (intersecção) entre A e B: = {10} Observação O elemento comum entre A e B deve ser contado apenas uma vez. Como está sendo contado duas vezes (nos dois eventos), subtrairemos um dos resultados possíveis do evento B, para evitar a contagem duplicada. PA PB = = 5 10 2 10 Subtraindo a contagem duplicada de P2, tem-se: PB = 1 10 Logo: PB = + = = = 5 10 1 10 6 10 0 60 60, % 54 Unidade II Re vi sã o: J ul ia na - D ia gr am aç ão : F ab io - 1 7- 08 -1 2 Saiba mais Neste tópico, foi mostrado apenas o básico do assunto Probabilidade, que é estudado tanto em disciplinas de Estatística quanto de Matemática. Esse assunto pode ser aprofundado, caso haja necessidade. Além de Probabilidade, vale o estudo do tópico Análise Combinatória, principalmente para quem quiser fazer concursos públicos (muito frequente nessas avaliações). Para saber mais, leia: RAMOS, A. W. Estatística. São Paulo: Escola Politécnica da USP, 2005. 5.4.1 Exercício resolvido O exercício a ser resolvido envolve a maior parte dos conceitos apresentados no Tópico 5. É um tipo de exercício muito utilizado em concursos públicos e provas de admissão. Favor analisar o enunciado e a resolução pacientemente. Uma caixa contém 20 canetas iguais, das quais 7 são defeituosas, e outra caixa contém 12, das quais 4 são defeituosas. Uma caneta é retirada aleatoriamente de cada caixa. As probabilidades de que ambas não sejam defeituosas e de que uma seja perfeita e a outra não são de: A) 88,33% e 45,00%. B) 43,33% e 45,00%. C) 43,33% e 55,00%. D) 23,33% e 45,00%. E) 23,33% e 55,00%. Resolução: Caixa A 20 canetas 7 defeituosas 13 perfeitas Caixa B 12 canetas 4 defeituosas 8 perfeitas 55 Re vi sã o: J ul ia na - D ia gr am aç ão : F ab io - 1 7- 08 -1 2 ESTATÍSTICA • Probabilidade de ambas não serem defeituosas A probabilidade de uma ser perfeita e a outra não é dada pela situação a seguir: A caneta da caixa A ser perfeita. e A caneta da caixa B ser perfeita. Expressão: PcxaPerf e PcxbPerf P ambas não defeituosas Pcxa = 13/20 Pcxb = 8/12 P ambas não defeituosas 13/20 x 8/12 = 104/240 = 0,4333 = 43,33% • Probabilidade de uma ser perfeita e a outra não A probabilidade de uma ser perfeita e a outra não é dada pela situação a seguir: A caneta da caixa A ser perfeita e a da B não ser. ou A caneta da caixa A não ser perfeita e a da B ser. Expressão: PcxaPerf e PcxbDef ou PcxaDef e PcxbPerf PcxaPerf = 13/20 PcxbDef = 4/12 PcxaPerf e PcxbDef = 13/20 x 4/12 = 52/240 PcxaDef = 7/20 PcxbPerf = 8/12 56 Unidade II Re vi sã o: J ul ia na - D ia gr am aç ão : F ab io - 1 7- 08 -1 2 PcxaDef e PcxbPerf = 7/20 x 8/12 = 56/240 P uma perfeita e outra não = PcxaPerf e PcxbDef ou PcxaDef e PcxbPerf 52/240 + 56/240 = 108/240 = 0,4500 = 45,00% A alternativa correta é a B (43,33% e 45,00%). 6 DISTRIBUIÇÃO NORMAL DE PROBABILIDADES 6.1 Conceitos fundamentais Dentre as várias distribuições de probabilidade existentes, neste tópico, será estudada a distribuição normal, pois apresenta grande aplicação em pesquisas científicas e tecnológicas (a maior parte das variáveis contínuas de interesse prático segue essa distribuição.) Além disso, a distribuição normal é base para boa parte dos tópicos da Estatística Avançada. A distribuição normal é uma distribuição de variáveis aleatórias contínuas. x Figura 10 – Distribuição normal de probabilidades Algumas características da distribuição normal: • A curva tem a forma de sino. • A curva é simétrica em relação à média. • A área abaixo da curva é igual a 1 (100%). Portanto, é composta de duas partes de 50%: a parte com valores abaixo da média e a parte com valores acima da média. • Para desenhar a curva normal (também chamada de curva de Gauss), dois parâmetros são necessários: média e desvio-padrão. 57 Re vi sã o: J ul ia na - D ia gr am aç ão : F ab io - 1 7- 08 -1 2 ESTATÍSTICA Lembrete Os cálculos da média e do desvio-padrão (das três abordagens possíveis: para dados não agrupados e para tabelas de frequência sem e com intervalo) já foram detalhadamente mostrados nos tópicos 3 e 4, respectivamente. Para utilizar a tabela normal (a seguir), necessitamos de uma simples expressão para calcular o escore z. O escore z é um valor intermediário para busca na tabela normal visando obter a probabilidade desejada. Note que para obter o escore z basta possuir os valores da média e desvio-padrão. z x x s = − Tabela 72 – Tabela normal de probabilidades Z 0 1 2 3 4 5 6 7 8 9 0,0 0,0000 0,0040 0,0080 0,0120 0,0160 0,0199 0,0239 0,0279 0,0319 0,0359 0,1 0,0398 0,0438 0,0478 0,0517 0,0557 0,0596 0,0636 0,0675 0,0714 0,0753 0,2 0,0793 0,0832 0,0871 0,0910 0,0948 0,0987 0,1026 0,1064 0,1103 0,1141 0,3 0,1179 0,1217 0,1255 0,1293 0,1331 0,1368 0,1406 0,1443 0,1480 0,1517 0,4 0,1554 0,1591 0,1628 0,1664 0,1700 0,1736 0,1772 0,1808 0,1844 0,1879 0,5 0,1915 0,1950 0,1985 0,2019 0,2054 0,2088 0,2123 0,2157 0,2190 0,2224 0,6 0,2257 0,2291 0,2324 0,2357 0,2389 0,2422 0,2454 0,2486 0,2517 0,2549 0,7 0,2580 0,2611 0,2642 0,2673 0,2704 0,2734 0,2764 0,2794 0,2823 0,2852 0,8 0,2881 0,2910 0,2939 0,2967 0,2995 0,3023 0,3051 0,3078 0,3106 0,3133 0,9 0,3159 0,3186 0,3212 0,3238 0,3264 0,3289 0,3315 0,3340 0,3365 0,3389 1,0 0,3413 0,3438 0,3461 0,3485 0,3508 0,3531 0,3554 0,3577 0,3599 0,3621 1,1 0,3643 0,3665 0,3686 0,3708 0,3729 0,3749 0,3770 0,3790 0,3810 0,3830 1,2 0,3849 0,3869 0,3888 0,3907 0,3925 0,3944 0,3962 0,3980 0,3997 0,4015 1,3 0,4032 0,4049 0,4066 0,4082 0,4099 0,4115 0,4131 0,4147 0,4162 0,4177 1,4 0,4192 0,4207 0,4222 0,4236 0,4251 0,4265 0,4279 0,4292 0,4306 0,4319 1,5 0,4332 0,4345 0,4357 0,4370 0,4382 0,4394 0,4406 0,4418 0,4429 0,4441 1,6 0,4452 0,4463 0,4474 0,4484 0,4495 0,4505 0,4515 0,4525 0,4535 0,4545 1,7 0,4554 0,4564 0,4573 0,4582 0,4591 0,4599 0,4608 0,4616 0,4625 0,4633 1,8 0,4641 0,4649 0,4656 0,4664 0,4671 0,4678 0,4686 0,4693 0,4699 0,4706 58 Unidade II Re vi sã o: J ul ia na - D ia gr am aç ão : F ab io - 1 7- 08 -1 2 1,9 0,4713 0,4719 0,4726 0,4732 0,4738 0,4744 0,4750 0,4756 0,4761 0,4767 2,0 0,4772 0,4778 0,4783 0,4788 0,4793 0,4798 0,4803 0,4808 0,4812 0,4817 2,1 0,4821 0,4826 0,4830 0,4834 0,4838 0,4842 0,4846 0,4850 0,4854 0,4857 2,2 0,4861 0,4864 0,4868 0,4871 0,4875 0,4878 0,4881 0,4884 0,4887 0,4890 2,3 0,4893 0,4896 0,4898 0,4901 0,4904 0,4906 0,4909 0,4911 0,4913 0,4916 2,4 0,4918 0,4920 0,4922 0,4925 0,4927 0,4929 0,4931 0,4932 0,4934 0,4936 2,5 0,4938 0,4940 0,4941 0,4943 0,4945 0,4946 0,4948 0,4949 0,4951 0,4952 2,6 0,4953 0,4955 0,4956 0,4957 0,4959 0,4960 0,4961 0,4962 0,4963 0,4964 2,7 0,4965 0,4966 0,4967 0,4968 0,4969 0,4970 0,4971 0,4972 0,4973 0,4974 2,8 0,4974 0,4975 0,4976 0,4977 0,4977 0,4978 0,4979 0,4979 0,4980 0,4981 2,9 0,4981 0,4982 0,4982 0,4983 0,4984 0,4984 0,4985 0,4985 0,4986 0,4986 3,0 0,4987 0,4987 0,4987 0,4988 0,4988 0,4989 0,4989 0,4989 0,4990 0,4990 3,1 0,4990 0,4991 0,4991 0,4991 0,4992 0,4992 0,4992 0,4992 0,4993 0,4993 3,2 0,4993 0,4993 0,4994 0,4994 0,4994 0,4994 0,4994 0,4995 0,4995 0,4995 3,3 0,4995 0,4995 0,4995 0,4996 0,4996 0,4996 0,4996 0,4996 0,4996 0,4997 3,4 0,4997 0,4997 0,4997 0,4997 0,4997 0,4997 0,4997 0,4997 0,4997 0,4998 3,5 0,4998 0,4998 0,4998 0,4998 0,4998 0,4998 0,4998 0,4998 0,4998 0,4998 3,6 0,4998 0,4998 0,4999 0,4999 0,4999 0,4999 0,4999 0,4999 0,49990,4999 3,7 0,4999 0,4999 0,4999 0,4999 0,4999 0,4999 0,4999 0,4999 0,4999 0,4999 3,8 0,4999 0,4999 0,4999 0,4999 0,4999 0,4999 0,4999 0,4999 0,4999 0,4999 3,9 0,5000 0,5000 0,5000 0,5000 0,5000 0,5000 0,5000 0,5000 0,5000 0,5000 Para trabalhar com a tabela normal a partir de um valor de z calculado, devemos seguir os exemplos: Exemplo 1: z = 1,27 Para buscar na tabela normal, z será separado em dois valores: • O primeiro inteiro e a primeira casa decimal = 1,2 (valor 1) • A segunda casa decimal = 7 (valor 2) • O valor 1 será buscado nos valores de linha da tabela e o valor 2 será buscado nos valores de coluna da tabela normal. O cruzamento de linha e coluna fornece a probabilidade desejada para o valor de z. 59 Re vi sã o: J ul ia na - D ia gr am aç ão : F ab io - 1 7- 08 -1 2 ESTATÍSTICA Tabela 73 – Esboço da tabela normal de probabilidades z 0 1 2 3 4 5 6 7 8 9 0,0 0,1 0,2 0,3 ... 1,2 0,3980 ... Logo, P = 0,3980 = 39,80% Exemplo 2: z = -0,64 Como a curva normal tem simetria em relação à média, basta considerar o valor de z sem o sinal negativo e obter P conforme o Exemplo 1. Valor 1 = 0,6 Valor 2 = 4 P = 0,2389 = 23,89% Exemplo 3: z = 3 Como a tabela normal trabalha com valores de z com duas casas decimais, basta adaptar o valor de z para as duas casas. Valor 1 = 3,0 Valor 2 = 0 P = 0,4987 = 49,87% Observação Para valores de z com mais de duas casas decimais, bastar arredondar para duas casas decimais e utilizar a tabela. 60 Unidade II Re vi sã o: J ul ia na - D ia gr am aç ão : F ab io - 1 7- 08 -1 2 Exercício introdutório Os comprimentos das peças produzidas por certa máquina apresentaram as seguintes medidas estatísticas: Média = 2,00 cm Desvio-padrão = 0,04 cm Qual é a probabilidade de uma peça retirada aleatoriamente do lote analisado ter comprimento entre 2,00 cm e 2,05 cm? Passo 1: determinar a região de interesse da curva (de acordo com o enunciado). Recomenda-se fortemente desenhar a curva normal com os dados do exercício. 2 2,05 Figura 11 – Curva normal com os dados do exercício introdutório Passo 2: como a região de interesse é composta pelo valor 2,05 e pela média (no eixo horizontal), calcule o valor do escore z usando a expressão a seguir e os dados do enunciado. z x x s z = − = − = = 2 05 2 0 04 0 05 0 04 125 , , , , , Passo 3: com o valor de z, obter a probabilidade utilizando a tabela normal. z = 1,25 Buscando na tabela normal (na linha 1,2 e coluna 5) P = 0,3944 = 39,44% A probabilidade de uma peça retirada aleatoriamente do lote analisado ter comprimento entre 2,00 cm e 2,05 cm é de 39,44%. 61 Re vi sã o: J ul ia na - D ia gr am aç ão : F ab io - 1 7- 08 -1 2 ESTATÍSTICA Observação Este tópico é base para todo o estudo de Estatística Aplicada ou avançada. Compreender a curva normal e o cálculo de probabilidades com essa curva permite entender os vários modelos de amostragem e geração de estimativas para uma população a partir de dados de uma amostra, bem como os conceitos de controle estatístico de processo. 6.1.1 Exercícios resolvidos 1. A duração de certo componente eletrônico tem média de 850 dias e desvio-padrão de 40 dias. Sabendo que a duração é normalmente distribuída, calcule a probabilidade de esse componente durar: a) Entre 850 e 1000 dias b) Entre 800 e 950 dias c) Mais que 750 dias d) Menos que 700 dias e) Mais que 850 dias Média = 850 Desvio-padrão = 40 a) 850 900 950 1000 Figura 12 – Curva normal com os dados do exercício 1a Análise: a área de interesse sob a curva está entre a média e 1000 dias. Logo, é possível obter diretamente a probabilidade. z = − = = 1000 850 40 150 40 3 75, 62 Unidade II Re vi sã o: J ul ia na - D ia gr am aç ão : F ab io - 1 7- 08 -1 2 Buscando na tabela normal (linha 3,7 e coluna 5): P = 0,4999 = 49,99% b) 800 850 900 950 Figura 13 – Curva normal com os dados do exercício 1b Análise: a área de interesse sob a curva está entre 800 e 950 dias. Como a fórmula de z funcionará apenas se um dos valores do intervalo for a média, o cálculo será feito em duas partes (a primeira de 800 até a média – chamada de z1 – e a segunda da média até 950 – chamada de z2). Após obter as probabilidades, bastar somar os seus valores. z1 800 850 40 50 40 125= − = − = − , Buscando na tabela normal, sem considerar o sinal negativo (linha 1,2 e coluna 5): P1 = 0,3944 = 39,44% z2 950 850 40 100 40 2 5= − = = , Buscando na tabela normal (linha 2,5 e coluna 0): P2 = 0,4938 = 49,38% A probabilidade será obtida somando-se P1 e P2: P = 39,44%+49,38% = 88,82% 63 Re vi sã o: J ul ia na - D ia gr am aç ão : F ab io - 1 7- 08 -1 2 ESTATÍSTICA c) 750 800 850 900 950 1000 1050 1100 1150 1200 Figura 14 – Curva normal com os dados do exercício 1c Análise: a área de interesse sob a curva está para valores superiores a 750 dias. Como a fórmula de z funcionará apenas se um dos valores do intervalo for a média, será calculada a parte de 750 até a média. A parte superior à média tem probabilidade de 50% (pela definição da curva normal) e não necessita de cálculo. Em seguida, basta somar as probabilidades. z = − = − = − 750 850 40 100 40 2 5, Buscando na tabela normal, sem considerar o sinal negativo (na linha 2,5 e coluna 0): P = 0,4938 = 49,38% O resultado será obtido somando a probabilidade encontrada com os 50% da parte superior da curva (acima da média): P = 49,38%+50% = 99,38% d) 500 550 600 650 700 Figura 15 – Curva normal com os dados do exercício 1d 64 Unidade II Re vi sã o: J ul ia na - D ia gr am aç ão : F ab io - 1 7- 08 -1 2 Análise: a área de interesse sob a curva está para valores inferiores a 700 dias. Como a fórmula de z funcionará apenas se um dos valores do intervalo for a média, será calculada a parte de 700 até a média. Porém, a parte de interesse é exatamente o restante da curva (cauda esquerda). Logo, para obtê-la, basta subtrair 50% da probabilidade calculada. z = − = − = − 700 850 40 150 40 3 75, Buscando na tabela normal, sem considerar o sinal negativo (linha 3,7 e coluna 5): P = 0,4999 = 49,99% Subtraindo 50% para obter a cauda da curva, tem-se: P = 50% - 49,99% = 0,01% e) 850 900 950 1000 1050 1100 1150 1200 Figura 16 – Curva normal com os dados do exercício 1e Análise: a área de interesse sob a curva está para valores superiores à média. Pela definição da curva normal, a probabilidade é de 50% para valores acima da média e 50% para valores abaixo da média. Logo, não há a necessidade de cálculo. P = 50% 2. Do total de 970 estudantes que prestaram um exame de admissão, apenas 3% foram aprovados. A nota média foi 5,5, e o desvio-padrão, 1,8. Sabendo que as notas seguem a distribuição normal, qual foi a nota de corte? Lembrete A nota de corte é a nota que separa os aprovados dos reprovados em alguma avaliação. 65 Re vi sã o: J ul ia na - D ia gr am aç ão : F ab io - 1 7- 08 -1 2 ESTATÍSTICA Análise: Aprovados: 3% Reprovados: 97% (50% com notas abaixo da média e 47% com notas acima da média). Média = 5,5 Desvio-padrão = 1,8 x (nota de corte) 3% (aprovados) 47% = 0,4700 5,5 Figura 17 – Curvanormal com os dados do exercício 2 Na Figura 18 foi indicada a região dos aprovados (3%). Como esta é a cauda da curva, será utilizada a região que vai da média até o início dos aprovados (47%), isto é, notas acima da média, porém menores que a nota de corte indicada na figura pela letra x. 47% = 0,4700 Buscando esse valor na parte central da tabela normal, foi encontrado o mais próximo, dado por: 0,4699 = 46,99% Esse valor está alocado na linha 1,8 e na coluna 8 da tabela normal, logo: z = 1,88 Substituindo os valores na fórmula do escore z, encontraremos o valor de x, que é a nota de corte desejada. z x x s x = − = − 188 5 5 18 , , , 66 Unidade II Re vi sã o: J ul ia na - D ia gr am aç ão : F ab io - 1 7- 08 -1 2 Manipulando algebricamente a expressão: 1,88 . 1,8 = x - 5,5 3,384 = x - 5,5 -x = -5,5 - 3,384 -x = -8,384 x = 8,384 A nota de corte para esse exame foi de aproximadamente 8,4. Portanto, os candidatos cuja nota ultrapassou os 8,4 fazem parte dos 3% aprovados. 7 CORRELAÇÃO LINEAR 7.1 Conceitos e diagrama de dispersão Em Estatística, a correlação é um parâmetro que indica o grau de correspondência entre duas variáveis (neste estudo, simbolizadas por x e y). • Exemplos: — salário de um trabalhador X escolaridade do trabalhador; — quantidade de livros que uma pessoa já leu X escolaridade; — horas de estudo X nota na prova; — temperatura de um forno X tempo de cozimento no forno; — velocidade do carro X tempo para chegar ao destino. A correlação pode ser: • Positiva: dada pela relação direta entre as variáveis (se a variável x aumentar, a variável y também aumentará, e vice-versa). Exemplos: — salário de um trabalhador X escolaridade do trabalhador; — quantidade de livros que uma pessoa já leu X escolaridade; — horas de estudo X nota na prova. • Negativa: dada pela relação inversa entre as variáveis (se a variável x aumentar, a variável y tenderá a diminuir, e vice-versa). Exemplos: 67 Re vi sã o: J ul ia na - D ia gr am aç ão : F ab io - 1 7- 08 -1 2 ESTATÍSTICA — temperatura de um forno X tempo de cozimento no forno; — velocidade do carro X tempo para chegar ao destino. De posse dos valores das variáveis x e y, podemos verificar a correlação entre elas utilizando um gráfico de dispersão. Exemplo 1: Número de anos que a pessoa estudou (xi) e número de livros que a pessoa já leu (yi). Tabela 74 – Tabela de duas variáveis (número de anos de estudo X número de livros que a pessoa já leu) para obtenção do diagrama de dispersão Xi 3 5 7 9 10 14 16 Yi 1 2 3 5 7 10 13 Construindo um gráfico cartesiano que associa as variáveis x e y, temos o diagrama de dispersão. 14 12 10 8 6 4 2 0 yi xi 0 2 4 6 8 10 12 14 16 18 Diagrama de Dispersão Figura 18 – Diagrama de dispersão para o Exemplo 1 Lembrete Gráfico cartesiano é aquele em que cada ponto é obtido por meio de um valor x e do seu correspondente y (par ordenado). Em softwares de Matemática/Estatística, é chamado de gráfico de dispersão. O perfil do gráfico é linear, pois se assemelha a uma reta ascendente, mesmo que quase perfeitamente. Este é um indicativo de que existe correlação entre as variáveis. Se a reta cruzasse perfeitamente todos os pontos, teríamos uma correlação linear perfeita. Como a reta é ascendente, a correlação é positiva entre as variáveis, isto é, um aumento de x resultará em um aumento de y, e vice-versa. 68 Unidade II Re vi sã o: J ul ia na - D ia gr am aç ão : F ab io - 1 7- 08 -1 2 Exemplo 2: preço do produto (xi) e demanda (procura) desse produto (yi) na prateleira de um supermercado qualquer. Tabela 75 – Tabela de duas variáveis (preço X demanda de um produto) para obtenção do diagrama de dispersão Xi 2,00 2,20 2,40 2,60 2,80 3,00 Yi 40 35 20 13 8 3 45 40 35 30 25 20 15 10 5 0 yi xi 1,8 2 2,2 2,4 2,6 2,8 3 3,2 Diagrama de Dispersão Figura 19 – Diagrama de dispersão para o Exemplo 2 O perfil do gráfico é linear, pois se assemelha a uma reta descendente, mesmo que quase perfeitamente. Logo, existe correlação entre as variáveis. Como a reta é descendente, a correlação é negativa entre as variáveis, isto é, um aumento de x resultará em uma diminuição de y, e vice-versa. 8 COEFICIENTE DE PEARSON Podemos verificar o quanto duas variáveis estão relacionadas entre si por meio do cálculo de um parâmetro. Esse parâmetro indica: • se a correlação é positiva ou negativa, por meio do seu sinal (relação direta ou inversa entre as variáveis); • a “força” da correlação, por meio de seu valor (módulo). Esse parâmetro é o coeficiente de correlação de Pearson (conhecido como coeficiente linear), indicado por r e calculado por: r n xi yi xi yi n xi xi n yi yi = ⋅ ⋅ − ⋅ ⋅ − ⋅ ⋅ − Σ Σ Σ Σ Σ Σ Σ( ( ) ) ( ( ) )2 2 2 2 69 Re vi sã o: J ul ia na - D ia gr am aç ão : F ab io - 1 7- 08 -1 2 ESTATÍSTICA Os possíveis valores de r variam de -1 a 1. A classificação mais detalhada do coeficiente é mostrada a seguir: • r = -1,00: correlação negativa perfeita. • r = -0,75: correlação negativa forte. • r = -0,50: correlação negativa média. • r = -0,25: correlação negativa fraca. • r = 0,00: correlação linear inexistente. • r = +0,25: correlação positiva fraca. • r = +0,50: correlação positiva média. • r = +0,75: correlação positiva forte. • r = +1,00: correlação positiva perfeita. Para entender o coeficiente de Pearson, serão calculados os coeficientes de correlação linear para os dois exemplos abordados nos diagramas de dispersão. Exemplo 1: número de anos que a pessoa estudou (xi) e número de livros que a pessoa já leu (yi). Tabela 76 – Tabela de duas variáveis (número de anos de estudo X número de livros que a pessoa já leu) para obtenção do coeficiente de Pearson Xi Yi 3 1 5 2 7 3 9 5 10 7 14 10 16 13 Uma maneira simples de calcular r é criar as colunas xi.yi, xi2 e yi2, e em seguida somar todas as colunas (∑). 70 Unidade II Re vi sã o: J ul ia na - D ia gr am aç ão : F ab io - 1 7- 08 -1 2 Tabela 77 – Tabela de duas variáveis (número de anos de estudo X número de livros que a pessoa já leu) para obtenção do coeficiente de Pearson, com os cálculos efetuados Xi Yi Xi · Yi Xi2 Yi2 3 1 3 9 1 5 2 10 25 4 7 3 21 49 9 9 5 45 81 25 10 7 70 100 49 14 10 140 196 100 16 13 208 256 169 64 41 497 716 357 Com a tabela devidamente preenchida, o cálculo de r pela fórmula pode ser efetuado. r n xi yi xi yi n xi xi n yi yi = ⋅ ⋅ − ⋅ ⋅ − ⋅ ⋅ − Σ Σ Σ Σ Σ Σ Σ( ( ) ) ( ( ) )2 2 2 2 Onde: n = 7 ∑xi.yi = 497 ∑xi = 64 ∑yi = 41 ∑xi2 = 716 ∑ yi2 = 357 r r = − − ⋅ − = − − 7 497 64 41 7 716 64 7 357 41 3479 2694 5012 4 2 2 . . ( . ( ) ) ( . ( ) ) ( 0096 2499 1681 855 916 818 855 749288 855 865 61 ) ( ) ( ) ( ) . ⋅ − = ⋅ = = r r r = 0,988 (correlação positiva muito forte) Exemplo 2: Preço do produto (xi) e demanda (procura) desse produto (yi) na prateleira de um supermercado qualquer. 71 Re vi sã o: J ul ia na - D ia gr am aç ão : F ab io - 1 7- 08 -1 2 ESTATÍSTICA Tabela 78 – Tabela de duas variáveis (preço X demanda de um produto) para obtenção do coeficiente de PearsonXi Yi 2 40 2,2 35 2,4 20 2,6 13 2,8 8 3 3 Gerando as colunas e calculando os somatórios, temos: Tabela 79 – Tabela de duas variáveis (preço X demanda de um produto) para obtenção do coeficiente de Pearson, com os cálculos efetuados Xi Yi Xi.Yi Xi² Yi² 2 40 80 4 1600 2,2 35 77 4,84 1225 2,4 20 48 5,76 400 2,6 13 33,8 6,76 169 2,8 8 22,4 7,84 64 3 3 9 9 9 15 119 270,2 38,2 3467 r n xi yi xi yi n xi xi n yi yi = ⋅ ⋅ − ⋅ ⋅ − ⋅ ⋅ − Σ Σ Σ Σ Σ Σ Σ( ( ) ) ( ( ) )2 2 2 2 Onde: n = 6 ∑xi.yi = 270,2 ∑xi = 15 ∑yi = 119 ∑xi2 = 38,2 ∑ yi2 = 3467 r r = − − ⋅ − = − 6 270 2 15 119 6 38 2 15 6 3467 119 16212 178 2 2 . , . ( . , ( ) ) ( . ( ) ) , 55 229 2 225 20802 14161 163 8 4 2 6641 163 8 2789 ( , ) ( ) , ( , ) ( ) , − ⋅ − = − ⋅ = r r 22 2 163 8 167 01, , , = 72 Unidade II Re vi sã o: J ul ia na - D ia gr am aç ão : F ab io - 1 7- 08 -1 2 r r = − − ⋅ − = − 6 270 2 15 119 6 38 2 15 6 3467 119 16212 178 2 2 . , . ( . , ( ) ) ( . ( ) ) , 55 229 2 225 20802 14161 163 8 4 2 6641 163 8 2789 ( , ) ( ) , ( , ) ( ) , − ⋅ − = − ⋅ = r r 22 2 163 8 167 01, , , = r = 0,981 (correlação negativa muito forte) Saiba mais Após o cálculo do coeficiente de correlação entre duas variáveis, pode- se estabelecer um modelo que explica o seu comportamento mútuo. Esse modelo é obtido pelo estudo de Regressão Linear. Para conhecer melhor esse assunto, leia: MORETTIN, L. G. Estatística básica. São Paulo: Makron Books, 1999. Resumo Nesta Unidade abordamos introdutoriamente o conceito de probabilidade. Vale lembrar que existem disciplinas somente voltadas para esse assunto. Inicialmente foram definidos os termos espaço amostral e evento, para podermos então conceituar probabilidade como o quociente entre o número de resultados favoráveis a um determinado evento e o total de resultados de um evento. Em seguida, o assunto estudado foi eventos complementares, o qual pode ser definido pela probabilidade de um evento não ocorrer (lembrando que se somarmos a probabilidade de um evento ocorrer com a de não ocorrer, teremos 100% como resultado). Estudamos também o cálculo para eventos independentes (em que um não interfere na realização do outro, obtido pelo produto das probabilidades dos eventos isolados) e os eventos mutuamente exclusivos (em que um anula a realização do outro, obtido pela soma das probabilidades dos eventos isolados). Abordamos introdutoriamente a utilização da distribuição normal de probabilidades. Esta é definida como uma distribuição de variáveis aleatórias contínuas, representada pela curva de Gauss. 73 Re vi sã o: J ul ia na - D ia gr am aç ão : F ab io - 1 7- 08 -1 2 ESTATÍSTICA Vimos que é possível trabalhar com a curva de Gauss com duas medidas já estudadas neste material, a média e o desvio-padrão do conjunto de dados em estudo. Foram resolvidos dois tipos de exercício utilizando a curva normal (ou de Gauss): o primeiro consistia na determinação do pedaço de interesse da curva e posterior consulta na tabela normal, para obtenção da probabilidade; o segundo, na identificação de um porcentual na curva, novamente consultando a tabela, para identificar qualquer ponto dar curva no eixo horizontal (além da média, que já é o centro da curva). Além disso, foi apresentado um estudo sobre o comportamento mútuo de duas variáveis qualitativas, definido com correlação. Para abordar a correlação entre duas variáveis, foram estudados dois métodos: a construção de um diagrama de dispersão (gráfico cartesiano) e o cálculo de um coeficiente de correlação, chamado de coeficiente de Pearson. Ambos indicavam a força da correlação e se esta era direta (se o valor da primeira variável aumenta, o da segunda também aumenta e vice-versa) ou inversa (se o valor da primeira variável aumenta, o da segunda diminui e vice versa). Destacamos que o coeficiente de Pearson só pode ter valores de -1 até 1, para correlações negativas (inversas) ou positivas (diretas). Exercícios Questão 1. (Enade 2008, Matemática) Há 10 postos de gasolina em uma cidade. Desses 10, exatamente dois vendem gasolina adulterada. Foram sorteados aleatoriamente dois desses 10 postos para serem fiscalizados. Qual é a probabilidade de que os dois postos infratores sejam sorteados? A) 1/45. B) 1/20. C) 1/10. D) 1/5. E) 1/2. Resposta correta: alternativa A. Análise das afirmativas Justificativa: pode-se resolver esta questão de duas formas diferentes. 74 Unidade II Re vi sã o: J ul ia na - D ia gr am aç ão : F ab io - 1 7- 08 -1 2 Solução 1: Utilizando a definição de probabilidade de ocorrência de um evento A, tem-se que: P A n A n S A S( ) ( ) ( ) ;= ⊆ onde n(A) é o número de elementos do evento A e n(S) representa o número de elementos do espaço amostral S. O espaço amostral, definido como o conjunto dos resultados do experimento aleatório, tem 45 elementos que podem ser obtidos por meio da combinação dos dez postos (n = 10), tomados dois a dois (x = 2), isto é, n x n x : : ( ) : : : :− = = 10 2 8 45 . Sendo o evento A o subconjunto de S formado pelos dois postos infratores, ou seja, n(A) = 1, tem-se, então, que P A( ) = 1 45 . Assim, a alternativa correta é A. Solução 2: Supondo que os dois postos foram sorteados sucessivamente e sem reposição, pode-se utilizar o chamado Teorema do Produto, P(A ∩ B) = P (A) × P(B/A). Sejam A o primeiro sorteado e B o segundo sorteado; se eles forem os dois postos que adulteram a gasolina entre os dez da cidade, tem-se, então, que a probabilidade de sortear o posto A é P A( ) = 2 10 , isto é, há duas chances em dez de se sortear um posto infrator na primeira tentativa. Sabendo-se que o posto A já foi sorteado, a chance de retirar, na segunda tentativa, o posto B, que também adultera a gasolina, fica P B A( / ) = 1 9 . Então, tem-se P(A ∩ B) = P (A) ∙ P(B/A) = 2 10 1 9 2 90 1 45 ⋅ = = Questão 2. Observe as curvas de distribuição normal da figura abaixo e assinale a alternativa incorreta: 0,9 0,8 0,7 0,6 0,5 0,4 0,3 0,2 0,1 0 -5 -4 -3 -2 -1 0 1 2 3 4 5 d b c a µ = 0, σ2 = 0,2 µ = 0, σ2 = 1,0 µ = 0, σ2 = 5,0 µ = 0, σ2 = 0,5 a b c d Figura 20 75 Re vi sã o: J ul ia na - D ia gr am aç ão : F ab io - 1 7- 08 -1 2 ESTATÍSTICA A) As curvas de distribuição normal referentes às figuras a, b e c são de distribuição normal padronizada. B) A curva a tem desvio-padrão no valor aproximado de 0,45. C) As dispersões das distribuições a, b e c mudaram porque as variâncias mudaram. D) A probabilidade de escolher um valor superior a 1,27 na curva b é de 0,102. E) A probabilidade de escolher um valor entre 0 e -2,43 na curva b é de 0,4925. Resolução desta questão na plataforma. 76 FIGURAS E ILUSTRAÇÕES Figura 2 RAMOS, A. W. Estatística. São Paulo: Escola Politécnica da USP, 2005. p. 39. Figura 3 RAMOS, A. W. Estatística. São Paulo: Escola Politécnica da USP, 2005. p. 39. Figura 4 RAMOS, A. W. Estatística. São Paulo: Escola Politécnica da USP, 2005. p. 40. Figura 5 CRESPO, A. A. Estatística fácil. São Paulo: Saraiva, 2004. p. 69. Figura 6 CRESPO, A. A. Estatística fácil. São Paulo: Saraiva, 2004. p. 70. Figura 7 BRUNI, A. L. Estatística aplicada à gestão empresarial. São Paulo: Atlas, 2007. p. 68. REFERÊNCIAS AKANIME, C. T. Estatística descritiva.São Paulo: Érica, 1998. BRUNI, A. L. Estatística aplicada à gestão empresarial. São Paulo: Atlas, 2007. CRESPO, A. A. Estatística fácil. São Paulo: Saraiva, 2004. MARIANO, M. V. Estatística descritiva. São Paulo: Unip, 2010. ______. Estatística indutiva. São Paulo: Unip, 2010. MOORE, D. S. Introdução à prática da Estatística. Rio de Janeiro: LTC, 2002. MORETTIN, L. G. Estatística básica. São Paulo: Makron Books, 1999. RAMOS, A. W. Estatística. São Paulo: Escola Politécnica da USP, 2005. 77 78 79 80 Informações: www.sepi.unip.br ou 0800 010 9000
Compartilhar