Baixe o app para aproveitar ainda mais
Prévia do material em texto
ESTATÍSTICA BÁSICA Professor: Narcelio de Araújo Pereira narcelioap@yahoo.com.br 2015 2 SUMÁRIO UNIDADE 1: PROBABILIDADE ................................................................ 3 UNIDADE 2: DISTRIBUIÇÃO BINOMIAL E NORMAL ..................... 14 UNIDADE 3: CORRELAÇÃO E REGRESSÃO ...................................... 37 REFERENCIAS ........................................................................................... 52 ANEXOS ....................................................................................................... 53 3 I - PROBABILIDADE 1 - Introdução Neste capítulo, presumiremos que a população é conhecida e calcularemos as chances de obter várias amostras desta população. Assim, mostraremos que a probabilidade é o reverso da estatística: na probabilidade usaremos a informação da população para inferir a natureza provável da amostra. Sendo assim, as situações marcadas pela possibilidade de ocorrência de mais de um resultado possível costumam ser analisadas em estatística com o auxílio das probabilidades. A probabilidade estuda o risco e o acaso em eventos futuros, determinando se é provável ou não o seu acontecimento. O cálculo das probabilidades pertence ao campo da Matemática, entretanto a maioria dos fenômenos de que trata a Estatística são de natureza aleatória ou probabilística. O conhecimento dos aspectos fundamentais do cálculo da probabilidade é uma necessidade essencial para o estudo da Estatística Indutiva ou Inferencial. Para estudar probabilidades, é necessário definir alguns conceitos e terminologias usuais, como os relativos a experimento aleatório, espaço amostral e eventos. 2 - Experimento Aleatório Suponha que uma moeda foi jogada uma vez e “deu cara”. O resultado que vemos e registramos é chamado de observação, ou medição, e o processo de realizar uma observação é chamado de experimento. Baseado neste exemplo, enunciamos a definição de experimentos aleatórios: Como exemplos de experimentos aleatórios, podem ser citados: E1: Joga-se um dado e observa-se o número mostrado na face de cima. E2: Joga-se uma moeda três vezes e observa-se o número de caras obtido. E3: Em uma linha de produção, fabricam-se peças em série e conta-se o número de peças defeituosas produzidas em um período de 24 horas. São fenômenos que, mesmo repetidos várias vezes sob condições semelhantes, apresentam resultados imprevisíveis. O resultado final depende do acaso. 4 É importante destacar que os experimentos mencionados possuem algumas características em comum: a) Cada experimento poderá ser repetido indefinidamente sob condições essencialmente inalteradas; b) Muito embora não seja possível afirmar que resultado particular ocorrerá, pode-se descrever o conjunto de todos os possíveis resultados do experimento; c) Quando o experimento for executado repetidamente, os resultados individuais parecerão ocorrer de forma acidental. Porém, quando o experimento for repetido um grande número de vezes, uma configuração definida ou uma regularidade surgirá. 3 - Espaço Amostral Um conjunto de resultados totais pode ser obtido ao ser realizada uma experiência aleatória, embora um e somente um resultado possa ser obtido por vez. Logo, por espaço amostral, entende-se: Considerando os quatros experimentos aleatórios citados no item anterior, o espaço amostral para cada um deles pode ser descrito, respectivamente, por: S1: {1; 2; 3; 4; 5; 6} S2: {0; 1; 2; 3} S3: {0; 1; 2; 3; .........; N} Cada elemento do espaço amostral que corresponde a um resultado recebe o nome de ponto amostral. No primeiro exemplo: o número 1 pertence ao espaço amostral {1}. 4 - Eventos Quando o espaço amostral for finito ou infinito numerável, todo subconjunto poderá ser considerado um evento. No entanto, se o espaço amostral for infinito não numerável, surgirá uma dificuldade teórica na identificação e apresentação de eventos. Logo, podemos definir evento como: Ao conjunto de resultados possíveis de um experimento aleatório damos o nome de espaço amostral ou conjunto universo, representado por S. . Qualquer subconjunto do espaço amostral S de um experimento aleatório. 5 Em relação aos quatro experimentos aleatórios apresentados inicialmente, podem ser citados, respectivamente, como os eventos abaixo: A1: {2; 4; 6}; isto é, um número par ocorre. A2: {2}; isto é, duas caras ocorrem. A3: {0}; isto é, todas as peças são perfeitas. Se considerarmos S como espaço amostral e A como evento, qualquer que seja A, se A está contido em S, então A é um evento de S. Em particular: Se A = S, A é chamado de evento certo. Se A está contido em S e A é um conjunto unitário, A é chamado de evento elementar. Se A = Ø, A é chamado de evento impossível. Nos itens anteriores aprendemos as definições e exemplos de experimento aleatório, espaço amostral e eventos. No item a seguir, usaremos estas definições para enunciar o conceito de probabilidade. 5 - Probabilidade Dado um experimento aleatório, sendo S o seu espaço amostral, vamos admitir que todos os elementos de S tenham a mesma chance de acontecer, ou seja, que S é um conjunto equiprovável. Aplicar probabilidade significa usá-la em situações em que não se pode prever um resultado futuro. Os resultados são incertos, regidos pelo acaso. Observe os exemplos a seguir: 1- No lançamento de uma moeda qual a probabilidade de obter “cara” em um evento A? S = {ca, co} = 2 A = {ca} = 1 P (A) = 1/2 = 0,5 = 50% 6 2 - No lançamento de um dado qual a probabilidade de obter um “número par” em um evento A? S = {1,2,3,4,5,6} = 6 A = {2,4,6} = 3 P (A) = 3/6 = 0,5 = 50% 3 - No lançamento de um dado qual a probabilidade de obter um “número menor ou igual a 6” em um evento A? S = {1,2,3,4,5,6} = 6 A = {1,2,3,4,5,6} = 6 P (A) = 6/6 = 1,0 = 100% Obs.: a probabilidade de todo evento certo é igual a 1 ou 100%. 4 - No lançamento de um dado qual a probabilidade de obter um “número maior que 6” em um evento A? S = {1,2,3,4,5,6} = 6 A = { } = 0 P (A) = 0/6 = 0 = 0% Obs.: a probabilidade de todo evento impossível é igual a 0 ou 0% 6 - Eventos Complementares Sabemos que um evento pode ocorrer ou não. Sendo p a probabilidade de que ele ocorra (sucesso) e q a probabilidade de que ele não ocorra (insucesso), para um mesmo evento existe sempre a relação: Obs.: Em uma distribuição de probabilidades o somatório das probabilidades atribuídas a cada evento elementar é igual a 1, logo temos: p1 + p2 + p3 + ... + pn = 1. Exemplos: 1 – Qual a probabilidade de não tirar o nº 4 no lançamento de um dado? Solução: sabemos que a probabilidade de tirar o nº 4 no lançamento aleatório de um dado é p = 1/6 ou 16,67%. Logo, a probabilidade de não tirar é q = 1 - p ou q = 1 - 1/6 = 5/6 ou 83,33%. 2 - Calcular a probabilidade de um piloto vencer uma dada corrida, onde as suas "chances", segundo os especialistas, são de "3 para 2". Calcule também a probabilidade dele perder. p + q = 1 7 Solução: O termo "3 para 2" significa: de cada 5 corridas ele ganha 3 e perde 2. Então p = 3/5 ou 60% (ganhar) e q = 2/5 ou 40% (perder). 3 - Qual a probabilidade de tirar um número maior ou igual a dois no lançamento de um dado? Solução: sabemos que neste evento só excluímos apossibilidade do resultado do lançamento ser o nº 1 e a probabilidade de tirá-lo no lançamento de um dado é p = 1/6. Logo, a probabilidade do resultado obtido neste lançamento ser maior ou igual a 2 é q = 1 – p, logo q = 1 - 1/6 = 5/6 ou 83,33%. Aprendemos a distinguir eventos complementares, e que a probabilidade de um evento acontecer somado à probabilidade deste mesmo evento não acontecer (complementar) é sempre igual a 1 ou 100%. A seguir vamos definir eventos independentes e calcular a probabilidade deles acontecerem. 7 - Eventos Independentes Dizemos que dois eventos são independentes quando a realização ou a não- realização de um dos eventos não afeta a probabilidade da realização do outro e vice-versa. Por exemplo, quando lançamos dois dados, o resultado obtido em um deles independe do resultado obtido no outro. Se dois eventos são independentes, a probabilidade de que eles se realizem simultaneamente é igual ao produto das probabilidades de realização dos dois eventos. Assim, se p1 é a probabilidade de realização do primeiro evento e p2 a probabilidade de realização do segundo evento, a probabilidade de que tais eventos se realizem simultaneamente é dada por: Esta regra também é conhecida como Teorema do produto, que se aplica nas operações multiplicativas de probabilidades. Operações multiplicativas geralmente envolvem a conjunção “e”, e são representadas pelo símbolo de intersecção “∩”. Fique atento aos exemplos de eventos independentes abaixo: p = p1 x p2 8 1 – Ao lançarmos dois dados, qual a probabilidade de obtermos o número 1 no primeiro e o número 5 no segundo dado? Solução: A probabilidade de obtermos 1 no primeiro dado é: p1 = 1/6 A probabilidade de obtermos 5 no segundo dado é: p2 = 1/6 Logo, a probabilidade de obtermos, simultaneamente, 1 no primeiro e 5 no segundo é: p = 1/6 x 1/6 = 1/36 ou 2,78% 2 – Qual a probabilidade da extração de uma bola vermelha e uma bola branca (nesta ordem) de uma urna com 6 bolas vermelhas e 4 bolas brancas, supondo a reposição da primeira bola extraída antes da extração da segunda bola? Solução: A probabilidade de obtermos uma bola de cor vermelha na primeira extração é: p1 = 6/10 A probabilidade de obtermos uma bola de cor branca na segunda extração é: p2 = 4/10 Logo, a probabilidade da extração das duas bolas: p = 6/10 x 4/10 = 24/100 = 0,24 ou 24% Aprendemos o que são eventos independentes e como calcular a probabilidade desses eventos acontecerem. A seguir vamos definir eventos mutuamente exclusivos e calcular a probabilidade deles acontecerem. 8 - Eventos Mutuamente Exclusivos Dizemos que dois ou mais eventos são mutuamente exclusivos quando a realização de um dos eventos exclui a realização do(s) outro(s). Assim, quando lançamos uma moeda, o evento “tirar cara” e o evento “tirar coroa” são mutuamente exclusivos, já que, ao se realizar um deles, o outro não se realiza. Se dois eventos são mutuamente exclusivos, a probabilidade de que um ou outro se realize é igual à soma das probabilidades de que cada um deles se realize: Esta regra também é conhecida como Teorema da soma, que se aplica nas operações aditivas de probabilidades. Operações aditivas geralmente envolvem a expressão “ou” e são representadas pelo símbolo de união “U”. p = p1 + p2 9 Veja os exemplos apresentados a seguir, em que os eventos são classificados como mutuamente exclusivos ou excludentes. a) Extrair uma carta vermelha e extrair uma carta de paus de um baralho. Como paus é um naipe preto, os eventos são mutuamente excludentes; b) Extrair uma carta vermelha e extrair uma carta preta de um baralho. Como não é possível que uma carta seja das duas cores ao mesmo tempo, os eventos são mutuamente excludentes; c) Extrair cara e extrair coroa do lance de uma moeda. Como não é possível que uma face seja cara e coroa ao mesmo tempo, os eventos são mutuamente excludentes; d) Extrair face par e extrair o número cinco do lance de um dado. Como cinco é um número ímpar, os eventos são mutuamente excludentes. Fique atento ao cálculo da probabilidade de eventos mutuamente excludentes: 1 – Ao lançarmos um dado, qual a probabilidade de obtermos o número 3 ou o número 5? Solução: A probabilidade de obtermos o número 3 é: p1 = 1/6 A probabilidade de obtermos o número 5 é: p2 = 1/6 Logo, a probabilidade de obtermos o número 3 ou o número 5 é: p = 1/6 + 1/6 = 2/6 = 1/3 ou 33,33% 2 – Ao lançarmos uma moeda, qual a probabilidade de obtermos cara ou coroa? Solução: A probabilidade de obtermos cara é: p1 = 1/2 A probabilidade de obtermos coroa é: p2 = 1/2 Logo, a probabilidade de obtermos cara ou coroa é: p = 1/2 + 1/2 = 2/2 = 1 ou 100% (evento certo) 3 – Qual a probabilidade da extração de uma bola vermelha ou branca de uma urna que contém 6 bolas vermelhas, 4 bolas brancas e 5 pretas? Solução: A probabilidade de obtermos uma bola vermelha é: p1 = 6/15 10 A probabilidade de obtermos uma bola branca é: p2 = 4/15 Logo, a probabilidade da extração de uma bola vermelha ou branca é: p = 4/15 + 6/15 = 10/15 ou 66,67% Exercícios Resolvidos 1 – Qual a probabilidade de sair o ás de ouros quando retirarmos uma carta de um baralho de 52 cartas? Resposta: Como só há um ás de ouros, o número de elementos do evento é 1; logo: p = 1/52 ou 1,92%. 2 – Qual a probabilidade de sair um rei quando retirarmos uma carta de um baralho de 52 cartas? Resposta: Como há quatro reis no baralho, o número de elementos do evento é 4; logo: p = 4/52 = 1/13 ou 7,69%. 3 – Em um lote de 12 peças, 4 são defeituosas. Sendo retirada uma peça ao acaso, calcule: a. A probabilidade dessa peça ser defeituosa Resposta: Temos p = 4/12 = 1/3 ou 33,33%. b. A probabilidade dessa peça não ser defeituosa Resposta: Temos p = 1 - 1/3 = 2/3 ou 66,67%. 4 – No lançamento de dois dados, calcule a probabilidade de se obter soma igual a 5. Resposta: O evento é formado pelos elementos (1,4), (2,3), (3,2) e (4,1). Como o número de elementos de S é 36, temos: p = 4/36 = 1/9 ou 11,11%. 5 – De dois baralhos de 52 cartas retiram-se, simultaneamente, uma carta do primeiro baralho e uma carta do segundo. Qual a probabilidade de a carta do primeiro baralho ser um rei e a do segundo ser o 5 de paus? Resposta: Como há quatro reis no baralho, o número de elementos do evento é 4; logo: p1 = 4/52 = 1/13 e p2 = 1/52. Como esses dois acontecimentos são independentes e simultâneos, vem: p = 1/13 x 1/52 = 1/676 ou 0,15%. 6 – Uma urna A contém: 3 bolas brancas, 4 pretas, 2 verdes; uma urna B contém: 5 bolas brancas, 2 pretas, 1 verde; uma urna C contém: 2 bolas brancas, 3 pretas e 4 verdes. Uma bola é retirada de cada urna. Qual a 11 probabilidade de as bolas retiradas da primeira, segunda e terceira urnas serem, respectivamente, branca, preta e verde? Resposta: Temos: p1 = 3/9 = 1/3; p2 = 2/8= 1/4 e p3 = 4/9. Como esses três acontecimentos são independentes e simultâneos, vem: p = 1/3 x 1/4 x 4/9 = 1/27 ou 3,70%. 7 – De um baralho de 52 cartas retiram-se, ao acaso, duas cartas sem reposição. Qual a probabilidade de a primeira carta ser o ás de paus e a segunda ser o rei de paus? Resposta: A probabilidade de sair o ás de paus na primeira carta é p1 = 1/52. Após a retirada da primeira carta, restam 51 cartas no baralho, já que a carta retirada não foi reposta. Assim, a probabilidade de a segunda carta ser o rei de paus é p2 = 1/51. Como esses dois eventos são independentes, temos: p = 1/52 x 1/51= 1/2652 ou 0,04%.8 – Qual a probabilidade de sair uma figura quando retiramos uma carta de um baralho de 52 cartas? Resposta: Temos pR = 4/52 = 1/13, pD = 1/13 pV = 1/13. Como esses eventos são mutuamente exclusivos, vem: p = 1/13 + 1/13 + 1/13 = 3/13 ou 23,08%. 9 – Qual a probabilidade de sair uma carta de copas ou de ouros quando retiramos uma carta de um baralho de 52 cartas? Resposta: Temos pC = 13/52 = 1/4, pO = 1/4. Como esses eventos são mutuamente exclusivos, vem: p = 1/4 + 1/4 = 1/2 ou 50%. 10 – No lançamento de um dado, qual a probabilidade de se obter um número não-inferior a 5? Resposta: A probabilidade de se ter um número não-inferior a 5 é a probabilidade de se obter 5 ou 6. Assim, p = 1/6 + 1/6 = 1/3 ou 33,33%. 11 – São dados dois baralhos de 52 cartas. Tiramos, ao mesmo tempo, uma carta do primeiro baralho e uma carta do segundo. Qual é a probabilidade de tirarmos uma dama e um rei, não necessariamente nesta ordem? Resposta: A probabilidade de tirarmos uma dama do primeiro baralho é p = 4/52 = 1/13 e um rei do segundo é p = 4/52 = 1/13, de acordo com o problema: p1 = 1/13 x 1/13= 1/169. A probabilidade de tirarmos um rei do primeiro baralho e uma dama do segundo é: p2 = 1/13 x 1/13= 1/169. Como esses dois eventos são mutuamente exclusivos, temos: p = 1/169 + 1/169= 2/169 ou 1,18%. 12 12 – Dois dados são lançados conjuntamente. Determine a probabilidade de a soma ser 10 ou maior que 10. Resposta: A soma deverá ser então 10, 11 ou 12. Para que a soma seja 10, a probabilidade é (4,6); (5,5) e (6,4), logo: p = 3/36. Para que a soma seja 11, a probabilidade é (5,6) e (6,5), logo: p = 2/36. Para que a soma seja 12, a probabilidade é (6,6), logo: p = 1/36. Como esses três eventos são mutuamente exclusivos, temos: p = 3/36 + 2/36 + 1/36 = 6/36 = 1/6 ou 16,67%. EXERCÍCIOS 1- No lançamento de um dado temos S = {1, 2, 3, 4, 5, 6}. Formule os eventos definidos pelas sentenças: (a) Obter um número par; (b) Obter um número menor ou igual a 6; (c) Obter o número 4; (d) Obter um número maior que 6. 2 – Construa o espaço amostral do evento “lance de um dado honesto”. Em relação ao espaço amostral, calcule: (a) a probabilidade de ocorrer face cinco; (b) a probabilidade de não ocorrer face três. 3 – Determine o espaço amostral do evento extração de uma carta de um baralho honesto. Calcule a probabilidade de: (a) extrair uma carta de copas; (b) extrair um rei; (c) extrair um valete de paus. 4 – Um grupo de 20 pessoas é formado por 12 homens e 8 mulheres. Em relação ao sorteio de um elemento deste grupo, calcule: (a) a probabilidade de ser homem; (b) a probabilidade de ser mulher. 5 – Uma bola é retirada ao acaso de uma urna que contém 12 bolas pretas, 16 verdes e 8 rosas. Calcule a probabilidade de: (a) não ser verde; (b) não ser preta; (c) ser rosa. 6 – Em um lote de 12 peças, quatro são defeituosas. Sendo retiradas aleatoriamente duas peças, calcule: (a) a probabilidade de ambas serem defeituosas; (b) a probabilidade de ambas não serem defeituosas; (c) a probabilidade de ao menos uma ser defeituosa. 7 – Uma moeda é lançada três vezes. Calcule a probabilidade de obtermos: (a) três caras; (b) duas caras e uma coroa; (c) uma cara somente; (d) nenhuma cara; (e) pelo menos uma cara; (f) no máximo uma cara. 13 8 – Uma urna contém 50 bolas idênticas. Sendo as bolas numeradas de 1 a 50, determine a probabilidade de, em uma extração ao acaso: (a) obtermos a bola de número 27; (b) obtermos uma bola de número par; (c) obtermos uma bola de número maior que 20; (d) obtermos uma bola de número menor ou igual a 20. 9 – Um par de dados é atirado. Encontre a probabilidade de que a soma seja 10 ou maior que 10 se: (a) um 5 aparece no primeiro dado; (b) um 5 aparece pelo menos em um dos dados. 10 – Um lote é formado por dez peças boas, quatro com defeitos e duas com defeitos graves. Uma peça é escolhida ao acaso. Calcule a probabilidade de que: (a) ela não tenha defeitos graves; (b) ela não tenha defeitos; (c) ela se boa ou tenha defeitos graves. 11 – Considere o mesmo lote do problema anterior. Retiram-se duas peças ao acaso. Calcule a probabilidade de que: (a) ambas sejam perfeitas; (b) pelo menos uma seja perfeita; (c) nenhuma tenha defeitos graves; (d) nenhuma seja perfeita. 14 II – DISTRIBUIÇÕES BINOMIAL E NORMAL Neste capítulo apresentaremos dois modelos teóricos de distribuição de probabilidade, aos quais um experimento aleatório estudado possa ser adaptado, o que permitirá a solução de grande número de problemas práticos. 1 - Variável Aleatória Assim, se o espaço amostral relativo ao “lançamento de duas moedas” é S = {(Ca, Ca), (Ca, Co), (Co, Ca), (Co, Co)} e se X representa “o número de caras” que aparecem, a cada ponto amostral podemos associar um número para X, de acordo com a tabela abaixo: PONTO AMOSTRAL X (Ca, Ca) 2 (Ca, Co) 1 (Co, Ca) 1 (Co, Co) 0 2 – Distribuição de Probabilidade Consideremos a distribuição de frequências relativa ao número de acidentes diários em um estacionamento: Nº DE ACIDENTES FREQUENCIAS 0 22 1 5 2 2 3 1 TOTAL 30 Suponhamos um espaço amostral S e que cada ponto amostral seja atribuído um número. Fica, então, definida uma função chamada variável aleatória, indicada por uma letra maiúscula, sendo seus valores indicados por letras minúsculas. 15 Em um dia, a probabilidade de: - não ocorrer acidente é: p = 22/30 = 0,73 ou 73% - ocorrer um acidente é: p = 5/30 = 0,17 ou 17% - ocorrerem dois acidentes é: p = 2/30 = 0,07 ou 7% - ocorrerem três acidentes é: p = 1/30 = 0,03 ou 3% Podemos, então, escrever: Nº DE ACIDENTES PROBABILIDADES 0 0,73 1 0,17 2 0,07 3 0,03 TOTAL 1,00 Essa tabela é denominada distribuição de probabilidade. Assim, voltando a tabela inicial. Temos: Seja X uma variável aleatória que pode assumir os valores x1, x2, x3, ....., xn. A cada valor xi correspondem a probabilidade pi de ocorrência de tais pontos no espaço amostral. Assim, temos: ∑ pi = 1 Os valores x1, x2, x3, ....., xn e seus correspondentes p1, p2, p3, ....., pn definem uma distribuição de probabilidade. 16 Logo, podemos escrever: Nº DE CARAS (X) P(X) 0 1/4 1 2/4 2 1/4 ∑ 1 Ao definir a distribuição de probabilidade, estabelecemos uma correspondência unívoca entre os valores da variável aleatória X e os valores da variável P. Esta correspondência define uma função; os valores xi (i = 1, 2, 3, ...., n) formam o domínio da função e os valores de pi (i = 1, 2, 3, ...., n), o seu conjunto imagem. Essa função, assim definida, é denominada função probabilidade e representada por: A função P(X = xi) determina a distribuição de probabilidade de variável aleatória X. Assim, ao lançarmos um dado, a variável aleatória X, definida por “pontos de um dado”, pode tomar os valores 1, 2, 3, ........., 6. Como a cada um destes valores está associada uma e uma só probabilidade de realização e ∑ P(xi) = 1, fica definida uma função de probabilidade, da qual resulta a seguinte distribuição de probabilidade: X P(X) 1 1/6 2 1/6 3 1/6 4 1/6 5 1/6 6 1/6 ∑ 1 f(x) = P(X = xi) 17 3 – Distribuição Binomial Eventos binomiais são marcados pela existência de duas categorias, mutuamente excludentes e coletivamente exaustivos. Mutuamente excludentes significa que uma categoria implica a possibilidade da não-ocorrênciasimultânea da outra categoria. Por coletivamente exaustivas entende-se que a união de ambos os eventos resulta no espaço amostral. Exemplos de eventos binomiais podem ser fornecidos por meio de números pares e ímpares no lançamento de um dado honesto, e por meio da extração de cartas vermelhas e pretas de um baralho. Geralmente, em análises estatísticas, os exemplos mais comuns de eventos binomiais são aqueles que estabelecem situações de sucesso e fracasso. Situações de sucesso correspondem àquilo que se deseja estudar. Situações de fracasso correspondem ao complemento. Ou seja, àquilo que não se deseja estudar. Vamos, neste item, considerar experimentos que satisfaçam as seguintes condições: a. O experimento deve ser repetido, nas mesmas condições, um número finito de vezes (n). b. As provas repetidas devem ser independentes, isto é, o resultado de uma não deve afetar os resultados das sucessivas. c. Em cada prova deve aparecer um dos dois possíveis resultados: sucesso e insucesso. d. No decorrer do experimento, a probabilidade p do sucesso e a probabilidade q (q = 1 – p) do insucesso manter-se-ão constantes. Resolveremos problemas do tipo: determinar a probabilidade de se obterem k sucessos em n tentativas. O experimento “obtenção de caras em cinco lançamentos sucessivos e independentes de uma moeda” satisfaz essas condições. Sabemos que, quando da realização de um experimento qualquer em uma única tentativa, se a probabilidade de realização de um evento (sucesso) é p, a probabilidade de não-realização desse mesmo evento (insucesso) é 1 – p = q. 18 Suponhamos, agora, que realizemos a mesma prova n vezes sucessivas e independentes. A probabilidade de que um evento se realize k vezes nas provas é dada pela função: Na qual: P (X = k) é a probabilidade de que o evento se realize k vezes em n provas; p é a probabilidade de que o evento se realize em uma só prova – sucesso; q é a probabilidade de que o evento não se realize no decurso dessa – insucesso; Essa função, denominada lei binomial, define a distribuição binomial. Exercícios Resolvidos 1 – Uma moeda é lançada 5 vezes seguidas e independentes. Calcule a probabilidade de serem obtidas 3 caras nessas 5 provas. 19 2 – Dois times de futebol, A e B, jogam entre si 6 vezes. Encontre a probabilidade de o time A ganhar 4 jogos. 3 – Uma moeda honesta, que apresenta a mesma probabilidade de cara ou coroa, é jogada quatro vezes. Deseja-se calcular a probabilidade de sair cara: (a) uma vez; (b) três vezes, (c) pelo menos uma vez. Neste caso, sabe-se que n é igual a 4 (número de lances da moeda); a probabilidade de sair cara é igual a meio, ou p = 0,50. A probabilidade de sair coroa também é igual a meio, ou q = 1 – p = 1 – 0,50 = 0,50. A variável x varia para cada situação: (a) Para calcular a probabilidade de ocorrer apenas uma cara, x = 1. P(x = 1) = C4,1(0,50) 1(0,50)4-1 = 0,25 ou 25% (b) Para calcular a probabilidade de ocorrerem três caras, x = 3. P(x = 3) = C4,3(0,50) 3(0,50)4-3 = 0,25 ou 25% (c) Pelo menos uma vez implica na aceitação do número de caras igual a 1, 2, 3 ou 4, ou na probabilidade de x = 1, ou x = 2, ou x = 3, ou x = 4. Ou, de forma mais fácil, pelo menos uma vez implica na aceitação de qualquer resultado menos o resultado x = 0. P(x ≥ 1) = P(x = 1) + P(x = 2) + P(x = 3) + P(x = 4) = 1 - P(x = 0) P(x ≥ 1) = 1 - C4,0(0,50)0(0,50)4-0 = 1 - 0,0625 = 0,9375 ou 93,75% 20 4 – A probabilidade de uma duplicata ser paga em dia é de 70%. Escolhemos ao acaso seis duplicatas para uma auditoria. Deseja-se calcular a probabilidade de: (a) todas serem pagas em atraso; (b) Apenas uma ser paga em dia; (c) todas serem pagas em dia. Solução: para resolver este problema podemos considerar como evento sucesso i) duplicata paga em dia; ii) duplicata paga em atraso. Considerando a primeira opção temos: (a) Para calcular a probabilidade de todas serem pagas em atraso, ou nenhuma ser paga em dia, temos x = 0. P(x = 0) = C6,0(0,70) 0(0,30)6-0 = 0,0007 ou 0,07% (b) Para calcular a probabilidade de apenas uma duplicata ser paga em dia, temos x = 1. P(x = 1) = C6,1(0,70) 1(0,30)6-1 = 0,01 ou 1% (c) Para calcular a probabilidade de todas as duplicatas serem pagas em dia, temos x = 6. P(x = 6) = C6,6(0,70) 6(0,30)6-6 = 0,118 ou 11,8% EXERCÍCIOS 1 – Determine a probabilidade de obtermos exatamente 3 caras em 6 lances de uma moeda. 2- Uma moeda é lançada 20 vezes. Qual a probabilidade de saírem 8 caras? 3 – Jogando-se um dado três vezes, determine a probabilidade de se obter um múltiplo de 3 duas vezes. 4 – Numa criação de coelhos, 40% são machos. Qual a probabilidade de que nasçam pelo menos 2 coelhos machos num dia em que nasceram 20 coelhos? 5 – Dois times de futebol, A e B, jogam entre si 6 vezes. Encontre a probabilidade de o time A: a. Ganhar dois ou três jogos; b. Ganhar pelo menos um jogo. 21 6 – A probabilidade de um atirador acertar o alvo em um único tiro é 2/3. Se ele atirar 5 vezes, qual a probabilidade de acertar exatamente 2 tiros? 7 – Seis parafusos são escolhidos ao acaso da produção de certa máquina, que apresenta 10% de peças defeituosas. Qual a probabilidade de serem defeituosos dois deles? 8 – Uma prova tipo teste tem 50 questões independentes. Cada questão tem 5 alternativas. Apenas uma das alternativas é a correta. Se um aluno resolve a prova respondendo a esmo as questões, qual a probabilidade de tirar nota 5? 9 – Uma urna tem 20 bolas pretas e 30 brancas. Retiram-se 25 bolas com reposição. Qual a probabilidade de que: a. 2 sejam pretas? b. Pelo menos 3 sejam pretas? c. 10 sejam brancas? 10 – A probabilidade de um arqueiro acertar o alvo com uma única flecha é 0,20. Lança 30 flechas no alvo. Qual a probabilidade de que: a. Exatamente 4 acertem o alvo? b. Pelo menos 3 acertem o alvo? 11 – Considere 10 tentativas independentes de um experimento. Cada tentativa admite sucesso com probabilidade 0,05. Seja X o número de sucessos, calcular P (1< x ≤ 4). 12 – Uma urna tem 10 bolas brancas e 40 pretas. Qual a probabilidade de que em 30 bolas retiradas com reposição ocorram no máximo 2 brancas? 13 – A probabilidade de um atirador acertar no alvo num único tiro é 1/4. O atirador atira 20 vezes no alvo. Qual a probabilidade de acertar: a. Exatamente 5 vezes? b. Pelo menos 3 vezes? c. Nenhuma vez? d. No máximo 4 vezes? 14 – Uma urna contém 8 bolas brancas e 12 pretas. Retiram-se 10 bolas com reposição. Qual a probabilidade de que: a. No máximo 2 sejam brancas? b. 3 sejam brancas? 22 15 – A probabilidade de uma máquina produzir uma peça defeituosa, num dia, é de 0,1. Qual a probabilidade de que em 20 peças produzidas pela máquina num dia, ocorram 3 defeituosas? 16 – Estima-se que cerca de 30% dos frangos congelados contenham suficiente número de bactérias salmonelas causadoras de doenças, se forem assados inadequadamente. Um consumidor compra 12 frangos congelados. Qual é a probabilidade do consumidor ter mais de 6 frangos contaminados? 17 – Acredita-se que 20% dos moradores das proximidades de uma grande indústria siderúrgica tem alergia aos poluentes lançados ao ar. Admitindo que este percentual de alérgicos é real (correto), calcule a probabilidade de que pelo menos 4 moradores tenham alergia entre 13 selecionados ao acaso. 18 - Três em cada quatro alunos de uma universidade fizeram cursinho antes de prestar vestibular. Se 16 alunos são selecionados ao acaso, qual é a probabilidade de que: (a) Pelo menos 12 tenham feito cursinho? (b) No máximo 13 tenham feito cursinho? (c) Exatamente 12 tenhamfeito cursinho? 19 - Admita que, respectivamente, 90% e 80% dos indivíduos das populações A e B sejam alfabetizados. Se 12 pessoas da população A e 10 da população B forem selecionadas ao acaso, qual é a probabilidade de que pelo menos uma não seja alfabetizada? 20 – Uma pesquisa, com 420 casais que possuem cinco filhos, constatou que a probabilidade de nascimento de meninos é de 58%. Nestas 420 famílias com cinco crianças cada uma, quantas se esperaria que tivessem: a) Nenhuma menina; b) Três meninos; c) Quatro meninos. 21 – As pacientes diagnosticadas com certa doença têm 80% de chance de serem curadas. Para um grupo de doze pacientes nessas condições, calcule a probabilidade de: a) Oito ficarem completamente curadas; b) Entre três (inclusive) e cinco (inclusive) não serem curadas; c) Não mais do que duas permanecerem com a doença. 23 22 – Um vendedor de seguros vende apólices a 5 homens, todos da mesma idade e de boa saúde. De acordo com as tabelas atuariais, a probabilidade de um homem, dessa idade particular, estar vivo daqui a 30 anos é de 2/3. Determinar a probabilidade de estarem ainda vivos daqui a 30 anos: a) Todos os cinco homens; b) Pelo menos 3; c) Apenas 2; d) Pelo menos 1. 23 – Uma recente pesquisa detectou que 90% dos fumantes de uma região afirmaram desejar parar com seu vício. Em uma amostra formada por dez pessoas: a) Qual a probabilidade de a maioria querer parar de fumar? a) Qual a probabilidade de todos quererem parar de fumar? 24 – Uma empresa comercial calcula que 5% de suas vendas não são recebidas, em função do recebimento de cheques sem fundos. Ao se analisar uma amostra formada por oito vendas, qual a probabilidade de: (a) todas serem pagas normalmente? (b) uma ou duas vendas, apenas, serem pagas? (c) pelo menos três vendas serem pagas normalmente? (d) todas as vendas não serem pagas? 25 – Existem treze jogos na Loteria Esportiva. Em cada um dos jogos, determinado time pode ganhar ou empatar ou perder. Calcule a probabilidade de um jogador que nada sabe sobre os times: (a) acertar todos os jogos; (b) acertar pelo menos um jogo; (c) acertar pelo menos doze jogos. Use o maior número de casas decimais nas respostas. 24 4 – Distribuição Normal Entre as distribuições teóricas de variável aleatória contínua, uma das mais empregadas é a distribuição normal. Consiste em uma distribuição contínua de probabilidades, onde a apresentação da distribuição de frequências f(x) de uma variável qualitativa x costuma apresentar-se em forma de sino e simétrica em relação à média. O estudo da distribuição normal recebeu contribuições de matemáticos importantes, como De Moivre, Laplace e Gauss. Alguns estudos revelam que medições repetidas de uma mesma grandeza, como o diâmetro de uma esfera ou o peso de determinado objeto, nunca forneciam os mesmos valores. Porém, a apresentação das frequências dos inúmeros números coletados sempre resultava em uma curiosa curva em forma de sino. Das observações surgiu o nome curva “normal” dos erros. Muitas das variáveis analisadas na pesquisa socioeconômica correspondem à distribuição normal ou dela se aproximam. O aspecto gráfico da distribuição normal é o da figura abaixo: Os conceitos associados à distribuição Normal são simples. Em torno da média, valor central, registra-se alta concentração de frequências ou probabilidade maior de ocorrência. À medida que nos afastamos da média, as frequências são reduzidas. A probabilidade de encontrarmos valores mais distantes da média diminui. Quanto mais longe da média e dos valores centrais, menores as frequências e as probabilidades. 25 Para uma perfeita compreensão da distribuição normal, observe a figura e procure visualizar as seguintes propriedades: Quando temos em mãos uma variável aleatória com distribuição normal, nosso principal interesse é obter a probabilidade de essa variável aleatória assumir um valor em um determinado intervalo. Vejamos como proceder, por meio de um exemplo concreto. A distribuição Normal de variável aleatória X depende dos parâmetros da media e do desvio padrão, proveniente da variância. Então, pode ser também representada desta maneira: X: N ( , S2), ou seja, X segue uma distribuição Normal de media e variância S2. Exemplo: Seja X a variável aleatória que representa os diâmetros dos parafusos produzidos por certa máquina. Vamos supor que essa variável tenha distribuição normal com média = 2 cm e desvio padrão s = 0,04 cm. Queremos conhecer a probabilidade de um parafuso tirado ao acaso ter um diâmetro com valor entre 2 e 2,05 cm. 1ª) A variável aleatória X pode assumir todo e qualquer valor real. 2ª) A representação gráfica da distribuição normal é uma curva em forma de sino, que recebe o nome de curva normal ou de Gauss ou de Moivre. 3ª) A distribuição é simétrica em torno da média ( ) 4ª) A área total limitada pela curva e pelo eixo das abscissas é igual a 1 ou à percentagem de 100%, já que essa área corresponde à probabilidade de a variável aleatória X assumir qualquer valor real. 5ª) A curva normal é assintótica em relação ao eixo das abscissas, isto é, aproxima-se indefinidamente do eixo das abscissas sem, contudo, alcançá-lo. 6ª) Como a curva é simétrica em torno de , a probabilidade de ocorrer valor maior do que a média é igual à probabilidade de ocorrer valor menor do que a média, isto é, ambas as probabilidades são iguais a 0,5 ou 50%. Escrevemos: P(X > ) = P(X < ) = 0,5 ou 50%. 26 É fácil notar que essa probabilidade, indicada por: P(2< X < 2,05) corresponde à área hachurada na figura: O cálculo direto dessa probabilidade exige um conhecimento de Matemática mais avançado do que aquele que dispomos no curso de ensino médio. Entretanto, podemos contornar facilmente esse problema. Basta aceitar, sem demonstração, que, se X é uma variável aleatória com distribuição normal de média e desvio padrão s, e então a variável z dada por: tem distribuição normal reduzida, isto é, tem distribuição normal de média 0 e desvio padrão 1. As probabilidades associadas à distribuição normal padronizada são encontradas em tabelas, não havendo necessidade de serem calculadas. Em anexo, é apresentada uma tabela de distribuição normal reduzida, que nos dá a probabilidade de Z tomar qualquer valor entre a média 0 e um dado valor z, isto é: P(0 < Z < z) Temos, então, que se X é uma variável aleatória com distribuição normal de média e desvio padrão s, podemos escrever: P( < X < x) = P(0 < Z < z), com 27 Voltemos, então, ao nosso problema. Queremos calcular P(2< X < 2,05). Para obter essa probabilidade, precisamos, em primeiro lugar, calcular o valor de z que corresponde a variável x = 2,05, já que para x = 2 → z = 0, pois = 2. Temos então: Z = 2,05 – 2 / 0,04 = 1,25 donde: P(2 < X < 2,05) = P(0 < Z < 1,25) Procuremos, agora, na tabela Z em anexo, o valor de z = 1,25. Observe a forma de entrada na tabela: Na primeira coluna encontramos o valor 1,2 (número inteiro + 1ª casa decimal). Em seguida, encontramos, na primeira linha, o valor 5 (2ª casa decimal), que corresponde ao último algarismo do número 1,25. Na intersecção da linha e coluna correspondentes encontramos o valor 0,3944, o que nos permite escrever: P(0 < Z < 1,25) = 0,3944 Assim, a probabilidade de um parafuso fabricado por essa máquina apresentar um diâmetro entre a média = 2 e o valor x = 2,05 é 0,3944. Escrevemos, então: P(2 < X < 2,05) = P(0 < Z < 1,25) = 0,3944 ou 39,44%.28 Exercícios Resolvidos 1 – Com base na tabela Z determine as probabilidades: a. P(-1,25 < Z < 0) A probabilidade procurada corresponde à parte hachurada da figura: Sabemos que: P(0 < Z < 1,25) = 0,3944 Pela simetria da curva, temos: P(-1,25 < Z < 0) = P(0 < Z < 1,25) = 0,3944ou 39,44%. b. P(-0,5 < Z < 1,48) A probabilidade procurada corresponde à parte hachurada da figura: Temos que: P(-0,5 < Z < 1,48) = P(-0,5 < Z < 0) + P(0 < Z < 1,48) Como: P(-0,5 < Z < 0) = P(0 < Z < 0,5) = 0,1915 e P(0 < Z < 1,48)= 0,4306 Obtemos: P(-0,5 < Z < 1,48) = 0,1915 + 0,4306 = 0,6221ou 62,21% 29 c. P(0,8 < Z < 1,23) A probabilidade procurada corresponde à parte hachurada da figura: Temos que: P(0,8 < Z < 1,23) = P(0 < Z < 1,23) - P(0 < Z < 0,8) Como: P(0 < Z < 1,23)= 0,3907 e P(0 < Z < 0,8)= 0,2881 Obtemos: P(0,8 < Z < 1,23) = 0,3907 - 0,2881 = 0,1026 ou 10,26% d. P(Z > 0,6) A probabilidade procurada corresponde à parte hachurada da figura: Temos que: P(Z > 0,6) = P(Z > 0) - P(0 < Z < 0,6) Como: P(Z > 0)= 0,5 e P(0 < Z < 0,6)= 0,2258 Obtemos: P(Z > 0,6) = 0,5 - 0,2258 = 0,2742 ou 27,42% 30 e. P(Z < 0,92) A probabilidade procurada corresponde à parte hachurada da figura: Temos que: P(Z < 0,92) = P(Z < 0) + P(0 < Z < 0,92) Como: P(Z < 0)= 0,5 e P(0 < Z < 0,92)= 0,3212, Obtemos: P(Z < 0,92) = 0,5 + 0,3212 = 0,8212 ou 82,12%. 2 – Os salários semanais dos operários industriais são distribuídos normalmente, em torno da média de R$ 500,00, com desvio padrão de R$ 40,00. Calcule a probabilidade de um operário escolhido ao acaso ter um salário semanal situado entre R$ 490,00 e R$ 520,00. Devemos inicialmente, determinar os valores Z1 e Z2 da variável de distribuição normal reduzida. Assim, Z1 = 490 – 500 = - 0,25 e Z2 = 520 – 500 = 0,5 40 40 Como: P(490 < X < 520) = P(- 0,25 < Z < 0,5) = P(- 0,25 < Z < 0) + P( 0 < Z < 0,5)= 0,0987 + 0,1915 = 0,2902 É, pois, de se esperar que, em média, 29,02% dos operários tenham salários entre R$ 490,00 e R$ 520,00, ou seja, a probabilidade de um operário escolhido ao acaso ter salário entre R$ 490,00 e R$ 520,00 é de 29,02%. 31 EXERCÍCIOS 1 – Sendo Z uma variável com distribuição normal reduzida, baseado na tabela Z calcule: a. P (0 < Z < 1,44) b. P (-0,85 < Z < 0) c. P (- 1,48 < Z < 2,05) d. P (0,72 < Z < 1,89) e. P (Z > - 2,03) f. P (Z > 1,08) g. P (Z < - 0,66) h. P (Z < 0,60) 2 – Use a tabela Z para encontrar as seguintes probabilidades: a. P (Z > 0,34) b. P (Z < 1,85) c. P (Z < - 1,24) d. P (1,56 < Z < 2,37) e. P (-0,37 < Z < 3,4) f. P (Z > 1,08) g. P (Z < - 0,66) h. P (Z < -2,30 ou Z > 1,29) 3 – seja X: N (100,25). Calcular a. P (100 ≤ X ≤ 106) b. P (89 ≤ X ≤ 107) c. P (112 ≤ X ≤ 116) d. P (X ≥ 108) e. P (X ≤ 90) 4 – Um teste padronizado de escolaridade tem distribuição normal com média aritmética de 100 e desvio padrão de 10. Determine a probabilidade de um indivíduo submetido a esse teste e escolhido ao acaso ter nota: a. Maior que 120 b. Maior que 80 c. Entre 85 e 115 d. Maior que 100 e. Até qual nota apresenta 83,40% de probabilidade de acontecer 32 5 – No exercício anterior, qual a nota que apresenta 93,70% de probabilidade de um aluno tirar acima dela? 6 – As alturas de 20000 alunos de um colégio têm distribuição aproximadamente normal, com media 1,64 m e desvio padrão 0,16 m. Pede-se: a) Qual o número esperado de alunos com altura superior a 1,52 m? b) Qual o intervalo simétrico em torno da media, que conterá 78% das alturas dos alunos? c) Qual a altura esperada, no qual 15036 alunos estejam abaixo dela? 7 – Os pesos de 600 estudantes são normalmente distribuídos com média aritmética de 65,3 kg e desvio padrão de 5,5 kg. Determine o número de estudantes que pesam: a. Entre 60 e 70 kg b. Mais que 63,2 kg c. Menos que 68 kg 8 – A duração de um componente eletrônico tem média de 850 dias e desvio padrão de 40 dias. Sabendo que a duração é normalmente distribuída, calcule a probabilidade de um componente escolhido ao acaso durar: a. Entre 700 e 1.000 dias b. Mais de 800 dias c. Menos de 750 dias 9 – Sendo X: N (50,16), determinar Xα, tal que: a. P (X ≥ Xα) = 0,05 b. P (X ≤ Xα) = 0,99 10 – Um fabricante de baterias sabe, por experiência passada, que as baterias de sua fabricação têm vida média de 600 dias e desvio padrão de 100 dias, sendo que a duração tem aproximadamente distribuição Normal. O fabricante oferece uma garantia de 312 dias, isto é, troca as baterias que apresentarem falhas nesse período. A fábrica produz mensalmente 10.000 baterias. Quantas baterias ele deverá trocar mensalmente pelo uso da garantia? 33 11 – Uma fábrica de carros sabe que os motores de sua fabricação têm duração normal com média de 150.000 km e desvio padrão de 5.000 km. Qual a probabilidade de que um carro, escolhido ao acaso, dos fabricados por essa firma, tenha um motor que dure: a. Menos de 170.000 km? b. Entre 140.000 e 165.000 km? c. Se a fábrica substitui o motor que apresenta duração inferior à garantia, qual deve ser esta garantia para que a porcentagem de motores substituídos seja inferior a 0,2%? 12 – As pontuações de QI seguem uma distribuição normal com uma pontuação média de 100 e desvio padrão de 15, isto é, X ~ N (100,225). Encontre a porcentagem de pessoas que se espera possuir uma pontuação de QI: a. De menos de 70? b. Entre 80 e 120? c. De mais de 50? 13 – Os salários dos diretores das empresas de São Paulo distribuem-se normalmente com média de R$ 8.000,00 e desvio padrão de R$ 500,00. Qual a percentagem de diretores que recebem: a. Menos de R$ 6.470,00? b. Entre R$ 8.920,00 e R$ 9.380,00? 14 – A quantidade de óleo contida em cada lata fabricada por uma indústria tem peso distribuído normalmente, com média de 990 g e desvio padrão igual a 10 g. Uma lata é rejeitada no comércio se tiver peso menor que 976 g. a. Qual a probabilidade de que em 10 latas observadas, uma seja rejeitada? b. Nas condições do item a, qual a probabilidade de que em 20 latas observadas, 3 sejam rejeitadas? 15 – Foi feito um estudo sobre a altura dos alunos da IFCE. Observou-se que ela se distribui normalmente com média de 1,72 m e desvio padrão de 5 cm. Qual a porcentagem dos alunos com altura: a. Entre 1,57 e 1,87 m? b. Acima de 1,90 m? 34 16 – Um estudo das modificações dos preços, no atacado, de produtos industrializados, mostrou que há distribuição normal com média de 50% e desvio padrão de 10%. Qual a porcentagem dos artigos que: a. Sofreram aumentos superiores a 75%? b. Sofreram aumentos entre 30% e 80%? 17 – O volume de correspondência recebido por uma firma quinzenalmente tem distribuição normal com média de 4000 cartas e desvio padrão de 200 cartas. Qual a percentagem de quinzenas em que a firma recebe: a. Entre 3600 e 4250 cartas? b. Mais de 4636 cartas? c. Menos de 3400 cartas? 18 – Numa fábrica foram instaladas 1000 lâmpadas novas. Sabe-se que a duração média das lâmpadas é de 800 horas e desvio padrão de 100 horas, com distribuição normal. Determinar a quantidade de lâmpadas que durarão: a. Menos de 500 horas? b. Mais de 700 horas? c. Entre 516 e 684 horas? 19 – Suponha que o tempo necessário para atendimento de clientes em uma central de atendimento telefônico siga uma distribuição normal de média de 8 minutos e desvio padrão de 2 minutos. (a) Qual é a probabilidade de queum atendimento dure menos de 5 minutos? (b) E mais do que 9,5 minutos? (c) E entre 7 e 10 minutos? (d) 75% das chamadas telefônicas requerem pelo menos quanto tempo de atendimento? 20 - Uma enchedora automática de refrigerantes está regulada para que o volume médio de líquido em cada garrafa seja de 1000 cm3 e desvio padrão de 10 cm3. Admita que o volume siga uma distribuição normal. a) Qual é a porcentagem de garrafas em que o volume de líquido é menor que 990 cm3? b) Qual é a porcentagem de garrafas em que o volume de líquido não se desvia da média em mais do que dois desvios padrões? c) Se 10 garrafas são selecionadas ao acaso, qual é a probabilidade de que, no máximo, 4 tenham volume de líquido superior a 1002 cm3? 35 21 – Suponha que as notas em certa disciplina estão normalmente distribuídas com média 5,0 e desvio padrão 1,5: a) determine o percentual de estudantes com nota superior a 8,0; b) se a nota mínima para obter aprovação e 3,0, determine o percentual de estudantes reprovados; c) explique por que a probabilidade de um estudante dessa população obter nota acima de 9,8 é praticamente zero. 22 – Um fabricante de máquinas de lavar sabe, por longa experiência, que a duração tem duração de suas máquinas tem distribuição normal com média de 1000 dias e desvio padrão de 200 dias. O fabricante oferece uma garantia de 1 ano (365 dias) para o produto. Produz mensalmente 2000 máquinas. Quantas máquinas ele espera trocar mensalmente pelo uso da garantia dada? 23 – Um fabricante de produtos alimentícios vende um de seus produtos em latas de 900 g de conteúdo líquido. Para embalar o produto, adquiriu uma máquina que permite obter o peso desejado, com distribuição normal e desvio padrão de 10 g. O IPM (Instituto de Pesos e Medidas) exige que no máximo 5% das latas contenham menos do que o peso líquido nominal. Responda: a) Se a máquina for regulada para 910 g, poderá satisfazer esta exigência do IPM? b) Qual deverá ser a regulagem da máquina para que a exigência do IPM seja satisfeita? c) Feita esta nova regulagem (item b), as latas são remetidas ao comércio. O IPM examina, então, uma amostra de 20 latas em um supermercado. Qual a probabilidade de encontrar pelo menos três com o peso inferior ao especificado na embalagem? 24 – Um teste de aptidão feito por pilotos de elite em treinamento inicial requer que uma série de operações seja realizada em uma rápida sucessão. Suponha que o tempo para completar o teste seja distribuído normalmente com média de 80 minutos e desvio padrão de 30 minutos. Para passar no teste, o candidato deve completá-lo em menos de 70 minutos. Pede-se: a) Se 200 candidatos fazem o teste, quantos são esperados passar no teste? b) Se os 5% melhores candidatos serão alocados para aeronaves maiores, quão rápido deve ser o candidato para que obtenha essa posição? 36 25 – A distribuição dos pesos de porcos numa suinocultura pode muito bem ser representada por uma distribuição normal, com média de 128,72 kg e desvio padrão de 32,46 kg. Um matadouro comprará 5000 porcos e pretende classificá-los de acordo com o peso, do seguinte modo: 18% dos mais leves como pequenos, os 50% seguintes como médios, os 22% seguintes como grandes e os 10% mais pesados como extras. Quais os limites de peso para cada classificação? 26 – Um pesquisador verificou que em uma cidade do interior de São Paulo o peso dos homens tem distribuição aproximadamente normal com média de 85 kg e desvio padrão de 20 kg, enquanto o das mulheres também apresenta-se normalmente distribuído, com média de 60 kg e desvio padrão de 8 kg. Pede- se: (a) sorteando-se um homem, qual a probabilidade de ele ter peso acima de 75 kg? (b) sorteando-se uma mulher, qual a probabilidade de ela ter peso acima de 65 kg? (c) qual é a probabilidade de uma pessoa ter peso acima de 65 kg, sendo ela sorteada de um grupo em que o número de mulheres é o triplo do de homens? 27 – Antes de uma importante prova de Estatística, o professor verificou que o tempo dedicado aos estudos de revisão dos seus alunos seguia uma distribuição aproximadamente normal, de media 12 horas e desvio padrão de 1,5 hora. Pede-se: a) Determinar o tempo de estudo que é superado por 98,5% dos alunos? b) Determinar a faixa em torno do valor médio que contenha 90% dos valores do tempo dedicados aos estudos. 28 – Para ser aprovado em um exame de seletivo um candidato deve obter nota superior a 8,2 em matemática e superior a 9,5 em português. Sabendo que as notas seguem uma distribuição normal, com media e variância apresentados na tabela seguinte, calcule quantos alunos de um grupo de 950 devem ser aprovados neste processo seletivo. PROVA MEDIA VARIANCIA PORTUGUES 7,3 7,29 MATEMÁTICA 6,1 3,24 37 III – CORRELAÇÃO E REGRESSÃO 1 - Introdução Nos capítulos anteriores, nossa preocupação era descrever a distribuição de valores de uma variável. Com esse objetivo, aprendemos a calcular medidas de tendência central e variabilidade. Quando, porém, consideramos observações de duas ou mais variáveis, surge um novo problema: as relações que podem existir entre as variáveis estudadas. Nesse caso, as medidas estudadas não são suficientes. Assim, quando consideramos variáveis como peso e altura de um grupo de pessoas, uso do cigarro e incidência de câncer, vocabulário e compreensão da leitura, dominância e submissão, procuramos verificar se existe alguma relação entre as variáveis de cada um dos pares e qual o grau dessa relação. Para isso, é necessário o conhecimento de novas medidas. Sendo a relação entre as variáveis de natureza quantitativa, a correlação é o instrumento adequado para descobrir e medir essa relação. Uma vez caracterizada a relação, procuramos descrevê-la através de uma função matemática. A regressão é o instrumento adequado para a determinação dos parâmetros dessa função. 2 – Correlação 2.1 – Relação funcional e relação estatística Como sabemos, o perímetro e o lado de um quadrado estão relacionados. A relação que os liga é perfeitamente definida e pode ser expressa por meio de uma sentença matemática: 2p = 4l, onde 2p é o perímetro e l é o lado do quadrado. Atribuindo-se, então, um valor qualquer a l, é possível determinar exatamente o valor de 2p. Consideremos, agora, a relação que existe entre o peso e a estatura de um grupo de pessoas. É evidente que essa relação não é do mesmo tipo da anterior; ela é bem menos precisa. Assim, pode acontecer que a estaturas diferentes correspondam pesos iguais ou que a estaturas iguais correspondam pesos diferentes. Porém, em media, quanto maior a estatura, maior o peso. 38 As relações do tipo perímetro-lado são conhecidas como relações funcionais e as do tipo peso-estatura, como relações estatísticas. 2.2 – Diagrama de dispersão Consideremos uma amostra aleatória, formada por dez dos 98 alunos de uma classe da faculdade A e pelas notas obtidas por eles em Matemática e Estatística: Tabela 1- Notas de Matemática e Estatística da Faculdade A Nºs Notas Matemática (xi) Estatística (yi) 01 5,0 6,0 08 8,0 9,0 24 7,0 8,0 38 10,0 10,0 44 6,0 5,0 58 7,0 7,0 59 9,0 8,0 72 3,0 4,0 80 8,0 6,0 92 2,0 2,0 Representando, em um sistema coordenado cartesiano ortogonal, os pares ordenados (xi,yi), obtemos uma nuvem de pontos que denominamos diagrama de dispersão. Esse diagrama nos fornece uma ideia grosseira, porém útil, da correlação existente: Quando duas variáveis estão ligadas por uma relação estatística, dizemosque existe correlação entre elas. 39 2.3 – Correlação linear Os pontos obtidos, vistos em conjunto, formam uma elipse em diagonal. Podemos imaginar que, quanto mais fina for a elipse, mais ela se aproximará de uma reta. Dizemos, então, que a correlação de forma elíptica tem como “imagem” uma reta, sendo, por isso, denominada correlação linear. É possível verificar que a cada correlação está associada como “imagem” uma relação funcional. Por esse motivo, as relações funcionais são chamadas relações perfeitas. Como a correlação em estudo tem como “imagem” uma reta ascendente, ela é chamada correlação linear positiva. Assim, uma correlação é: Linear positiva se os pontos do diagrama têm como “imagem” uma reta ascendente; Linear negativa se os pontos do diagrama têm como “imagem” uma reta descendente; Não-linear se os pontos têm como “imagem” uma curva. Se os pontos apresentam-se dispersos, não oferecendo uma “imagem” definida, concluímos que não há relação alguma entre as variáveis em estudo. 40 Temos, então: 2.4 – Coeficiente de correlação linear O instrumento empregado para a medida da correlação linear é o coeficiente de correlação. Esse coeficiente deve indicar o grau de intensidade da correlação entre duas variáveis e, ainda, o sentido dessa correlação (positivo ou negativo). Faremos uso do coeficiente de correlação de Pearson, que é dado por: onde n é o número de observações. Os valores limites do coeficiente r são -1 e +1, isto é, o valor de r pertence ao intervalo [-1,+1]. 41 Assim: Se a correlação entre duas variáveis é perfeita e positiva, então r = +1; Se a correlação é perfeita e negativa, então r = -1; Se não há correlação entre as variáveis, então r = 0. Logicamente: Se r = +1, há uma correlação perfeita e positiva entre as variáveis; Se r = -1, há uma correlação perfeita e negativa entre as variáveis; Se r = 0, ou não há correlação entre as variáveis, ou a relação que porventura exista não é linear. NOTAS: Para que uma relação possa ser descrita por meio do coeficiente de correlação de Pearson é imprescindível que ela se aproxime de uma função linear. Uma maneira prática de verificarmos a linearidade da relação é a inspeção do diagrama de dispersão: se a elipse apresenta saliências ou reentrâncias muito acentuadas, provavelmente trata-se de correlação curvilínea. Para podermos tirar algumas conclusões significativas sobre o comportamento simultâneo das variáveis analisadas, é necessário que: 0,6 ≤ | r | ≤ 1 (forte correlação entre as variáveis). Se 0,3 ≤ | r | < 0,6, há uma correlação relativamente fraca entre as variáveis. Se 0 < | r | < 0,3, a correlação é muita fraca e, praticamente, nada podemos concluir sobre a relação entre as variáveis em estudo. Vamos, então, calcular o coeficiente de correlação relativo à Tabela 1. O modo mais prático para obtermos r é abrir, na tabela, colunas correspondentes aos valores de xiyi, xi 2 e yi 2. Assim, temos a tabela a seguir: 42 Tabela 2 – Cálculo dos valores de xiyi, xi 2 e yi 2 (n = 10) Matemática (xi) Estatística (yi) xiyi xi2 yi2 5,0 6,0 30 25 36 8,0 9,0 72 64 81 7,0 8,0 56 49 64 10,0 10,0 100 100 100 6,0 5,0 30 36 25 7,0 7,0 49 49 49 9,0 8,0 72 81 64 3,0 4,0 12 9 16 8,0 6,0 48 64 36 2,0 2,0 4 4 4 Σ = 65 Σ = 65 Σ = 473 Σ = 481 Σ = 475 Logo: Daí: r = 0,91. Resultado que indica uma correlação linear positiva altamente significativa entre as duas variáveis. 43 Resolva: 1. Complete o esquema de cálculo do coeficiente de correlação para os valores das variáveis xi e yi: 44 3 – Regressão 3.1 – Ajustamento da reta Sempre que desejamos estudar determinada variável em função de outra, fazemos uma análise de regressão. Podemos dizer que a análise de regressão tem por objetivo descrever, através de um modelo matemático, a relação entre as duas variáveis, partindo de n observações das mesmas. A variável sobre a qual desejamos fazer uma estimativa recebe o nome de variável dependente e a outra recebe o nome de variável independente. Assim, supondo X a variável independente e Y a dependente, vamos procurar determinar o ajustamento de uma reta à relação entre essas variáveis, ou seja, vamos obter uma função definida por: Y = aX + b onde a e b são os parâmetros. Sejam duas variáveis X e Y, entre as quais exista uma correlação acentuada, embora não perfeita, como, por exemplo, as que formam a tabela 2. Daí, temos: Tabela 3 – Valores das variáveis xi e yi. xi 5 8 7 10 6 7 9 3 8 2 yi 6 9 8 10 5 7 8 4 6 2 cujo diagrama de dispersão é dado por: 45 Podemos concluir, pela forma do diagrama, que se trata de uma correlação retilínea, de modo a permitir o ajustamento de uma reta, imagem da função definida por: Y = aX + b Vamos, então, calcular os valores dos parâmetros a e b com a ajuda das fórmulas: onde, NOTA: Como estamos fazendo uso de uma amostra para obtermos os valores dos parâmetros, o resultado, na realidade, é uma estimativa da verdadeira equação de regressão. Sendo assim, escrevemos: 46 Formemos, então, a tabela de valores: Tabela 4 – Cálculo dos valores de xiyi e xi2 (n = 10). (xi) (yi) xiyi xi2 5,0 6,0 30 25 8,0 9,0 72 64 7,0 8,0 56 49 10,0 10,0 100 100 6,0 5,0 30 36 7,0 7,0 49 49 9,0 8,0 72 81 3,0 4,0 12 9 8,0 6,0 48 64 2,0 2,0 4 4 Σ = 65 Σ = 65 Σ = 473 Σ = 481 Temos, assim: a = 10x473 – 65x65 = 4730 – 4225 = 505 = 0,8632 10x481 – (65)2 4810 – 4225 585 47 Assim, temos: 3.2 – Interpolação e extrapolação Voltando à tabela 1, vemos que 4,0 não figura entre as notas de Matemática. Entretanto, podemos estimar a nota correspondente em Estatística fazendo X = 4,0 na equação: O mesmo acontece com a nota 1,0. Repetindo o procedimento, temos: Como a nota 4,0 pertence ao intervalo [2,10], dizemos que foi feita uma interpolação; e como a nota 1,0 não pertence ao intervalo [2,10], dizemos que foi uma extrapolação. NOTA: Uma norma fundamental no uso das equações de regressão é a de nunca extrapolar, exceto quando considerações teóricas ou experimentais demonstrem a possibilidade de extrapolação. 48 Resolva: 1. Complete o esquema para o ajustamento de uma reta aos dados: xi 2 4 6 8 10 12 14 yi 30 25 22 18 15 11 10 49 EXERCÍCIOS 1 – Um grupo de pessoas fez uma avaliação do peso aparente de alguns objetos. Com o peso real e a media dos pesos aparentes, dados pelo grupo, obteve-se a tabela: PESO REAL 18 30 42 62 73 97 120 PESO APARENTE 10 23 33 60 91 98 159 Calcule o índice de correlação. 2 – Considere os resultados de dois testes, X e Y, obtidos por um grupo de alunos da escola A: xi 11 14 19 19 22 28 30 31 34 37 yi 13 14 18 15 22 17 24 22 24 25 a) Verifique, pelo diagrama, se existe correlação retilínea; b) Em caso afirmativo, calcule o coeficiente de correlação; c) Escreva, em poucas linhas, as conclusões a que chegou sobre a relação entre as variáveis. 3 – A tabela abaixo apresenta a produção de uma indústria: ANOS 1980 1981 1982 1983 1984 1985 1986 1987 1988 QUANTIDADES (t) 34 36 36 38 41 42 43 44 46 Calcule: a) O coeficiente de correlação; Sugestão: para simplificar oscálculos, use para o tempo uma variável auxiliar, por exemplo: xi’ = xi - 1984 b) A reta ajustada; c) A produção estimada para o ano de 1989. 50 4 – A tabela abaixo apresenta valores que mostram como o comprimento de uma barra de aço varia conforme a temperatura: TEMPERATURA (ºC) 10 15 20 25 30 COMPRIMENTO (mm) 1003 1005 1010 1011 1014 Determine: a) O coeficiente de correlação; b) A reta ajustada a essa correlação; c) O valor estimado do comprimento da barra para a temperatura de 18ºC; d) O valor estimado do comprimento da barra para a temperatura de 35ºC; 5 – A variação do valor da Unidade de Preços ao Consumidor - UPC, relativamente a alguns meses de 2009, deu origem à tabela: MESES mai jun jul ago Set out nov VALORES (R$) 10,32 10,32 11,34 11,34 11,34 12,22 12,22 Calcule: a) O grau de correlação de correlação; b) Estabeleça a equação de regressão de Y sobre X; c) Estime o valor da UPC para o mês de dezembro. Sugestão: substitua os meses, respectivamente, por 1, 2, 3, ....., 7. 6 – A partir da tabela: xi 1 2 3 4 5 6 yi 70 50 40 30 20 10 a) Calcule o coeficiente de correlação; b) Determine a reta ajustada; c) Estime o valor de Y para X = 0. 51 7 – Certa empresa, estudando a variação da demanda de seu produto em relação à variação de preço de venda, obteve a tabela: PREÇO (xi) 38 42 50 56 59 63 70 80 95 110 DEMANDA (yi) 350 325 297 270 256 246 238 223 215 208 a) Determine o coeficiente de correlação; b) Estabeleça a equação da reta ajustada; c) Estime o valor de Y para X = 60 e X = 120. 8 – Pretendendo-se estudar a relação entre as variáveis “consumo de energia elétrica” (xi) e “volume de produção nas empresas industriais” (yi), fez-se uma amostragem que inclui vinte empresas, computando-se os seguintes valores: Σxi =11,34; Σyi = 20,72; Σ xi2 = 12,16; Σ yi2 =84,96; Σxiyi = 22,13 Determine: a) O cálculo do coeficiente de correlação; b) A equação de regressão de Y para X; c) A equação de regressão de X para Y. 52 REFERENCIAS Bruni, Adriano Leal. Estatística aplicada à gestão empresarial. 1.ed. São Paulo: Editora Atlas, 2007. Crespo, Antonio Arnot. Estatística fácil. 17.ed. São Paulo: Saraiva, 2002. Hoffmann, Ronaldo; Ovalle, Vieira Sonia. Elementos de estatística. 4.ed. São Paulo: Editora Atlas, 2003. Morettin, Pedro A. Estatística básica. 5.ed. São Paulo: Saraiva, 2002. Pinheiro, João Ismael D. Estatística básica: a arte de trabalhar com dados. Rio de Janeiro: Elsevier, 2009. Silva, Ermes Medeiro da; Silva, Elio Medeiro da; Gonçalves; Valter; Murolo, Afrânio Carlos. Estatística: Para os cursos de economia, Administração e Ciências Contábeis - 1. 3.ed. São Paulo: Editora Atlas, 1999. Toledo, Geraldo Luciano; Ovalle, Ivo Izidoro. Estatística básica. 2.ed. São Paulo: Editora Atlas, 1985. 53 ANEXO: Tabela de Distribuição Normal. 54
Compartilhar