Baixe o app para aproveitar ainda mais
Prévia do material em texto
Renato Nogueirol Lobo Probabilidade e Estatística Sumário 03 CAPÍTULO 3 – Como Aplicar a Teoria da Probabilidade? ...................................................05 Introdução ....................................................................................................................05 3.1 Probabilidade: conceitos básicos................................................................................05 3.1.1 Conceitos básicos ...........................................................................................05 3.1.2 Variável aleatória ............................................................................................06 3.1.3 Resultado .......................................................................................................07 3.1.4 Evento ............................................................................................................07 3.1.5 Probabilidade incondicional..............................................................................08 3.1.6 Probabilidade Condicional ...............................................................................08 3.1.7 Propriedades da probabilidade .........................................................................08 3.1.8 Avaliando testes de triagem ..............................................................................09 3.2 Modelos teóricos ......................................................................................................10 3.2.1 Distribuição Binomial .......................................................................................10 3.2.2 Distribuição Poisson .........................................................................................12 3.2.3 Distribuição Normal ........................................................................................14 3.2.4 Distribuição Multinominal .................................................................................18 3.3 Correlação e Regressão Linear ..................................................................................19 3.3.1 Correlação Linear ...........................................................................................19 3.3.2 Regressão Linear ............................................................................................21 3.3.3 Coeficiente de Correlação ................................................................................22 3.3.4 Regressão .......................................................................................................23 Síntese ..........................................................................................................................26 Referências Bibliográficas ................................................................................................27 05 Capítulo 3 Introdução Você já parou para analisar quais são suas chances de ganhar na Mega-sena? E num jogo de dois dados? Se compararmos o número de possíveis resultados na Mega-sena, que é bastante alto, ao número de possíveis resultados num jogo de dados, será fácil concluir que nossa chance de ganhar num jogo de dados é muito maior. Para que você possa refletir sobre o assunto, a pro- babilidade de ganhar na Mega-sena com uma única aposta é de 1 chance em 50 milhões. Já no caso dos dados, a probabilidade de, ao jogarmos dois dados, obtermos o valor 5 é de 11 chances em 100. Neste capítulo, você irá conhecer, portanto, os conceitos básicos de probabilidade e os modelos Binomial, Poisson e Normal. Iremos também investigar o que é correlação e regressão linear, bem como o coeficiente de correlação. Preparado? Então vamos lá! 3.1 Probabilidade: conceitos básicos Entenda a probabilidade como um número que reflete a possibilidade ou probabilidade de um determinado evento ocorrer. Se você jogar um dado, há seis resultados possíveis, cada um deles igualmente provável. Qual então é a probabilidade de obtermos um número específico? Uma vez que existem seis resultados possíveis, a probabilidade é de 1/6. Esses resultados são chamados de resultados favoráveis. 3.1.1 Conceitos básicos A probabilidade pode ser expressa como um número entre 1 e 0, ou entre 0% e 100%. Um evento com uma probabilidade de 1 pode ser considerado uma certeza: por exemplo, a probabilidade de, ao lançarmos uma moeda, obtermos cara ou coroa é 1, porque não existem outras opções. Um evento com uma probabilidade de 0,5 tem chances iguais de ocorrer ou não. No lançamento de uma moeda, por exemplo, a probabilidade de obtermos cara é 0,5, porque há somente duas opções e cara é uma delas. A teoria da probabilidade paradoxal aplica cálculos precisos para quantificar medidas de in- certeza de eventos aleatórios. O conceito pode ser ilustrado no contexto de um estudo sobre a obesidade em crianças de 5-10 anos de idade que buscam atendimento médico em uma prática pediátrica particular. A população (base de amostragem) inclui todas as crianças que procuraram atendimento nos últimos 12 meses. Como Aplicar a Teoria da Probabilidade? 06 Laureate- International Universities Probabilidade e Estatística IDADE (anos) 5 6 7 8 9 10 TOTAL MENINOS 432 379 501 410 420 418 2560 MENINAS 408 513 412 436 461 500 2730 TOTAIS 840 892 913 846 881 918 5290 Quadro 1 - Número de casos de obesidade por idade encontrada em uma clinica pediátrica. Fonte: Elaborado pelo autor, 2015. Um bom exemplo ligado à área de produção é o seguinte: imagine que numa produção foram retirados 260 parafusos para serem examinados e em cinco deles foram encontrados defeitos. Com base nesta informação, podemos estimar que a probabilidade de que um parafuso seja defeituoso é aproximadamente igual à frequência relativa, que é 5/260 = 0,019 ou 1,9%. Outro tipo de probabilidade que usamos em produção é a estimativa subjetiva, com base nas experiências de uma pessoa. Digamos que um engenheiro geológico examina uma extensa área de propriedade particular, escolhendo o melhor local para perfurar um poço de petróleo. Ele afirma que, com base em sua experiência anterior, a probabilidade de ser bem sucedido é de 30%. Esta é uma estimativa subjetiva de probabilidade e os interessados na perfuração da área podem usá-la para tomar sua decisão. Na probabilidade, a percentagem refere-se à possibilidade de que alguma coisa vai acontecer. Como já mencionamos anteriormente, 0 significa a impossibilidade e 1 determina certeza. Em outras palavras, a escala vai do menos provável até o mais provável. Conceitos de probabilidade ajudam a definir risco, quantificando as perspectivas de resultados não intencionais e negativos. 3.1.2 Variável aleatória Em probabilidade e estatística, uma variável aleatória, quantidade aleatória, variável aleatória ou variável estocástica é uma variável cujo valor está sujeito a variações devidas ao acaso, ou seja, à aleatoriedade, em um sentido matemático. A variável aleatória pode assumir um conjunto de possíveis valores diferentes, cada um com uma probabilidade associada, em contraste com outras variáveis existentes. Possíveis valores de uma variável aleatória podem representar os possíveis resultados de um experimento ainda a ser realizado, ou os possíveis resultados de um experimento passado cujo valor já existente é utilizado, por exemplo, devido a medições imprecisas ou incerteza quântica. Eles também podem representar os resultados de um processo aleatório tais como a fiação quí- mica em uma fieira ou a aleatoriedade subjetiva, a qual resulta do conhecimento incompleto de uma amostra. A função matemática que descreve os possíveis valores de uma variável aleatória e suas probabilidades associadas é conhecida como distribuição de probabilidade. Variáveis alea- tórias podem ser discretas ou contínuas. Os resultados de uma variável aleatória, em função dedistribuição de probabilidade da variável, são chamados de variantes aleatórias. Por exemplo, o tempo não é uma variável aleatória, pois sabemos que amanhã terá 24 horas, o mês de janeiro terá 31 dias e assim por diante. No entanto, a taxa de retorno esperada sobre um fundo de investimento e o desvio padrão esperado desses retornos são variáveis aleatórias. Tentamos prevê-las nos baseando no histórico e em nosso conhecimento de economia, mas não poderemos dizer com certeza que as variáveis obedecerão tudo o que previmos ou esperamos. 07 3.1.3 Resultado Saiba que resultado refere-se a qualquer valor possível que uma variável aleatória pode tomar. Jo- gadores de loteria têm uma probabilidade quase certa de perder seu dinheiro apostando, porém há uma pequena chance de que eles se tornem milionários, pois para um único bilhete de loteria, existe apenas um resultado. Quando um resultado particular acontece, chamamos de evento. Estatisticamente, consideramos os resultados significativos como improváveis se tiverem ocorrido por acaso. Sempre que uma análise estatística é realizada e os são resultados interpretados, há uma possibilidade finita de que os resultados ocorram por acaso, sendo uma limitação inerente a qualquer análise estatística. Os erros, como os de medição, por exemplo, podem causar uma interpretação errônea dos resultados. A probabilidade de que o processo seja um encontro ao acaso, entretanto, pode ser calculada e um limite mínimo de significância estatística pode ser ajustado, sendo que os níveis estatisticamente significantes comuns são 5% e 1%. Resultados significativos são necessários para muitos casos práticos de experimentação em vários ramos da pesquisa estatística. A escolha do nível de significância estatística é influenciada por certo número de parâmetros e as alterações nos diferentes tipos de experimentos. Na maioria dos casos de consideração prática, a distribuição de parâmetros ou qualidade segue uma dis- tribuição normal, no entanto, devemos tomar cuidado para visualizar outras distribuições dentro da população dada. 3.1.4 Evento Na teoria das probabilidades, um evento é um conjunto de resultados de uma experiência para o qual uma probabilidade é atribuída. Um único resultado pode ser um elemento de muitos eventos diferentes. Além disso, eventos diferentes em um experimento geralmente não possuem valores igualmente prováveis, uma vez que eles podem incluir diferentes resultados. Nosso cotidiano é cheio de eventos aleatórios! O lançamento de uma moeda, os jogos de dados, a escolha de um “rei” no baralho de cartas e sorteios de loteria são exemplos de eventos deste tipo. Entenda que os eventos podem ser: • Independentes - em que cada evento não afeta outros eventos posteriores. Exemplo: se você jogar uma moeda três vezes e obter cara, qual a chance de que o próximo lance também seja cara? A chance é simplesmente 1/2, ou 50%, assim como qualquer outro lance da moeda, pois o que aconteceu no passado não afetará o sorteio atual. • Dependentes (também chamado de condicional) - em que um evento é afetado por outros eventos. Exemplo: quando você tira duas cartas de um baralho, há menos cartas disponíveis e, portanto, a probabilidade vai mudar. • Incompatíveis – em que os eventos não podem acontecer ao mesmo tempo Vamos verificar a possibilidade de que, ao tirarmos duas cartas de um baralho, uma delas seja um “rei”. Para a primeira carta, a chance é de 4 em 52, mas para a 2º temos: • Se a primeira carta era um rei, então é menos provável que a segunda também o seja, já que apenas 3 das 51 cartas que ficaram são reis; • Se a primeira carta não era um rei, então é pouco provável que a segunda seja um rei, pois das 51 cartas que ficaram, apenas 4 são reis. 08 Laureate- International Universities Probabilidade e Estatística 3.1.5 Probabilidade incondicional Se selecionarmos uma criança por amostragem aleatória simples, então cada criança tem a mesma probabilidade (ou igual oportunidade) de ser selecionada. A probabilidade é de 1 / N Em que: N representa o tamanho da população = 5.290. Assim, a probabilidade de que qualquer criança seja selecionada para o exemplo apresentado é 1/5.290 = 0,0002. Na maioria das situações de amostragem, não estamos preocupados com a amostragem de um indivíduo específico, mas sim com a probabilidade de amostragem de certos tipos de indivíduos. Por exemplo, qual é a probabilidade de selecionar um menino ou uma criança de sete anos de idade? A fórmula seguinte pode ser usada para calcular probabilidades de seleção de indivíduos com atributos específicos. Acompanhe! P (característica) = número de pessoas com a característica / N 3.1.6 Probabilidade Condicional Cada uma das probabilidades calculadas no item anterior, por exemplo, P (menino) e P (criança de 7 anos de idade), é uma probabilidade incondicional, pois o denominador para cada um é o tamanho total da população (N = 5290), refletindo o fato de que toda a amostra em toda a população é elegível para ser selecionada. No entanto, por vezes, é de interesse concentrar o foco em um subconjunto específico da população ou uma subpopulação. Por exemplo, suponha que estamos interessados apenas nas meninas e queremos saber qual é a probabilidade de selecionar uma menina de 9 anos a partir da sub-população de meninas? Há um total de NG = 2.730 meninas (NG se refere à população de meninas), e a probabilidade de selecionar uma de 9 anos a partir da subpopulação de meninas é escrita da seguinte forma: P (9 anos / meninas) = número de pessoas com característica / NG Em que: / meninas indica que estamos condicionando a questão a subgrupo específico. A probabilidade condicional é calculada da mesma forma que se calculam as probabilidades incondicionais, ou qualquer probabilidade. Nesse caso: P (9 anos | meninas) = 461/2730 = 0,169. Isto também significa que 16,9% das meninas têm 9 anos de idade. Note que isto não é o mesmo que a probabilidade de selecionar uma menina de 9 anos de idade da população total, que é P (garota de 9 anos de idade) = 461/5290 = 0,087. 3.1.7 Propriedades da probabilidade A probabilidade tem duas propriedades que a definem: 1. A probabilidade em todo o caso existente é um número entre 0 e 1, ou 0 <P (E) <1. Também podemos usar a probabilidade numa escala de 0% (impossível) e 100% (totalmente possível). Portanto, não existe uma probabilidade negativa ou uma probabilidade superior a 1 (ou 100%) . 09 2. A soma de todas as probabilidades de todos os eventos é igual a 1, desde que ambos os eventos sejam mutuamente exclusivos e exaustivos. As probabilidades empíricas são objetivamente elaboradas a partir de dados históricos. Se nós montamos uma distribuição de resultado com base nos últimos vinte anos de dados e, em segui- da, usar essa distribuição para fazer previsões, estaremos utilizando uma abordagem empírica. Precisamos lembrar, no entanto, que o desempenho do passado não garante resultados futuros, então uma abordagem puramente empírica significa desvantagens. 3.1.8 Avaliando testes de triagem Os testes de seleção são muitas vezes utilizados para avaliar a probabilidade de que uma amostra te- nha uma condição particular. Por exemplo, em um caso médico, o raciocínio é que se a doença é iden- tificada precocemente um tratamento pode levar à cura ou melhora da qualidade de vida. A preventiva médica é constituída frequentemente por testes laboratoriais que detectam marcadores específicos de determinada doença. Por exemplo, o antigénio (PSA) específico para o câncer de próstata, mede as concentrações sanguíneas de PSA, uma proteína produzida pela glândula da próstata. Outros exemplos são os testes de pressão arterial, eletrocardiograma de rotina, exames de mama, exames retais digitais, mamografias, exames de sangue eurina. Em cada um desses exemplos, temos uma tabulação da população ou um quadro de amostragem que nos permite calcular as probabilidades desejadas. Há casos, no entanto, em que uma tabulação completa não é acessí- vel e os modelos de probabilidade podem ser usados para gerar apenas probabilidades. Existem dois modelos de probabilidade particularmente úteis para esses casos: • o modelo de distribuição binomial, que é útil para probabilidades em que temos uma variável discreta; • o modelo de distribuição normal, o que é útil para calcular a probabilidade em uma variável contínua. Estes modelos de probabilidade são extremamente importantes na estatística, e nós vamos dis- cutí-los em seguida. 10 Laureate- International Universities Probabilidade e Estatística 3.2 Modelos teóricos Um modelo estatístico é um conjunto de suposições a respeito da geração dos dados observados e dos dados semelhantes de uma população maior. Ele representa formas idealizadas do processo de geração de dados que descrevem um conjunto de distribuições de probabilidade. Um modelo é normalmente especificado por equações matemáticas que se relacionam com uma ou mais variáveis aleatórias e, possivelmente, outras variáveis não aleatórias. Todos os testes de hipóteses e todas as estimativas estatísticas são derivados de modelos, os quais, de modo geral, são parte da fundação de inferência estatística. 3.2.1 Distribuição Binomial Quando você jogar uma moeda, desde que não haja situações tendenciosas, haverá dois re- sultados possíveis: cara ou coroa, sendo que cada resultado tem uma probabilidade fixa de ½. Essas distribuições são chamadas de distribuições binomiais. Tomemos um exemplo simples: os quatro resultados possíveis que poderiam ocorrer se você jogasse uma moeda duas vezes estão listados a seguir no Quadro 2. Note que os quatro resultados são igualmente prováveis com probabilidade 1/4. Lembre-se de que os lançamentos da moeda são independentes. Por isso, a probabilidade de dar cara no primeiro lançamento e cara no segundo lançamento é o produto de P (1) e P (2), que é 1/2 x 1/2 = 1/4. O mesmo se aplica para o cálculo da proba- bilidade de uma cara e uma coroa, que é 1/2 x 1/2 = 1/4. Possibilidades Moeda I Moeda II 1 Cara Cara 2 Coroa Coroa 3 Cara Coroa 4 Coroa Cara Quadro 2 - Quatro resultados possíveis. Fonte: Elaborado pelo autor, 2015. Os quatro resultados possíveis podem ser classificados pelo número de caras que surgem. Pode- ria ser duas vezes, uma ou nenhuma. As probabilidades destas possibilidades são mostradas no Quadro 3 e na Figura 1. Uma vez que dois dos resultados representam o caso em que apenas uma cara aparece nas duas jogadas, a probabilidade deste evento é igual a 1/4 + 1/4 =1/2. Confira a seguir! Numero de Caras Probabilidade Duas 1/4 Uma 1/2 Nenhuma 1/4 Quadro 3 - As probabilidades de obter 0, 1, ou 2 caras. Fonte: Elaborado pelo autor, 2015. 11 0,60 0,50 0,40 0,30 0,20 0,10 0,00 Probabilidade PROBABILIDADE Figura 1 - Probabilidades de obtermos cara nos lançamentos. Fonte: Elaborado pelo autor, 2015. A Figura 1 é uma distribuição de probabilidade discreta, pois mostra a probabilidade para cada um dos valores, definindo “cara” como sucesso. Esse tipo de distribuição é uma distribuição binomial. A distribuição binomial consiste das probabilidades de cada um dos possíveis números de sucessos em n tentativas para eventos independentes que cada um tem uma probabilidade de π de ocorrência. Para o exemplo da moeda, N = 2 e π = 0,5. A fórmula para a distribuição binomial é mostrada a seguir: Em que: P (x) é a probabilidade de x sucessos em N tentativas; N é o número de tentativas; π é a probabilidade de sucesso em uma determinada tentativa. Se aplicarmos isto ao exemplo das moedas, temos: Se você jogar uma moeda duas vezes, qual é a probabilidade de obter uma ou mais caras? A probabilidade de obtermos exatamente uma cara é 0,50. Já a probabilidade de obtermos duas caras é de 0,25, ao passo que a probabilidade de obter uma ou duas caras é de 0,50 + 0,25 = 0,75. Se jogarmos uma moeda 12 vezes, qual seria a probabilidade de obtermos de 0 a 3 caras? A resposta é encontrada calculando a probabilidade de nenhuma cara, uma cara, duas 12 Laureate- International Universities Probabilidade e Estatística caras e três caras, as quais serão de: 0,0002, 0,0029, 0,0161, e 0,0537. A soma das probabi- lidades é 0,073. O cálculo de probabilidades binomiais cumulativas pode ser bastante tedioso. Considere o experimento de arremesso de moeda em que você jogou uma moeda doze vezes e gravou o número de caras. Você pode esperar a metade das jogadas cair e, por conseguinte, o número médio de caras seria 6. Em geral, a média de uma distribuição binomial com parâmetros N (o número de ensaios) e π (a probabilidade de sucesso de cada ensaio) é: μ = N π Em que: μ é a média da distribuição binomial. A variância da distribuição binomial é dada por: σ2 = N π (1-π) Em que: σ2 é a variância da distribuição binomial. Vamos voltar para o experimento moeda de arremesso. A moeda foi jogada doze vezes, certo? Então N = 12. Há uma probabilidade de 0,5 de obtermos cara. Portanto, π = 0,5. A média e variância, por conseguinte, podem ser calculadas conforme a seguir: μ = N π = (12) (0,5) = 6 σ2 = N π (1-π) = (12) (0,5) (1,0 - 0,5) = 3,0. Não esquecendo que o desvio padrão (σ) é a raiz quadrada da variância (σ2). Um bom exemplo da utilização da distribuição binomial em uma indústria é a fabricação de lâmpadas. Uma análise feita no lote produzido no dia anterior detectou que 1% das lâmpadas produzidas nesse lote eram defeituosas. Na produção de hoje, foi retirada uma amostra aleatória de 30 lâmpadas. O engenhei- ro responsável pela produção precisa saber se há nesta amostra mais de uma lâmpada defeituosa. Após o cálculo, utilizando a distribuição binomial teremos que a probabilidade será de 3,61%. 3.2.2 Distribuição Poisson Na teoria da probabilidade e estatística, a distribuição de Poisson (em homenagem ao matemá- tico francês Siméon Denis Poisson) é uma distribuição de probabilidade discreta que expressa a probabilidade de um determinado número de eventos ocorrerem em um intervalo de tempo e/ ou espaço fixo. Estes eventos ocorrem com uma taxa média conhecida e independente do tempo desde o último caso ocorrido. A distribuição de Poisson também pode ser utilizada para eventos em outros intervalos especifi- cados, tais como a distância, área ou volume. Por exemplo, o número de chamadas telefônicas recebidas em um call center por hora, o número de eventos de luminosidade por segundo a partir de uma fonte radioativa, ou o número de pedestres em uma rua em determinada hora do dia. A distribuição foi introduzida pela primeira vez por Siméon-Denis Poisson (1781-1840) e publica- da, com sua teoria da probabilidade, em 1837, em sua obra Pesquisa sobre a probabilidade de decisões em Matéria Penal e Civil. O trabalho teorizou sobre o número de condenações injustas de um dado país, concentrando-se em certas variáveis aleatórias (N) que contam, entre outras coisas, o número de ocorrências discretas que, em algumas vezes, chamamos de eventos e ocor- rem durante um intervalo de tempo determinado. 13 A aplicação prática desta distribuição foi feita por Ladislaus Bortkiewicz em 1898, quando lhe foi dada a tarefa de investigar o número de soldados no exército prussiano mortos acidentalmente por chutes de cavalo. Neste contexto, foi introduzida a distribuição de Poisson para o campo da engenharia. A distribuição de Poisson pode ser usada para calcular as probabilidades de diferentes números de “sucessos” com base em um número médio de sucessos. A fim de aplicar a distribuição de Poisson, os vários eventos devem ser independentes.Tenha em mente que o termo “sucesso” realmente não significa sucesso no sentido positivo tradicional, mas apenas que o resultado desejado ocorreu. Imagine que você sabia que o número médio de chamadas para um quartel dos bombeiros em um dia de semana era igual a 8. Qual é a probabilidade de que em um determinado dia da semana houvesse 11 chamadas ao invés de 8? Este problema pode ser resolvido com a seguinte fórmula, baseada na distribuição de Poisson: Em que: e é a base dos logaritmos naturais (2,7183); μ é a média do número de “sucessos”; x é o número de “sucessos” em questão. Para este exemplo, Desde que a média seja 8 e a questão refira-se a 11 chamados. Aplicações da Distribuição de Poisson: • defeitos congênitos e mutações genéticas; • doenças raras como a leucemia; • acidentes de carro; • fluxo de tráfego; • número de erros de digitação em uma página; • pelos encontrados em hambúrguer do McDonald; • disseminação de um animal em extinção no continente africano; • falha de uma máquina em um mês. Média e variância de Distribuição de Poisson Se μ é o número médio de sucessos ocorridos num determinado intervalo de tempo da distribuição de Poisson, então a média e o desvio da distribuição são ambos iguais a μ. Na distribuição de Poisson, apenas um parâmetro (μ) é necessário para determinar a probabilidade de um evento. Você deve estar se perguntando: “mas qual é a diferença entre as distribuições de Poisson e bi- nomial?”. Enquanto a distribuição binomial pode ser usada para encontrar a probabilidade de 14 Laureate- International Universities Probabilidade e Estatística um número designado de sucessos em “n” tentativas, a distribuição de Poisson é usada para encontrar a probabilidade de um número designado de sucessos por unidade de intervalo. As outras condições exigidas para se aplicar a distribuição binomial são também exigidas para se aplicar a distribuição de Poisson, isto é, deve existir somente dois resultados mutuamente exclusivos, os eventos devem ser independentes e o número médio de sucessos por unidade de intervalo deve permanecer constante. A distribuição de Poisson é frequentemente usada em pesquisa operacional na solução de proble- mas administrativos. Alguns exemplos são o número de chamadas telefônicas para a polícia por hora, o número de clientes chegando a posto de gasolina por hora, e o número de acidentes de tráfego num cruzamento por semana. Um exemplo de produção, para melhor entendimento da utilização da distribuição de Poisson é: uma fábrica de componentes eletrônicos produz uma média de 5 peças com defeito por hora. Qual a probabilidade desta fábrica não produzir nenhuma peça defeituosa em um intervalo de 1 hora? Fazendo o cálculo, temos que a probabilidade é de 0,67% 3.2.3 Distribuição Normal A distribuição normal é a distribuição mais importante e mais amplamente utilizada nas estatís- ticas. Às vezes é chamada de curva do sino ou curva de Gauss, em homenagem ao matemá- tico Karl Friedrich Gauss. Embora Gauss tenha um papel importante na história da curva, foi Abraham de Moivre que descobriu a distribuição normal. Distribuições normais podem diferir em sua forma e desvio padrão. A Figura 2 mostra três distribuições normais. A verde, mais à es- querda, a distribuição em vermelho no meio e a distribuição de preto, mais à direita. Estas, bem como todas as outras distribuições normais, são simétricos com os valores relativamente mais no centro da distribuição e menos nas caudas. Figura 2 - Distribuições normais que diferem em média e desvio padrão. Fonte: Elaborada pelo autor, 2015. 15 A densidade da distribuição normal ou a altura de um dado valor no eixo X é mostrada a seguir. O símbolo que representa a base do logaritmo natural é π, constante. A distribuição normal possui sete características, as quais estão listadas a seguir! • 1. As distribuições normais são simétricas em torno de sua média. • 2. A média, mediana e moda de uma distribuição normal são iguais. • 3. A área abaixo da curva normal é igual a 1,0. • 4. Distribuições normais são mais densas no centro e menos densa nas caudas. • 5. Distribuições normais são definidas por dois parâmetros, a média (μ) e o desvio-padrão (Đ). • 6. 68% da área de uma distribuição normal está dentro de um desvio padrão da média. • 7. Aproximadamente 95% da área de uma distribuição normal está dentro de dois desvios padrão da média. Já vimos que a distribuição binomial pode ser usada para resolver problemas, tais como: se uma moeda honesta é jogada 100 vezes, qual é a probabilidade de obtermos 60 ou mais caras? A probabilidade “x caras” de N tentativas é calculada usando a fórmula: Em que: x é o número de caras (60); N é o número de jogadas (100); π é a probabilidade de uma cara (0.5). Portanto, para resolver esse problema, você pode calcular a probabilidade de 60 caras, a probabilidade de 61 caras, 62 caras, assim por diante e somar todas estas probabilidades. Imagine quanto tempo as pessoas levavam para calcular as probabilidades binomiais antes do advento das calculadoras e computadores. Abraham de Moivre, um estatístico do século VXIII e consultor para os jogadores de cartas, muitas vezes foi chamado a fazer esses cálculos demorados. Moivre notou que, quando o número de eventos aumentava, a forma da distribuição binomial aproximava-se de uma curva muito suave. Moivre pensou que se conseguisse encontrar uma expressão matemática para esta curva, ele seria capaz de resolver problemas tais como encontrar a probabilidade de 60 ou mais caras de 100 jogadas muito mais fácil. A curva que ele descobriu agora é chamada de curva normal. 16 Laureate- International Universities Probabilidade e Estatística 0 2 4 6 8 10 12 Figura 3 - A aproximação normal para a distribuição binomial para 12 jogadas. Fonte: Elaborada pelo autor, 2015. A curva suave é a distribuição normal. Note que ela se aproxima das probabilidades binomiais representadas pelas alturas das linhas azuis. A importância da curva normal é que as distribuições de diversos fenômenos naturais são aproximadamente uma distribuição normal. Uma das primei- ras aplicações da distribuição normal é a análise de erros de medição feita em observações astro- nômicas, erros que ocorreram por causa de instrumentos imperfeitos e observadores imperfeitos. Galileu, no século XVII, observou que estes erros eram simétricos e que pequenos erros ocorriam com maior frequência do que os grandes erros. Isso levou a várias distribuições hipotéticas de erros, mas foi no início do século XIX que descobriu-se que esses erros seguiam uma distribuição normal. Independente disso, os matemáticos Adrain em 1808 e Gauss em 1809 desenvolveram a fórmula para a distribuição normal e mostraram que os erros se encaixam bem nesta distribuição. Essa mesma distribuição foi descoberta por Laplace em 1778. Laplace mostrou que, mesmo que uma distribuição não seja normalmente distribuída, os meios de amostras repetidas da distribui- ção seriam quase uma distribuição normal, e que quanto maior for o tamanho da amostra mais ela se aproxima de a uma distribuição normal. Quételet (1840) foi o primeiro a aplicar a distribuição normal para características humanas. Ele observou que as características tais como altura, peso e força foram distribuídas normalmente. As áreas sob as porções de uma distribuição normal podem ser obtidas através de cálculo. A Figura 4 mostra uma distribuição normal com uma média de 50 e um desvio padrão de 10. A área sombreada entre 40 e 60 contém 68% da distribuição. 10 20 30 40 50 60 70 80 90 Figura 4 - A distribuição normal com uma média de 50 e desvio padrão de 10 e 68% da superfície está dentro de um desvio padrão (10) da média (50). Fonte: Elaborada pelo autor, 2015. 17 A Figura 5, por sua vez, mostrauma distribuição normal com uma média de 100 e um desvio pa- drão de 20. Tal como na Figura 4, 68% da distribuição está dentro de um desvio padrão da média 20 40 60 80 100 120 140 160 180 Figura 5 - A distribuição normal com uma média de 100 e desvio padrão de 20 e 68% da superfície está dentro de um desvio padrão (20) da média (100). Fonte: Elaborada pelo autor, 2015. As distribuições normais mostradas nas Figuras 4 e 5 são exemplos específicos da regra geral de 68%. A Figura 6 mostra uma distribuição normal com uma média de 75% e um desvio padrão de 10. A área sombreada contém 95% e estende-se de 55,4 a 94,6. Para todas as distribuições normais, 95% da superfície está dentro de 1,96 desvios padrão da média. 35 45 55 65 75 85 95 105 115 Figura 6 - Uma distribuição normal com uma média de 75 e um desvio padrão de 10 e 95% da superfície está dentro de 1,96 desvios padrão da média. Fonte: Elaborada pelo autor, 2015. Vamos supor que em uma indústria produtora de parafusos, porcas e arruelas, a espessura média de arruelas tenha distribuição normal com média de 11,15mm e desvio padrão de 2,238mm. Qual a porcentagem de arruelas com espessura entre 8,70mm e 14,70mm? Utilizando a distribuição normal, temos que essa probabilidade é de 80,50%. Outro exemplo é o de uma fazenda criadora de porcos. Imagine que o peso médio de 800 porcos dessa fazenda é de 64 kg, e o desvio padrão é de 15kg. Se este peso for distribuído de forma normal, você pode utilizar os cálculos da distribuição normal para saber quantos porcos pesarão entre 42kg e 73kg. Executando os cálculos, chegaremos ao número de 525 animais. 18 Laureate- International Universities Probabilidade e Estatística CASO Fábrica de sacolas de papel Um fabricante de sacolas de papel para supermercado está tendo problemas com a qualidade de seu produto. A questão está relacionada à resistencia e a tração do papel das sacolas. Após uma análise prévia, foi verificado que essa variável segue um modelo normal, com uma média de 40N e um desvio padrão de 2N. Seus clientes necessitam de uma resitência à tração mínima de 35N. Na proxima semana, haverá uma entrega de 100.000 sacolas. Para esse fato, qual deve ser a probabilidade de produzir as sacolas com essa especificação? O fabricante deverá criar um pla- no de ação para garantir essa probabilidade mínima e aumentar a confiabilidade para 95%, pois sabemos que a variabilidade aceita em um processo estável é de, no máximo, 5%. 3.2.4 Distribuição Multinominal A distribuição binomial permite calcular a probabilidade de obtenção de um determinado núme- ro de resultados binários. Assim, o lançamento de uma moeda terá um resultado binário, pois limita-se a duas possibilidades. A distribuição multinominal, por sua vez, pode ser usada para calcular as probabilidades em situações em que existam mais do que dois resultados possíveis. Por exemplo, imagine que dois jogadores de xadrez tenham jogado vários jogos. Ficou determi- nado que a probabilidade de o jogador A ganhar é de 0,40. Já a probabilidade de o jogador B vencer é de 0,35, enquanto a probabilidade de o jogo terminar em empate é de 0,25. A distri- buição multinominal pode ser usada para responder a perguntas como: “Se os dois jogarem 12 jogos, qual é a probabilidade de que o jogador A ganhe 7 jogos, o jogador B ganhe 2 jogos, e o restante dos jogos resulte em empate?”. A fórmula a seguir dá a probabilidade de obtenção de um conjunto específico de resultados, quando há três resultados possíveis para cada evento: Em que: P é a probabilidade; n é o número total de eventos; n1 é o número de vezes que ocorre Resultado 1; n2 é o número de vezes que ocorre Resultado 2; n3 é o número de vezes que ocorre Resultado 3; P1 é a probabilidade do resultado 1; P2 é a probabilidade do resultado 2; P3 é a probabilidade do resultado 3. 19 Para o exemplo do xadrez: n = 12 (12 jogos são disputados); n1 = 7 (número vitórias do jogador A); n2 = 2 (número vitórias do Jogador B); n3 = 3 (número de empates); p1 = 0,40 (probabilidade do jogador A ganha); p2 = 0,35 (probabilidade Jogador B ganha); P3 = 0,25 (probabilidade de um empate). A fórmula para resultados k é: Note-se que a distribuição binomial é um caso especial da multinominal quando k = 2. Aqui, temos o seguinte exemplo: uma máquina de tubos metálicos cujos diâmetros podem ser considerados uma variável aleatória normal com média 200mm e desvio padrão de 2mm. Veri- fica-se que 15% dos tubos estão sendo rejeitados como grandes e 10% como pequenos. Quais são as tolerâncias de especificação para esse diâmetro? Mantidas essas especificações, qual deverá ser a regulagem média da máquina para que a rejeição por diâmetro grande seja nula? Nesse caso, qual será a porcentagem de rejeição por diâmetro pequeno? Como podemos verificar, a máquina deve ser regulada para valores entre 198mm e 202mm, lembrando que existe uma tendência maior de obtermos peças com diâmetro maior, portanto nada impede de, por segurança, colocarmos de 198mm a 201,50. VOCÊ QUER VER? Neste vídeo da Univesp TV, você pode rever as principais propriedades da distribuição estatísticas, complementando os conhecimentos recém-adquiridos sobre o cálculo de distribuição. Disponível em: <https://www.youtube.com/watch?v=j3Zbup0KMxY>. 3.3 Correlação e Regressão Linear O uso da regressão linear ou correlação existe quando você precisa saber se uma variável de medição está associada a outra variável de medição, ou então quando você quer medir a força da associação entre essas variáveis, na equação que descreve o relacionamento entre elas, podendo ser usada para prever valores desconhecidos. Um dos gráficos mais comuns coloca uma variável de medição no x (horizontal) e a outra no eixo y (vertical). 3.3.1 Correlação Linear O objetivo de uma análise de correlação linear é determinar se existe uma relação entre dois conjun- tos de variáveis. Existem três tipos de correlação: correlação positiva, correlação negativa e nenhuma correlação. Essas relações podem ser facilmente visualizadas usando diagramas de dispersão. 20 Laureate- International Universities Probabilidade e Estatística • Correlação positiva: com o aumento dos valores do eixo X, os valores do eixo Y tendem a aumentar. Se fosse numa correlação positiva, todos os pontos cairiam sobre uma linha reta. Esses pontos demonstrarão que o relacionamento entre as duas variáveis é perfeito. y 6 4 2 0 0 2 4 6 x Figura 7 - Correlação positiva. Figura 7 - Correlação positiva. Fonte: Elaborada pelo autor, 2015. • Correlação negativa: com o aumento dos valores do eixo X, os valores do eixo Y tendem a diminuir. Se fosse numa correlação negativa, todos os pontos caiririam sobre uma linha reta. Esses pontos demonstrarão que o relacionamento entre as duas variáveis é perfeito. y 6 4 2 0 0 2 4 6 x Figura 8 - Correlação negativa. Fonte: Elaborado pelo autor, 2015. 21 • Nenhuma correlação: parece não haver qualquer relação entre as duas variáveis. 10 9 8 7 6 5 4 3 2 1 0 1 1,5 2 2,5 3 Figura 9 - Nenhuma correlação. Fonte: Elaborada pelo autor, 2015. 3.3.2 Regressão Linear Técnica matemática para encontrar a linha reta que melhor se ajusta aos valores de uma fun- ção linear, plotados em um gráfico de dispersão como pontos de dados. Se o melhor ajuste de linha for encontrado, ele pode ser usado como base para estimar os valores futuros da função, estendendo-o, mantendo a sua inclinação. A regressão linear é a análise preditiva mais básica e comumente usada. Estimativas de regressão são usadas para descrever dados e para explicar a relação entre uma variável dependente e uma ou mais variáveis independentes. A seguir, apresentamos três exemplos práticos de correlaçãolinear: 1. O gerente de produto responsável por uma determinada marca de cereal matinal infantil gostaria de prever a demanda para o cereal durante o próximo ano. Para utilizar a análise de regressão, a equipe sabe que as seguintes variáveis podem afetar as vendas: » preço do produto; » número de crianças de 5 a 12 anos de idade (o mercado-alvo); » preço de produtos do concorrente; » eficácia da publicidade (como medido pela publicidade exposição); » as vendas anuais do ano em questão; » as vendas anuais de períodos anteriores. 2. Um especulador de ouro está considerando uma grande compra de barras de ouro. Ele gostaria de prever o preço do produto para dois anos a partir de agora. Seu horizonte de planejamento, portanto, se dará por meio de análise de regressão. Em preparação, ele produz a seguinte lista de variáveis independentes: » taxa de juros; » taxa de inflação; » preço do petróleo; » a demanda por jóias de ouro; » a demanda por ouro industrial e comercial; » a cotação da bolsa. 22 Laureate- International Universities Probabilidade e Estatística 3. Um agente imobiliário gostaria de prever com precisão o preço de venda de casas. Ele acredita que algumas variáveis afetam o preço de uma proriedade: » tamanho da casa (número de pés quadrados); » número de quartos; » fachada do lote; » condição; » localização. Em cada um desses exemplos, o principal motivo para utilizar a análise de regressão é a previsão. No entanto, analisar a relação entre as variáveis também pode ser bastante útil na gestão da toma- da de decisão. Por exemplo, o gerente de produto pode querer saber como o preço está relaciona- do com a demanda do produto para tomar uma decisão sobre uma possível mudança nos preços. Vamos estudar mais alguns exemplos de Diagrama de Dispersão? Esse link o levará a um estudo que apresenta um exemplo resolvido de utilização do diagrama, bem como explicações a respeito de como efetuar cada etapa. Disponível em: <http://www.esalq. usp.br/qualidade/mod3/pag1_3.htm> VOCÊ QUER LER? 3.3.3 Coeficiente de Correlação O coeficiente de correlação r, chamado coeficiente de correlação linear, mede a força e a di- reção de uma relação linear entre duas variáveis. A correlação linear coeficiente é, por vezes, referida como o coeficiente de correlação de Pearson em homenagem a seu criador: Karl Pearson (1910). A fórmula matemática para calcular r é: Em que: n é o número de pares de dados. O valor de r é tal que -1 <r <1. Os sinais + e - são usados para correlações lineares positivas e correlações lineares negativas, respectivamente. A associação entre duas variáveis pode ser de dois tipos: correlacional e experimental. Numa relação experimental, os valores de uma das variáveis são controlados pela atribuição ao acaso do objeto sendo estudado e observando o que acontece com os valores da outra variável. Por exemplo, pode-se atribuir dosagens casuais de certa droga e observar a resposta do organismo testado; pode-se atribuir níveis de fertilizante ao acaso e observar as diferenças na produção de determinada cultura. Na associação correlacional, por outro lado, não se tem nenhum controle sobre as variáveis estudadas. Elas são observadas como ocorrem em seu ambiente natural, sem nenhuma interfe- rência, isto é, as duas variáveis são aleatórias. Assim, a diferença entre as duas situações é que na experimental nós atribuímos valores ao acaso de uma forma não tendenciosa, e na outra a atribuição é feita pela natureza. 23 3.3.4 Regressão Os estatísticos são muitas vezes chamados para desenvolver métodos para prever uma variável a partir de outras variáveis. Por exemplo, pode-se querer prever a média de uma faculdade pela frequência dos alunos. Na regressão linear simples, prevemos o valor de uma variável a partir valores de uma segunda variável. A variável que estamos prevendo é referida como Y. A variável na qual estamos nos baseando é chamada variável critério e é referida como X. Quando existe apenas uma variável de previsão, o método é chamado de regressão simples. Na regressão linear simples as previsões de Y, quando plotadas em função do X, formam uma linha reta. Os dados de exemplo na Tabela 1 estão representados na Figura 10. Você pode ver que há uma relação positiva entre X e Y, portanto podemos dizer que quanto maior o valor de X, mais elevada a previsão de Y. X Y 1.00 1.00 2.00 2.00 3.00 1.30 4.00 3.75 5.00 2.25 Tabela 1 - Os dados de exemplo. Fonte: Elaborado pelo autor, 2015. 5 4 3 2 1 0 1 2 3 X y 4 5 Figura 10 - Um gráfico de dispersão dos dados de exemplo. Fonte: Elaborado pelo autor, 2015. 24 Laureate- International Universities Probabilidade e Estatística A regressão linear consiste em encontrar a linha reta que melhor se ajuste através de todos os pontos, a qual é chamada de linha de regressão. A linha diagonal preta na Figura 11 é a linha de regressão, e consiste no valor previsto em Y para cada valor possível de X. As linhas verticais dos pontos para a linha de regressão representam os erros de predição. Como você pode ver, o ponto vermelho está muito perto da linha de regressão e o erro é pequeno. Em contrapartida, o ponto de amarelo está bastante distante da linha de regressão e, por conseguinte, o erro é grande. 5 4 3 2 1 0 1 2 3 X y 4 5 3.75 2.25 1.30 2.00 1.00 Figura 11 - Um gráfico de dispersão dos dados de exemplo. A linha preta consiste nas previsões, os pontos são os dados reais. Já as linhas verticais entre os pontos e a linha preta representam os erros de previsão. Fonte: Elaborado pelo autor, 2015. A Tabela 2 mostra os valores preditos (Y ‘) e os erros de previsão (Y-Y’). Por exemplo, o primeiro tem um ponto Y de 1,00 e um Y ‘ de 1,21. Portanto, o erro de previsão é de -0,21. X Y Y’ Y-Y’ (Y-Y’)2 1.00 1.00 1.210 -0.210 0.044 2.00 2.00 1.635 0.365 0.133 3.00 1.30 2.060 -0.760 0.578 4.00 3.75 2.485 1.265 1.600 5.00 2.25 2.910 -0.660 0.436 Tabela 2 - Dados de exemplo. Fonte: Elaborado pelo autor, 2015. O critério mais comumente usado para a linha de melhor ajuste é a linha que minimiza a soma dos quadrados dos erros de previsão. A última coluna da Tabela 2 mostra os quadrados dos erros de predição, cuja soma é inferior ao que seria com qualquer outra linha de regressão. A fórmula para uma linha de regressão é: Y ‘= bX + A, 25 Em que: Y ‘representa o valor previsto; b é o declive da linha; A é a ordenada Y. A equação para a linha na Figura 11 é: Y ‘= 0.425X + 0,785, para X = 1, Y ‘= (0,425) (1) + 0,785 = 1.21 E para X = 2, Y ‘= (0,425) (2) + 0,785 = 1,64. A equação de regressão é mais simples se as variáveis são uniformizadas, de modo que os seus meios são iguais a 0 e desvios padrão são iguais a 1. Um bom exemplo de regressão linear é o consumo de combustível em um carro. Após uma regulagem eletrônica, um veículo apresenta um rendimento ideal no que tange a consumo de combustível. Contudo, com o passar do tempo, esse rendimento vai se degradando. Os dados a seguir representam o rendimento medido mês a mês após a regulagem. X 1 2 3 4 5 6 Y 10,7 10,9 10,8 9,3 9,5 10,4 X 7 8 9 10 11 12 Y 9,0 9,3 7.6 7,6 7,9 7,7 Tabela 3 - relação entre o tempo de manutenção e o rendimento em Km/l. Fonte: Elaborado pelo autor, 2015. X: meses após a regulagem Y: rendimento em Km/l VOCÊ QUER VER? Ficou interessado em regressão linear e na correlação entre as variáveis? Quer assistir a um vídeo que explique os cálculos? Então acesse o canal Falando Matemática Prof. Allan e veja a videoaula Correlação e Regressão Linear. Disponível em: <https://www. youtube.com/watch?v=5Nmzd9slQk0>. 26 Laureate- International Universities Síntese Concluímos este capítulo sobre a aplicação da teoria da probabilidade, bem como seus concei-tos principais e características norteadoras. Agora você possui instrumentos teóricos para poder solucionar problemas e situações que envolvam a probabilidade. Neste capítulo, você teve a oportunidade de: • conhecer os conceitos básicos de probabilidade • aprender os modelos teóricos Binomial, Poisson e Nornal • compreender os fundamentos básicos da correlação e regressão linear • identificar os coeficientes de correlação e os parâmetros de regressão Síntese 27 Referências AMARAL, D.A. Gauss, Carl Friedrich (1777-1855). Disponível em: <http://www.fem.unicamp. br/~em313/paginas/person/gauss.htm>. Acesso em: 30 dez. 2015. BUSSAB, W. O.; MORETTIN, P. A. Estatística básica. 5 ed. São Paulo: Saraiva, 2002. CORRELAÇÃO e Regressão Linear Simples. Produzido por Falando Matemática prof. Allan. 19 nov. 2014. Disponível em: <https://www.youtube.com/watch?v=5Nmzd9slQk0>. Acesso em: 30 dez. 2015. DEVORE, J. L. Probabilidade e Estatística para Engenharia e Ciências. São Paulo: Thomp- son, 2006. ESTATÍSTICA - Aula 11 - Distribuições de probabilidade. Produzido por Univesp TV. 09 Mar. 2015. Disponível em: <https://www.youtube.com/watch?v=j3Zbup0KMxY>. Acesso em: 30 dez. 2015. INSTITUTO BRASILEIRO DE GEOGRAFIA E ESTRATÍSTICA (IBGE). Evolução da Mortalidade – 2000 – Brasil. Disponível em: <http://www.ibge.gov.br/home/estatistica/populacao/tabuade- vida/evolucao_da_mortalidade.shtm>. Acesso em: Acesso em: 30 dez. 2015. LEVINE, D. M.; BERENSON, M. L; e STEPHAN, D. Estatística: teoria e aplicações usando o Microsoft® Excel em português. 3. ed. Rio de Janeiro: LTC, 2005. MAGALHÃES, A. N.; LIMA, A. C. P. Noções de probabilidade e estatística. 6. ed. São Paulo: Edusp, 2005. MONTGOMERY, D.C.; RUNGER, G. C. Estatística aplicada e probabilidade para enge- nheiros. Rio de Janeiro: LTC, 2003. MORGADO, A.C.O. et al. Análise Combinatória e Probabilidade. Rio de Janeiro: IMPA/ VITA, Coleção Vitae, 1991. PIETRANTONIO, H. Modelos probabilísticos em segurança diária. Jun. 2009. Disponível em: <http://sites.poli.usp.br/d/ptr5802/ModProb.pdf>. Acesso em: 30 dez. 2015. REYES, A. E. L.; VICINO, S. R. Diagrama de dispersão. CIAGRI - DME-ESALQ/USP. Disponível em: <http://www.esalq.usp.br/qualidade/mod3/pag1_3.htm>. Acesso em: 30 dez. 2015. SANTOS, P.O.; MELLO, M. P.; MURARI, I.T. C. Introdução à Análise Combinatória. 3. ed. Campinas: Unicamp, 2002. UOL. Brasil tem mais de 204 milhões de habitantes, diz IBGE. 28 ago. 2015. Dispo- nível em: <http://noticias.uol.com.br/cotidiano/ultimas-noticias/2015/08/28/brasil-tem-mais- -de-204-milhoes-de-habitantes-diz-ibge.htm>. Acesso em: 30 dez. 2015. Bibliográficas
Compartilhar