Baixe o app para aproveitar ainda mais
Prévia do material em texto
Estatística Descritiva - Unidade 3 - Probabilidade I Estatística Descritiva Unidade 3 - Probabilidade I Estatística Descritiva - Unidade 3 - Probabilidade I Rafaela Rodrigues Oliveira Amaro Introdução No estudo da estatística, tivemos a oportunidade de observar que as informações coletadas, mesmo em condições igualitárias de experimentação, oscilam, ou seja, variam e, por consequência, essa diversidade dificulta o prenúncio de resultados possíveis e aceitáveis na matemática. Explicar tais fenômenos é factível por intermédio da teoria que fundamenta a temática de probabilidade; e aplicar esse conceito é mais comum do que imaginamos, pois nos cercam constantemente. Encontrar reportagens que declaram: “a chance de ganhar na loteria estadual é de um em quinhentos mil”; ou, “a probabilidade de contrair dengue é 45% maior no verão que em comparação à outras estações do ano”, ou ainda: “a chance de realizar uma cirurgia cardíaca com sucesso é de 86%”. Você se lembra de algum discurso semelhante a este? Com certeza a resposta será sim, pois a probabilidade é parte integrante de toda situação em que se deseja encontrar a chance de determinada situação ocorrer. Compreender os conceitos que constituem essa disciplina será a essência desta terceira unidade. Vamos começar! Ótimo aprendizado para você! 1. Probabilidade O estudo da probabilidade e da estatística estão intimamente ligados, pois para compreender a inferência estatística é fundamental compreender os conceitos que fundamentam a teoria probabilística. Na estatística, analisamos o conjunto de dados obtidos com as ferramentas pertencentes a tal ciência e encontramos conclusões acerca da avaliação da qualidade e mensuração da quantidade de como tais dados se associam entre si. Já, na teoria da probabilidade, o objetivo é prever os resultados de um experimento ou processo sistemático. Estatística Descritiva - Unidade 3 - Probabilidade I Vincular chances de determinado fenômeno acontecer a números é aplicar a probabilidade; Larson e Farber(2016) afirmam que um experimento de probabilidade é uma ação, ou tentativa pela qual respostas são encontradas, ou em outras palavras, as chances de um evento acontecer serem positivas. Assim, para entender a dinâmica desta ciência é fundamental compreender dois conceitos: ● Espaço amostral (S): corresponde ao conjunto de todos os resultados; possíveis em um experimento de probabilidade; ● Evento (E): é um subgrupo do espaço amostral, geralmente são escolhidas características específicas para definí-lo. Freund (2009) relembra os três postulados relativos ao estudo da teoria de probabilidade que se aplicam a um espaço amostral finito: I. As probabilidades obtidas são representadas por números reais ou zero; assim a probabilidade de um evento A deve ser um número maior ou igual a zero, porém menor ou igual a um, essa afirmação é descrita por: 0 ≤ 𝑃(𝐴) ≤ 1 𝑜𝑢, 𝑒𝑚 𝑝𝑜𝑟𝑐𝑒𝑛𝑡𝑎𝑔𝑒𝑚, 0% ≤ 𝑃(𝐴) ≤ 100%; II. Qualquer espaço amostral S possui probabilidade equivalente a 1, que equivale 100%, desta maneira 𝑃(𝑆) = 1 𝑜𝑢 𝑃(𝑆) = 100%; III. Se dois eventos A e B são mutuamente exclusivos (não existe intersecção entre os conjuntos), a probabilidade da união do evento A com o evento B, ou vice-versa equivale ao resultado da soma da probabilidade do evento A com a probabilidade de ocorrência do evento B, ou seja, 𝑃(𝐴 ∪ 𝐵) = 𝑃(𝐴) + 𝑃(𝐵). Vale ressaltar que o resultado provindo de um cálculo de probabilidade varia entre um e zero, de maneira que, se igual a 1 (um) que equivale a um resultado de 100%, isto é, este evento de fato acontece, porém se a probabilidade for zero corresponde a uma associação a um evento impossível, ou seja, nulo de acontecer. Vamos a um exemplo prático, admita um dado comum de seis faces, este será jogado determinadas vezes, considerando este contexto qual é seu espaço amostral? Agora se consideramos a possibilidade de um número par aparecer na Estatística Descritiva - Unidade 3 - Probabilidade I face superior deste mesmo dado, qual será o evento desta outra situação hipotética? Ou ainda, qual a probabilidade de lançar este dado e encontrar um número primo, lembrando que um número é primo se os seus divisores são apenas ele mesmo e 1, na face superior? Respondendo ao primeiro questionamento, é necessário determinar o espaço amostral, ou seja, identificarmos todos os casos possíveis, logo, nesta situação específica é 𝑆 = {1, 2,3,4,5,6}. O evento de sair um número par no lançamento de um dado é encontrado, compreendendo que num dado de seis faces {1, 2,3,4,5,6} há três números pares, logo, este conjunto representa o evento: 𝐸 = {2, 4,6}. Finalmente para determinar a solução da terceira indagação, vamos ter que realizar a divisão entre o número que corresponde ao conjunto dos números primos contidos em um dado {1,2,3,5}e o conjunto que se refere ao espaço amostral {1, 2,3,4,5,6}, assim probabilidade requerida é dada por P (número primo) = 4 6 = 2 3 = 66,67% . Agora, formalizando a maneira de calcular a probabilidade de um evento, a relação é dada por: 𝑃(𝐸) = 𝑛ú𝑚𝑒𝑟𝑜 𝑑𝑒 𝑟𝑒𝑠𝑢𝑙𝑡𝑎𝑑𝑜𝑠 𝑛𝑜 𝑒𝑣𝑒𝑛𝑡𝑜 (𝐸) 𝑛ú𝑚𝑒𝑟𝑜 𝑡𝑜𝑡𝑎𝑙 𝑑𝑒 𝑟𝑒𝑠𝑢𝑙𝑡𝑎𝑑𝑜𝑠 𝑛𝑜 𝑒𝑠𝑝𝑎ç𝑜 𝑎𝑚𝑜𝑠𝑡𝑟𝑎𝑙 (𝑆) É importante salientar que o resultado obtido pelo cálculo de uma probabilidade pode ser apresentado em formato fracionário, decimal ou percentual, todas essas configurações são matematicamente aceitáveis, sendo necessário apenas a percepção de tal distinção, porém os resultados em porcentagens são mais comuns. Você sabia? Para encontrar resultados corretos em formato decimal ou percentual é preciso utilizar a regra de arredondamento corretamente. De acordo com a Resolução nº 886/66, do IBGE há os seguintes casos: se o número for menor que 5 e o primeiro algarismo a ser abandonado é 0, 1, 2, 3 ou 4, fica inalterado o último algarismo que logo permanecerá; agora, se o número for maior que cinco, ou seja, se o primeiro algarismo a ser abandonado é o 6, 7, 8, ou 9, aumenta-se em uma unidade o algarismo que permanece; mas, se o número for igual a 5, há duas soluções: se após o 5 seguir, em qualquer casa, um algarismo diferente de zero, aumenta-se uma unidade ao algarismo que permanece, já, se o 5 for o Estatística Descritiva - Unidade 3 - Probabilidade I último algarismo ou após o 5 só se seguirem zeros, o último algarismo a ser conservado só será aumentando de uma unidade se for ímpar. Vamos discutir a seguinte questão, clássica no estudo de probabilidade condicional: “considere que, em uma urna há três bolas brancas, cinco bolas vermelhas e sete bolas pretas, qual a probabilidade de se retirar ao acaso uma bola preta?” Bem, já foi informado que há sete bolas pretas, assim este é o evento, pois apresenta a quantidade de resultados possíveis para a situação proposta; agora é necessário determinar o espaço amostral, ou seja, todos os resultados possíveis, que será obtido adicionando todas as bolas contidas na urna, independente da cor, logo: 3 + 5 + 7 = 15. Agora, podemos encontrar a probabilidade, que será dada por: 𝑃(𝑏𝑜𝑙𝑎 𝑝𝑟𝑒𝑡𝑎) = 7 15 . Como a fração resultante é irredutível, ou seja, não é possível simplificá-la ou reduzi-la, logo o resultado permanece o mesmo, isto é continua inalterado. 1.1. Probabilidade condicional Para determinar a probabilidade de um evento é necessário especificar o espaço amostral, caso contrário, deparamos com respostas distintas, porém válidas no contexto estabelecido. Desta forma, haverá situações em que será condicionado um evento em relação a ocorrência de outro, neste cenário, Larson e Farber (2016) estabelecem que a probabilidade condicional é a probabilidade deum evento ocorrer dado que outro evento já tenha sucedido, ou seja, já aconteceu. É denotado por 𝑃(𝐵/𝐴) a probabilidade de o evento 𝐵ocorrer, dado que o evento 𝐴 já tenha ocorrido e essa relação é descrita matematicamente por: 𝑃(𝐵/𝐴) = 𝑃(𝐴 ∩ 𝐵) 𝑃(𝐵) = 𝑛ú𝑚𝑒𝑟𝑜 𝑑𝑒 𝑐𝑎𝑠𝑜𝑠 𝑓𝑎𝑣𝑜𝑟𝑎𝑣𝑒𝑖𝑠 𝑑𝑒 𝐴 ∩ 𝐵 𝑛ú𝑚𝑒𝑟𝑜 𝑑𝑒 𝑐𝑎𝑠𝑜𝑠 𝑓𝑎𝑣𝑜𝑟𝑎𝑣𝑒𝑖𝑠 𝑑𝑜 𝑒𝑣𝑒𝑛𝑡𝑜 𝐵 Você sabia? O símbolo ∩representa a intersecção entre conjuntos, desta maneira, escrever 𝐴 ∩ 𝐵( lê-se: A intersecção B) significa determinar os elementos Estatística Descritiva - Unidade 3 - Probabilidade I que pertencem aos dois conjuntos simultaneamente, ou seja, é comum ao conjunto A e ao conjunto B. Já em um caso de intersecção de mais conjuntos, por exemplo, 𝐴 ∩ 𝐵 ∩ 𝐶(lê-se: A intersecção B intersecção C) significa determinar os elementos que pertencem aos três conjuntos ao mesmo tempo. Para diferenciar e compreender este novo conceito considere que uma universidade coletou dados referentes a mil alunos ingressantes em seus cursos de graduação referentes ao primeiro semestre do ano, estes números foram separados e classificados por gênero e por classificação dos cursos pertencentes às áreas de: exatas, humanas e biológicas; esses números são apresentados na tabela 1 abaixo: Tabela 1: Área de estudo versus gênero. Fonte: Elaborado pela autora, 2019. Nestas circunstâncias, qual seria a probabilidade de um aluno optar por um curso que pertença a área de exatas? E qual a probabilidade de uma pessoa, sendo mulher, ter escolhido estudar em um curso da área de humanas? E, por fim, qual a probabilidade de estudar em curso da área de biológicas, sendo homem? Para facilitar nossos cálculos e visualizar os totais referentes à cada categoria, será acrescentada à tabela 1 mais uma coluna à direita da última, com os resultados referentes aos somatórios correspondentes a cada linha e adicionada outra linha, dispondo do resultado das somas referentes aos gêneros, que estão dispostos em colunas, agora, observe a tabela 2, com estes dados e as modificações indicadas. Tabela 2: Área de estudo versus gênero com respectivos totais. Estatística Descritiva - Unidade 3 - Probabilidade I Fonte: Elaborado pela autora, 2019. Bem, agora será mais fácil responder aos questionamentos, lembrando que, para cada um destes, é necessário distinguir se a situação enquadra-se em uma probabilidade condicional ou um caso de probabilidade comum. Para descobrir a probabilidade de um aluno escolher um curso da área de exatas, é simples, vamos pensar... já que o sexo não foi especificado, basta realizar a divisão entre o total de alunos que optaram por exatas pelo total de alunos ingressantes no primeiro semestre, logo, obtemos a seguinte razão: 𝑃(𝑒𝑥𝑎𝑡𝑎𝑠) = 457 1000 , logo é perceptível que a probabilidade deste evento ocorrer não depende de outro, ou seja, não está condicionado à existência de nenhum outro. Qual a probabilidade de uma pessoa sendo mulher estudar na área de humanas? Pois bem, perceba que foi condicionado ao evento de estudar um curso da área de humanas, porém ser mulher, logo, é um caso que devemos utilizar da definição de probabilidade condicional e por isso deve ser solucionada pela relação apresentada anteriormente, assim𝑃(𝐵/𝐴) = 𝑛(𝐴∩𝐵) 𝑛(𝐵) = 95 520 = 19 104 . O último questionamento proposto também é uma situação em que é necessário utilizar o conceito de probabilidade condicional, pois é solicitada a probabilidade de estudar na área de biológicas, dada a condição de ser homem, observe que a ocorrência de um evento possui uma dependência com o acontecimento do outro, assim: 𝑃(𝐵/𝐴) = 𝑛(𝐴∩𝐵) 𝑛(𝐵) = 68 480 = 17 120 . É possível perceber que nestes dois casos em que o sexo foi definido, representa uma probabilidade diferente caso não houvesse sido imposta esta condição. Qual é a probabilidade de um estudante ser de humanas? Note que este evento é independente de qualquer outro, logo temos: 𝑃(ℎ𝑢𝑚𝑎𝑛𝑎𝑠) = 232 1000 . Voltando para o caso em que uma mulher precisa ser estudante de humanas é 𝑃(𝐵/𝐴) = 19 104 já calculada anteriormente. Agora compare os resultados, qual é maior? 1.2. Dependência e independência de eventos. Em alguns contextos que se fundamentam eventos probabilísticos encontramos problemas em que a chance de determinado evento interfere ou Estatística Descritiva - Unidade 3 - Probabilidade I não na ocorrência de outros; Larson e Farber (2016) definem, formalmente, como eventos independentes, quando um deles não interfere na probabilidade da ocorrência do outro, caso contrário, os eventos são ditos dependentes entre si. Castanheira (2013) formaliza que um evento A é dito independente de um evento B, se a probabilidade de A equivale a probabilidade condicional de A, dado B, ou seja, 𝑃(𝐴) = 𝑃(𝐴/𝐵)e, por consequência, se A é independente de B e B é independente de A, logo: 𝑃(𝐵) = 𝑃(𝐵/𝐴). A maior aplicação do conceito de dependência e independência de eventos está na igualdade expressa por: 𝑃(𝐴 ∩ 𝐵) = 𝑃(𝐴) ⋅ 𝑃(𝐵)(lê-se probabilidade de A intersecção B é igual a probabilidade de A vezes a probabilidade de B), que reconhece que, sendo dois eventos independentes, a intersecção entre eles é representada pelo produto entre a probabilidade do evento A pela probabilidade de ocorrência do evento B. Neste momento, vamos praticar este conceito, que é importantíssimo na probabilidade e permite a fácil resolução de problemas que se adequam a diversos casos? Considere as situações abaixo e classifique-as como dependentes ou independentes e, em seguida, justifique suas respostas. ❏ Jogar um dado de seis lados (A) e tirar um 2 e jogar uma moeda e sair cara (B); ❏ Selecionar uma rainha em um baralho sem reposição (A) e tirar uma carta de ouros do baralho (B); ❏ Tirar uma bola preta em uma urna que contém dez bolas pretas (A) e ganhar em um jogo de azar (B). Para classificar tais acontecimentos e outros, como eventos dependentes ou eventos independentes, devemos analisar se a ocorrência de um vai interferir na ocorrência do outro: ❏ O evento A ( tirar um ao jogar um dado) não interfere na ocorrência do evento B (sair cara ao jogar uma moeda), pois jogar o dado é uma situação e jogar uma moeda, outra, logo, estes eventos são independentes, eles não possuem nenhuma relação; Estatística Descritiva - Unidade 3 - Probabilidade I ❏ Observe que o evento A (tirar uma rainha em um baralho) e o B (tirar uma carta de ouros no baralho) são relacionados ao mesmo conjunto de cartas, logo, se retirar uma carta, no caso, uma rainha, este acontecimento vai interferir no outro, pois teremos uma carta a menos no espaço amostral, assim, são ditos eventos dependentes; ❏ Retirar uma bola em uma urna, que representa o evento A, e apostar em um jogo de azar (evento B) são eventos distintos e não ocasionam intervenção UM no outro, logo, são classificados como eventos independentes. 1.3. Teorema de Bayes O teorema de Bayes é fundamentado no conceito de probabilidade condicional, descrito e analisado anteriormente, pois relacionam raciocínios contrários, assim, é necessário conhecer a base de um para compreender a dinâmica do outro. A probabilidade condicional trabalha com a probabilidade de ocorrer um evento B sob a condição de ocorrer seu antecedente A; enquanto que, o teorema de Bayes trata a probabilidade de ocorrer o evento A sob a condição de ocorrer o evento B que sucede A. Freund (2009) descreve que, formalmente, o Teorema de Bayes é utilizado se 𝐵1,𝐵2,. . . , 𝑒 𝐵𝑘são eventos mutuamente excludentes, ou seja, a intersecção é nula, dos quais um deve ocorrer, logo: 𝑃(𝐵𝑖/𝐴) = 𝑃(𝐵𝑖) ⋅ 𝑃(𝐴/𝐵𝑖) 𝑃(𝐵1) ⋅ 𝑃(𝐴/𝐵1) + 𝑃(𝐵2) ⋅𝑃(𝐴/𝐵2) + . . . + 𝑃(𝐵𝑘) ⋅ 𝑃(𝐴/𝐵𝑘) Para 𝑖 = 1,2, . . . , 𝑜𝑢 𝑘. Observe que os símbolos 𝑃(𝐵1/𝐴) E 𝑃(𝐴/𝐵1) podem ter aparência similar, mas há grande diferença no que eles representam e em seu significado no contexto do exercício proposto, por isso, atenção para identificar e calcular seus valores. Estatística Descritiva - Unidade 3 - Probabilidade I Você Sabia? O treinador de beisebol Billy Beane ficou mundialmente famoso por otimizar a performance do seu time através do uso estatística e análise de dados, sua história foi retratada no filme “Moneyball” baseado no livro de Michael Lewis sobre a história de Beine “Moneyball: The Art of Winning a Unfair Game”. Seu maior desafio foi montar este time, em 2012, pois o clube enfrentava dificuldades financeiras então decidiu utilizar estatística e análise de dados para basear as suas escolhas em dados reais, contratou um cientista para analisar as porcentagens de acertos de seus jogadores. Vamos colocar em prática esse importante e essencial conceito da teoria de probabilidades? Para isso, vamos resolver a problemática sugerida abaixo, como exemplo de aplicação. Assuma que a probabilidade de diagnosticar com sucesso a presença no organismo de determinada doença rara foi identificada, como sendo 0,75. Quando identificada esta patologia corretamente, a probabilidade de cura é alterada para 0,85. Se não for detectada perfeitamente essa doença, a probabilidade de cura é dada para 0,35. Considere que certo paciente com esta doença é curado, assim qual é a probabilidade de que este tenha sido diagnosticado corretamente? 𝑃(𝐵1/𝐴) = 𝑃(𝐵𝑖) ⋅ 𝑃(𝐴/𝐵𝑖) 𝑃(𝐵1) ⋅ 𝑃(𝐴/𝐵1) + 𝑃(𝐵2) ⋅ 𝑃(𝐴/𝐵2) = 0,75 ⋅ 0,85 0,75 ⋅ 0,95 + 0,25 ⋅ 0,35 = 0,7969 ≃ 79,69% Assim, de acordo com o resultado acima, é possível inferir que há aproximadamente 79,69%, ou seja, arredondando, existem cerca de 80% de chances que um paciente, dentro das circunstâncias apresentadas, seja diagnosticado corretamente. Note que é uma probabilidade condicional, porém tendo em vista que um determinado evento já ocorreu, o paciente ter sido curado, para depois analisar se ele foi de fato diagnosticado de maneira correta. O teorema de Bayes é mais eficaz quando é utilizada uma série de dados históricos para fundamentar as previsões. Por isso, é importante continuar fazendo o acompanhamento e corrigir os possíveis erros de estruturação do método aplicado, pois pequenos erros podem propagar-se de maneira a Estatística Descritiva - Unidade 3 - Probabilidade I tornarem-se grandes erros, quando este teorema é utilizado, uma vez que a determinação incorreta de uma das probabilidades do Teorema interfere no resultado final. Você sabia? Thomas Bayes (1701-1776) foi um reverendo presbiteriano que viveu na Inglaterra. Em 1778, o filósofo Richard Price (1723-1791) apresentou à Royal Society um artigo que aparentemente encontrou entre os papéis de Bayes, com o nome ‘ An essay towards solving a problem in the doctrine of chances ’ (‘Ensaio buscando resolver um problema na doutrina das probabilidades’). Nesse artigo constava a demonstração do famoso teorema de Bayes; após sua publicação, o trabalho caiu no esquecimento e só foi resgatado pelo matemático francês Pierre- Simon de Laplace (1749-1827), que o revelou ao mundo (PENA, 2009). 2. Variável aleatória contínua e discreta Montgomery e Runger (2016) definem variável aleatória discreta como uma função que confere um número real a cada resultado no espaço amostral de um experimento aleatório, em outras palavras, quando uma variável apresenta um número enumerável de valores; e variável aleatória contínua como uma variável aleatória associada a um intervalo (finito ou infinito) de números reais, neste caso a variável pode assumir ou não infinitos valores sendo possível enumerar ou não a quantidade de valores que esta variável pode assumir. Assim, caso a imagem da função de probabilidade seja finita ou contável, tem-se uma variável aleatória discreta; mas se a imagem desta função seja o conjunto dos números reais, tem- se uma variável aleatória contínua. Quando se lida com variáveis aleatórias discretas, é possível atribuir diretamente valores de probabilidade aos valores numéricos estipulados. São descritos por exemplos de variáveis aleatórias contínuas: corrente elétrica, peso, temperatura, tempo, altura, dentre outros; já os exemplares de variável aleatória discreta são descritas por: número de moléculas em uma amostra de gás, quantidade de votos recebidos em uma eleição número de arranhões em uma determinada área, grau de queimaduras na pele, pontos Estatística Descritiva - Unidade 3 - Probabilidade I obtidos em uma prova de vestibular número de pessoas em fila de espera, dentre outros (MONTGOMERY; RUNGER, 2016). 2.1. Esperança matemática No estudo da estatística e entre outros âmbitos da matemática constantemente trabalhamos com o conceito de média aritmética, agora, no contexto do estudo de probabilidade, seremos apresentados ao conceito de esperança matemática, estas definições são equivalentes, mas são aplicados em cenários diferentes. Castanheira (2013) define esperança matemática como a média aritmética de uma variável aleatória, fenômeno ou experimento aleatório; este conceito é importantíssimo em nossos estudos, pois representa a quantidade utilizada como resumo do comportamento de uma variável aleatória. Neste contexto a média de uma distribuição de probabilidade é a esperança de sua variável aleatória. e sua interpretação consiste em um parâmetro que viabiliza caracterizar distribuições de probabilidades. O cálculo da esperança matemática é fácil de ser executado e é viável pela fórmula: 𝐸(𝑥) = 𝑛 ⋅ 𝑝, em que 𝐸(𝑥) representa a esperança matemática de acontecer o evento 𝑥, ou seja, o valor médio que esperaríamos se o experimento continuasse sendo repetido várias vezes, 𝑛identifica o número de tentativas a serem realizadas e 𝑝 a probabilidade de ocorrer o evento 𝑥 em uma tentativa única. Veremos agora um exemplo prático de como este conceito é aplicado, assuma que em um aquário existem 100 peixes, estes são diferenciados pela cor predominante em seu corpo, desta maneira, há 20 peixes vermelhos, 30 peixes amarelos, 25 peixes verdes e 25 peixes laranjas, assim, qual é a quantidade de peixes verdes ao final de 28 tentativas levando em consideração que a cada tentativa tira-se apenas um peixe? Bem, para solucionar esta questão temos que determinar a esperança matemática, onde n equivale a 28 e p a probabilidade de retirar do aquário um peixe verde que é o número de casos favoráveis em que tira-se um peixe verde sobre o total o número total de possibilidades, logo: 𝐸(𝑥) = 𝑛 ⋅ 𝑝 → 𝐸(𝑝𝑒𝑖𝑥𝑒 𝑣𝑒𝑟𝑑𝑒) = 28 ⋅ 25 100 = 7 Estatística Descritiva - Unidade 3 - Probabilidade I Este resultado retrata que esperamos que nas 28 tentativas, 7 peixes sejam verdes. 2.2. Variância e desvio padrão de variável aleatória discreta Como já foi apresentado na unidade dois, a variância e desvio padrão são classificadas como medidas de dispersão, que identificam como a média dispõe- se no contexto dos dados; a variância é caracterizada por avaliar o grau de homogeneidade dos valores em torno da média aritmética e o desvio padrão identifica e quantifica o “erro” presente em um conjunto de dados, previamente determinado. Assim como a esperança, a variância também tem importância significativa na caracterização de diversas distribuições de probabilidade. Quando se identifica a esperança e a variância de um modelo, ele fica totalmente caracterizado, ou seja, sabemos seu formato geral e suas particularidades. No atual cenário, a fórmula para obter tais medidas (variância e desvio padrão) são diferentes, logo, considerando n como o númerode tentativas em um experimento e x como o número de sucessos obtidos, as fórmulas que permitem calcular a variância (𝑠2) e o desvio padrão (𝑠) são sinalizados respectivamente por: 𝑠2 = 𝑛 ⋅ 𝑝 ⋅ 𝑞 e 𝑠 = √ 𝑛 ⋅ 𝑝 ⋅ 𝑞. Vamos aplicar estas fórmulas? E entender como tais relações se aplicam? Considerando o mesmo enunciado do exercício do aquário, que resolvemos anteriormente e, baseando-se nas informações contidas nele; vamos determina a variância e o desvio padrão. Bem, a variância é calculada por: 𝑠2 = 𝑛 ⋅ 𝑝 ⋅ 𝑞 → 𝑠2 = 28 ⋅ 25 100 ⋅ 75 100 = 5,25 peixes ao quadrado e, como o desvio caracteriza-se por ser a raiz quadrada da variância, logo, para encontrá-la, basta calcular a raiz quadrada do resultado anterior, observe: 𝑠 = √ 𝑛 ⋅ 𝑝 ⋅ 𝑞 = √5,25 ≃ 2,29peixes. 2.3. Distribuição de variável aleatória. As distribuições de freqüências de amostras foram analisadas anteriormente, no decorrer do segundo capítulo, agora, discutiremos sobre distribuição de probabilidade de populações. Estatística Descritiva - Unidade 3 - Probabilidade I Distribuições de probabilidade podem ser contínuas ou discretas, dependendo se eles definem probabilidades para variáveis contínuas ou discretas. Montgomery e Runger (2016) conceituam a distribuição de probabilidade de uma variável aleatória X, como a descrição das probabilidades associadas aos possíveis valores que X assume. Existem muitas distribuições de probabilidade que também podem ser chamadas de modelos probabilísticos, mas algumas merecem destaque por sua importância prática. Os modelos de probabilidade são utilizados para descrever vários fenômenos ou situações que encontramos na natureza, ou experimentos por nós elaborados. Esses modelos são expressos por uma família de distribuições de probabilidade que dependem de um ou vários parâmetros. O estereótipo deve necessariamente representar, na medida do possível, a complexidade que envolve o mundo real da população em estudo. Nesta unidade, será abordado o conceito de distribuição de probabilidade discreta que retrata a probabilidade de ocorrência de cada valor de uma variável aleatória discreta, lembrando que este tipo de variável tem valores contábeis, como uma lista de inteiros não negativos, ou seja, só valores positivos e enumeráveis. Assim, vamos aprender a identificar, analisar e calcular as distribuições de probabilidades discretas: Distribuição de Bernoulli e Distribuição Binomial. 3. Distribuição de Bernoulli A distribuição de Bernoulli é uma distribuição discreta que se envolve com diversas outras distribuições de probabilidade, como a distribuição binomial, e a distribuição geométrica. A distribuição de Bernoulli simboliza o resultado de um ensaio, desta maneira, as sequências de ensaios independentes de Bernoulli resultam em outras distribuições probabilísticas, neste contexto, a distribuição binomial modela o número de sucessos em n ensaios, a distribuição geométrica modela o número de falhas que antecede o primeiro sucesso; assim, a Estatística Descritiva - Unidade 3 - Probabilidade I distribuição de Bernoulli é incorporada e, consequentemente, relacionada a outras (CASTANHEIRA, 2013). São exemplos de utilização da distribuição de Bernoulli: o lançamento de uma moeda, onde existe a possibilidade de sucesso e, também de fracasso de determinada face da moeda ser exibida; sexo de um bebê, que pode ser atribuído o sucesso ou o fracasso de em relação ao gênero desejado; resultado de um teste de germinação, que pode obter um resultado de sucesso ou fracasso relacionado a realização de tal procedimento. Constantemente, os termos Distribuição Binomial e Distribuição de Bernoulli são confundidos e mal interpretados, logo, para impedir tal problema é importante estabelecer que testes de Bernoulli levam à uma distribuição binomial. Dessa maneira, a distribuição binomial é uma soma de vários ensaios Bernoulli independentes e uniformemente distribuídos. Castanheira (2013) informa que um ensaio de Bernoulli é um processo de amostragem, que possui como condições de existência: ❏ para cada tentativa, é possível dois resultados possíveis e mutuamente exclusivos (não existe intersecção entre os eventos, ou seja, intersecção nula), ou seja, se um dado evento acontecer exclui totalmente a ocorrência do outro, que são denominados sucesso e fracasso; ❏ as observações ou séries de tentativas são formadas por eventos independentes; ❏ o processo é estacionário, ou seja, a probabilidade de sucesso é contínuo e constante em cada tentativa executada. Agora, vamos estudar com mais detalhes a distribuição binomial e, consequentemente, a aplicação dos ensaios de Bernoulli, uma vez que um conceito está atrelado a outro. Vamos lá? Você sabia? Jacques Bernoulli (ou Jakob Bernoulli) foi um matemático suíço que nasceu na Basileia, em 27 de dezembro de 1654 e faleceu na mesma cidade, em Estatística Descritiva - Unidade 3 - Probabilidade I 16 de agosto de 1705, aos 50 anos. Estudou teologia apenas para atender ao desejo do pai, pois desde jovem manifestava extraordinária vocação para a matemática. Foi o primeiro matemático a desenvolver o cálculo infinitesimal para além do que fora feito por Newton e Leibniz, aplicando-o a novos problemas (JACQUES, 2017). 4. Distribuição Binomial Distribuição binomial pode ser definida como um modelo probabilístico de determinado número de sucessos quando submetidas a n provas do mesmo tipo, logo, este experimento deve ser repetido n vezes, sendo que cada um destes experimentos deve admitir somente dois resultados possíveis; sucesso ou fracasso, uma vez que p deve representar o sucesso e q identifica o fracasso, ambos resultados são definidos como constantes em cada um dos ensaios (MARTINS; DOMINGUES, 2017). A fórmula para o cálculo da probabilidade de certo número de sucessos em n ensaios por intermédio de uma Distribuição Binomial é dada pela relação descrita por: 𝑃(𝑥) = 𝑛! 𝑥!(𝑛−𝑥)! ⋅ 𝑝𝑥 ⋅ 𝑞𝑛 − 𝑥 Em que x representa o número de sucessos; p é a probabilidade de sucesso em cada prova, q é a probabilidade de fracasso de cada prova, n é o número de repetições do mesmo experimento; logo, é necessário identificar corretamente cada componente que compõe o exercício a ser resolvido por este modelo probabilístico, de modo a não cometer erros. Saiba mais! O símbolo !, (lê-se fatorial) que aparece na fórmula de Distribuição Binomial , representa no âmbito da matemática o produto de todos os números inteiros de n a 1, logo n! (lê-se n fatorial) equivale a realizar as Estatística Descritiva - Unidade 3 - Probabilidade I operações de multiplicação: n x (n-1) x (n-e) x (n-3) x….x (n - 5) x (n- 4) x (n - 3) x (n - 2) x 1 = n!. São exemplos de experiências binomiais: a população de um município que foi vacinado ou não vacinado; gênero das crianças em uma creche; escolher uma peça defeituosa ou não; respostas classificadas como verdadeiro ou falso em um questionário, quantidade de fumantes e não fumantes em grupo de idosos num asilo, número de caras no lançamento de trinta moedas, número de meninos entre um conjunto de cinquenta bebês, número de sementes germinadas em duzentas sementes, entre outros inúmeros exemplos. No geral podemos dizer que experiências binomiais são aquelas em que existem apenas duas possibilidades ocorrência ou não de determinado evento. Martins e Domingues (2017) afirmam que uma distribuição binomial pode ser utilizada e manipulada algebricamente, se forem atendidas as seguintes condições: ● O número de ensaios é fixo e constante, ou seja, são realizadas n provas do mesmo tipo; ● Cada ensaio é independente dos outros ensaios; ● Cada ensaio admite apenas dois resultados possíveis, um chamado fracasso e outro como sucesso; ● A probabilidadede um evento é a mesma para cada ensaio realizado; Durante o ano de 2017, na Bolsa de valores de São Paulo, foi constatado que 60% de todas suas ações tiveram sua cotação acrescida, ou seja, valorizadas no mercado financeiro; em contrapartida, 40% de todas as ações mantiveram-se constantes ou diminuíram seu valor de mercado. Um serviço de assessoria financeira optou em avaliar dez ações deste conjunto de ações administradas pela bolsa de valores, que foram singularmente recomendadas. Qual a probabilidade de que metade deste total de ações escolhidas tenham suas cotações aumentadas? Estatística Descritiva - Unidade 3 - Probabilidade I Vamos resolver este problema, referente à aplicação do conceito de distribuição binomial? Inicialmente, é preciso identificar as informações, vamos lá?: foram selecionadas dez ações (n = 10); é desejado que metade das dez ações, ou seja cinco das ações (x = 5) tenham aumentado suas cotações, p equivale ao sucesso do evento, logo p = 0,6 e, por consequência e definição o fracasso q é calculado por: q = 1 - x = 1 - 0,6 = 0,4. Assim, substituindo tais informações: 𝑃(𝑥) = 𝑛! 𝑥! (𝑛 − 𝑥)! ⋅ 𝑝𝑥 ⋅ 𝑞𝑛 − 𝑥 𝑃(5) = 10! 5! (10 − 5)! ⋅ 0,65 ⋅ 0,410 − 5 = 0,20 = 20% O resultado encontrado acima permite inferir que a chance de que metade das dez ações escolhidas, ou seja, cinco destas delas terem suas cotações valorizadas é de 20%. Saiba mais! Calculadoras científicas são equipamentos muito importantes para a resolução de problemas de matemática avançada, como no cálculo que utiliza a distribuição binomial, pois neste dispositivo é possível inserir todas as operações matemáticas requisitadas na fórmula. Para utilizar uma calculadora científica com segurança, é importante conhecer onde estão e como executar todas as funções que você precisa para suas atividades, assim leia o manual de instrução e procure se habituar com a mesma. Além da facilidade de ter os cálculos feitos de maneira rápida, a calculadora também mostra resultados sem erros, você pode utilizá-la tanto para agilizar os cálculos como para conferir as contas que você fez. Estatística Descritiva - Unidade 3 - Probabilidade I Síntese Nesta unidade, foi possível apresentar o panorama no qual se insere a teoria das probabilidades, a partir de conceitos e definições básicas e fundamentais. Foram discutidas as regras que moldam e sustentam a probabilidade condicional, bem como os princípios que a caracterizam e diferenciam do Teorema de Bayes; em relação a este teorema foi discutido sua fundamentação teórica e aplicabilidade Também foram desenvolvidos diversos cálculos para solucionar situações cotidianas diversas que envolvem a aplicabilidade de tais conceitos de probabilidade. Foi explanado o conceito geral de distribuição de probabilidade de uma variável aleatória discreta assim como sua utilização no contexto estatístico e probabilístico, também foi possível definir e caracterizar a Distribuição de Bernoulli, bem como a distribuição binomial, dispondo de diversos parâmetros próprios de cada distribuição e diferenciando-se para cada experimento probabilístico por intermédio da resolução de exercícios diversos. Assim, nesta unidade, você teve a oportunidade de: ● Compreender o conceito de probabilidade e aplicar sua funcionalidade na resolução de exercícios; ● Conhecer a definição de probabilidade condicional e resolver exercícios associados a tal conceito de dependência; ● Conhecer a definição de dependência e independência de eventos e sua aplicabilidade em probabilidade ● Interpretar e analisar os cálculos dos parâmetros estatísticos, diversos; ● Tomar decisões com base nas análises das representações e dos resultados analisados; ● Calcular a esperança matemática, variância e desvio padrão e diferenciar tais conceitos no contexto associado a variável aleatória discreta; Estatística Descritiva - Unidade 3 - Probabilidade I ● Interpretar e analisar os cálculos dos parâmetros estatísticos: esperança matemática, variância e desvio padrão.; ● Reconhecer e definir distribuição de Bernoulli; ● Resolver problemas utilizando as distribuições de variável aleatória: Distribuição de Bernoulli e Distribuição Binomial; ● Compreender a dinâmica das distribuições de variável aleatória; ● Reconhecer uma distribuição binomial; ● Resolver exercícios por intermédio de uma distribuição binomial. Bibliografia CASTANHEIRA, Nelson Pereira. Estatística aplicada a todos os níveis. Curitiba: Intersaberes, 2013. Disponível em: Minha Biblioteca. COSTA, Giovani Glaucio de Oliveira. Curso de estatística básica - Teoria e Prática. 2ªedição. São Paulo: Atlas, 2015. Disponível em: Minha Biblioteca. Estatística Descritiva - Unidade 3 - Probabilidade I FREUND, John E. Economia, Administração e Contabilidade. Estatística Aplicada. Porto Alegre: Bookman, 2009. JACQUES Bernoulli. [S. l.], 9 abr. 2017. Disponível em: https://www.somatematica.com.br/biograf/bernoulliJacques.php. Acesso em: 30 jun. 2019. LARSON, Ron; FARBER, Betsy. Estatística Aplicada. 6. ed. São Paulo: Pearson, 2016. 654 p. v. único. Disponível em: Biblioteca Virtual Universitária. MARTINS, Gilberto de Andrade; DOMINGUES, Osmar. Estatística Geral e Aplicada. São Paulo: Atlas, 2017. MAGALHÃES, Marcos ; LIMA, Antonio Carlos Predroso de. Noções de Probabilidade e Estatística. São Paulo: Edusp, 2015. MILONE, Giuseppe. Estatística Geral e Aplicada. Rio de Janeiro: Thomson, 2006.v MONTGOMERY, Douglas C; RUNGER, Georg C. Estatística Básica e Probabilidade para Engenheiros. São Paulo: LTR, 2016. MORETIM, Luiz Gonzaga. Estatística Básica: probabilidade e inferência. 1. ed. São Paulo: Pearson, 2010. 376 p. v. único. Disponível em: Biblioteca Virtual Universitária MORAES, Fabíola Eugênio Arrabaça. Estatística Descritiva. 1. ed. São Paulo: Pearson, 2010. 142 p. v. único. Disponível em: Biblioteca Virtual Universitária. NETO, Pedro Luiz de Oliveira Costa; CYMBALISTA, Melvin. Probabilidades. São Paulo: Edgard Blucher, 2012.Disponível em: Biblioteca Virtual Universitária. Estatística Descritiva - Unidade 3 - Probabilidade I PENA, Sérgio Danilo. Thomas Bayes: o cara!. Belo Horizonte, 1 jul. 2009. Disponível em: http://cienciahoje.org.br/artigo/thomas-bayes-o-cara/. Acesso em: 26 jun. 2019. WALPOLE, Ronald E. et al. Probabilidade e Estatística para engenharias e ciências. São Paulo: Pearson, 2008.
Compartilhar