Prévia do material em texto
Estatística Descritiva - Unidade 3 - Probabilidade I
Estatística
Descritiva
Unidade 3 - Probabilidade I
Estatística Descritiva - Unidade 3 - Probabilidade I
Rafaela Rodrigues Oliveira Amaro
Introdução
No estudo da estatística, tivemos a oportunidade de observar que as
informações coletadas, mesmo em condições igualitárias de experimentação,
oscilam, ou seja, variam e, por consequência, essa diversidade dificulta o
prenúncio de resultados possíveis e aceitáveis na matemática. Explicar tais
fenômenos é factível por intermédio da teoria que fundamenta a temática de
probabilidade; e aplicar esse conceito é mais comum do que imaginamos, pois
nos cercam constantemente.
Encontrar reportagens que declaram: “a chance de ganhar na loteria
estadual é de um em quinhentos mil”; ou, “a probabilidade de contrair dengue é
45% maior no verão que em comparação à outras estações do ano”, ou ainda: “a
chance de realizar uma cirurgia cardíaca com sucesso é de 86%”. Você se lembra
de algum discurso semelhante a este? Com certeza a resposta será sim, pois a
probabilidade é parte integrante de toda situação em que se deseja encontrar a
chance de determinada situação ocorrer. Compreender os conceitos que
constituem essa disciplina será a essência desta terceira unidade.
Vamos começar! Ótimo aprendizado para você!
1. Probabilidade
O estudo da probabilidade e da estatística estão intimamente ligados, pois
para compreender a inferência estatística é fundamental compreender os
conceitos que fundamentam a teoria probabilística. Na estatística, analisamos o
conjunto de dados obtidos com as ferramentas pertencentes a tal ciência e
encontramos conclusões acerca da avaliação da qualidade e mensuração da
quantidade de como tais dados se associam entre si. Já, na teoria da
probabilidade, o objetivo é prever os resultados de um experimento ou processo
sistemático.
Estatística Descritiva - Unidade 3 - Probabilidade I
Vincular chances de determinado fenômeno acontecer a números é aplicar
a probabilidade; Larson e Farber(2016) afirmam que um experimento de
probabilidade é uma ação, ou tentativa pela qual respostas são encontradas, ou
em outras palavras, as chances de um evento acontecer serem positivas. Assim,
para entender a dinâmica desta ciência é fundamental compreender dois
conceitos:
● Espaço amostral (S): corresponde ao conjunto de todos os
resultados; possíveis em um experimento de probabilidade;
● Evento (E): é um subgrupo do espaço amostral, geralmente são
escolhidas características específicas para definí-lo.
Freund (2009) relembra os três postulados relativos ao estudo da teoria de
probabilidade que se aplicam a um espaço amostral finito:
I. As probabilidades obtidas são representadas por números reais ou zero;
assim a probabilidade de um evento A deve ser um número maior ou igual
a zero, porém menor ou igual a um, essa afirmação é descrita por: 0 ≤
𝑃(𝐴) ≤ 1 𝑜𝑢, 𝑒𝑚 𝑝𝑜𝑟𝑐𝑒𝑛𝑡𝑎𝑔𝑒𝑚, 0% ≤ 𝑃(𝐴) ≤ 100%;
II. Qualquer espaço amostral S possui probabilidade equivalente a 1, que
equivale 100%, desta maneira 𝑃(𝑆) = 1 𝑜𝑢 𝑃(𝑆) = 100%;
III. Se dois eventos A e B são mutuamente exclusivos (não existe intersecção
entre os conjuntos), a probabilidade da união do evento A com o evento B,
ou vice-versa equivale ao resultado da soma da probabilidade do evento
A com a probabilidade de ocorrência do evento B, ou seja, 𝑃(𝐴 ∪ 𝐵) =
𝑃(𝐴) + 𝑃(𝐵).
Vale ressaltar que o resultado provindo de um cálculo de probabilidade varia
entre um e zero, de maneira que, se igual a 1 (um) que equivale a um resultado
de 100%, isto é, este evento de fato acontece, porém se a probabilidade for zero
corresponde a uma associação a um evento impossível, ou seja, nulo de
acontecer.
Vamos a um exemplo prático, admita um dado comum de seis faces, este
será jogado determinadas vezes, considerando este contexto qual é seu espaço
amostral? Agora se consideramos a possibilidade de um número par aparecer na
Estatística Descritiva - Unidade 3 - Probabilidade I
face superior deste mesmo dado, qual será o evento desta outra situação
hipotética? Ou ainda, qual a probabilidade de lançar este dado e encontrar um
número primo, lembrando que um número é primo se os seus divisores são
apenas ele mesmo e 1, na face superior?
Respondendo ao primeiro questionamento, é necessário determinar o
espaço amostral, ou seja, identificarmos todos os casos possíveis, logo, nesta
situação específica é 𝑆 = {1, 2,3,4,5,6}. O evento de sair um número par no
lançamento de um dado é encontrado, compreendendo que num dado de seis
faces {1, 2,3,4,5,6} há três números pares, logo, este conjunto representa o
evento: 𝐸 = {2, 4,6}. Finalmente para determinar a solução da terceira indagação,
vamos ter que realizar a divisão entre o número que corresponde ao conjunto
dos números primos contidos em um dado {1,2,3,5}e o conjunto que se refere ao
espaço amostral {1, 2,3,4,5,6}, assim probabilidade requerida é dada por P
(número primo) =
4
6
=
2
3
= 66,67% .
Agora, formalizando a maneira de calcular a probabilidade de um evento,
a relação é dada por:
𝑃(𝐸) =
𝑛ú𝑚𝑒𝑟𝑜 𝑑𝑒 𝑟𝑒𝑠𝑢𝑙𝑡𝑎𝑑𝑜𝑠 𝑛𝑜 𝑒𝑣𝑒𝑛𝑡𝑜 (𝐸)
𝑛ú𝑚𝑒𝑟𝑜 𝑡𝑜𝑡𝑎𝑙 𝑑𝑒 𝑟𝑒𝑠𝑢𝑙𝑡𝑎𝑑𝑜𝑠 𝑛𝑜 𝑒𝑠𝑝𝑎ç𝑜 𝑎𝑚𝑜𝑠𝑡𝑟𝑎𝑙 (𝑆)
É importante salientar que o resultado obtido pelo cálculo de uma
probabilidade pode ser apresentado em formato fracionário, decimal ou
percentual, todas essas configurações são matematicamente aceitáveis, sendo
necessário apenas a percepção de tal distinção, porém os resultados em
porcentagens são mais comuns.
Você sabia? Para encontrar resultados corretos em formato decimal ou
percentual é preciso utilizar a regra de arredondamento corretamente. De acordo
com a Resolução nº 886/66, do IBGE há os seguintes casos: se o número for menor
que 5 e o primeiro algarismo a ser abandonado é 0, 1, 2, 3 ou 4, fica inalterado o
último algarismo que logo permanecerá; agora, se o número for maior que cinco,
ou seja, se o primeiro algarismo a ser abandonado é o 6, 7, 8, ou 9, aumenta-se
em uma unidade o algarismo que permanece; mas, se o número for igual a 5, há
duas soluções: se após o 5 seguir, em qualquer casa, um algarismo diferente de
zero, aumenta-se uma unidade ao algarismo que permanece, já, se o 5 for o
Estatística Descritiva - Unidade 3 - Probabilidade I
último algarismo ou após o 5 só se seguirem zeros, o último algarismo a ser
conservado só será aumentando de uma unidade se for ímpar.
Vamos discutir a seguinte questão, clássica no estudo de probabilidade
condicional: “considere que, em uma urna há três bolas brancas, cinco bolas
vermelhas e sete bolas pretas, qual a probabilidade de se retirar ao acaso uma
bola preta?”
Bem, já foi informado que há sete bolas pretas, assim este é o evento, pois
apresenta a quantidade de resultados possíveis para a situação proposta; agora
é necessário determinar o espaço amostral, ou seja, todos os resultados
possíveis, que será obtido adicionando todas as bolas contidas na urna,
independente da cor, logo: 3 + 5 + 7 = 15. Agora, podemos encontrar a
probabilidade, que será dada por: 𝑃(𝑏𝑜𝑙𝑎 𝑝𝑟𝑒𝑡𝑎) =
7
15
.
Como a fração resultante é irredutível, ou seja, não é possível simplificá-la ou
reduzi-la, logo o resultado permanece o mesmo, isto é continua inalterado.
1.1. Probabilidade condicional
Para determinar a probabilidade de um evento é necessário especificar o
espaço amostral, caso contrário, deparamos com respostas distintas, porém
válidas no contexto estabelecido. Desta forma, haverá situações em que será
condicionado um evento em relação a ocorrência de outro, neste cenário, Larson
e Farber (2016) estabelecem que a probabilidade condicional é a probabilidade
deum evento ocorrer dado que outro evento já tenha sucedido, ou seja, já
aconteceu.
É denotado por 𝑃(𝐵/𝐴) a probabilidade de o evento 𝐵ocorrer, dado que o
evento 𝐴 já tenha ocorrido e essa relação é descrita matematicamente por:
𝑃(𝐵/𝐴) =
𝑃(𝐴 ∩ 𝐵)
𝑃(𝐵)
=
𝑛ú𝑚𝑒𝑟𝑜 𝑑𝑒 𝑐𝑎𝑠𝑜𝑠 𝑓𝑎𝑣𝑜𝑟𝑎𝑣𝑒𝑖𝑠 𝑑𝑒 𝐴 ∩ 𝐵
𝑛ú𝑚𝑒𝑟𝑜 𝑑𝑒 𝑐𝑎𝑠𝑜𝑠 𝑓𝑎𝑣𝑜𝑟𝑎𝑣𝑒𝑖𝑠 𝑑𝑜 𝑒𝑣𝑒𝑛𝑡𝑜 𝐵
Você sabia? O símbolo ∩representa a intersecção entre conjuntos, desta
maneira, escrever 𝐴 ∩ 𝐵( lê-se: A intersecção B) significa determinar os elementos
Estatística Descritiva - Unidade 3 - Probabilidade I
que pertencem aos dois conjuntos simultaneamente, ou seja, é comum ao
conjunto A e ao conjunto B. Já em um caso de intersecção de mais conjuntos, por
exemplo, 𝐴 ∩ 𝐵 ∩ 𝐶(lê-se: A intersecção B intersecção C) significa determinar os
elementos que pertencem aos três conjuntos ao mesmo tempo.
Para diferenciar e compreender este novo conceito considere que uma
universidade coletou dados referentes a mil alunos ingressantes em seus cursos
de graduação referentes ao primeiro semestre do ano, estes números foram
separados e classificados por gênero e por classificação dos cursos pertencentes
às áreas de: exatas, humanas e biológicas; esses números são apresentados na
tabela 1 abaixo:
Tabela 1: Área de estudo versus gênero.
Fonte: Elaborado pela autora, 2019.
Nestas circunstâncias, qual seria a probabilidade de um aluno optar por
um curso que pertença a área de exatas? E qual a probabilidade de uma pessoa,
sendo mulher, ter escolhido estudar em um curso da área de humanas? E, por
fim, qual a probabilidade de estudar em curso da área de biológicas, sendo
homem?
Para facilitar nossos cálculos e visualizar os totais referentes à cada
categoria, será acrescentada à tabela 1 mais uma coluna à direita da última, com
os resultados referentes aos somatórios correspondentes a cada linha e
adicionada outra linha, dispondo do resultado das somas referentes aos gêneros,
que estão dispostos em colunas, agora, observe a tabela 2, com estes dados e as
modificações indicadas.
Tabela 2: Área de estudo versus gênero com respectivos totais.
Estatística Descritiva - Unidade 3 - Probabilidade I
Fonte: Elaborado pela autora, 2019.
Bem, agora será mais fácil responder aos questionamentos, lembrando
que, para cada um destes, é necessário distinguir se a situação enquadra-se em
uma probabilidade condicional ou um caso de probabilidade comum. Para
descobrir a probabilidade de um aluno escolher um curso da área de exatas, é
simples, vamos pensar... já que o sexo não foi especificado, basta realizar a
divisão entre o total de alunos que optaram por exatas pelo total de alunos
ingressantes no primeiro semestre, logo, obtemos a seguinte razão: 𝑃(𝑒𝑥𝑎𝑡𝑎𝑠) =
457
1000
, logo é perceptível que a probabilidade deste evento ocorrer não depende de
outro, ou seja, não está condicionado à existência de nenhum outro.
Qual a probabilidade de uma pessoa sendo mulher estudar na área de
humanas? Pois bem, perceba que foi condicionado ao evento de estudar um
curso da área de humanas, porém ser mulher, logo, é um caso que devemos
utilizar da definição de probabilidade condicional e por isso deve ser solucionada
pela relação apresentada anteriormente, assim𝑃(𝐵/𝐴) =
𝑛(𝐴∩𝐵)
𝑛(𝐵)
=
95
520
=
19
104
.
O último questionamento proposto também é uma situação em que é
necessário utilizar o conceito de probabilidade condicional, pois é solicitada a
probabilidade de estudar na área de biológicas, dada a condição de ser homem,
observe que a ocorrência de um evento possui uma dependência com o
acontecimento do outro, assim: 𝑃(𝐵/𝐴) =
𝑛(𝐴∩𝐵)
𝑛(𝐵)
=
68
480
=
17
120
.
É possível perceber que nestes dois casos em que o sexo foi definido,
representa uma probabilidade diferente caso não houvesse sido imposta esta
condição. Qual é a probabilidade de um estudante ser de humanas? Note que
este evento é independente de qualquer outro, logo temos: 𝑃(ℎ𝑢𝑚𝑎𝑛𝑎𝑠) =
232
1000
.
Voltando para o caso em que uma mulher precisa ser estudante de humanas é
𝑃(𝐵/𝐴) =
19
104
já calculada anteriormente. Agora compare os resultados, qual é
maior?
1.2. Dependência e independência de eventos.
Em alguns contextos que se fundamentam eventos probabilísticos
encontramos problemas em que a chance de determinado evento interfere ou
Estatística Descritiva - Unidade 3 - Probabilidade I
não na ocorrência de outros; Larson e Farber (2016) definem, formalmente, como
eventos independentes, quando um deles não interfere na probabilidade da
ocorrência do outro, caso contrário, os eventos são ditos dependentes entre si.
Castanheira (2013) formaliza que um evento A é dito independente de um evento
B, se a probabilidade de A equivale a probabilidade condicional de A, dado B, ou
seja, 𝑃(𝐴) = 𝑃(𝐴/𝐵)e, por consequência, se A é independente de B e B é
independente de A, logo: 𝑃(𝐵) = 𝑃(𝐵/𝐴).
A maior aplicação do conceito de dependência e independência de eventos
está na igualdade expressa por: 𝑃(𝐴 ∩ 𝐵) = 𝑃(𝐴) ⋅ 𝑃(𝐵)(lê-se probabilidade de A
intersecção B é igual a probabilidade de A vezes a probabilidade de B), que
reconhece que, sendo dois eventos independentes, a intersecção entre eles é
representada pelo produto entre a probabilidade do evento A pela probabilidade
de ocorrência do evento B.
Neste momento, vamos praticar este conceito, que é importantíssimo na
probabilidade e permite a fácil resolução de problemas que se adequam a
diversos casos?
Considere as situações abaixo e classifique-as como dependentes ou
independentes e, em seguida, justifique suas respostas.
❏ Jogar um dado de seis lados (A) e tirar um 2 e jogar uma
moeda e sair cara (B);
❏ Selecionar uma rainha em um baralho sem reposição (A) e
tirar uma carta de ouros do baralho (B);
❏ Tirar uma bola preta em uma urna que contém dez bolas
pretas (A) e ganhar em um jogo de azar (B).
Para classificar tais acontecimentos e outros, como eventos dependentes
ou eventos independentes, devemos analisar se a ocorrência de um vai interferir
na ocorrência do outro:
❏ O evento A ( tirar um ao jogar um dado) não interfere na ocorrência
do evento B (sair cara ao jogar uma moeda), pois jogar o dado é uma
situação e jogar uma moeda, outra, logo, estes eventos são
independentes, eles não possuem nenhuma relação;
Estatística Descritiva - Unidade 3 - Probabilidade I
❏ Observe que o evento A (tirar uma rainha em um baralho) e o B (tirar
uma carta de ouros no baralho) são relacionados ao mesmo
conjunto de cartas, logo, se retirar uma carta, no caso, uma rainha,
este acontecimento vai interferir no outro, pois teremos uma carta a
menos no espaço amostral, assim, são ditos eventos dependentes;
❏ Retirar uma bola em uma urna, que representa o evento A, e apostar
em um jogo de azar (evento B) são eventos distintos e não
ocasionam intervenção UM no outro, logo, são classificados como
eventos independentes.
1.3. Teorema de Bayes
O teorema de Bayes é fundamentado no conceito de probabilidade
condicional, descrito e analisado anteriormente, pois relacionam raciocínios
contrários, assim, é necessário conhecer a base de um para compreender a
dinâmica do outro.
A probabilidade condicional trabalha com a probabilidade de ocorrer um
evento B sob a condição de ocorrer seu antecedente A; enquanto que, o teorema
de Bayes trata a probabilidade de ocorrer o evento A sob a condição de ocorrer o
evento B que sucede A.
Freund (2009) descreve que, formalmente, o Teorema de Bayes é utilizado
se 𝐵1,𝐵2,. . . , 𝑒 𝐵𝑘são eventos mutuamente excludentes, ou seja, a intersecção é
nula, dos quais um deve ocorrer, logo:
𝑃(𝐵𝑖/𝐴) =
𝑃(𝐵𝑖) ⋅ 𝑃(𝐴/𝐵𝑖)
𝑃(𝐵1) ⋅ 𝑃(𝐴/𝐵1) + 𝑃(𝐵2) ⋅𝑃(𝐴/𝐵2) + . . . + 𝑃(𝐵𝑘) ⋅ 𝑃(𝐴/𝐵𝑘)
Para 𝑖 = 1,2, . . . , 𝑜𝑢 𝑘.
Observe que os símbolos 𝑃(𝐵1/𝐴) E 𝑃(𝐴/𝐵1) podem ter aparência similar,
mas há grande diferença no que eles representam e em seu significado no
contexto do exercício proposto, por isso, atenção para identificar e calcular seus
valores.
Estatística Descritiva - Unidade 3 - Probabilidade I
Você Sabia? O treinador de beisebol Billy Beane ficou mundialmente famoso por
otimizar a performance do seu time através do uso estatística e análise de dados,
sua história foi retratada no filme “Moneyball” baseado no livro de Michael Lewis
sobre a história de Beine “Moneyball: The Art of Winning a Unfair Game”.
Seu maior desafio foi montar este time, em 2012, pois o clube enfrentava
dificuldades financeiras então decidiu utilizar estatística e análise de dados para
basear as suas escolhas em dados reais, contratou um cientista para analisar as
porcentagens de acertos de seus jogadores.
Vamos colocar em prática esse importante e essencial conceito da teoria
de probabilidades? Para isso, vamos resolver a problemática sugerida abaixo,
como exemplo de aplicação.
Assuma que a probabilidade de diagnosticar com sucesso a presença no
organismo de determinada doença rara foi identificada, como sendo 0,75.
Quando identificada esta patologia corretamente, a probabilidade de cura é
alterada para 0,85. Se não for detectada perfeitamente essa doença, a
probabilidade de cura é dada para 0,35. Considere que certo paciente com esta
doença é curado, assim qual é a probabilidade de que este tenha sido
diagnosticado corretamente?
𝑃(𝐵1/𝐴) =
𝑃(𝐵𝑖) ⋅ 𝑃(𝐴/𝐵𝑖)
𝑃(𝐵1) ⋅ 𝑃(𝐴/𝐵1) + 𝑃(𝐵2) ⋅ 𝑃(𝐴/𝐵2)
=
0,75 ⋅ 0,85
0,75 ⋅ 0,95 + 0,25 ⋅ 0,35
= 0,7969
≃ 79,69%
Assim, de acordo com o resultado acima, é possível inferir que há
aproximadamente 79,69%, ou seja, arredondando, existem cerca de 80% de
chances que um paciente, dentro das circunstâncias apresentadas, seja
diagnosticado corretamente. Note que é uma probabilidade condicional, porém
tendo em vista que um determinado evento já ocorreu, o paciente ter sido curado,
para depois analisar se ele foi de fato diagnosticado de maneira correta.
O teorema de Bayes é mais eficaz quando é utilizada uma série de dados
históricos para fundamentar as previsões. Por isso, é importante continuar
fazendo o acompanhamento e corrigir os possíveis erros de estruturação do
método aplicado, pois pequenos erros podem propagar-se de maneira a
Estatística Descritiva - Unidade 3 - Probabilidade I
tornarem-se grandes erros, quando este teorema é utilizado, uma vez que a
determinação incorreta de uma das probabilidades do Teorema interfere no
resultado final.
Você sabia? Thomas Bayes (1701-1776) foi um reverendo presbiteriano que viveu
na Inglaterra. Em 1778, o filósofo Richard Price (1723-1791) apresentou à Royal
Society um artigo que aparentemente encontrou entre os papéis de Bayes, com o
nome ‘ An essay towards solving a problem in the doctrine of chances ’ (‘Ensaio
buscando resolver um problema na doutrina das probabilidades’). Nesse artigo
constava a demonstração do famoso teorema de Bayes; após sua publicação, o
trabalho caiu no esquecimento e só foi resgatado pelo matemático francês Pierre-
Simon de Laplace (1749-1827), que o revelou ao mundo (PENA, 2009).
2. Variável aleatória contínua e discreta
Montgomery e Runger (2016) definem variável aleatória discreta como uma
função que confere um número real a cada resultado no espaço amostral de um
experimento aleatório, em outras palavras, quando uma variável apresenta um
número enumerável de valores; e variável aleatória contínua como uma variável
aleatória associada a um intervalo (finito ou infinito) de números reais, neste caso
a variável pode assumir ou não infinitos valores sendo possível enumerar ou não
a quantidade de valores que esta variável pode assumir. Assim, caso a imagem
da função de probabilidade seja finita ou contável, tem-se uma variável aleatória
discreta; mas se a imagem desta função seja o conjunto dos números reais, tem-
se uma variável aleatória contínua. Quando se lida com variáveis aleatórias
discretas, é possível atribuir diretamente valores de probabilidade aos valores
numéricos estipulados.
São descritos por exemplos de variáveis aleatórias contínuas: corrente
elétrica, peso, temperatura, tempo, altura, dentre outros; já os exemplares de
variável aleatória discreta são descritas por: número de moléculas em uma
amostra de gás, quantidade de votos recebidos em uma eleição número de
arranhões em uma determinada área, grau de queimaduras na pele, pontos
Estatística Descritiva - Unidade 3 - Probabilidade I
obtidos em uma prova de vestibular número de pessoas em fila de espera, dentre
outros (MONTGOMERY; RUNGER, 2016).
2.1. Esperança matemática
No estudo da estatística e entre outros âmbitos da matemática
constantemente trabalhamos com o conceito de média aritmética, agora, no
contexto do estudo de probabilidade, seremos apresentados ao conceito de
esperança matemática, estas definições são equivalentes, mas são aplicados em
cenários diferentes.
Castanheira (2013) define esperança matemática como a média aritmética
de uma variável aleatória, fenômeno ou experimento aleatório; este conceito é
importantíssimo em nossos estudos, pois representa a quantidade utilizada como
resumo do comportamento de uma variável aleatória. Neste contexto a média de
uma distribuição de probabilidade é a esperança de sua variável aleatória. e sua
interpretação consiste em um parâmetro que viabiliza caracterizar distribuições
de probabilidades.
O cálculo da esperança matemática é fácil de ser executado e é viável pela
fórmula: 𝐸(𝑥) = 𝑛 ⋅ 𝑝, em que 𝐸(𝑥) representa a esperança matemática de
acontecer o evento 𝑥, ou seja, o valor médio que esperaríamos se o experimento
continuasse sendo repetido várias vezes, 𝑛identifica o número de tentativas a
serem realizadas e 𝑝 a probabilidade de ocorrer o evento 𝑥 em uma tentativa
única.
Veremos agora um exemplo prático de como este conceito é aplicado,
assuma que em um aquário existem 100 peixes, estes são diferenciados pela cor
predominante em seu corpo, desta maneira, há 20 peixes vermelhos, 30 peixes
amarelos, 25 peixes verdes e 25 peixes laranjas, assim, qual é a quantidade de
peixes verdes ao final de 28 tentativas levando em consideração que a cada
tentativa tira-se apenas um peixe?
Bem, para solucionar esta questão temos que determinar a esperança
matemática, onde n equivale a 28 e p a probabilidade de retirar do aquário um
peixe verde que é o número de casos favoráveis em que tira-se um peixe verde
sobre o total o número total de possibilidades, logo:
𝐸(𝑥) = 𝑛 ⋅ 𝑝 → 𝐸(𝑝𝑒𝑖𝑥𝑒 𝑣𝑒𝑟𝑑𝑒) = 28 ⋅
25
100
= 7
Estatística Descritiva - Unidade 3 - Probabilidade I
Este resultado retrata que esperamos que nas 28 tentativas, 7 peixes sejam
verdes.
2.2. Variância e desvio padrão de variável aleatória discreta
Como já foi apresentado na unidade dois, a variância e desvio padrão são
classificadas como medidas de dispersão, que identificam como a média dispõe-
se no contexto dos dados; a variância é caracterizada por avaliar o grau de
homogeneidade dos valores em torno da média aritmética e o desvio padrão
identifica e quantifica o “erro” presente em um conjunto de dados, previamente
determinado.
Assim como a esperança, a variância também tem importância significativa
na caracterização de diversas distribuições de probabilidade. Quando se
identifica a esperança e a variância de um modelo, ele fica totalmente
caracterizado, ou seja, sabemos seu formato geral e suas particularidades.
No atual cenário, a fórmula para obter tais medidas (variância e desvio padrão)
são diferentes, logo, considerando n como o númerode tentativas em um
experimento e x como o número de sucessos obtidos, as fórmulas que permitem
calcular a variância (𝑠2) e o desvio padrão (𝑠) são sinalizados respectivamente
por: 𝑠2 = 𝑛 ⋅ 𝑝 ⋅ 𝑞 e 𝑠 = √ 𝑛 ⋅ 𝑝 ⋅ 𝑞.
Vamos aplicar estas fórmulas? E entender como tais relações se aplicam?
Considerando o mesmo enunciado do exercício do aquário, que resolvemos
anteriormente e, baseando-se nas informações contidas nele; vamos determina
a variância e o desvio padrão.
Bem, a variância é calculada por: 𝑠2 = 𝑛 ⋅ 𝑝 ⋅ 𝑞 → 𝑠2 = 28 ⋅
25
100
⋅
75
100
= 5,25 peixes
ao quadrado e, como o desvio caracteriza-se por ser a raiz quadrada da variância,
logo, para encontrá-la, basta calcular a raiz quadrada do resultado anterior,
observe: 𝑠 = √ 𝑛 ⋅ 𝑝 ⋅ 𝑞 = √5,25 ≃ 2,29peixes.
2.3. Distribuição de variável aleatória.
As distribuições de freqüências de amostras foram analisadas
anteriormente, no decorrer do segundo capítulo, agora, discutiremos sobre
distribuição de probabilidade de populações.
Estatística Descritiva - Unidade 3 - Probabilidade I
Distribuições de probabilidade podem ser contínuas ou discretas,
dependendo se eles definem probabilidades para variáveis contínuas ou
discretas. Montgomery e Runger (2016) conceituam a distribuição de
probabilidade de uma variável aleatória X, como a descrição das probabilidades
associadas aos possíveis valores que X assume. Existem muitas distribuições de
probabilidade que também podem ser chamadas de modelos probabilísticos,
mas algumas merecem destaque por sua importância prática.
Os modelos de probabilidade são utilizados para descrever vários
fenômenos ou situações que encontramos na natureza, ou experimentos por nós
elaborados. Esses modelos são expressos por uma família de distribuições de
probabilidade que dependem de um ou vários parâmetros. O estereótipo deve
necessariamente representar, na medida do possível, a complexidade que
envolve o mundo real da população em estudo.
Nesta unidade, será abordado o conceito de distribuição de probabilidade
discreta que retrata a probabilidade de ocorrência de cada valor de uma variável
aleatória discreta, lembrando que este tipo de variável tem valores contábeis,
como uma lista de inteiros não negativos, ou seja, só valores positivos e
enumeráveis. Assim, vamos aprender a identificar, analisar e calcular as
distribuições de probabilidades discretas: Distribuição de Bernoulli e Distribuição
Binomial.
3. Distribuição de Bernoulli
A distribuição de Bernoulli é uma distribuição discreta que se envolve com
diversas outras distribuições de probabilidade, como a distribuição binomial, e a
distribuição geométrica. A distribuição de Bernoulli simboliza o resultado de um
ensaio, desta maneira, as sequências de ensaios independentes de Bernoulli
resultam em outras distribuições probabilísticas, neste contexto, a distribuição
binomial modela o número de sucessos em n ensaios, a distribuição geométrica
modela o número de falhas que antecede o primeiro sucesso; assim, a
Estatística Descritiva - Unidade 3 - Probabilidade I
distribuição de Bernoulli é incorporada e, consequentemente, relacionada a
outras (CASTANHEIRA, 2013).
São exemplos de utilização da distribuição de Bernoulli: o lançamento de
uma moeda, onde existe a possibilidade de sucesso e, também de fracasso de
determinada face da moeda ser exibida; sexo de um bebê, que pode ser atribuído
o sucesso ou o fracasso de em relação ao gênero desejado; resultado de um teste
de germinação, que pode obter um resultado de sucesso ou fracasso relacionado
a realização de tal procedimento.
Constantemente, os termos Distribuição Binomial e Distribuição de
Bernoulli são confundidos e mal interpretados, logo, para impedir tal problema é
importante estabelecer que testes de Bernoulli levam à uma distribuição
binomial. Dessa maneira, a distribuição binomial é uma soma de vários ensaios
Bernoulli independentes e uniformemente distribuídos.
Castanheira (2013) informa que um ensaio de Bernoulli é um processo de
amostragem, que possui como condições de existência:
❏ para cada tentativa, é possível dois resultados possíveis e
mutuamente exclusivos (não existe intersecção entre os eventos, ou
seja, intersecção nula), ou seja, se um dado evento acontecer exclui
totalmente a ocorrência do outro, que são denominados sucesso e
fracasso;
❏ as observações ou séries de tentativas são formadas por eventos
independentes;
❏ o processo é estacionário, ou seja, a probabilidade de sucesso é
contínuo e constante em cada tentativa executada.
Agora, vamos estudar com mais detalhes a distribuição binomial e,
consequentemente, a aplicação dos ensaios de Bernoulli, uma vez que um
conceito está atrelado a outro. Vamos lá?
Você sabia? Jacques Bernoulli (ou Jakob Bernoulli) foi um matemático suíço que
nasceu na Basileia, em 27 de dezembro de 1654 e faleceu na mesma cidade, em
Estatística Descritiva - Unidade 3 - Probabilidade I
16 de agosto de 1705, aos 50 anos. Estudou teologia apenas para atender ao
desejo do pai, pois desde jovem manifestava extraordinária vocação para a
matemática. Foi o primeiro matemático a desenvolver o cálculo infinitesimal para
além do que fora feito por Newton e Leibniz, aplicando-o a novos problemas
(JACQUES, 2017).
4. Distribuição Binomial
Distribuição binomial pode ser definida como um modelo probabilístico de
determinado número de sucessos quando submetidas a n provas do mesmo tipo,
logo, este experimento deve ser repetido n vezes, sendo que cada um destes
experimentos deve admitir somente dois resultados possíveis; sucesso ou
fracasso, uma vez que p deve representar o sucesso e q identifica o fracasso,
ambos resultados são definidos como constantes em cada um dos ensaios
(MARTINS; DOMINGUES, 2017).
A fórmula para o cálculo da probabilidade de certo número de sucessos em
n ensaios por intermédio de uma Distribuição Binomial é dada pela relação
descrita por:
𝑃(𝑥) =
𝑛!
𝑥!(𝑛−𝑥)!
⋅ 𝑝𝑥 ⋅ 𝑞𝑛 − 𝑥
Em que x representa o número de sucessos; p é a probabilidade de sucesso
em cada prova, q é a probabilidade de fracasso de cada prova, n é o número de
repetições do mesmo experimento; logo, é necessário identificar corretamente
cada componente que compõe o exercício a ser resolvido por este modelo
probabilístico, de modo a não cometer erros.
Saiba mais! O símbolo !, (lê-se fatorial) que aparece na fórmula de
Distribuição Binomial , representa no âmbito da matemática o produto de todos
os números inteiros de n a 1, logo n! (lê-se n fatorial) equivale a realizar as
Estatística Descritiva - Unidade 3 - Probabilidade I
operações de multiplicação: n x (n-1) x (n-e) x (n-3) x….x (n - 5) x (n- 4) x (n - 3) x
(n - 2) x 1 = n!.
São exemplos de experiências binomiais: a população de um município que
foi vacinado ou não vacinado; gênero das crianças em uma creche; escolher uma
peça defeituosa ou não; respostas classificadas como verdadeiro ou falso em um
questionário, quantidade de fumantes e não fumantes em grupo de idosos num
asilo, número de caras no lançamento de trinta moedas, número de meninos
entre um conjunto de cinquenta bebês, número de sementes germinadas em
duzentas sementes, entre outros inúmeros exemplos. No geral podemos dizer
que experiências binomiais são aquelas em que existem apenas duas
possibilidades ocorrência ou não de determinado evento.
Martins e Domingues (2017) afirmam que uma distribuição binomial pode
ser utilizada e manipulada algebricamente, se forem atendidas as seguintes
condições:
● O número de ensaios é fixo e constante, ou seja, são realizadas n provas
do mesmo tipo;
● Cada ensaio é independente dos outros ensaios;
● Cada ensaio admite apenas dois resultados possíveis, um chamado
fracasso e outro como sucesso;
● A probabilidadede um evento é a mesma para cada ensaio realizado;
Durante o ano de 2017, na Bolsa de valores de São Paulo, foi constatado
que 60% de todas suas ações tiveram sua cotação acrescida, ou seja, valorizadas
no mercado financeiro; em contrapartida, 40% de todas as ações mantiveram-se
constantes ou diminuíram seu valor de mercado. Um serviço de assessoria
financeira optou em avaliar dez ações deste conjunto de ações administradas
pela bolsa de valores, que foram singularmente recomendadas. Qual a
probabilidade de que metade deste total de ações escolhidas tenham suas
cotações aumentadas?
Estatística Descritiva - Unidade 3 - Probabilidade I
Vamos resolver este problema, referente à aplicação do conceito de
distribuição binomial?
Inicialmente, é preciso identificar as informações, vamos lá?: foram
selecionadas dez ações (n = 10); é desejado que metade das dez ações, ou seja
cinco das ações (x = 5) tenham aumentado suas cotações, p equivale ao sucesso
do evento, logo p = 0,6 e, por consequência e definição o fracasso q é calculado
por: q = 1 - x = 1 - 0,6 = 0,4.
Assim, substituindo tais informações:
𝑃(𝑥) =
𝑛!
𝑥! (𝑛 − 𝑥)!
⋅ 𝑝𝑥 ⋅ 𝑞𝑛 − 𝑥
𝑃(5) =
10!
5! (10 − 5)!
⋅ 0,65 ⋅ 0,410 − 5 = 0,20 = 20%
O resultado encontrado acima permite inferir que a chance de que metade
das dez ações escolhidas, ou seja, cinco destas delas terem suas cotações
valorizadas é de 20%.
Saiba mais! Calculadoras científicas são equipamentos muito importantes
para a resolução de problemas de matemática avançada, como no cálculo que
utiliza a distribuição binomial, pois neste dispositivo é possível inserir todas as
operações matemáticas requisitadas na fórmula. Para utilizar uma calculadora
científica com segurança, é importante conhecer onde estão e como executar
todas as funções que você precisa para suas atividades, assim leia o manual de
instrução e procure se habituar com a mesma. Além da facilidade de ter os
cálculos feitos de maneira rápida, a calculadora também mostra resultados sem
erros, você pode utilizá-la tanto para agilizar os cálculos como para conferir as
contas que você fez.
Estatística Descritiva - Unidade 3 - Probabilidade I
Síntese
Nesta unidade, foi possível apresentar o panorama no qual se insere a
teoria das probabilidades, a partir de conceitos e definições básicas e
fundamentais. Foram discutidas as regras que moldam e sustentam a
probabilidade condicional, bem como os princípios que a caracterizam e
diferenciam do Teorema de Bayes; em relação a este teorema foi discutido sua
fundamentação teórica e aplicabilidade Também foram desenvolvidos diversos
cálculos para solucionar situações cotidianas diversas que envolvem a
aplicabilidade de tais conceitos de probabilidade.
Foi explanado o conceito geral de distribuição de probabilidade de uma
variável aleatória discreta assim como sua utilização no contexto estatístico e
probabilístico, também foi possível definir e caracterizar a Distribuição de
Bernoulli, bem como a distribuição binomial, dispondo de diversos parâmetros
próprios de cada distribuição e diferenciando-se para cada experimento
probabilístico por intermédio da resolução de exercícios diversos.
Assim, nesta unidade, você teve a oportunidade de:
● Compreender o conceito de probabilidade e aplicar sua
funcionalidade na resolução de exercícios;
● Conhecer a definição de probabilidade condicional e resolver
exercícios associados a tal conceito de dependência;
● Conhecer a definição de dependência e independência de eventos e
sua aplicabilidade em probabilidade
● Interpretar e analisar os cálculos dos parâmetros estatísticos,
diversos;
● Tomar decisões com base nas análises das representações e dos
resultados analisados;
● Calcular a esperança matemática, variância e desvio padrão e
diferenciar tais conceitos no contexto associado a variável aleatória
discreta;
Estatística Descritiva - Unidade 3 - Probabilidade I
● Interpretar e analisar os cálculos dos parâmetros estatísticos:
esperança matemática, variância e desvio padrão.;
● Reconhecer e definir distribuição de Bernoulli;
● Resolver problemas utilizando as distribuições de variável aleatória:
Distribuição de Bernoulli e Distribuição Binomial;
● Compreender a dinâmica das distribuições de variável aleatória;
● Reconhecer uma distribuição binomial;
● Resolver exercícios por intermédio de uma distribuição binomial.
Bibliografia
CASTANHEIRA, Nelson Pereira. Estatística aplicada a todos os níveis. Curitiba:
Intersaberes, 2013. Disponível em: Minha Biblioteca.
COSTA, Giovani Glaucio de Oliveira. Curso de estatística básica - Teoria e Prática.
2ªedição. São Paulo: Atlas, 2015. Disponível em: Minha Biblioteca.
Estatística Descritiva - Unidade 3 - Probabilidade I
FREUND, John E. Economia, Administração e Contabilidade. Estatística
Aplicada. Porto Alegre: Bookman, 2009.
JACQUES Bernoulli. [S. l.], 9 abr. 2017. Disponível em:
https://www.somatematica.com.br/biograf/bernoulliJacques.php. Acesso em: 30
jun. 2019.
LARSON, Ron; FARBER, Betsy. Estatística Aplicada. 6. ed. São Paulo: Pearson,
2016. 654 p. v. único. Disponível em: Biblioteca Virtual Universitária.
MARTINS, Gilberto de Andrade; DOMINGUES, Osmar. Estatística Geral e
Aplicada. São Paulo: Atlas, 2017.
MAGALHÃES, Marcos ; LIMA, Antonio Carlos Predroso de. Noções de
Probabilidade e Estatística. São Paulo: Edusp, 2015.
MILONE, Giuseppe. Estatística Geral e Aplicada. Rio de Janeiro: Thomson,
2006.v
MONTGOMERY, Douglas C; RUNGER, Georg C. Estatística Básica e
Probabilidade para Engenheiros. São Paulo: LTR, 2016.
MORETIM, Luiz Gonzaga. Estatística Básica: probabilidade e inferência. 1. ed.
São Paulo: Pearson, 2010. 376 p. v. único. Disponível em: Biblioteca Virtual
Universitária
MORAES, Fabíola Eugênio Arrabaça. Estatística Descritiva. 1. ed. São Paulo:
Pearson, 2010. 142 p. v. único. Disponível em: Biblioteca Virtual Universitária.
NETO, Pedro Luiz de Oliveira Costa; CYMBALISTA, Melvin. Probabilidades. São
Paulo: Edgard Blucher, 2012.Disponível em: Biblioteca Virtual Universitária.
Estatística Descritiva - Unidade 3 - Probabilidade I
PENA, Sérgio Danilo. Thomas Bayes: o cara!. Belo Horizonte, 1 jul. 2009.
Disponível em: http://cienciahoje.org.br/artigo/thomas-bayes-o-cara/. Acesso
em: 26 jun. 2019.
WALPOLE, Ronald E. et al. Probabilidade e Estatística para engenharias e
ciências. São Paulo: Pearson, 2008.