Prévia do material em texto
Responsável pelo Conteúdo:
Prof Ms Alexandre Silva
Probabilidade e Distribuição de
Frequências como Estimativa da
Probabilidade
Nesta unidade da disciplina Bioestatística, estudaremos as
probabilidades e as distribuições de frequências como
estimativas de probabilidade. O estudo das probabilidades é
fundamental para entender a parte analítica da estatística,
assim, permitindo a tomada de decisões em pesquisas..
Atenção
Para um bom aproveitamento do curso, leia o material teórico atentamente antes de realizar
as atividades. É importante também respeitar os prazos estabelecidos no cronograma.
Um casal vai fazer sua consulta de aconselhamento genético pois estão planejado ter
um filho e na família da mulher existe uma indivíduos com uma doença de herança genética.
O especialista vai fazer uma séria de perguntas, solicitar alguns exames. A pergunta que o
casal fez é: “Qual a chance do nosso bebe nascer com esta doença”? Nesta situação a resposta
não pode ser absoluta: SIM ou NÃO, mas vai se dar termos de probabilidade, ou seja, uma
maneira matemática de quantificar a chance de um evento ocorrer. Então o especialista
responde: “Existe uma chance em cem do filho de vocês apresentarem esta doença, agora
vocês decidem de desejam ou não correr este risco.”
Contextualização
Noções de Probabilidade
Após realizar a descrição dos eventos utilizando gráficos, tabelas, calculado média,
desvio padrão, fazendo correlações e regressões, o pesquisador deseja fazer inferências, ou
seja, extrapolar seus resultados para a população. Para tanto, é necessário entender
probabilidade, uma vez que as inferências são expressas em probabilidade daquela conclusão
ser falsa ou verdadeira.
Probabilidade aleatória
Para entender a probabilidade de um evento aleatório, precisamos definir:
S – Espaço amostral: É o conjunto de todos os elementos possíveis.
EVENTO – É qualquer subconjunto de S (Notação A, B, C...)
(phi) - Conjunto vazio, ou seja, representa um evento impossível.
Definimos então probabilidade de um evento A como a razão entre o número de
elementos de A e o número de elementos do espaço amostral (S). Representa-se como a
formula abaixo:
Vamos considerar o seguinte exemplo: Um pesquisador deseja saber qual a
probabilidade de, ao lançar um dado, deste cair com a face 3 voltada para cima.
Analisando este pueril exemplo, porém muito ilustrativo, temos:
Um dado tem 6 faces;
Cada vez que um dado é lançado, somente uma face fica voltada para cima;
Então temos as seguintes possibilidades:
Material Teórico
Portanto, das 6 possibilidades, somente uma satisfaz a condição CAIR FACE
3.
Em termos de probabilidade, temos o seguinte:
O espaço amostral (S) é:
S:{1, 2, 3, 4, 5, 6}
O evento (A) CAIR FACE 3 é:
A: {3}
A probabilidade do evento A (CAIR FACE 3) é dado pela expressão:
Resolvendo a equação:
P(A) = 0,1667 ou 16,67%
São propriedades da probabilidade:
1. A probabilidade de qualquer evento é um valor entre 0 e 1: 0 P 1; se
apresentado na forma de porcentagem: 0% P 100%.
2. A probabilidade de um evento vazio é sempre iguala zero: P() = 0. Voltando ao
nosso exemplo anterior, se o pesquisador perguntasse: Qual a probabilidade de ao
jogar um dado, CAIR A FACE 7? Como um dado não possui esta face, o evento
A é vazio ou A:{ }. Pela fórmula, zero divido por qualquer número continua sendo
zero.
3. A probabilidade de ocorre um evento igual ao espaço amostra é 1: P(S) = 1. No
nosso exemplo, se o pesquisador perguntasse: Qual a probabilidade de ao jogar um
dado, CAIR UMA FACE ENTRE 1 E 6? Vejam que o evento A se satisfaz com
qualquer uma das faces do dado, ou seja A:{1;2;3;4;5;6} que equivale ou espaço
1 único elemento do evento A {3}
6 elementos do espaço amostra S {1;2;3;4;5;6}
amostral. Pela fórmula, teremos uma probabilidade dada pela razão entre A, ou
seja 6 e S que também é ö que resulta no valor 1 ou 100%.
Probabilidade condicional
Chamamos de probabilidade condicional a probabilidade de ocorrer determinado
evento quando este depende de uma dada condição. A probabilidade de ocorrer o evento A
sob a condição de ter ocorrido o evento B, representa-se então: P(A|B) que se lê:
probabilidade de A dado B.
De volta ao nosso exemplo dos dados, pense na seguinte pergunta:
- Qual a probabilidade de, ao se lançar um dado, ocorrer face 6, sabendo
antecipadamente que a face que ocorreu é par?
Em termos da estatística a pergunta deveria ser construída assim: Qual a probabilidade
de ocorrer o evento A dado que ocorreu o evento B? Escreve-se da seguinte maneira:
P(A|B).
A fórmula para a resolução de uma probabilidade condicional é:
Onde se lê: A probabilidade de A dado B é a razão (divisão) entre o número de
elementos da intersecção entre A e B e o número de elementos de B.
Entendendo a fórmula:
Evento A: face 6, já sabemos que o dado tem somente 1 face com o número 6. Evento
B: face par, o dado possui as seguintes faces com números pares: {2; 4; 6}, ou seja 3 faces
com números pares. A intersecção entre os Eventos A e B é a quantidade de elementos que
existem nos dois conjuntos: A e B.
Figura 1 : Evento A e Evento B
Figura 2: Intersecção entre os eventos A e B
Sabemos que: A=1 elemento; B= 3 elementos; P (A∩B) = 1 elemento, então temos:
Eventos independentes
Dizemos que dois eventos são independentes quando a probabilidade de um ocorrer
um dos eventos não é modificada pela ocorrência do outro evento.
Vamos pensar nesta situação: Um jogador joga moeda e dado, ele deseja saber: Qual a
probabilidade de ocorrer cara na moeda sabendo que no jogo do dado caiu a face 5?
Devemos raciocinar: O resultado do jogo da moeda interfere no resultado do jogo do
dado? Uma moeda tem duas faces, uma chamada cara (C) e outra de coroa (K), por sua vez o
dado, como já vimos, tem 6 faces. Visualizem:
Antes do jogo de moedas, qual o espaço amostra do jogo de dados? É o seguinte:
S={1; 2; 3; 4; 5; 6}
A moeda foi lançada:
Caiu a face Cara, como fica o espaço amostral do jogo de dado após o jogo da
moeda?É o seguinte:
S={1; 2; 3; 4; 5; 6}
Ou seja, não muda. Portanto, dizemos que o evento “Cair 5 no jogo de dados” é
independente do evento “Cair cara no jogo de moeda”.
Dizemos então que a probabilidade de A dado B é igual a probabilidade de A e
representamos da seguinte maneira:
P(A|B) = P(A)
Teorema do produto
Este teorema diz que se A e B são eventos independentes, a probabilidade de ocorrer
A e B é dada pela probabilidade de ocorrer A multiplicada pela de ocorrer B.
P(A e B) = P(A) x P(B).
Exemplo: Qual a probabilidade de ocorrer cara jogando uma moeda duas vezes?
Possibilidades:
Tentativa 1º. Lançamento 2º. Lançamento
1
2
3
4
Figura 3: probabilidades em um jogo duplo de moedas.
Cara
C
K
C
C
K
K K
C
Veja que a probabilidade de cair cara (C) no primeiro lançamento é de ½ e de cair
coroa (K) no 2º. Lançamento é de ½ e de cair em dois lançamentos Cara (C) e Cara (C) é de
¼. Então, aplicando a formula temos:
P(C e C) = ½ x ½ = ¼
Teorema da soma
Quando A e B são eventos que nãopodem ocorrer ao mesmo tempo, a probabilidade
de ocorrer A ou B é dada pela seguinte expressão: P(A ou B) = P(A) + P(B)
Se uma urna possui duas bolas brancas, uma azul e uma vermelha e retira-se uma ao
acaso. Qual a probabilidade de sair uma colorida?
Figura 4: urna com bolas coloridas.
A condição só é satisfeita se for sorteada a bola vermelha ou a azul. Veja duas bolas
das quatro existentes satisfazem então a condição. A probabilidade de ser retirada a bola azul
é de ¼ e de ser retirada a bola vermelha é também de ¼ , portanto a expressão fica:
P(azul ou vermelha) = ¼ + ¼ = ½
Distribuição Normal ou de Gauss
As frequências obtidas da maioria das medidas biológicas e de outras situações dão
origem aos gráficos com características em comum, semelhante ao apresentado abaixo.
Observem que esta distribuição de frequências apresenta muitos indivíduos com valores
semelhantes, no exemplo entre 39 e 41, poucos com valores abaixo disto e poucos com
valores acima disto. Vemos então um gráfico com formato de sino. Este tipo de distribuição de
frequências recebe o nome de distribuição normal.
A distribuição Normal tem as seguintes características:
A variável aleatória pode assumir qualquer valor;
O gráfico da distribuição é uma curva em forma de sino, simétrica em torno da
média populacional representada pela letra grega ;
A área total da curva representa uma freqüência de 100% da população. A área
representa a probabilidade da variável assumir qualquer valor.
Os parâmetros são: (média populacional) e a 2 (variância populacional).
Figura 5 Distribuição de medidas do tórax de soldados escoceses
Cada população apresentará uma média e uma variância que vai gerar uma curva
normal diferente e característica daquela população. Na figura acima, se quisermos saber a
probabilidade de um soldado daquela população ter medida de tórax entre 38 e 39
polegadas, basta calcular a área da curva desta parcela da população. Para isto é necessário
cálculos complexos, pois a figura é uma curva e não uma reta.
Para entender melhor este conceito, faça um exercício mental tentando responder as
questões propostas abaixo:
1. Como seria um gráfico de distribuição de frequências da altura da população adulta
do Brasil?
2. Sabendo que a glicemia (quantidade de glicose no sangue) normal das pessoas é de 80
mg/dL; como seria a distribuição de frequências da glicemia da população de uma
cidade?
3. Em uma prova aplicada a 1000 alunos, valendo de zero a dez, como seria o gráfico da
distribuição de frequências das notas?
Distribuição normal reduzida
O cálculo de probabilidades de populações com distribuição do tipo normal é
complexo para ser utilizado rotineiramente. Para facilitar este tipo de calculo, foi feita o
tabelamento de todas as possíveis probabilidades de uma única curva normal que recebeu o
nome de Curva Normal Reduzida.
Esta curva possui as seguintes características:
É uma distribuição com média 0 e variância 1.
A variável aleatória representada pela distribuição normal reduzida é a z.
Na distribuição normal reduzida dos valores de probabilidade de 0 até z estão dispostos
em tabelas.
Exemplo. A probabilidade de ocorrer valores entre 0 e 1,5 corresponde a área pintada:
Se formos procurar na tabela a probabilidade entre 0 e 1,5 obtemos o valor de 0,4332
ou 43,32%. Na tabela devemos procurar a linha que contenha a primeira unidade e o decimal
1,5 e a coluna com o centésimo e o milésimo: 0,00. No cruzamento da linha e com a coluna
selecionada obtemos então o valor 0,4332 que em porcentagem fica 43,32%. Observe que a
tabela apresenta somente a parte positiva da curva, porém, como a curva é simétrica, a
probabilidade do lado positivo é idêntica a do lado negativo.
Cálculo de probabilidade com qualquer variável com distribuição
normal
Vejamos o seguinte exemplo:
A quantidade de colesterol no plasma tem distribuição normal com média 200mg
e desvio padrão de 20mg conforme a ilustração abaixo:
Pergunta-se: Qual a probabilidade de um indivíduo apresentar valores de colesterol
entre 200 e 225 mg.
Para facilitar o entendimento, coloque os valores em um esboço da curva, como
mostrado abaixo:
=200
Se X é uma variável com distribuição normal (esta informação tem que ser dada no
exercício) de média e desvio padrão então devemos transformar a variável X em Z pela
seguinte expressão:
Substituindo os valores:
Para X (valor dado na questão)= 225 temos:
Z1 = (225-200)/20 = 1,25
Para X (valor dado na questão) = 200 temos:
Z2 = (200-200)/20 = 0
Substituímos X1 (=225) e X2 (=200) dados na questão por Z1 e Z2 que foram
calculados pela fórmula, assim teremos um o seguinte esboço da distribuição normal reduzida:
O que significa dizer que a probabilidade X entre 200mg e 225mg é a mesma
probabilidade de Z assumir valores entre 0 e z=1,25, que segunda a tabela vamos buscar a
linha 1,2 (Veja na tabela abaixo) e a coluna 0,05 (veja na tabela abaixo) onde obtemos o
valor: 0,3944 ou 39,44%.
200 225
0 1,25 Z
Figura 6 Tábua da distribuição das probabilidades em uma curva normal reduzida, valores entre 0 e z P(0 - z).
Como leitura complementar, segue o link para o artigo:
Ensaio sobre a relação epistemológica entre probabilidade e método científico
Material Complementar
Berquó, E.S; Souza, J.M.P.; Gotlieb, S.L.D Bioestatística. 2º Ed., Editora pedagógica e
Universitária, São Paulo, 1981, p.1-6.
Vieira, S Introdução a Bioestatística, 5º.Ed, Editora Campus, 2008, São Paulo, Brasil, p.
1-7.
Vieira, S Bioestatística: tópicos avançados. 2° Ed. Editora Campus, 2003, São
Paulo, Brasil.
Referências
_________________________________________________________________________________
_________________________________________________________________________________
_________________________________________________________________________________
_________________________________________________________________________________
_________________________________________________________________________________
_________________________________________________________________________________
_________________________________________________________________________________
_________________________________________________________________________________
_________________________________________________________________________________
_________________________________________________________________________________
_________________________________________________________________________________
_________________________________________________________________________________
_________________________________________________________________________________
_________________________________________________________________________________
_________________________________________________________________________________
_________________________________________________________________________________
_________________________________________________________________________________
_________________________________________________________________________________
_________________________________________________________________________________
_________________________________________________________________________________
_________________________________________________________________________________
__________________________________________________________________________________________________________________________________________________________________
_________________________________________________________________________________
_________________________________________________________________________________
_________________________________________________________________________________
_________________________________________________________________________________
_________________________________________________________________________________
_________________________________________________________________________________
_________________________________________________________________________________
_________________________________________________________________________________
_________________________________________________________________________________
_________________________________________________________________________________
_________________________________________________________________________________
_________________________________________________________________________________
Anotações