Baixe o app para aproveitar ainda mais
Prévia do material em texto
Responsável pelo Conteúdo: Prof Ms Alexandre Silva Probabilidade e Distribuição de Frequências como Estimativa da Probabilidade Nesta unidade da disciplina Bioestatística, estudaremos as probabilidades e as distribuições de frequências como estimativas de probabilidade. O estudo das probabilidades é fundamental para entender a parte analítica da estatística, assim, permitindo a tomada de decisões em pesquisas.. Atenção Para um bom aproveitamento do curso, leia o material teórico atentamente antes de realizar as atividades. É importante também respeitar os prazos estabelecidos no cronograma. Um casal vai fazer sua consulta de aconselhamento genético pois estão planejado ter um filho e na família da mulher existe uma indivíduos com uma doença de herança genética. O especialista vai fazer uma séria de perguntas, solicitar alguns exames. A pergunta que o casal fez é: “Qual a chance do nosso bebe nascer com esta doença”? Nesta situação a resposta não pode ser absoluta: SIM ou NÃO, mas vai se dar termos de probabilidade, ou seja, uma maneira matemática de quantificar a chance de um evento ocorrer. Então o especialista responde: “Existe uma chance em cem do filho de vocês apresentarem esta doença, agora vocês decidem de desejam ou não correr este risco.” Contextualização Noções de Probabilidade Após realizar a descrição dos eventos utilizando gráficos, tabelas, calculado média, desvio padrão, fazendo correlações e regressões, o pesquisador deseja fazer inferências, ou seja, extrapolar seus resultados para a população. Para tanto, é necessário entender probabilidade, uma vez que as inferências são expressas em probabilidade daquela conclusão ser falsa ou verdadeira. Probabilidade aleatória Para entender a probabilidade de um evento aleatório, precisamos definir: S – Espaço amostral: É o conjunto de todos os elementos possíveis. EVENTO – É qualquer subconjunto de S (Notação A, B, C...) (phi) - Conjunto vazio, ou seja, representa um evento impossível. Definimos então probabilidade de um evento A como a razão entre o número de elementos de A e o número de elementos do espaço amostral (S). Representa-se como a formula abaixo: Vamos considerar o seguinte exemplo: Um pesquisador deseja saber qual a probabilidade de, ao lançar um dado, deste cair com a face 3 voltada para cima. Analisando este pueril exemplo, porém muito ilustrativo, temos: Um dado tem 6 faces; Cada vez que um dado é lançado, somente uma face fica voltada para cima; Então temos as seguintes possibilidades: Material Teórico Portanto, das 6 possibilidades, somente uma satisfaz a condição CAIR FACE 3. Em termos de probabilidade, temos o seguinte: O espaço amostral (S) é: S:{1, 2, 3, 4, 5, 6} O evento (A) CAIR FACE 3 é: A: {3} A probabilidade do evento A (CAIR FACE 3) é dado pela expressão: Resolvendo a equação: P(A) = 0,1667 ou 16,67% São propriedades da probabilidade: 1. A probabilidade de qualquer evento é um valor entre 0 e 1: 0 P 1; se apresentado na forma de porcentagem: 0% P 100%. 2. A probabilidade de um evento vazio é sempre iguala zero: P() = 0. Voltando ao nosso exemplo anterior, se o pesquisador perguntasse: Qual a probabilidade de ao jogar um dado, CAIR A FACE 7? Como um dado não possui esta face, o evento A é vazio ou A:{ }. Pela fórmula, zero divido por qualquer número continua sendo zero. 3. A probabilidade de ocorre um evento igual ao espaço amostra é 1: P(S) = 1. No nosso exemplo, se o pesquisador perguntasse: Qual a probabilidade de ao jogar um dado, CAIR UMA FACE ENTRE 1 E 6? Vejam que o evento A se satisfaz com qualquer uma das faces do dado, ou seja A:{1;2;3;4;5;6} que equivale ou espaço 1 único elemento do evento A {3} 6 elementos do espaço amostra S {1;2;3;4;5;6} amostral. Pela fórmula, teremos uma probabilidade dada pela razão entre A, ou seja 6 e S que também é ö que resulta no valor 1 ou 100%. Probabilidade condicional Chamamos de probabilidade condicional a probabilidade de ocorrer determinado evento quando este depende de uma dada condição. A probabilidade de ocorrer o evento A sob a condição de ter ocorrido o evento B, representa-se então: P(A|B) que se lê: probabilidade de A dado B. De volta ao nosso exemplo dos dados, pense na seguinte pergunta: - Qual a probabilidade de, ao se lançar um dado, ocorrer face 6, sabendo antecipadamente que a face que ocorreu é par? Em termos da estatística a pergunta deveria ser construída assim: Qual a probabilidade de ocorrer o evento A dado que ocorreu o evento B? Escreve-se da seguinte maneira: P(A|B). A fórmula para a resolução de uma probabilidade condicional é: Onde se lê: A probabilidade de A dado B é a razão (divisão) entre o número de elementos da intersecção entre A e B e o número de elementos de B. Entendendo a fórmula: Evento A: face 6, já sabemos que o dado tem somente 1 face com o número 6. Evento B: face par, o dado possui as seguintes faces com números pares: {2; 4; 6}, ou seja 3 faces com números pares. A intersecção entre os Eventos A e B é a quantidade de elementos que existem nos dois conjuntos: A e B. Figura 1 : Evento A e Evento B Figura 2: Intersecção entre os eventos A e B Sabemos que: A=1 elemento; B= 3 elementos; P (A∩B) = 1 elemento, então temos: Eventos independentes Dizemos que dois eventos são independentes quando a probabilidade de um ocorrer um dos eventos não é modificada pela ocorrência do outro evento. Vamos pensar nesta situação: Um jogador joga moeda e dado, ele deseja saber: Qual a probabilidade de ocorrer cara na moeda sabendo que no jogo do dado caiu a face 5? Devemos raciocinar: O resultado do jogo da moeda interfere no resultado do jogo do dado? Uma moeda tem duas faces, uma chamada cara (C) e outra de coroa (K), por sua vez o dado, como já vimos, tem 6 faces. Visualizem: Antes do jogo de moedas, qual o espaço amostra do jogo de dados? É o seguinte: S={1; 2; 3; 4; 5; 6} A moeda foi lançada: Caiu a face Cara, como fica o espaço amostral do jogo de dado após o jogo da moeda?É o seguinte: S={1; 2; 3; 4; 5; 6} Ou seja, não muda. Portanto, dizemos que o evento “Cair 5 no jogo de dados” é independente do evento “Cair cara no jogo de moeda”. Dizemos então que a probabilidade de A dado B é igual a probabilidade de A e representamos da seguinte maneira: P(A|B) = P(A) Teorema do produto Este teorema diz que se A e B são eventos independentes, a probabilidade de ocorrer A e B é dada pela probabilidade de ocorrer A multiplicada pela de ocorrer B. P(A e B) = P(A) x P(B). Exemplo: Qual a probabilidade de ocorrer cara jogando uma moeda duas vezes? Possibilidades: Tentativa 1º. Lançamento 2º. Lançamento 1 2 3 4 Figura 3: probabilidades em um jogo duplo de moedas. Cara C K C C K K K C Veja que a probabilidade de cair cara (C) no primeiro lançamento é de ½ e de cair coroa (K) no 2º. Lançamento é de ½ e de cair em dois lançamentos Cara (C) e Cara (C) é de ¼. Então, aplicando a formula temos: P(C e C) = ½ x ½ = ¼ Teorema da soma Quando A e B são eventos que nãopodem ocorrer ao mesmo tempo, a probabilidade de ocorrer A ou B é dada pela seguinte expressão: P(A ou B) = P(A) + P(B) Se uma urna possui duas bolas brancas, uma azul e uma vermelha e retira-se uma ao acaso. Qual a probabilidade de sair uma colorida? Figura 4: urna com bolas coloridas. A condição só é satisfeita se for sorteada a bola vermelha ou a azul. Veja duas bolas das quatro existentes satisfazem então a condição. A probabilidade de ser retirada a bola azul é de ¼ e de ser retirada a bola vermelha é também de ¼ , portanto a expressão fica: P(azul ou vermelha) = ¼ + ¼ = ½ Distribuição Normal ou de Gauss As frequências obtidas da maioria das medidas biológicas e de outras situações dão origem aos gráficos com características em comum, semelhante ao apresentado abaixo. Observem que esta distribuição de frequências apresenta muitos indivíduos com valores semelhantes, no exemplo entre 39 e 41, poucos com valores abaixo disto e poucos com valores acima disto. Vemos então um gráfico com formato de sino. Este tipo de distribuição de frequências recebe o nome de distribuição normal. A distribuição Normal tem as seguintes características: A variável aleatória pode assumir qualquer valor; O gráfico da distribuição é uma curva em forma de sino, simétrica em torno da média populacional representada pela letra grega ; A área total da curva representa uma freqüência de 100% da população. A área representa a probabilidade da variável assumir qualquer valor. Os parâmetros são: (média populacional) e a 2 (variância populacional). Figura 5 Distribuição de medidas do tórax de soldados escoceses Cada população apresentará uma média e uma variância que vai gerar uma curva normal diferente e característica daquela população. Na figura acima, se quisermos saber a probabilidade de um soldado daquela população ter medida de tórax entre 38 e 39 polegadas, basta calcular a área da curva desta parcela da população. Para isto é necessário cálculos complexos, pois a figura é uma curva e não uma reta. Para entender melhor este conceito, faça um exercício mental tentando responder as questões propostas abaixo: 1. Como seria um gráfico de distribuição de frequências da altura da população adulta do Brasil? 2. Sabendo que a glicemia (quantidade de glicose no sangue) normal das pessoas é de 80 mg/dL; como seria a distribuição de frequências da glicemia da população de uma cidade? 3. Em uma prova aplicada a 1000 alunos, valendo de zero a dez, como seria o gráfico da distribuição de frequências das notas? Distribuição normal reduzida O cálculo de probabilidades de populações com distribuição do tipo normal é complexo para ser utilizado rotineiramente. Para facilitar este tipo de calculo, foi feita o tabelamento de todas as possíveis probabilidades de uma única curva normal que recebeu o nome de Curva Normal Reduzida. Esta curva possui as seguintes características: É uma distribuição com média 0 e variância 1. A variável aleatória representada pela distribuição normal reduzida é a z. Na distribuição normal reduzida dos valores de probabilidade de 0 até z estão dispostos em tabelas. Exemplo. A probabilidade de ocorrer valores entre 0 e 1,5 corresponde a área pintada: Se formos procurar na tabela a probabilidade entre 0 e 1,5 obtemos o valor de 0,4332 ou 43,32%. Na tabela devemos procurar a linha que contenha a primeira unidade e o decimal 1,5 e a coluna com o centésimo e o milésimo: 0,00. No cruzamento da linha e com a coluna selecionada obtemos então o valor 0,4332 que em porcentagem fica 43,32%. Observe que a tabela apresenta somente a parte positiva da curva, porém, como a curva é simétrica, a probabilidade do lado positivo é idêntica a do lado negativo. Cálculo de probabilidade com qualquer variável com distribuição normal Vejamos o seguinte exemplo: A quantidade de colesterol no plasma tem distribuição normal com média 200mg e desvio padrão de 20mg conforme a ilustração abaixo: Pergunta-se: Qual a probabilidade de um indivíduo apresentar valores de colesterol entre 200 e 225 mg. Para facilitar o entendimento, coloque os valores em um esboço da curva, como mostrado abaixo: =200 Se X é uma variável com distribuição normal (esta informação tem que ser dada no exercício) de média e desvio padrão então devemos transformar a variável X em Z pela seguinte expressão: Substituindo os valores: Para X (valor dado na questão)= 225 temos: Z1 = (225-200)/20 = 1,25 Para X (valor dado na questão) = 200 temos: Z2 = (200-200)/20 = 0 Substituímos X1 (=225) e X2 (=200) dados na questão por Z1 e Z2 que foram calculados pela fórmula, assim teremos um o seguinte esboço da distribuição normal reduzida: O que significa dizer que a probabilidade X entre 200mg e 225mg é a mesma probabilidade de Z assumir valores entre 0 e z=1,25, que segunda a tabela vamos buscar a linha 1,2 (Veja na tabela abaixo) e a coluna 0,05 (veja na tabela abaixo) onde obtemos o valor: 0,3944 ou 39,44%. 200 225 0 1,25 Z Figura 6 Tábua da distribuição das probabilidades em uma curva normal reduzida, valores entre 0 e z P(0 - z). Como leitura complementar, segue o link para o artigo: Ensaio sobre a relação epistemológica entre probabilidade e método científico Material Complementar Berquó, E.S; Souza, J.M.P.; Gotlieb, S.L.D Bioestatística. 2º Ed., Editora pedagógica e Universitária, São Paulo, 1981, p.1-6. Vieira, S Introdução a Bioestatística, 5º.Ed, Editora Campus, 2008, São Paulo, Brasil, p. 1-7. Vieira, S Bioestatística: tópicos avançados. 2° Ed. Editora Campus, 2003, São Paulo, Brasil. Referências _________________________________________________________________________________ _________________________________________________________________________________ _________________________________________________________________________________ _________________________________________________________________________________ _________________________________________________________________________________ _________________________________________________________________________________ _________________________________________________________________________________ _________________________________________________________________________________ _________________________________________________________________________________ _________________________________________________________________________________ _________________________________________________________________________________ _________________________________________________________________________________ _________________________________________________________________________________ _________________________________________________________________________________ _________________________________________________________________________________ _________________________________________________________________________________ _________________________________________________________________________________ _________________________________________________________________________________ _________________________________________________________________________________ _________________________________________________________________________________ _________________________________________________________________________________ __________________________________________________________________________________________________________________________________________________________________ _________________________________________________________________________________ _________________________________________________________________________________ _________________________________________________________________________________ _________________________________________________________________________________ _________________________________________________________________________________ _________________________________________________________________________________ _________________________________________________________________________________ _________________________________________________________________________________ _________________________________________________________________________________ _________________________________________________________________________________ _________________________________________________________________________________ _________________________________________________________________________________ Anotações
Compartilhar