Baixe o app para aproveitar ainda mais
Prévia do material em texto
1 CAPÍTULO 3 – CÁLCULO DE PROBABILIDADES A teoria matemática da probabilidade dá-nos o instrumental para construção e análise de modelos matemáticos relativos a fenômenos aleatórios. Ao estudarmos um fenômeno aleatório, temos diante de nós um experimento cujo resultado não pode ser previsto. Ocorrem- nos então logo à mente experimentos relacionados com jogos de azar. De fato, a teoria das probabilidades, surgida nos séculos XV e XVI, foi motivada por problemas deste tipo. Historicamente, o propósito original da teoria das probabilidades limitava-se à descrição e ao estudo dos jogos de azar e quase todo o esforço era concentrado no cálculo do valor de certas probabilidades de interesse. 2 Entretanto, a obtenção de valores numéricos de probabilidades não é o principal objetivo da teoria, e sim a descoberta de leis gerais, e a construção de modelos teóricos satisfatórios. Com o advento da teoria das probabilidades, foi possível estabelecer as distribuições de probabilidade, consideradas hoje a espinha dorsal da teoria estatística, pois todos os processos inferenciais são aplicações de distribuições de probabilidade. Assim, o conhecimento dos conceitos advindos da teoria das probabilidades é de grande importância para uma correta utilização da técnica estatística. 3 3.1. CONCEITO DE PROBABILIDADE 3.1.1. Definições importantes - Experimentos probabilísticos ou aleatórios São ações ou fenômenos que podem ser repetidos e que os resultados não são previsíveis, ou seja, são aleatórios ou casuais. São exemplos de experimentos aleatórios: i. Exp.1: lançar uma moeda 10 vezes e observar o número de caras obtidas; ii. Exp.2: jogar um dado e observar a sua face superior; iii. Exp.3: observar o nascimento de três bezerros e identificar o sexo. 4 - Espaço amostral () É o conjunto de todos os possíveis resultados de um experimento aleatório. Os elementos de são chamados de pontos amostrais. Aos experimentos aleatórios exemplificados anteriormente estão associados os seguintes espaços amostrais, respectivamente: i. 10,9,8,7,6,5,4,3,2,1,0 1 ; ii. 6,5,4,3,2,1 2 ; iii. MMMMMFMFMFMMMFFFMFFFMFFF ,,,,,,, 3 5 - Evento É um subconjunto qualquer de que representa um determinado resultado, podendo ser composto por um ou mais pontos amostrais. Os conjuntos (espaço amostral) e (conjunto vazio) são considerados eventos, sendo denominados de eventos certo e impossível, respectivamente. Como exemplo temos: no Exp.3, pode- se estar interessado no evento B: nascer exatamente 2 fêmeas, ou seja, MFFFMF,FFM,B . 6 3.1.2. Conceito Moderno de Probabilidade Seja um experimento qualquer e o espaço amostral associado a esse experimento, a cada evento E de associaremos um número real EP , denominado probabilidade da ocorrência do evento E, se forem satisfeitas as seguintes condições ou axiomas: (i) 0EP , para qualquer evento E em ; (ii) 1Ω P ; (iii) Se 1 E e 2 E são dois eventos de e são mutuamente exclu- sivos**, então 2121 EPEPEEP . 7 ** Diz-se que dois eventos são mutuamente exclusivos se, e somente se, a ocorrência de um impede a ocorrência do outro. Correspondentemente, caracterizam-se, na teoria dos conjuntos, por dois conjuntos disjuntos, isto é, que não possuem nenhum ponto em comum. Assim, BA . Decorre daí, duas propriedades importantes, ou sejam: a. 10 EP b. EPEPPEP c 1 8 3.2. VARIÁVEL ALEATÓRIA E DISTRIBUIÇÃO DE PROBABILIDADE Para facilitar o desenvolvimento da teoria das probabilidades é importante associarmos um número a um evento aleatório e calcularmos a probabilidade de ocorrência desse número em lugar da probabilidade do evento. Por exemplo, considerando o Exp.3, tem-se MMMMMFMFMFMMMFFFMFFFMFFF ,,,,,,, 3 . Considere os dois eventos: E1: nascer exatamente 2 fêmeas 8 3 ,, 11 EPMFFFMFFFME ; 9 E2: nascer pelo menos 2 fêmeas 2 1 8 4 ,,, 22 EPFFFMFFFMFFFME . Portanto, pode-se definir a variável aleatória X, como o número de fêmeas que nasceram em três partos, em que 3,2,1,0X e assim, 2 2 2 1 XPEP XPEP 10 - Definição: Variável aleatória (v.a.) é uma variável qualquer (função) que associa a acada evento do espaço amostral um número real (ou uma série de números). Como cada evento aleatório está relacionado a uma probabilidade de ocorrência, então cada um dos possíveis valores da v.a. estará também associado a uma probabilidade de ocorrência. - Notação: Variável aleatória: X, Y, Z (maiúsculas) Valores assumidos pela v.a.: ,,, 321 xxx (minúsculas) Probabilidade que a v.a. assuma o valor x: xXP Probabilidade que a v.a. assuma o valor menor ou igual a x: xXP 11 3.2.1. Variável aleatória discreta Seja X uma variável aleatória, tal que o número de valores de X seja finito ou infinito enumerável, então X será uma variável aleatória discreta (v.a.d.). Em geral é obtida mediante alguma forma de contagem. Ex.: - no de acidentes ocorridos em uma semana; - no de bezerros do sexo feminino, nascidos em três partos; - no de plantas sadias em uma área de reflorestamento; - no de defeitos por peça produzida por um fabricante, etc. 12 3.2.2. Variável aleatória contínua Seja X uma variável aleatória, tal que X possa assumir todo e qualquer valor em algum intervalo bxa , onde a e b podem ser, respectivamente + e , então X é uma variável aleatória contínua (v.a.c.). Assim uma v.a. X é contínua quando associada a um espaço amostral infinito não enumerável. Ex.: - diâmetro a altura do peito de árvores de eucalipto, em uma área de reflorestamento; - produção de leite, em kg, de uma vaca; - altura das plantas de soja, etc. 13 3.3. DISTRIBUIÇÕES DE PROBABILIDADES Algumas variáveis aleatórias adaptam-se muito bem a uma série de problemas e aparecem com bastante frequência em situações práticas. Portanto, um estudo mais aprofundado das mesmas facilita bastante a construção de modelos de probabilidade, bem como a determinação dos seus principais parâmetros, ou seja, nesses casos a distribuição de probabilidades pode ser representada de uma maneira mais compacta, isto é, existe uma lei ou modelo utilizado para atribuir as probabilidades a cada valor da v.a. Assim, para um dado problema, tentamos verificar se ele satisfaz às condições de algum modelo conhecido, pois isso facilitaria muito o nosso trabalho. 14 3.3.1. Distribuições discretas de probabilidades 3.3.1.1. Distribuição binomial Quando um experimento aleatório, com apenas dois resultados possíveis, sucesso ou fracasso, é repetido n vezes, de tal forma que as n realizações do experimento sejam independentes e a probabilidade de ocorrer o sucesso seja p, a v.a. definida como X: número de sucessos ocorridos em n realizações do experimento, tem distribuição binomial com parâmetros n e p, isto é, pnBX ,~ . A seguir são apresentados três experimentos aleatórios, tais que, a v.a. X de interesse tem distribuição binomial. 15 1. Observar a v.a. X: número de sementes que germinam em uma amostra de 100 sementes; 2. Observar a v.a. X: número de plantassadias de uma determinada espécie nativa, em uma parcela contendo 30 plantas; 3. Observar o nascimento de 10 bezerros e verificar a v.a. X: número de fêmeas nascidas. A função de probabilidade de uma v.a. pnBX ,~ é dada por: xnx pp x n xXP 1 em que, !! ! xnx n x n , nx ,,2,1,0 e 10 p . 16 A média e a variância de uma v.a. X com distribuição binomial são, respectivamente: - npXE X ; - pnpXV X 12 . 17 Exemplo 1: Considerando o Exp.3 e definindo X como a v.a. que representa o número de fêmeas que nasceram em três partos, tem-se: - no de realizações do experimento aleatório: 3n partos; - probabilidade de sucesso (nascimento de fêmea): 2 1 p ; - v.a. X: no de fêmeas nascidas em três partos, tal que 3,2,1,0x ; 18 - probabilidade associada a cada ponto amostral: 8 1 8 1 11 8 1 !)33(!3 !3 2 1 1 2 1 3 3 3 8 3 8 1 3 2 1 4 1 !)23(!2 !3 2 1 1 2 1 2 3 2 8 3 8 1 3 4 1 2 1 !)13(!1 !3 2 1 1 2 1 1 3 1 8 1 8 1 1 8 1 1 !)03(!0 !3 2 1 1 2 1 0 3 0 333 232 131 030 XP XP XP XP 19 Assim, a distribuição de probabilidades é dada por: X 0 1 2 3 xXP 1/8 3/8 3/8 1/8 1,0 20 Exemplo 2: Sabe-se que o poder germinativo de certa variedade de milho é 30%. Semeando-se 10 sementes dessa variedade, qual é a probabilidade de germinar: (a) uma semente? (b) mais de uma semente? Neste caso, tem-se: - no de realizações do experimento aleatório: 10n sementes semeadas; - probabilidade de sucesso (semente germinar): 30,0p ; - v.a. X: no de sementes germinadas, em 10 semeadas, com 10,,1,0 x ; 21 (a) P(germinar uma semente) 1211,001211,0107,03,0 !)110(!1 !10 3,013,0 1 10 1 9 1101 XP (b) P(germinar mais de uma semente) = 101 XPXP 0282,017,01 !)010(!0 !10 3,013,0 0 10 0 10 0100 XP Então, P(germinar mais de uma semente) = 8507,01211,00282,01 22 3.3.1.2. Distribuição Poisson A distribuição Poisson é uma forma limite da distribuição binomial, quando n tende a infinito e p tende a zero, ficando o produto np finito e não nulo. Assim, a distribuição Poisson é utilizada quando o no de observações de um experimento aleatório é muito grande ( 50n ) e a probabilidade de sucesso é muito pequena ( 10,0p ) e o termo np permanece constante. É conhecida classicamente como a lei dos fenômenos raros. Este tipo de distribuição é útil para descrever as probabilidades do no de ocorrências num campo ou intervalo contínuo (em geral, tempo ou espaço). 23 São exemplos de v.a. que podem ter como modelo a distribuição Poisson: - no de defeitos por cm2; - no de acidentes por dia; - no anual de suicídios; - no de chamadas erradas por hora, num circuito telefônico, etc. Note que a unidade de medida (tempo, área, etc) é contínua mas a variável aleatória (no de ocorrências) é discreta. Além disso, na maioria das vezes, verifica-se que as falhas não são contáveis, como por exemplo, não é possível contar os acidentes que não ocorreram em um dia, nem tão pouco o no de chamadas telefônicas que não foram feitas. 24 A função de probabilidade de uma v.a. PoissonX ~ é dada por: !x e xXP x , em que ,3,2,1,0x , 718281828,2e é a base do logaritmo natural ou neperiano e 0 é o único parâmetro da distribuição, conhecido como o número esperado ou número médio de sucessos. Sabendo-se que uma v.a. tem resultados distribuídos segundo Poisson e conhecendo o n o médio de ocorrências por unidade de medida, podemos determinar a probabilidade de qualquer dos resultados possíveis. 25 A distribuição Poisson tem uma característica muito importante e bem peculiar. A sua média ( X ) e a sua variância ( 2 X ) são iguais ao único parâmetro da distribuição, isto é, 2 XX . 26 Exemplo 1: A emissão de partículas radioativas tem sido modelada através de uma distribuição de Poisson, com valor do parâmetro dependendo da fonte utilizada. Suponha que o número de partículas alfa, emitidas por minuto, seja uma v.a. seguindo o modelo Poisson com parâmetro 5, ou seja, a taxa média de ocorrência é de 5 emissões a cada minuto. Qual é a probabilidade de haver mais de 2 emissões em um minuto? Neste caso tem-se que: - X: v.a. referente ao número de partículas alfa emitidas/min, com ,3,2,1,0x ; - taxa média de emissões/min (parâmetro da Poisson): 5 emissões/min. Portanto, 5~ PoissonX 27 Então, 21012 XPXPXPXP , em que 0067,0 !0 5 0 50 e XP ; 0337,0 !1 5 1 51 e XP e 0842,0 !2 5 2 52 e XP . Assim, 8754,01246,010842,00337,00067,012 XP . 28 Obs.: se o intervalo de tempo é alterado, a v.a. mantém a mesma distribuição de Poisson, mas com valor do parâmetro ajustado de forma conveniente. Por exemplo, se o período de tempo considerado for de 30 segundos, teremos que o número de partículas emitidas em 30 segundos terá distribuição Poisson(2,5), ou seja, o parâmetro que era de 5 emissões/min, que corresponde a 5 emissões/60 segundos, passa a ser 2,5 emissões/30 se-gundos. Assim, a a probabilidade de ter mais de 2 emissões em 30 segun-dos, será: 4562,05438,012565,02052,00821,01 !2 5,2 !1 5,2 !0 5,2 1 21012 5,225,215,20 eee XPXPXPXP 29 Exemplo 2: Sabe-se que a proporção de canhotos numa população é de 2%. Numa sala com 100 estudantes, qual é a probabilidade de haver: a. Um canhoto? b. Nenhum canhoto? c. Mais de um canhoto? - Parâmetro da Poisson: 202,0100 np a. 2707,0 !1 2 )1( 21 e XP b. 1353,0 !0 2 )0( 20 e XP c. 5940,02707,01353,011011 XPXPXP 30 3.3.2. Distribuições contínuas de probabilidades 3.3.2.1. Distribuição normal É uma das mais importantes distribuições de probabilidades, sendo aplicada em inúmeros fenômenos e constantemente utilizada para o desenvolvimento teórico da inferência estatística. É também conhecida como distribuição de Gauss, Laplace ou Laplace-Gauss. Seja X uma v.a.c.. Dizemos que X tem distribuição normal se possuir a seguinte f.d.p.: 2 2 2 22 1 x exf , para x, e 02 . 31 Notação: 2,~ NX : X tem distribuição normal com média e variância 2 . i)Representação gráfica: 68,27%, 2 95,45% , 3 99,73% 32 É um gráfico em forma de sino. O seu posicionamento em relação ao eixo das ordenadas e seu achatamento é determinado pelos parâmetros e 2 , respectivamente. ii ) Propriedades: 1. xf possui um ponto de máximo para x ; 2. xf tem dois pontos de inflexão cujas abscissas valem e ; 3. xf é simétrica em relação a x e tem-se que od ; 4. xf tende a zero quando x tende para (assintótica em relação ao eixo x). 33 iii) Cálculo de probabilidades: Para o cálculo da probabilidade da v.a.c. assumir um valor em determinado intervalo, surgem dois problemas: 1º) Integração de f(x), pois para o seu cálculo é necessário o desenvolvi-mento em séries. 2º) Elaboração de tabelas do tipo x dxxfxXP )()( se torna inviável, pois a f.d.p. depende de dois parâmetros, e 2 , o que leva à neces-sidade do estabelecimento de todas as possíveis combinações de valores desses parâmetros. 34 Porém, estes problemas são resolvidos pela padronização dos valores, obtendo-se assim a distribuição normal padronizada ou reduzida. Variável Normal Padronizada (Z) É obtida por meio de uma transformação linear da variável normal X, obtendo-se assim uma escala relativa de valores na qual a média é tomada como ponto de referência e o desvio padrão como medida de afastamento da média: X Z ou x z , em que z é o valor da variável normal padronizada Z, x é o valor da v.a. X, é a média de X e é o desvio padrão de X. 35 - Média e Variância da Variável Normal Padronizada: Se 2,~ NX e X Z , então 1,0~ NZ , para quais- quer valores de e 2 , 0 Z e 12 Z . Assim, é possível tabelar as probabilidades (áreas) da v.a. Z e, então, as probabilidades relacionadas à v.a. X podem ser determinadas a partir das probabilidades de Z. 36 Tabela da Distribuição Normal Padrão Há vários tipos de tabelas que nos fornecem as probabilidades sob a curva normal. A tabela que vamos utilizar nos fornece a probabilidade da variável Z assumir um valor entre zero e um particular 0 z , 0 0 zZP , ou seja: z0 0 0 00 0 z dzzfzZP corresponde à área hachurada sob a curva normal xf . 37 - EXEMPLOS: 1) Calcule: a. 9656,04656,05,0)82,1( ZP b. 0212,04788,05,0)03,2( ZP c. 8795,03849,04946,020,155,2 ZP d. 0250,04750,05,096,1 ZP 38 2) Se 25,100~ NX , calcule: a. 0228,04772,05,00,2110 ZPXP 0,2 25 100110 z b. 6826,03413,020,10,110595 ZPXP 0,1 25 10095 1 z e 0,1 25 100105 2 z 39 c. Encontre x tal que 3446,0 xXP 1554,03446,05,003446,0 zZPzZP Assim, 40,0z . Porém, como 3446,0 zZP é menor do que 0,5 então o valor de z é negativo, ou seja, 40,0z . Isto significa que 3446,040,0 ZP . Portanto, como x z , tem-se 98100)540,0( 25 100 40,0 x x 40 3.3.2.2. Distribuições t, 2 e F Distribuições amostrais, como a t, 2 e F, desempenham papel importante na Estatística, pois estas são consideradas na obtenção de intervalos de confiança (teoria da estimação) e de uma regra de decisão, conhecida como teste de hipóteses (teoria da decisão). 41 Distribuição t de Student Sabe-se que, se a v.a. 2,~ NX então a v.a. n NX 2 ,~ e quando a distribuição de X for desconhecida, com 30n , pelo Teorema Central do Limite, tem-se que a distribuição de X é aproximadamente Normal com média X e variância n X 2 2 . Na maioria dos trabalhos envolvendo amostragem, a variância populacional 2 é desconhecida, impossibilitando que inferências sejam realizadas com relação ao parâmetro . Porém, pode-se substituir pelo seu estimador S, obtendo-se n S X T , 42 que tem outra distribuição conhecida por t de Student. Assim, tT ~ , em que 1 n graus de liberdade é o único parâmetro da distribuição. Da mesma forma que a distribuição Normal padrão, tem-se tabelas para a distribuição t de Student. Estas geralmente apresentam valores de t para diferentes valores de probabilidade () e de graus de liberdade ( ). Nessas tabelas encontram-se os valores de t , de acordo com uma informação probabilística e diferentes valores para , tais como 0,25; 0,20; 0,15, 0,10; 0,05; 0,025; 0,01; 0,005 e 0,001. 43 Um exemplo de tabela tem em seu interior os valores de t , conforme a ilustração a seguir. 44 3.3.3. Distribuição qui-quadrado ( 2) A distribuição qui-quadrado possui várias aplicações em Estatística, dentre as quais podemos citar sua utilização na obtenção de inferências sobre o parâmetro 2 de uma população Normal e testes para o estudo de associação de variáveis em tabelas de contingência. Outra aplicação importante refere-se aos testes de falta de ajuste de um modelo teórico aos dados observados em um experimento ou levantamento amostral (Ferreira, 2005). 45 Se 1 1 2 2 n XX S n i i é obtido de uma amostra aleatória proveniente de uma distribuição Normal com média e variância 2 , então a variável 2 2 2 1 Sn possui distribuição qui-quadrado com 1 n graus de liberdade. 46 De forma análoga à distribuição t, existem tabelas que apresentam os valores de 2 , para diferentes valores de probabilidade ( ) e de graus de liberdade ( ). Nessas tabelas geralmente encontram-se os valores de 2 , de acordo com a informação probabilística 22P . A seguir, ilustra-se o esquema geral de uma distribuição qui-quadrado, onde pode-se observar os significados de 2 e . 47 48 3.3.4. Distribuição F A distribuição F está entre as mais importantes na Estatística, tendo um destaque ainda maior na Estatística Experimental. Esta distribuição foi elaborada por Snedecor e recebeu o nome de F em homenagem a Sir R. A. Fisher. Essa distribuição é definida pela variável resultante da razão de duas variáveis aleatórias independentes com distribuição qui- quadrado. Assim, sejam duas v.a. independentes U e V, com distribuição qui-quadrado com 1 e 2 graus de liberdade, respectivamente, a variável 2 1 V U X possui distribuição F, com parâmetros 1 e 2 graus de liberdade. 49 Também têm-se tabelas que apresentam os valores de F, para diferentes valores de probabilidade ( ) e de graus de liberdade 1 e 2 , denominados graus de liberdade do numerador e denominador, respectivamente. Nessas tabelas encontram-se os valores de F , de acordo com a informação probabilística FFP , sendo geralmente, %1%,5,2%,5%,10 e 0,5%. No interior dessas tabelas encontram-se os valores de F conforme ilustração a seguir. 50
Compartilhar