Baixe o app para aproveitar ainda mais
Prévia do material em texto
Variáveis aleatórias e distribuições de probabilidade José Tadeu de Almeida Introdução Nesta aula, você estudará as variáveis aleatórias e as distribuições de probabilidade. Por meio delas, você compreenderá como são realizadas operações que envolvem conjuntos de resultados fi nitos e infi nitos, e como a Estatística trata essas diferentes possibilidades. Objetivos de aprendizagem Ao fi nal desta aula, você será capaz de: • conceituar variáveis aleatórias, distribuições de probabilidade e valor esperado. 1 Variáveis aleatórias discretas O estudo das probabilidades tem por objetivo verifi car as chances de ocorrência de um evento em torno de uma série de resultados esperados. Assim, temos a possibilidade de associar as informações decorrentes de cada evento a uma lista de valores ou a uma função. Denominamos essas duas variáveis como variáveis aleatórias. Elas descrevem e representam pontos do espaço amostral, que é o conjunto de possíveis resultados de um experimento (MILONE; ANGELINI, 1993). Uma variável aleatória é uma função que associa um número real a cada resultado do espaço amostral. As variáveis aleatórias se dividem em discretas e contínuas. Quando o conjunto de valo- res de um espaço amostral é fi nito (como no caso de efetuarmos uma contagem de uma popula- ção), dizemos que a variável aleatória é discreta. Imagine que você retirou ao acaso uma carta de um baralho francês que conta com 52 car- tas e quatro naipes. Aqui, sabemos que o espaço amostral é fi nito (52 cartas). Assim, a variável aleatória X= {ouros}, por exemplo, tem treze resultados possíveis. Nesse caso, a probabilidade de sucesso de retirarmos uma carta desse naipe é dada por { }( ) 13 1/ 4 52 p X ouros {p X ouros { }p X ouros }(p X ouros ( )p X ouros ) 13p X ouros 13 52 p X ouros 52 = = =p X ouros = = ={= = ={p X ouros {= = ={ }= = =}p X ouros }= = =})= = =)p X ouros )= = =)= = =p X ouros = = = (MILONE; ANGELINI, 1993). Essa variável, portanto, é discreta! 2 Variáveis aleatórias contínuas Há distribuições em que o espaço amostral é infi nito, e não pode ser mensurado antecipa- damente. Nesse caso, o resultado de um experimento pode assumir qualquer valor dentro de um intervalo de resultados, e a associação de uma função ao conjunto de resultados gera as variáveis aleatórias contínuas (MILONE; ANGELINI, 1993). Por exemplo, sabemos que até o mês de fevereiro de 2017, segundo a Federação Internacio- nal de Atletismo, o recorde mundial de tempo na corrida de cem metros rasos foi de 9,58 segundos (IAAF, 2017). Um pesquisador que pretenda verificar o desempenho de um grupo de velocistas no prazo de até 60 segundos deve considerar que os resultados possíveis se dão a partir de 9,58 segundos, de modo que o intervalo de resultados é dado por 9,58 ≤ X ≤ 60. FIQUE ATENTO! Na situação citada, consideramos que não há outros elementos que possam afetar a condução do experimento do teste de corrida. Descartamos a possibilidade de algum desses velocistas correrem os cem metros em um tempo inferior a 9,58 segundos, por exemplo. As medições de tempo são variáveis contínuas, já que, em um minuto, há infinitas combinações de resultados (segundos, milionésimos de segundo etc.). Figura 1 – Velocidade e tempo geram variáveis aleatórias contínuas Fonte: Kaliva / Shutterstock.com SAIBA MAIS! Conheça mais sobre as variáveis aleatórias lendo o segundo capítulo da monografia de Rafael Pedro Mariotto (UFSC), disponível em: <https://repositorio.ufsc.br/ bitstream/handle/123456789/96591/Rafael.pdf?sequence=2>. Sabendo, portanto, que os resultados possíveis do experimento da corrida são dados entre 9,58 e 60 segundos, a probabilidade (9,58 60)(9,58 60)≤ ≤(9,58 60)P X(9,58 60)P X(9,58 60)(9,58 60)≤ ≤(9,58 60)P X(9,58 60)≤ ≤(9,58 60) indica a chance de um valor da variável aleató- ria X estar em algum ponto entre os valores 9,58 e 60. 3 Distribuições de probabilidade Cada valor de uma variável aleatória X com n elementos está associada a um resultado amostral de um experimento, de modo que essa variável possa assumir os valores 1 2 3, , , 1 2 3, , , 1 2 3 … nx x x x1 2 3x x x x1 2 3, , , x x x x, , , 1 2 3, , , 1 2 3x x x x1 2 3, , , 1 2 3 …x x x x… . A probabilidade associada a cada valor ix , ou seja, de visualizarmos um certo valor ix , é dada por ip . Em outras palavras, a chance de obtermos o valor ix é igual a ip . Cada valor ix corresponde a uma probabilidade ip , de modo que a soma das probabilidades de obtermos valores de uma variável aleatória é igual a 1: i=1 n 1=∑ i pi=1 pi=1∑ p∑ Esse conjunto de probabilidades associado a uma variável aleatória é denominado distri- buição de probabilidade (CRESPO, 2005). Por exemplo, se temos a variável aleatória X = {obter o naipe ‘ouros’} ao retirar uma carta de um baralho, podemos obter os resultados ouros, espadas, copas, paus. Cada um desses valores está associado a apenas uma probabilidade de realização, de modo que a soma dessas probabilidades é igual a 1. A distribuição de probabilidade é dada pela tabela a seguir: Tabela 1 – Distribuição de probabilidades X P(X) Ouros 13/52 Espadas 13/52 Copas 13/52 Paus 13/52 TOTAL 52/52 = 1 Fonte: elaborada pelo autor, 2017. FIQUE ATENTO! Espaços amostrais podem conter apenas parte de uma população, ou seu todo, em infi nitos resultados possíveis. Distribuições de probabilidade, assim como as variáveis aleatórias a elas associadas, tam- bém podem ser discretas ou contínuas. 4 Distribuições discretas de probabilidade A distribuição discreta de probabilidade está associada a variáveis aleatórias discretas (quando os resultados do conjunto amostral são fi nitos). Um exemplo de distribuição discreta de probabilidade é a distribuição binomial. Nela, os elementos do espaço amostral podem ser agru- pados em duas classes diferentes, mutuamente exclusivas. Imagine uma linha de produção em que as peças podem ser “defeituosas” ou “não defeituosas”, em um critério qualitativo (MILONE; ANGELINI, 1993). A distribuição binominal é aplicável quando o experimento segue o chamado processo de amostragem de Bernoulli, cujas condições são: • existência de “n” repetições do experimento em igualdade de condições; • eventos independentes, ou seja, que não se relacionam (como no caso de peças defei- tuosas ou perfeitas); • apenas dois resultados possíveis que se excluem mutuamente. Dada a independência dos eventos e a igualdade de condições nas repetições, a probabi- lidade de ocorrência dos resultados esperados é constante em todas as tentativas (MILONE; ANGELINI, 1993). FIQUE ATENTO! Em eventos mutuamente exclusivos, a ocorrência de um evento necessariamente exclui a ocorrência de outro. As probabilidades associadas a uma distribuição binominal seguem o padrão “sucesso” ou “fracasso” de um experimento, de modo que o cálculo da probabilidade é dado por: ( ) , x n x−x n x−n x,n x,P x C p q(P x C p q( )P x C p q) = × ×P x C p q= × ×x n xP x C p qx n x= × ×x n x= × ×P x C p q= × ×x n x= × ×n xP x C p qn x= × ×n x= × ×P x C p q= × ×n x= × × Em que: n é o número de repetições do experimento; x é o número desejado de sucessos, ou sua proporção; (n - x) é a proporção ou o número de fracassos; p é a probabilidade de sucessos; q é a probabilidade de fracassos, de modo que q 1 pq 1 p= −q 1 p ; ,n x,n x,C é o número total de combinações de “n” elementos entre si, em que a ordem não é rele- vante (como quando um triângulo ABC é o mesmo que um triângulo BAC). Esse valor é dado pela seguinte equação: ( ), ! ! !(! !( )! !)n x,n x, n C ( C ( ) C ) C ! C ! =C =n xC n x n C n x n x! !x n x! !(! !(x n x(! !(! !−! !x n x! !−! ! Em que: n! = n × (n - 1) × (n - 2) × … × 3 × 2 × 1 (MILONE; ANGELINI, 1993). Por exemplo, 4! = 4 × 3 × 2× 1 = 24. EXEMPLO Uma fi rma produz 10% de peças defeituosas. Qual é a probabilidade de uma amostra de 4 peças possuir 3 perfeitas e uma defeituosa? A probabilidade de su- cesso no evento A = {peça em bom estado} é igual a 90%, já que 10% são defeituo- sas. Assim, temos n = 4 e x = 3. Logo, aplicando a fórmula: ( ) , x n x−x n x−n x,n x,P x C p q(P x C p q( )P x C p q) = × ×P x C p q= × ×x n xP x C p qx n x= × ×x n x= × ×P x C p q= × ×x n x= × ×n xP x C p qn x= × ×n x= × ×P x C p q= × ×n x= × × , obtemos ( ) ( ) ( ) 3 4 3(3 4 3( )3 4 3)4,3 3 4 3−3 4 3= = × × =)= = × × =)p x C p sucesso q fracasso(p x C p sucesso q fracasso( )p x C p sucesso q fracasso) (p x C p sucesso q fracasso( )p x C p sucesso q fracasso) (p x C p sucesso q fracasso(3 4 3p x C p sucesso q fracasso3 4 3(3 4 3(p x C p sucesso q fracasso(3 4 3(4,3p x C p sucesso q fracasso4,33p x C p sucesso q fracasso3= = × × =p x C p sucesso q fracasso= = × × =)= = × × =)p x C p sucesso q fracasso)= = × × =) (= = × × =(p x C p sucesso q fracasso(= = × × =( )= = × × =)p x C p sucesso q fracasso)= = × × =) (= = × × =(p x C p sucesso q fracasso(= = × × =(4,3= = × × =4,3p x C p sucesso q fracasso4,3= = × × =4,33= = × × =3p x C p sucesso q fracasso3= = × × =3 34,3 0,90 0,130,90 0,130,90 0,1× × =0,90 0,1× × =0,90 0,130,90 0,13× × =30,90 0,13C ( )4,3 4! 4 3 2 1 0,07 0,07 0,07 4 0,07 0,28 28 ( 0,07 0,07 0,07 4 0,07 0,28 28 ( ) 0,07 0,07 0,07 4 0,07 0,28 28 )3! 4 3 ! 3 2 1 1(3! 4 3 ! 3 2 1 1( )3! 4 3 ! 3 2 1 1) 0,07 0,07 0,07 4 0,07 0,28 28 3! 4 3 ! 3 2 1 1 0,07 0,07 0,07 4 0,07 0,28 28 ( 0,07 0,07 0,07 4 0,07 0,28 28 (3! 4 3 ! 3 2 1 1( 0,07 0,07 0,07 4 0,07 0,28 28 ( ) 0,07 0,07 0,07 4 0,07 0,28 28 )3! 4 3 ! 3 2 1 1) 0,07 0,07 0,07 4 0,07 0,28 28 )× 4! 4 3 2 1× × ×4! 4 3 2 1 3! 4 3 ! 3 2 1 1− × × ×3! 4 3 ! 3 2 1 1)3! 4 3 ! 3 2 1 1)− × × ×)3! 4 3 ! 3 2 1 1) C % 4,3C % 4,3 4! 4 3 2 1 C % 4! 4 3 2 1 0,07 0,07 0,07 4 0,07 0,28 28C % 0,07 0,07 0,07 4 0,07 0,28 28 ( 0,07 0,07 0,07 4 0,07 0,28 28 ( C % ( 0,07 0,07 0,07 4 0,07 0,28 28 ( ) 0,07 0,07 0,07 4 0,07 0,28 28 ) C % ) 0,07 0,07 0,07 4 0,07 0,28 28 ) 4! 4 3 2 1 0,07 0,07 0,07 4 0,07 0,28 28 4! 4 3 2 1 C % 4! 4 3 2 1 0,07 0,07 0,07 4 0,07 0,28 28 4! 4 3 2 1 ×C % × 4! 4 3 2 1× × ×4! 4 3 2 1 C % 4! 4 3 2 1× × ×4! 4 3 2 14! 4 3 2 1 0,07 0,07 0,07 4 0,07 0,28 28 4! 4 3 2 1× × ×4! 4 3 2 1 0,07 0,07 0,07 4 0,07 0,28 28 4! 4 3 2 1 C % 4! 4 3 2 1 0,07 0,07 0,07 4 0,07 0,28 28 4! 4 3 2 1× × ×4! 4 3 2 1 0,07 0,07 0,07 4 0,07 0,28 28 4! 4 3 2 1 0,07 0,07 0,07 4 0,07 0,28 28= × = × = × = =0,07 0,07 0,07 4 0,07 0,28 28C % 0,07 0,07 0,07 4 0,07 0,28 28= × = × = × = =0,07 0,07 0,07 4 0,07 0,28 28 ( 0,07 0,07 0,07 4 0,07 0,28 28 ( = × = × = × = = ( 0,07 0,07 0,07 4 0,07 0,28 28 ( C % ( 0,07 0,07 0,07 4 0,07 0,28 28 ( = × = × = × = = ( 0,07 0,07 0,07 4 0,07 0,28 28 ( ) 0,07 0,07 0,07 4 0,07 0,28 28 ) = × = × = × = = ) 0,07 0,07 0,07 4 0,07 0,28 28 ) C % ) 0,07 0,07 0,07 4 0,07 0,28 28 ) = × = × = × = = ) 0,07 0,07 0,07 4 0,07 0,28 28 ) 0,07 0,07 0,07 4 0,07 0,28 28= × = × = × = =0,07 0,07 0,07 4 0,07 0,28 28C % 0,07 0,07 0,07 4 0,07 0,28 28= × = × = × = =0,07 0,07 0,07 4 0,07 0,28 280,07 0,07 0,07 4 0,07 0,28 28= × = × = × = =0,07 0,07 0,07 4 0,07 0,28 28C % 0,07 0,07 0,07 4 0,07 0,28 28= × = × = × = =0,07 0,07 0,07 4 0,07 0,28 28 5 Distribuições contínuas de probabilidade Quando a variável aleatória pode assumir qualquer valor em um intervalo, a distribuição de probabilidade é contínua. Dentro desse intervalo, há infi nitos possíveis resultados que satisfazem um evento. Assim a probabilidade de uma variável aleatória X, defi nida pela função f(x), ser locali- zada no intervalo a < × < b é dada por ba( ) ( )∫P a X b f x dxaP a X b f x dxa (P a X b f x dx( )P a X b f x dx)P a X b f x dx(P a X b f x dx( )P a X b f x dx)< < =P a X b f x dx< < =)< < =)P a X b f x dx)< < =) ∫P a X b f x dx∫ (MILONE; ANGELINI, 1993). Na próxima fi gura, você perceberá que há uma relação entre a área sob a curva (dada pela integral b a ( )∫ f x dxb f x dxb ( f x dx( ) f x dx)∫ f x dx∫ ) e a probabilidade associada à variável aleatória X. Como há infi nitos resultados possíveis para esses experimentos, a probabilidade de encon- trarmos um valor particular “a” é igual a zero, ou seja, ( ) 1/ 0= = ∞ =)= = ∞ =) 1/ 0= = ∞ =1/ 0P X a(P X a( = = ∞ =P X a= = ∞ = . Geometricamente, esse resultado seria calculado como uma integral entre a e a, ou seja, aa ( ) 0=∫ f x dx a f x dxa ( f x dx( ) f x dx)∫ f x dx∫ Um exemplo de distribuição contínua de probabilidades é a distribuição normal. Ela se aplica à análise de grandes amostras e possui algumas propriedades, entre as quais destacamos a repre- sentação gráfi ca ser perfeitamente simétrica, tendo sua curva um formato de sino. SAIBA MAIS! A distribuição normal possui uma série de aplicações, como na Ciência Política, por exemplo, para a verifi cação das preferências de voto dos eleitores. Em consequência, 50% dos valores são inferiores à média, e 50% são superiores, de modo que o ponto médio da distribuição é o ponto máximo da função f(x) (MILONE; ANGELINI, 1993). Figura 2 – Distribuição normal, uma distribuição contínua 99,9% 99,7% 95,2% 0,1% 0,1% 2,15% 2,15% 13,6% 13,6% 34,1% 34,1% 0 1 2 3 4 0 -1-2-3-4 Fonte: elaborada pelo autor, 2017. Perceba a relação entre a área da curva e a distribuição de probabilidades. Considerando que a média da variável aleatória é igual a zero, observamos que entre a média zero e o valor 3 (corres- pondente a três vezes o desvio padrão, ou seja, o afastamento dos dados da variável em relação à média) há 99,7% dos elementos da variável aleatória. A área à direita da média (calculada através da integral b ( )∫ f x dxb f x dxb ( f x dx( ) f x dx)∫ f x dx∫ a ) corresponde a 50% dos elementos da variável. 6 Valor esperado O valor esperado, ou esperança matemática, é a medida de tendência central das variáveis aleatórias. Trata-se, portanto, da média ponderada dos valores que a variável aleatória X poderá assumir (MILONE; ANGELINI, 1993). Em variáveis aleatórias discretas, o cálculo do valor esperado é dado por: ( ) ( ) ( ) ( ) ( )1 1 2 2)1 1 2 2) (1 1 2 2(= × + × + … + × = ∑ ×(= × + × + … + × = ∑ ×( )= × + × + … + × = ∑ ×) (= × + × + … + × = ∑ ×( )= × + × + … + × = ∑ ×) (= × + × + … + × = ∑ ×(1 1 2 2= × + × + … + × = ∑ ×1 1 2 2)1 1 2 2)= × + × + … + × = ∑ ×)1 1 2 2) (1 1 2 2(= × + × + … + × = ∑ ×(1 1 2 2( n n i i)n n i i)= × + × + … + × = ∑ ×n n i i= × + × + … + × = ∑ ×)= × + × + … + × = ∑ ×)n n i i)= × + × + … + × = ∑ ×)E X X f X f X f f X(E X X f X f X f f X( )E X X f X f X f f X) (E X X f X f X f f X( )E X X f X f X f f X) (E X X f X f X f f X( )E X X f X f X f f X) (E X X f X f X f f X( )E X X f X f X f f X) (E X X f X f X f f X( )E X X f X f X f f X)= × + × + … + × = ∑ ×E X X f X f X f f X= × + × + … + × = ∑ ×(= × + × + … + × = ∑ ×(E X X f X f X f f X(= × + × + … + × = ∑ ×( )= × + × + … + × = ∑ ×)E X X f X f X f f X)= × + × + … + × = ∑ ×) (= × + × + … + × = ∑ ×(E X X f X f X f f X(= × + × + … + × = ∑ ×( )= × + × + … + × = ∑ ×)E X X f X f X f f X)= × + × + … + × = ∑ ×) (= × + × + … + × = ∑ ×(E X X f X f X f f X(= × + × + … + × = ∑ ×( )= × + × + … + × = ∑ ×)E X X f X f X f f X)= × + × + … + × = ∑ ×) (= × + × + … + × = ∑ ×(E X X f X f X f f X(= × + × + … + × = ∑ ×( )= × + × + … + × = ∑ ×)E X X f X f X f f X)= × + × + … + × = ∑ ×)1 1 2 2= × + × + … + × = ∑ ×1 1 2 2E X X f X f X f f X1 1 2 2= × + × + … + × = ∑ ×1 1 2 2)1 1 2 2)= × + × + … + × = ∑ ×)1 1 2 2)E X X f X f X f f X)1 1 2 2)= × + × + … + × = ∑ ×)1 1 2 2) (1 1 2 2(= × + × + … + × = ∑ ×(1 1 2 2(E X X f X f X f f X(1 1 2 2(= × + × + … + × = ∑ ×(1 1 2 2( n n i iE X X f X f X f f Xn n i i= × + × + … + × = ∑ ×n n i i= × + × + … +× = ∑ ×E X X f X f X f f X= × + × + … + × = ∑ ×n n i i= × + × + … + × = ∑ ×)= × + × + … + × = ∑ ×)n n i i)= × + × + … + × = ∑ ×)E X X f X f X f f X)= × + × + … + × = ∑ ×)n n i i)= × + × + … + × = ∑ ×) Aqui, ififi representa a frequência relativa, ou seja, probabilidade de ocorrência de um evento. A frequência relativa é dada pela razão entre a frequência absoluta (o número de vezes que um valor iX é observado em uma população com n elementos) e o número total de observações (n), conforme a fórmula: ∑ = ii Xfifi n EXEMPLO Qual é o valor esperado de “coroas” (use C para cara e K para coroa) no experimento discreto do lançamento de quatro moedas? Se lançarmos três moedas, há pos- sibilidade de obtermos oito (23) resultados diferentes. Logo, o espaço amostral é formado pelo conjunto S = {(CCC), (CCK), (CKC), (KCC), (KKC), (KCK), (CKK), (KKK)}. Há apenas uma chance em oito de as três moedas exibirem “coroa”, logo, a frequ- ência relativa na obtenção de três coroas é 3 1 0,125 8 = == =f3f3 . Confi ra as probabilidades relativas às observações. Figura 3 – Distribuição de frequências no lançamento de seis moedas Coroas fi fi x Xi 0 0,125 0 1 0,375 0,38 2 0,375 0,75 3 0,125 0,38 SOMA 1,00 1,50 Fonte: elaborada pelo autor, 2017. Logo, o valor esperado da variável aleatória discreta X = {número de “coroas” no lançamento de seis moedas} é igual a 1,5, ou seja, no lançamento, espera-se obter 1,5 coroas. Para variáveis contínuas e defi nidas por ( )X f x(X f x(=X f x= , o valor esperado será dado pela integral da função ( ) ( )= ∫E x f x dx(E x f x dx( )E x f x dx)E x f x dx(E x f x dx( )E x f x dx) = ∫E x f x dx= ∫ . Fechamento Nesta aula, você teve a oportunidade de: • conhecer os conceitos de variável aleatória e suas distinções (discreta e contínua) a partir do conceito de distribuição de probabilidade; • entender o conceito de esperança matemática, ou valor esperado, e sua expressão algébrica. Referências BUSSAB, Wilton de Oliveira; MORETTIN, Pedro. Estatística Básica. 6.ed. São Paulo: Saraiva, 2010. INTERNATIONAL ASSOCIATION OF ATHLETICS FEDERATIONS (IAAF). Toplists – Senior Outdoor – 100 meters men. Disponível em: <https://www.iaaf.org/records/toplists/sprints/100-metres/ outdoor/men/senior>. Acesso em: 06 mar. 2017. MARIOTTO, Rafael Pedro. Introdução às Variáveis Aleatórias e Cadeias de Markov. Monografia. (Licenciatura em Matemática) - Universidade Federal de Santa Catarina, 2009. Disponível em: <https://repositorio.ufsc.br/bitstream/handle/123456789/96591/Rafael.pdf?sequence=2>. Acesso em: 28 fev. 2017. MILONE, Giuseppe; ANGELINI, Flávio. Estatística geral. São Paulo: Atlas, 1993.
Compartilhar