Baixe o app para aproveitar ainda mais
Prévia do material em texto
Probabilidade e Estat́ıstica: Laboratóri 3 Luiz Antonio de Freitas1 Variáveis Aleatórias Palavras-chaves: distribuição, esperança, variância, covariância. 1 Variáveis Aleatórias A variável aleatória é usualmente denotada pelas letras maiúsculas X, Y e Z. • variável categórica: não numérica, partição do espaço amostral. Como exemplo, – os candidatos à eleição/2010 para presidente: Dilma Rousseff(PT), José Serra(PSDB), Marina Silva(PV), Branco/Nulo, Não Sabe, Eymael(PSDC), Ivan Pinheiro(PCB), Levy Fidelix(PRTB), Pĺınio (PSOL), Rui Costa Pimenta(PCO), Zé Maria(PSTU). • variável discreta: (geralmente relacionada à contagem, quantidade). Como exemplo, – X: número de meninas numa famı́lia com 3 crianças. • variável cont́ınua: (geralmente relacionada à medidas, medição, mensuração). Como exemplo, – X: peso de uma pessoa 2 Distribuição • variável categórica: Pesquisa de intenção de votos para presidente, realizada pelo Ibope (2010) e publicada em 28/08/2010, sob o registro: 26139/2010 (TSE). A margem de erro é de 2 ponto(s) percentual(ais) e foram consultadas 2.506 pessoas entre os dias 24/08/2010 e 26/08/2010. Tabela 1 Candidatos Intenção de Votos Dilma Rousseff (PT) 51% José Serra (PSDB) 27% Marina Silva (PV) 7% Branco/Nulo 5% Não Sabe 9% Eymael (PSDC) 0% Ivan Pinheiro (PCB) 0% Levy Fidelix (PRTB) 0% Pĺınio (PSOL) 0% Rui Costa Pimenta (PCO) 0% Zé Maria (PSTU) 0% Soma 100% 1Faculdade de Computação, Universidade Federal de Mato Grosso do Sul, CP 549, CEP 79070-900, Campo Grande, Mato Grosso do Sul, Brasil. E-mail: laf@facom.ufms.br (L.A. Freitas). 2 1. Obs. 1: Note-se que a Intenção de Votos (segunda coluna) pode ser vista como uma probabilidade estimada de o eleitor manifestar intenção de votar num determinado candidato. Este exemplo se enquadra na definição intuitiva de probabilidade (ver definição intuitiva em Laboratório 2) 2. Obs. 2: Para a variável categórica pode ser usada uma distribuição polinomial. A distribuição polinomial pode ser vista em Guerra & Donaire (1982). Neste curso trabalharemos com a definição intuitiva de probabilidade (ver definição intuitiva em Laboratório 2) • variável discreta: distribuição de probabilidade , P [X = x] , que satisfaz P [X = x] ≥ 0 e ∑ x P [X = x] = 1 (1) Como exemplo, a quantidade X de meninas numa famı́lia com 3 crianças tem distribuição Tabela 2 x P [X = x] 0 P [X = 0] 1 P [X = 1] 2 P [X = 2] 3 P [X = 3]∑ 1.00 ou x P [X = x] 0 0.125 1 0.375 2 0.375 3 0.125∑ 1.00 • variável cont́ınua: função densidade de probabilidade , ou simplesmente função densidade , f (x) , que satisfaz f (x) ≥ 0 e ∫ +∞ −∞ f (x) dx = 1 (2) Como exemplo, o peso X de uma pessoa é uma variável aleatória cont́ınua • gráficos, de P [X = x] e de f (x), para os dois exemplos, respectivamente: a quantidade X de meninas numa famı́lia com 3 crianças (gráfico da esquerda); o peso X de uma pessoa (gráfico da direita) −1 0 1 2 3 4 5 0. 0 0. 1 0. 2 0. 3 0. 4 0. 5 discreta: gráfico de P[X=x] X 0 20 40 60 80 100 120 0. 00 0. 01 0. 02 0. 03 0. 04 0. 05 contínua: gráfico de f(x) X • para mais detalhes veja Guerra & Donaire (1982). 3 3 Função de Distribuição • variável discreta: função de distribuição acumulada, ou simplismente função de distribuição, dada por F (x) = ∑ X≤x P [X = x] . (3) • variável cont́ınua: função de distribuição acumulada, dada por F (x) = ∫ x −∞ f (u) du, (4) em que f (u) satisfaz a condição (2). ●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●● ●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●● ●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●● ●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●● ●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●● −1 0 1 2 3 4 5 0. 0 0. 5 1. 0 1. 5 discreta: gráfico de F[x] X ●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●● ●●●●●●●●●●●● ●●●●●●●● ●●●●●● ●●●●● ●●●●● ●●●● ●●●● ●●●● ●●● ●●● ●●● ●●● ●●● ●●● ●●● ●●● ●●● ●●● ●●● ●●● ●●● ●●● ●●● ●●● ●●● ●●●● ●●●● ●●●● ●●●●● ●●●●● ●●●●●● ●●●●●●●● ●●●●●●●●●●●● ●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●● 0 20 40 60 80 100 120 0. 0 0. 5 1. 0 1. 5 contínua: gráfico de F[x] Y • para mais detalhes veja Guerra & Donaire (1982). 4 Média/Esperança Matemática A esperança matemática de uma variável aleatória X, E [X], é a média da distribuição, e será denotada também por µx. É dada pelas equações abaixo • variável discreta µx = E [X] = ∑ x x P [X = x] (5) • variável cont́ınua µx = E [X] = ∫ ∞ −∞ x f (x) dx (6) 4 5 Variância e Desvio Padrão • a variância de uma variável aleatória X será denotada por σ2x ou var [X]. É dada por σ2x = var [X] = E [ (X − µx)2 ] = E [ X2 ] − µ2x. (7) Note-se que E [ X2 ] 6= E [X] e também E [ X2 ] > µ2x • variância para variável discreta var [X] = ∑ x (x− µx)2 P [X = x] (8) – para mais detalhes sugerimos Guerra & Donaire (1982) – testes de hipóteses para outros parâmetros pode ser encontrado em Guerra & Donaire (1982) – este Laboratório 8 é uma reprodução parcial do Caṕıtulo 9 de Guerra & Donaire (1982) • variância para variável cont́ınua var [X] = ∫ ∞ −∞ (x− µx)2 f (x) dx (9) • desvio padrão: para a variável X, discreta ou cont́ınua, o desvio padrão, σx ou d p [X], é dado por σx = √ σ2x = √ var [X] (10) • ! A EXCLAMAÇ~AO É UTILIZADA PARA COMENTAR PROGRAM SD ! A FUNÇO "PROGRAM" SEGUIDA DO NOME DO PROGRAMA DA INÖCIO AO PROGRAMA REAL SOMA,MEAN,VAR,X INTEGER LENGTH,CONT !"DOUBLEPRECISION","INTEGER","REAL" S~AO COMANDOS DE ESPECIFICAÇO, ESTES ESPECIFICAM O TIPO DA VARIAVEL PRINT*, "Digite o tamanho da amostra: " ! TANTO O COMANDO "PRINT*," QUANTO O "WRITE(*,*)" FAZEM IMPRESSÇO READ(*,*) LENGTH ! "READ(*,*)" LÒ O VALOR DA VARIAVEL WRITE(*,*) "Digite a amostra: " CALL AMOSTRA (LENGTH) ! "CALL" CHAMA A SUBRROTINA STOP END ! ASSIM COMO "PROGRAM" DA INICIO AO PROGRAMA, "STOP" E "END" FINALIZAM ESTE SUBROUTINE AMOSTRA (LENGTH) !"SUBROUTINE" SEGUIDO DO NOME DA SUBROTINA E UMA OU MAIS VARIAV?IS ENTRE PARENTESE "(X)" NO CASO INTEGER LENGTH,CONT REAL SOMA,MEAN,VAR,X(LENGTH) SOMA=0 DO CONT=1,LENGTH,1 READ(*,*) X(CONT) SOMA=SOMA+X(CONT) END DO MEAN=SOMA/LENGTH VAR=0 DO CONT=1,LENGTH,1 VAR=VAR+(((X(CONT)-MEAN)**2)/(LENGTH-1)) END DO PRINT*, "Desvio Padrao: ",SQRT(VAR) PRINT*, "Precione ENTER para sair." READ(*,*) RETURN END 6 Distribuições Conjuntas • considere-se X e Y duas variáveis aleatórias quaisquer num mesmo espaço amostral 5 • se X e Y são discretas, a distribuição conjunta de X e Y é dada por P [X = x, Y = y] = P [X = x] P [Y = y|X = x] (11) ou P [X = x, Y = y] = P [Y = y] P [X = x|Y = y] , (12) em que a) P [X = x] e P [Y = y], que satisfazem (1), são as distribuições marginais de X e de Y , respecti- vamente b) P [Y = y|X = x] e P [X = x|Y = y], que também satisfazem (1), são as distribuição condicional de Y |x e distribuição condicional de X|y, respectivamente • se X e Y são cont́ınuas, a distribuição conjunta de X e Y é dada por f (x, y) = f (x) f (y|x) , ou f (x, y) = f (y) f (x|y) (13) em que a) f (x) e f (y), que satisfazem (1), são as funções densidade marginais de X e de Y , respectivamente b) f (y|x) e f (x|y), que também satisfazem (2), são as função densidade condicional de Y |x e função densidade condicional de X|y, respectivamente 7 Covariância • considere-se X e Y duas variáveis aleatórias quaisquer num mesmo espaço amostral. A esperança de XY , se existe, é dada por: E [XY ] = ∑ x ∑ y xy P [X = x, Y = y] , se X e Y são discretas (14)ou E [XY ] = ∫ ∞ −∞ ∫ ∞ −∞ xy f (x, y) dx dy, se X e Y são cont́ınuas (15) • A covariância entre X e Y , σxy ou cov [X,Y ], é dada por cov [X,Y ] = E [(X − µx) (Y − µy)] = E [XY ]− µxµy, (16) em que µx e µy são as esperanças E (X) e E (Y ), respectivamente • PROGRAM COVARIANCIA REAL SOMA,MEANX,MEANY,COV INTEGER LENGTH,CONT PRINT*, "Digite o tamanho da amostra: " READ(*,*) LENGTH WRITE(*,*) "Digite a amostra 1: " CALL AMOSTRA (LENGTH) STOP END SUBROUTINE AMOSTRA (LENGTH) REAL X(LENGTH),Y(LENGTH),MEANX,MEANY SOMA=0 DO CONT=1,LENGTH,1 6 READ(*,*) X(CONT) SOMA=SOMA+X(CONT) END DO MEANX=SOMA/LENGTH WRITE(*,*) "Digite a amostra 2: " SOMA=0 DO CONT=1,LENGTH,1 READ(*,*) Y(CONT) SOMA=SOMA+Y(CONT) END DO MEANY=SOMA/LENGTH COV=0 DO CONT=1,LENGTH,1 COV=COV+((X(CONT)-MEANX)*(Y(CONT)-MEANY)) END DO COV=COV/(LENGTH-1) PRINT*, "COVARIANCIA: ",COV PRINT*, "Precione ENTER para sair." READ(*,*) RETURN END 8 Correlação • considere-se X e Y duas variáveis aleatórias quaisquer num mesmo espaço amostral. A correlação entre X e Y , ρxy ou cor [X,Y ], é dada por ρxy = cor [X,Y ] = cov [X,Y ] σxσy = σxy σxσy , (17) em que σx e σy são os desvios padrão de X e Y , respectivamente. • PROGRAM CORRELACAO REAL SOMA,MEANX,MEANY,COV,VARX,VARY INTEGER LENGTH,CONT PRINT*, "Digite o tamanho da amostra: " READ(*,*) LENGTH WRITE(*,*) "Digite a amostra 1: " CALL AMOSTRA (LENGTH) STOP END SUBROUTINE AMOSTRA (LENGTH) REAL X(LENGTH),Y(LENGTH),MEANX,MEANY SOMA=0 DO CONT=1,LENGTH,1 READ(*,*) X(CONT) SOMA=SOMA+X(CONT) END DO MEANX=SOMA/LENGTH WRITE(*,*) "Digite a amostra 2: " SOMA=0 DO CONT=1,LENGTH,1 READ(*,*) Y(CONT) SOMA=SOMA+Y(CONT) END DO MEANY=SOMA/LENGTH VARX=0 DO CONT=1,LENGTH,1 VARX=VARX+(((X(CONT)-MEANX)**2)/(LENGTH-1)) END DO VARY=0 DO CONT=1,LENGTH,1 VARY=VARY+(((Y(CONT)-MEANY)**2)/(LENGTH-1)) END DO COV=0 DO CONT=1,LENGTH,1 7 COV=COV+(((X(CONT)-MEANX)*(Y(CONT)-MEANY))/(LENGTH-1)) END DO COR=COV/SQRT(VARY*VARX) PRINT*, "CORRELAAO: ",COR READ(*,*) RETURN END 9 Propriedades da Média e da Variância • Se X e Y são duas variáveis aleatórias, discreta ou cont́ınua, num mesmo espaço amostral, e k é uma constante real, então valem as propriedades abaixo E [k X] = k E [X] (18) var [k X] = k2 var [X] (19) d p [k X] = k d p [X] (20) E [X + Y ] = E [X] + E [Y ] (21) E [X − Y ] = E [X]− E [Y ] (22) var [X ± Y ] = var [X] + var [Y ]± 2cov [X,Y ] (23) • se X e Y são independentes var [X ± Y ] = var [X] + var [Y ] (24) • Sejam X1, X2, . . . , Xn variáveis aleatórias quaisquer num mesmo espaço amostral, a0, a1, a2, . . . , an números reais, e Y = a0 + a1X1 + a2X2 + · · ·+ anXn. Então, E [Y ] = a0 + n∑ i=1 aiE [Xi] (25) var [Y ] = n∑ i=1 a2i var [Xi] + 2 n∑ i=2 i−1∑ j=1 aiajcov [Xi, Xj ] (26) • Se X1, X2, . . . , Xn são variáveis aleatórias independentes, num mesmo espaço amostral, var [Y ] = n∑ i=1 a2i var [Xi] (27) 8 10 Considerações Finais • para mais detalhes sobre variância, covariância e correlação, veja Feller (1968). Existe a versão em ĺıngua portuguesa • note-se que este não é um texto. É um assunto dado em tópicos (pontuados/itemizados) • solicitamos gentilmente que, se o aluno perceber algum erro, alguma contradição com o que é visto na literatura, favor nos notificar Referências Feller, W. (1968). An Introduction to Probability Theory and its Applications, vol. 1. Wiley, New York, third edition. Guerra, M. J. & Donaire, D. (1982). Estat́ıstica Indutiva: teoria e aplicações. Livraria Ciência e Tecnologia Editora, São Paulo, 2a edição. Ibope (2010). Pesquisa de intenção de votos para Presidente, realizada pelo Ibope e publicada em 28/08/2010 . Tribunal Superior Eleitoral, Brasil. Margem de erro: 2 ponto(s) percentual(ais), Registro: 26139/2010, Amostra: 2506 pessoas, Peŕıodo de aplicação: 24/08/2010 a 26/08/2010.
Compartilhar