Baixe o app para aproveitar ainda mais
Prévia do material em texto
Probabilidade e Estat́ıstica: Laboratório 3 Luiz Antonio de Freitas1 Variáveis Aleatórias Palavras-chaves: distribuição, esperança, variância, covariância. 1 Variáveis Aleatórias A variável aleatória é usualmente denotada pelas letras maiúsculas X, Y e Z. ∙ variável categórica: não numérica, partição do espaço amostral. Como exemplo, – os candidatos à eleição/2010 para presidente: Dilma Rousseff(PT), José Serra(PSDB), Marina Silva(PV), Branco/Nulo, Não Sabe, Eymael(PSDC), Ivan Pinheiro(PCB), Levy Fidelix(PRTB), Pĺınio (PSOL), Rui Costa Pimenta(PCO), Zé Maria(PSTU). ∙ variável discreta: (geralmente relacionada à contagem, quantidade). Como exemplo, – X: número de meninas numa famı́lia com 3 crianças. ∙ variável cont́ınua: (geralmente relacionada à medidas, medição, mensuração). Como exemplo, – X: peso de uma pessoa 2 Distribuição ∙ variável categórica: Pesquisa de intenção de votos para presidente, realizada pelo Ibope (2010) e publicada em 28/08/2010, sob o registro: 26139/2010 (TSE). A margem de erro é de 2 ponto(s) percentual(ais) e foram consultadas 2.506 pessoas entre os dias 24/08/2010 e 26/08/2010. Tabela 1 Candidatos Intenção de Votos Dilma Rousseff (PT) 51% José Serra (PSDB) 27% Marina Silva (PV) 7% Branco/Nulo 5% Não Sabe 9% Eymael (PSDC) 0% Ivan Pinheiro (PCB) 0% Levy Fidelix (PRTB) 0% Pĺınio (PSOL) 0% Rui Costa Pimenta (PCO) 0% Zé Maria (PSTU) 0% Soma 100% 1Faculdade de Computação, Universidade Federal de Mato Grosso do Sul, CP 549, CEP 79070-900, Campo Grande, Mato Grosso do Sul, Brasil. E-mail: laf@facom.ufms.br (L.A. Freitas). 2 1. Obs. 1: Note-se que a Intenção de Votos (segunda coluna) pode ser vista como uma probabilidade estimada de o eleitor manifestar intenção de votar num determinado candidato. Este exemplo se enquadra na definição intuitiva de probabilidade (ver definição intuitiva em Laboratório 2) 2. Obs. 2: Para a variável categórica pode ser usada uma distribuição polinomial. A distribuição polinomial pode ser vista em Guerra & Donaire (1982). Neste curso trabalharemos com a definição intuitiva de probabilidade (ver definição intuitiva em Laboratório 2) ∙ variável discreta: distribuição de probabilidade , P [X = x] , que satisfaz P [X = x] ≥ 0 e ∑ x P [X = x] = 1 (1) Como exemplo, a quantidade X de meninas numa famı́lia com 3 crianças tem distribuição Tabela 2 x P [X = x] 0 P [X = 0] 1 P [X = 1] 2 P [X = 2] 3 P [X = 3]∑ 1.00 ou x P [X = x] 0 0.125 1 0.375 2 0.375 3 0.125∑ 1.00 ∙ variável cont́ınua: função densidade de probabilidade , ou simplesmente função densidade , f (x) , que satisfaz f (x) ≥ 0 e ∫ +∞ −∞ f (x) dx = 1 (2) Como exemplo, o peso X de uma pessoa é uma variável aleatória cont́ınua ∙ gráficos, de P [X = x] e de f (x), para os dois exemplos, respectivamente: a quantidade X de meninas numa famı́lia com 3 crianças (gráfico da esquerda); o peso X de uma pessoa (gráfico da direita) −1 0 1 2 3 4 5 0. 0 0. 1 0. 2 0. 3 0. 4 0. 5 discreta: gráfico de P[X=x] X 0 20 40 60 80 100 120 0. 00 0. 01 0. 02 0. 03 0. 04 0. 05 contínua: gráfico de f(x) X ∙ para mais detalhes veja Guerra & Donaire (1982). 3 3 Função de Distribuição ∙ variável discreta: função de distribuição acumulada, ou simplismente função de distribuição, dada por F (x) = ∑ X≤x P [X = x] . (3) ∙ variável cont́ınua: função de distribuição acumulada, dada por F (x) = ∫ x −∞ f (u) du, (4) em que f (u) satisfaz a condição (2). ●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●● ●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●● ●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●● ●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●● ●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●● −1 0 1 2 3 4 5 0. 0 0. 5 1. 0 1. 5 discreta: gráfico de F[x] X ●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●● ●●●●●●●●●●●● ●●●●●●●● ●●●●●● ●●●●● ●●●●● ●●●● ●●●● ●●●● ●●● ●●● ●●● ●●● ●●● ●●● ●●● ●●● ●●● ●●● ●●● ●●● ●●● ●●● ●●● ●●● ●●● ●●●● ●●●● ●●●● ●●●●● ●●●●● ●●●●●● ●●●●●●●● ●●●●●●●●●●●● ●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●● 0 20 40 60 80 100 120 0. 0 0. 5 1. 0 1. 5 contínua: gráfico de F[x] Y ∙ para mais detalhes veja Guerra & Donaire (1982). 4 Média/Esperança Matemática A esperança matemática de uma variável aleatória X, E [X], é a média da distribuição, e será denotada também por �x. É dada pelas equações abaixo ∙ variável discreta �x = E [X] = ∑ x x P [X = x] (5) ∙ variável cont́ınua �x = E [X] = ∫ ∞ −∞ x f (x) dx (6) 4 5 Variância e Desvio Padrão ∙ a variância de uma variável aleatória X será denotada por �2x ou var [X]. É dada por �2x = var [X] = E [ (X − �x)2 ] = E [ X2 ] − �2x. (7) Note-se que E [ X2 ] ∕= E [X] e também E [ X2 ] > �2x ∙ variância para variável discreta var [X] = ∑ x (x− �x)2 P [X = x] (8) – para mais detalhes sugerimos Guerra & Donaire (1982) – testes de hipóteses para outros parâmetros pode ser encontrado em Guerra & Donaire (1982) – este Laboratório 8 é uma reprodução parcial do Caṕıtulo 9 de Guerra & Donaire (1982) ∙ variância para variável cont́ınua var [X] = ∫ ∞ −∞ (x− �x)2 f (x) dx (9) ∙ desvio padrão: para a variável X, discreta ou cont́ınua, o desvio padrão, �x ou d p [X], é dado por �x = √ �2x = √ var [X] (10) ∙ #include<iostream> #include<math.h> #define Max 1000 using namespace std; float var (int,float,float); float var (int tam,float media,float a[Max]) { int cont=0; float base=0,som=0,variancia=0; for (cont=0;cont<tam;cont++) { base=(a[cont]-media); // pow(base,exp); som=pow(base,2)/(tam-1); variancia=som+variancia; } return variancia; } // int main () { float x[Max],soma=0,mean=0,vari=0,sum=0,base=0,sd=0; int cont=0,length=0; cout<< "Digite o tamanho da amostra\n"; cin>> length; cout<< "Digite a amostra:\n"; for (cont=0;cont<length;cont++) { cin>> x[cont]; soma=x[cont]+soma; } mean=soma/(cont); vari=var(length,mean,x); sd=sqrt(vari); cout<< "Desvio Padrão: "<<sd; system("PAUSE > null"); return 0; } 5 6 Distribuições Conjuntas ∙ considere-se X e Y duas variáveis aleatórias quaisquer num mesmo espaço amostral ∙ se X e Y são discretas, a distribuição conjunta de X e Y é dada por P [X = x, Y = y] = P [X = x] P [Y = y∣X = x] (11) ou P [X = x, Y = y] = P [Y = y] P [X = x∣Y = y] , (12) em que a) P [X = x] e P [Y = y], que satisfazem (1), são as distribuições marginais de X e de Y , respecti- vamente b) P [Y = y∣X = x] e P [X = x∣Y = y], que também satisfazem (1), são as distribuição condicional de Y ∣x e distribuição condicional de X∣y, respectivamente ∙ se X e Y são cont́ınuas, a distribuição conjunta de X e Y é dada por f (x, y) = f (x) f (y∣x) , ou f (x, y) = f (y) f (x∣y) (13) em que a) f (x) e f (y), que satisfazem (1), são as funções densidade marginais de X e de Y , respectivamente b) f (y∣x) e f (x∣y), que também satisfazem (2), são as função densidade condicional de Y ∣x e função densidade condicional de X∣y, respectivamente 7 Covariância ∙ considere-se X e Y duas variáveis aleatórias quaisquer num mesmo espaço amostral. A esperança de XY , se existe, é dada por: E [XY ] = ∑ x ∑ y xy P [X = x, Y = y] , se X e Y são discretas (14) ou E [XY ] = ∫ ∞ −∞ ∫ ∞ −∞ xy f (x, y) dx dy, se X e Y são cont́ınuas (15) ∙ A covariância entre X e Y , �xy ou cov [X,Y ], é dada por cov [X,Y ] = E [(X − �x) (Y − �y)] = E [XY ]− �x�y, (16) em que �x e �y são as esperanças E (X) e E (Y ), respectivamente ∙ #include<iostream> #include<math.h> #defineMax 1000 using namespace std; int main () { float x[Max],soma=0,meanx=0,meany=0,sum=0,y[Max],cov=0; int cont=0,length=0; cout<< "Digite o tamanho da amostra\n"; cin>> length; 6 cout<< "Digite uma amostra:\n"; for (cont=0;cont<length;cont++) { cin>> x[cont]; soma=x[cont]+soma; } meanx=soma/length; soma=0; cout<< "Digite outra amostra:\n"; for (cont=0;cont<length;cont++) { cin>> y[cont]; soma=y[cont]+soma; } meany=soma/length; for (cont=0;cont<length;cont++) { sum=((x[cont]-meanx)*(y[cont]-meany))+sum; } cov=sum/(length-1); cout<<"Covariância:"<<cov; system("PAUSE > null"); return 0; } 8 Correlação ∙ considere-se X e Y duas variáveis aleatórias quaisquer num mesmo espaço amostral. A correlação entre X e Y , �xy ou cor [X,Y ], é dada por �xy = cor [X,Y ] = cov [X,Y ] �x�y = �xy �x�y , (17) em que �x e �y são os desvios padrão de X e Y , respectivamente. ∙ #include<iostream> #include<math.h> #define Max 1000 using namespace std; float var (int,float,float); float cov (int,float,float,float,float); // Função Covariância float cov (int len,float meana,float meanb,float a[Max],float b[Max]) { int cont=0; float sumat=0; for (cont=0;cont<len;cont++) { sumat=((a[cont]-meana)*(b[cont]-meanb))+sumat; } return sumat/(len-1); } // Função Variância float var (int tam,float media,float a[Max]) { int cont=0; float base=0,som=0,variancia=0; for (cont=0;cont<tam;cont++) { base=(a[cont]-media); // pow(base,exp); som=pow(base,2)/(tam-1); variancia=som+variancia; } return variancia; } // int main () { float x[Max],soma=0,meanx=0,meany=0,sum=0,sdx=0,sdy=0,y[Max],cova=0,cor=0,sumx=0,sumy=0; int cont=0,length=0; 7 cout<< "Digite o tamanho da amostra\n"; cin>> length; cout<< "Digite uma amostra:\n"; for (cont=0;cont<length;cont++) { cin>> x[cont]; soma=x[cont]+soma; } meanx=soma/length; soma=0; cout<< "Digite outra amostra:\n"; for (cont=0;cont<length;cont++) { cin>> y[cont]; soma=y[cont]+soma; } meany=soma/length; sdx=var(length,meanx,x); sdx=sqrt(sdx); sdy=var(length,meany,y); sdy=sqrt(sdy); cova=cov(length,meanx,meany,x,y); cor=cova/(sdx*sdy); cout<<"Correlação:"<<cor; system("PAUSE > null"); return 0; } 9 Propriedades da Média e da Variância ∙ Se X e Y são duas variáveis aleatórias, discreta ou cont́ınua, num mesmo espaço amostral, e k é uma constante real, então valem as propriedades abaixo E [k X] = k E [X] (18) var [k X] = k2 var [X] (19) d p [k X] = k d p [X] (20) E [X + Y ] = E [X] + E [Y ] (21) E [X − Y ] = E [X]− E [Y ] (22) var [X ± Y ] = var [X] + var [Y ]± 2cov [X,Y ] (23) ∙ se X e Y são independentes var [X ± Y ] = var [X] + var [Y ] (24) ∙ Sejam X1, X2, . . . , Xn variáveis aleatórias quaisquer num mesmo espaço amostral, a0, a1, a2, . . . , an números reais, e Y = a0 + a1X1 + a2X2 + ⋅ ⋅ ⋅+ anXn. Então, E [Y ] = a0 + n∑ i=1 aiE [Xi] (25) var [Y ] = n∑ i=1 a2i var [Xi] + 2 n∑ i=2 i−1∑ j=1 aiajcov [Xi, Xj ] (26) 8 ∙ Se X1, X2, . . . , Xn são variáveis aleatórias independentes, num mesmo espaço amostral, var [Y ] = n∑ i=1 a2i var [Xi] (27) 10 Considerações Finais ∙ para mais detalhes sobre variância, covariância e correlação, veja Feller (1968). Existe a versão em ĺıngua portuguesa ∙ note-se que este não é um texto. É um assunto dado em tópicos (pontuados/itemizados) ∙ solicitamos gentilmente que, se o aluno perceber algum erro, alguma contradição com o que é visto na literatura, favor nos notificar Referências Feller, W. (1968). An Introduction to Probability Theory and its Applications, vol. 1. Wiley, New York, third edition. Guerra, M. J. & Donaire, D. (1982). Estat́ıstica Indutiva: teoria e aplicações. Livraria Ciência e Tecnologia Editora, São Paulo, 2a edição. Ibope (2010). Pesquisa de intenção de votos para Presidente, realizada pelo Ibope e publicada em 28/08/2010 . Tribunal Superior Eleitoral, Brasil. Margem de erro: 2 ponto(s) percentual(ais), Registro: 26139/2010, Amostra: 2506 pessoas, Peŕıodo de aplicação: 24/08/2010 a 26/08/2010.
Compartilhar