Variáveis Aleatórias e Distribuições

•

UFMS

0

Climei Rodrigues Cabreira

22/10/2020

E aí, curtiu este material?

Ajude a incentivar outros estudantes a melhorar o conteúdo

Gostou desse material? Compartilhe! 🧡

Probabilidade e Estatística

30.048 Materiais compartilhados

Baixe o app para aproveitar ainda mais

Leia os materiais offline, sem usar a internet. Além de vários outros recursos!

Prévia do material em texto

Probabilidade e Estat́ıstica: Laboratório 3
Luiz Antonio de Freitas1
Variáveis Aleatórias
Palavras-chaves: distribuição, esperança, variância, covariância.
1 Variáveis Aleatórias
A variável aleatória é usualmente denotada pelas letras maiúsculas X, Y e Z.
∙ variável categórica: não numérica, partição do espaço amostral. Como exemplo,
– os candidatos à eleição/2010 para presidente: Dilma Rousseff(PT), José Serra(PSDB), Marina
Silva(PV), Branco/Nulo, Não Sabe, Eymael(PSDC), Ivan Pinheiro(PCB), Levy Fidelix(PRTB),
Pĺınio (PSOL), Rui Costa Pimenta(PCO), Zé Maria(PSTU).
∙ variável discreta: (geralmente relacionada à contagem, quantidade). Como exemplo,
– X: número de meninas numa famı́lia com 3 crianças.
∙ variável cont́ınua: (geralmente relacionada à medidas, medição, mensuração). Como exemplo,
– X: peso de uma pessoa
2 Distribuição
∙ variável categórica: Pesquisa de intenção de votos para presidente, realizada pelo Ibope (2010) e
publicada em 28/08/2010, sob o registro: 26139/2010 (TSE). A margem de erro é de 2 ponto(s)
percentual(ais) e foram consultadas 2.506 pessoas entre os dias 24/08/2010 e 26/08/2010.
Tabela 1
Candidatos Intenção de Votos
Dilma Rousseff (PT) 51%
José Serra (PSDB) 27%
Marina Silva (PV) 7%
Branco/Nulo 5%
Não Sabe 9%
Eymael (PSDC) 0%
Ivan Pinheiro (PCB) 0%
Levy Fidelix (PRTB) 0%
Pĺınio (PSOL) 0%
Rui Costa Pimenta (PCO) 0%
Zé Maria (PSTU) 0%
Soma 100%
1Faculdade de Computação, Universidade Federal de Mato Grosso do Sul, CP 549, CEP 79070-900, Campo Grande, Mato
Grosso do Sul, Brasil. E-mail: laf@facom.ufms.br (L.A. Freitas).
2
1. Obs. 1: Note-se que a Intenção de Votos (segunda coluna) pode ser vista como uma probabilidade
estimada de o eleitor manifestar intenção de votar num determinado candidato. Este exemplo se
enquadra na definição intuitiva de probabilidade (ver definição intuitiva em Laboratório 2)
2. Obs. 2: Para a variável categórica pode ser usada uma distribuição polinomial. A distribuição
polinomial pode ser vista em Guerra & Donaire (1982). Neste curso trabalharemos com a definição
intuitiva de probabilidade (ver definição intuitiva em Laboratório 2)
∙ variável discreta: distribuição de probabilidade ,
P [X = x] , que satisfaz P [X = x] ≥ 0 e
∑
x
P [X = x] = 1 (1)
Como exemplo, a quantidade X de meninas numa famı́lia com 3 crianças tem distribuição
Tabela 2
x P [X = x]
0 P [X = 0]
1 P [X = 1]
2 P [X = 2]
3 P [X = 3]∑
1.00
ou
x P [X = x]
0 0.125
1 0.375
2 0.375
3 0.125∑
1.00
∙ variável cont́ınua: função densidade de probabilidade , ou simplesmente função densidade ,
f (x) , que satisfaz f (x) ≥ 0 e
∫ +∞
−∞
f (x) dx = 1 (2)
Como exemplo, o peso X de uma pessoa é uma variável aleatória cont́ınua
∙ gráficos, de P [X = x] e de f (x), para os dois exemplos, respectivamente: a quantidade X de meninas
numa famı́lia com 3 crianças (gráfico da esquerda); o peso X de uma pessoa (gráfico da direita)
−1 0 1 2 3 4 5
0.
0
0.
1
0.
2
0.
3
0.
4
0.
5
discreta: gráfico de P[X=x]
X
0 20 40 60 80 100 120
0.
00
0.
01
0.
02
0.
03
0.
04
0.
05
contínua: gráfico de f(x)
X
∙ para mais detalhes veja Guerra & Donaire (1982).
3
3 Função de Distribuição
∙ variável discreta: função de distribuição acumulada, ou simplismente função de distribuição, dada por
F (x) =
∑
X≤x
P [X = x] . (3)
∙ variável cont́ınua: função de distribuição acumulada, dada por
F (x) =
∫ x
−∞
f (u) du, (4)
em que f (u) satisfaz a condição (2).
●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●
●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●
●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●
●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●
●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●
−1 0 1 2 3 4 5
0.
0
0.
5
1.
0
1.
5
discreta: gráfico de F[x]
X
●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●
●●●●●●●●●●●●
●●●●●●●●
●●●●●●
●●●●●
●●●●●
●●●●
●●●●
●●●●
●●●
●●●
●●●
●●●
●●●
●●●
●●●
●●●
●●●
●●●
●●●
●●●
●●●
●●●
●●●
●●●
●●●
●●●●
●●●●
●●●●
●●●●●
●●●●●
●●●●●●
●●●●●●●●
●●●●●●●●●●●●
●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●
0 20 40 60 80 100 120
0.
0
0.
5
1.
0
1.
5
contínua: gráfico de F[x]
Y
∙ para mais detalhes veja Guerra & Donaire (1982).
4 Média/Esperança Matemática
A esperança matemática de uma variável aleatória X, E [X], é a média da distribuição, e será denotada
também por �x. É dada pelas equações abaixo
∙ variável discreta
�x = E [X] =
∑
x
x P [X = x] (5)
∙ variável cont́ınua
�x = E [X] =
∫ ∞
−∞
x f (x) dx (6)
4
5 Variância e Desvio Padrão
∙ a variância de uma variável aleatória X será denotada por �2x ou var [X]. É dada por
�2x = var [X] = E
[
(X − �x)2
]
= E
[
X2
]
− �2x. (7)
Note-se que E
[
X2
]
∕= E [X] e também E
[
X2
]
> �2x
∙ variância para variável discreta
var [X] =
∑
x
(x− �x)2 P [X = x] (8)
– para mais detalhes sugerimos Guerra & Donaire (1982)
– testes de hipóteses para outros parâmetros pode ser encontrado em Guerra & Donaire (1982)
– este Laboratório 8 é uma reprodução parcial do Caṕıtulo 9 de Guerra & Donaire (1982)
∙ variância para variável cont́ınua
var [X] =
∫ ∞
−∞
(x− �x)2 f (x) dx (9)
∙ desvio padrão: para a variável X, discreta ou cont́ınua, o desvio padrão, �x ou d p [X], é dado por
�x =
√
�2x =
√
var [X] (10)
∙ #include<iostream>
#include<math.h>
#define Max 1000
using namespace std;
float var (int,float,float);
float var (int tam,float media,float a[Max])
{
int cont=0;
float base=0,som=0,variancia=0;
for (cont=0;cont<tam;cont++)
{
base=(a[cont]-media);
// pow(base,exp);
som=pow(base,2)/(tam-1);
variancia=som+variancia;
}
return variancia;
}
//
int main ()
{
float x[Max],soma=0,mean=0,vari=0,sum=0,base=0,sd=0;
int cont=0,length=0;
cout<< "Digite o tamanho da amostra\n";
cin>> length;
cout<< "Digite a amostra:\n";
for (cont=0;cont<length;cont++)
{
cin>> x[cont];
soma=x[cont]+soma;
}
mean=soma/(cont);
vari=var(length,mean,x);
sd=sqrt(vari);
cout<< "Desvio Padrão: "<<sd;
system("PAUSE > null");
return 0;
}
5
6 Distribuições Conjuntas
∙ considere-se X e Y duas variáveis aleatórias quaisquer num mesmo espaço amostral
∙ se X e Y são discretas, a distribuição conjunta de X e Y é dada por
P [X = x, Y = y] = P [X = x] P [Y = y∣X = x] (11)
ou
P [X = x, Y = y] = P [Y = y] P [X = x∣Y = y] , (12)
em que
a) P [X = x] e P [Y = y], que satisfazem (1), são as distribuições marginais de X e de Y , respecti-
vamente
b) P [Y = y∣X = x] e P [X = x∣Y = y], que também satisfazem (1), são as distribuição condicional
de Y ∣x e distribuição condicional de X∣y, respectivamente
∙ se X e Y são cont́ınuas, a distribuição conjunta de X e Y é dada por
f (x, y) = f (x) f (y∣x) , ou f (x, y) = f (y) f (x∣y) (13)
em que
a) f (x) e f (y), que satisfazem (1), são as funções densidade marginais de X e de Y , respectivamente
b) f (y∣x) e f (x∣y), que também satisfazem (2), são as função densidade condicional de Y ∣x e função
densidade condicional de X∣y, respectivamente
7 Covariância
∙ considere-se X e Y duas variáveis aleatórias quaisquer num mesmo espaço amostral. A esperança de
XY , se existe, é dada por:
E [XY ] =
∑
x
∑
y
xy P [X = x, Y = y] , se X e Y são discretas (14)
ou
E [XY ] =
∫ ∞
−∞
∫ ∞
−∞
xy f (x, y) dx dy, se X e Y são cont́ınuas (15)
∙ A covariância entre X e Y , �xy ou cov [X,Y ], é dada por
cov [X,Y ] = E [(X − �x) (Y − �y)] = E [XY ]− �x�y, (16)
em que �x e �y são as esperanças E (X) e E (Y ), respectivamente
∙ #include<iostream>
#include<math.h>
#defineMax 1000
using namespace std;
int main ()
{
float x[Max],soma=0,meanx=0,meany=0,sum=0,y[Max],cov=0;
int cont=0,length=0;
cout<< "Digite o tamanho da amostra\n";
cin>> length;
6
cout<< "Digite uma amostra:\n";
for (cont=0;cont<length;cont++)
{
cin>> x[cont];
soma=x[cont]+soma;
}
meanx=soma/length;
soma=0;
cout<< "Digite outra amostra:\n";
for (cont=0;cont<length;cont++)
{
cin>> y[cont];
soma=y[cont]+soma;
}
meany=soma/length;
for (cont=0;cont<length;cont++)
{
sum=((x[cont]-meanx)*(y[cont]-meany))+sum;
}
cov=sum/(length-1);
cout<<"Covariância:"<<cov;
system("PAUSE > null");
return 0;
}
8 Correlação
∙ considere-se X e Y duas variáveis aleatórias quaisquer num mesmo espaço amostral. A correlação
entre X e Y , �xy ou cor [X,Y ], é dada por
�xy = cor [X,Y ] =
cov [X,Y ]
�x�y
=
�xy
�x�y
, (17)
em que �x e �y são os desvios padrão de X e Y , respectivamente.
∙ #include<iostream>
#include<math.h>
#define Max 1000
using namespace std;
float var (int,float,float);
float cov (int,float,float,float,float);
// Função Covariância
float cov (int len,float meana,float meanb,float a[Max],float b[Max])
{
int cont=0;
float sumat=0;
for (cont=0;cont<len;cont++)
{
sumat=((a[cont]-meana)*(b[cont]-meanb))+sumat;
}
return sumat/(len-1);
}
// Função Variância
float var (int tam,float media,float a[Max])
{
int cont=0;
float base=0,som=0,variancia=0;
for (cont=0;cont<tam;cont++)
{
base=(a[cont]-media);
// pow(base,exp);
som=pow(base,2)/(tam-1);
variancia=som+variancia;
}
return variancia;
}
//
int main ()
{
float x[Max],soma=0,meanx=0,meany=0,sum=0,sdx=0,sdy=0,y[Max],cova=0,cor=0,sumx=0,sumy=0;
int cont=0,length=0;
7
cout<< "Digite o tamanho da amostra\n";
cin>> length;
cout<< "Digite uma amostra:\n";
for (cont=0;cont<length;cont++)
{
cin>> x[cont];
soma=x[cont]+soma;
}
meanx=soma/length;
soma=0;
cout<< "Digite outra amostra:\n";
for (cont=0;cont<length;cont++)
{
cin>> y[cont];
soma=y[cont]+soma;
}
meany=soma/length;
sdx=var(length,meanx,x);
sdx=sqrt(sdx);
sdy=var(length,meany,y);
sdy=sqrt(sdy);
cova=cov(length,meanx,meany,x,y);
cor=cova/(sdx*sdy);
cout<<"Correlação:"<<cor;
system("PAUSE > null");
return 0;
}
9 Propriedades da Média e da Variância
∙ Se X e Y são duas variáveis aleatórias, discreta ou cont́ınua, num mesmo espaço amostral, e k é uma
constante real, então valem as propriedades abaixo
E [k X] = k E [X] (18)
var [k X] = k2 var [X] (19)
d p [k X] = k d p [X] (20)
E [X + Y ] = E [X] + E [Y ] (21)
E [X − Y ] = E [X]− E [Y ] (22)
var [X ± Y ] = var [X] + var [Y ]± 2cov [X,Y ] (23)
∙ se X e Y são independentes
var [X ± Y ] = var [X] + var [Y ] (24)
∙ Sejam X1, X2, . . . , Xn variáveis aleatórias quaisquer num mesmo espaço amostral, a0, a1, a2, . . . , an
números reais, e
Y = a0 + a1X1 + a2X2 + ⋅ ⋅ ⋅+ anXn.
Então,
E [Y ] = a0 +
n∑
i=1
aiE [Xi] (25)
var [Y ] =
n∑
i=1
a2i var [Xi] + 2
n∑
i=2
i−1∑
j=1
aiajcov [Xi, Xj ] (26)
8
∙ Se X1, X2, . . . , Xn são variáveis aleatórias independentes, num mesmo espaço amostral,
var [Y ] =
n∑
i=1
a2i var [Xi] (27)
10 Considerações Finais
∙ para mais detalhes sobre variância, covariância e correlação, veja Feller (1968). Existe a versão em
ĺıngua portuguesa
∙ note-se que este não é um texto. É um assunto dado em tópicos (pontuados/itemizados)
∙ solicitamos gentilmente que, se o aluno perceber algum erro, alguma contradição com o que é visto na
literatura, favor nos notificar
Referências
Feller, W. (1968). An Introduction to Probability Theory and its Applications, vol. 1. Wiley, New York, third
edition.
Guerra, M. J. & Donaire, D. (1982). Estat́ıstica Indutiva: teoria e aplicações. Livraria Ciência e Tecnologia
Editora, São Paulo, 2a edição.
Ibope (2010). Pesquisa de intenção de votos para Presidente, realizada pelo Ibope e publicada em 28/08/2010 .
Tribunal Superior Eleitoral, Brasil. Margem de erro: 2 ponto(s) percentual(ais), Registro: 26139/2010,
Amostra: 2506 pessoas, Peŕıodo de aplicação: 24/08/2010 a 26/08/2010.