Livro Noções de Probabilidade e Estatística - Magalhães parte 1
91 pág.

Livro Noções de Probabilidade e Estatística - Magalhães parte 1


DisciplinaProbabilidade e Estatística12.907 materiais121.462 seguidores
Pré-visualização37 páginas
se as duas tabelas, a de freqüências observadas e a
tlc esperadas, estão suficientemente próximas uma da outra.
Ilxemplo 5.-f 0.. Apresentamos os dados relativos a uma amostra de 80 famílias, de
lun certo bairro, com as informações sobre o número de pessoas que trabalham
nufamília (") e o número de adolescentes entre 12 e 1B anos (A).
A rnarginal deT e as freqüências de seus valores, restritas ao grupo Á- 0, serão
irpresentadas em seguida. Note que as freqüências de ocorrência, restritas a cada
grr.rpo de valor de A, nada mais são do que as colunas da tabela de dupla entrada
rlo início do exemplo.
r\Á 0 1 2 trJ 4 total
0 5 4 2 3 1 15
I 2 B 6 4 I 2t
2 4 8 B 5 2 27
.1 , 4 2 2 5 4 I7
total 15 22 1B T7 B, 80
T freq.
0 15
1 2L
2 27
3 L7
total 80
t40 Capítulo 5 : Variáv eis Bidimensionais
T /A:0 freq. observ.
0 5
1 2
2 4
J 4
total 15
Se houvesse independência entre T e A, o comportamento da variâvel ?
em cada grupo deveria ser o mesmo e, portanto, esperaríamos que as freqüênci
de cada valor de 7 mantivessem a mesma proporcionalidade encontrada na
ilmostra como um todo. Em outras palavras, as duas tabelas acima precisariam ser
parecidas quanto à freqüência relativa. Acrescentamos, na tabela restrita ao grupo
A.:0, uma nova coluna com a freqüência esperada caso a independência se
verifique. Essa coluna foi calculada multiplicando a freqüência relativa do valor
cle ? (em toda a amostra) pela freqüência do grupo. Por exemplo, a freqüência
esperada do valor T:7, no grupo dos Á:0, seria 21180 x 15:3,94. Note
que esta freqüência não precisa ser um número inteiro.
T\Á:0 freq. observ. freq. esperada
0 5 2,87
1 2 3,94
2 4 5,06
3 4 3,19
total 15 15
De modo análogo ao feito para o grupo Á: 0, calculamos as freqüências
esperadas para todas as colunas da tabela de dupla entrada (valores aproximados):
7 \.4 0 1 2 ò 4 total
0 2,Bl 4,13 3,37 3,19 1,50 15
I 3,94 5,77 4,73 4,46 2,r0 27
2 5,06 7,42 6,08 5,74 2,70 27
t
t) 3,19 4,67 3,83 3,61 I,70 17
total 15 22 1B 77 B 80
5,2 Associação entre Variáveis 141
eube agora quantificar se essa tabela está ou não "muito" distante da tabela
ohscrvada. Uma medida usualmente calculada é a seguinte:
Q':D4,
i,i "11
Eonl o,;.i e eii repfesentando, respectivamente, as freqüências observadas e
csl)cradas na linha 'i e coluna j. A medida Q2 usa a diferença entre oi.j e ei.j
elcvada ao quadrado para evitar o cancelamento de termos positivos por
flL:gativos. A divisão pot ei.i objetiva padronizar a medida, relativizando o
tnrrranho da diferença encontrada. Como estamos tratando de observações de
vrrriÍrveis, podem ocorrer flutuações devido à natureza aleatóúa da amostragem e
\u20acrrrrcluiremos pela independência entre essas variáveis, se houver razoáxel
proximidade nas tabelas. Não é difícil perceber que isto significa valores
pe(luenos da medida Q2 e,no Capítulo 8, desenvolveremos um critério estatístico,
piìriÌ tomar a decisão de aceitar a independôncia de duas variáveis. Para este
excrnplo, vamos nos contentar em apresentar o cálculo da medida Q2 que, pelo
tlr:rr valor, consideraremos uma indicação de não independência:
D
No caso de dependência linear e de variáveis quantitativas, existe uma
prrtla medida que é freqüentemente utilizada e será definida, a seguir, para um
corr.junto de dados brutos.
I)t1[iníção 5.4: Correlação entre variáveis num conjunto de dados brutos
Considere um conjunto de dados com n pares de valores para as variáveis
.\ c Y, representados por (ru,g),'í:I,2,...,fr.O coeficiente de correlação
rrrcrlc a dependência linear entre as variáveis e é calculado da seguinte forma:
'n
D@o - r,,r,,)(ar. - a,*,)i,:l
(5-2,81)2 +...+ (4-r,70)2 :12.63.2,81 L,70Q,:
Px,Y 
=
142
ou, em uma forma mais conveniente para cálculo,
Capítulo 5: Variáveis
n,
LrtAt.-TLIohsAobsi:l
, . | ,,\J-ìlca o
88
D"o: 10Bb ,D"?: 151533;i--L i:l
88
Dru:310, tú:12640;i:t i:L
8
D*oro: 43245.i:l
PX,Y:
As expressões anteriores podem ser adaptadas para o caso em que
dados estão agrupados em uma tabela de freqüência. As expressões não
apresentadas aqui, mas acreditamos que podem ser obtidas sem dificuldade.
É possível verificar que o coeficiente de correlação é sempre um nú
entre 
-1 e 1. Um ponto a ser ressaltado, que muitas vezes causa confusão, é
correlação igual a zero não indica independência. Se a correlação é zero, o
podemos dizer é que não existe dependência linear entre as variáveis.
interpretação para os termos presentes no seu cálculo será dada mais adian
quando definiremos coeficiente de correlação para variáveis aleatórias.
Exemplo 5.11: A quantidade de chuva é um fator importante na produtivi
agrícola. Para medir esse efeito foram anotados, para 8 diferentes regi
produtoras de soja, o índice pluviométrico em milímetros (X) e a produção
o, út
uma
,tí'ítt(. Tfutuúll>
çr"ned'u,tt7-D : >
' 
"o-'o 
auxílio o" rr-uofrín[ilf"
-,1, rtÌ''ú'UtA
5.2 Associação entre Variáveis 143
Scgue que r o6, : l-35, 63 e y oo, : 38, 75. Utilizando a expressão de cálculo da
currelação vem que:
PX,Y:
lÌrrtanto, a correlação entre índice pluviométrico e produção é positiva e bastante
titzoável. Desta forma, locais com maior intensidade de chuva tenderiam a ter
tttlior produtividade. tr
Vamos voltar nossa atenção agora paravariâveis aleatórias discretas. Para
elcí'inir medidas de dependência entre elas, precisamos estudar, inicialmente, as
propriedades do valor esperado.
Sejam X e Y duas variáveis aleatórias discretas com distribuição
conjunta p(r,y). As marginais de X e )z serão representadas, repectivamente, por
p(t:) e p(y).
Vamos determinar o valor esperado da variável X +Y:
E(x-+Y): tIt" +üp@,a)r.u
: I D,p@,Ò +L,\un@,u)
TU:E'!J
: I" (t p@,a))+t, (f p(*,Ò)
rUUT
:trp@)+tap@)
X;U
: E(x) + E(Y).
Notc que obtemos essa importante propriedade do valor esperado, sem necessitar
tlc rtcnhuma hipótese adicional sobre as variáveis. Dessa forma, esse resultado
lcrn ampla aplicação e também é válido para mais de duas variáveis.
Considere agora o produto XY. O valor esperado do produto será o
pt'oduto dos valores esperados, sempre que as variáveis forem independentes.
Para X eY variâveis aleatórias discretas independentes, temos:
43245-8x135,63x38,75
t44 Capítulo 5 : Variáveis B idimensionais
E(xY): tL"yp@,a)
r '!l
: I D,*aP@)P@) -$
r lt 
'.ü*
: (T 
'p@)) (Duna) ít ,nf: E(x) E(Y) . \ /t
Exemplo 5.12.' No Exemplo 5.5, o par de variáveis f*,h represenr
respectivamente, a quantidade de poços artesianos e de riachos em sub-regiões
uma certa ârea. A próxima tabela contém os valores das variáveis X f Y e X
com suas probabilidades.
(X,Y) X+Y XY p(r,a)
(0,0) 0 0 L /10(0,1) I 0 2/r0
(0,2) 2 0 2/r0
(1,0 1 0 L/n
(1,1) 2 I 1170
(2,0) 2 0 L/10
(2, 1 tr) 2 L/rc
(2,2) 4 4 r/70
Utilizando a tabela acima, a função de probabilidade de X +Y e a de XY
obtidas sem dificuldade:
(
x+rl 0 L 2 3 4
Para os valores esperados temos:
E(X+Y):18/ro
As distribuições marginais de X e Y jâ
reapresentadas em seguida:
e E(XY) :7lto.
foram calculadas no Exemplo 5.5 e são
5.2 Associação entre Variáveis 145
xl o 1 2
p | 5/10 2/70 slto
vl o t z
pi | 3lt0 4lr0 3lt0
Segue então que E(X) : S/10 e E(Y) : L'
Podemos agora verificar que
E(X +Y) : ISlto: E(X) + E(Y): B/10 + 1, '
isto é, o valor esperado da soma é igual à soma dos valores esperados.
Entretanto, para o produto temos
RE(xY):7lLo+E(x)E(Y): õ * t,
ou seja, o valor esperado do produto de duas variáveis não é igual ao produto de
seus valores esperados. Note que, conforme já havíamos mencionado, as variáveis
aleatórias X eY não são independentes. tr
Na Figura 5.2, apresentamos a expressão do valor esperado da sorra de
variáveis aleatórias.
Fígura 5.2: Valor esperado da soma de vuriáveis aleatórias.
É importante salientar a relação unidirecional de implicação entre a
independência