Buscar

Aula 5 - Variáveis Aleatórias Contínuas

Prévia do material em texto

Variáveis aleatórias contínuas
Voltemos agora nossa atenção para descrever a distribuição de probabilidade de uma variável aleatória (v.a.) que pode assumir todos os valores em um intervalo. Medidas de altura, temperatura, peso, produção de leite, pressão arterial, etc, são todas deste tipo.
A distribuição de probabilidade de uma v.a. contínua pode ser visualizada como uma forma alisada de um histograma baseado em um grande número de observações, cuja área total de todos os retângulos é igual a 1,0 [a altura do retângulo em cada intervalo de classe ((i) é proporcional à densidade de proporção (fi/(i) do intervalo, de modo que a área do retângulo é igual (i.fi/(i = fi]. Ou seja, com um número suficientemente grande de observações, diminuindo-se os intervalos de classe, o histograma tende ficar cada vez menos irregular, até aproximar da forma de uma curva bem mais suave. Isto é ilustrado na Figura 1, considerando a variável X = peso de recém-nascido.
Como probabilidade é interpretada como a freqüência relativa de um evento em uma longa série de ensaios independentes, a curva obtida como a forma limite dos histogramas (Figura 1c), representa a maneira pela qual a probabilidade total (1,0) é distribuída em relação à amplitude dos possíveis valores da v.a. X. A função matemática f(x), cujo gráfico produz tal curva é chamada função densidade de probabilidade da v.a. contínua X.
A função densidade de probabilidade, f(x), a qual descreve a distribuição de probabilidade para uma v.a. aleatória contínua, têm as propriedades:
 a área total sob a curva é igual a 1;
 P(a ( X ( b) = área sob a curva entre os pontos a e b;
 f(x) ( 0 (não negativa)
(d) P(X = xi ) = 0
“Com variáveis aleatórias contínuas, a probabilidade que X = xi é sempre zero [P(X = xi) = 0]. Assim, é somente relevante falar a respeito da probabilidade que X encontra-se em um intervalo”.
A dedução P(X = xi) = 0 necessita alguns esclarecimentos. No contexto do exemplo do peso ao nascer, a afirmação P(X = 8,5 lb) = 0, parece irreal, pois significa que nenhum recém-nascido pode pesar 8,5 lb. Para resolver este paradoxo, devemos reconhecer que a acurácia do esquema de medida é limitada, tal que o número 8,5 é indistinguível de todos aqueles que o circunda, digamos [8,495; 8,505]. Assim, a questão diz respeito à probabilidade de um intervalo circundando 8,5 e a área deste intervalo sob a curva não é maior do que zero. 
Histograma de 100 pesos ao nascer com intervalos de classe de 1 libra (= 453,6g)
Histograma de 5000 pesos ao nascer com intervalos de classe de 0,25 libras.
Curva de densidade de probabilidade para a variável aleatória contínua X = peso ao nascer.
Figura 1. Curva de densidade de probabilidade vista como uma forma limite de histogramas.
Estando f(x) de uma variável aleatória contínua X especificada, o problema de se calcular P(a ( X ( b), vem a ser o cálculo da área sob a curva. Tal determinação envolve cálculo integral. Mas, felizmente, áreas de distribuições importantes estão tabuladas e disponíveis para consulta. 
No cálculo da probabilidade de um intervalo, a até b, não há necessidade de se preocupar se qualquer um dos extremos ou ambos estão incluídos no intervalo. Com P(X = a) = P(X = b) = 0,
P(a ( X ( b) = P(a < X ( b) = P(a ( X < b) = P(a < X < b)
Valem para as v.a contínuas, os conceitos de esperança (() e variância ((2). Suas determinações, entretanto, exigem a aplicação de método de cálculo integral que não será aqui utilizado.
Dada uma v.a. X contínua, interessa saber qual a f(x). Alguns modelos são freqüentemente usados para representar a função densidade de probabilidade (f.d.p.) de v.a. contínuas. O mais utilizado é descrito a seguir:
Distribuição Normal
Definição: Uma v.a. X tem distribuição normal com parâmetros ( e (2, -( < ( < ( e 0 < (2 < ( , se sua f.d.p. é dada por:
 
, -( < x < (
onde: ( = 3,14159...; e = 2,71828 ...
Gráfico
Propriedades
Os parâmetros ( e (2 representam, respectivamente, a média e a variância da distribuição, isto é, E(X) = ( e Var(X) = (2. A demonstração requer manipulações de integral e não será apresentada aqui.
Outras propriedades, enumeradas a seguir, podem ser facilmente observadas de seu gráfico:
f(x) ( 0 quando x ( ((
( ( ( e ( + ( são pontos de inflexão de f(x)
x = ( é o ponto de máximo de f(x) e o valor máximo é 
 
f(x) é simétrica ao redor de x = (, isto é, f(( + x) = f(( - x), para todo -( < x < (
média = moda = mediana
Os intervalos ( ( (, ( ( 2( e ( ( 3(, têm, respectivamente, as probabilidades de 0, 683, 0,954 e 0,997, ou seja:
 Distribuição normal
Se X tem distribuição normal, com média ( e variância (2, denota-se por:
X : N ((, (2)
Interpretando os parâmetros
Duas distribuições normais com diferentes médias, mas com o mesmo desvio padrão (()
Três distribuições normais com médias iguais, mas com diferentes desvios padrões ((). Decrescendo (, aumenta a altura máxima 
) e a concentração de probabilidade em torno de (.
Exemplo 1. Considere dois grupos de frangos de corte criados em uma granja no sul de Minas Gerais, comparáveis em todos os aspectos, exceto pela linhagem. 
	O gráfico ilustra o ganho de peso dessas populações e permite afirmar que:
( ) a média aritmética e a variância da Linhagem I são superiores às da Linhagem II.
( ) a média aritmética da Linhagem I é superior à da II e as variâncias são iguais.
( ) as médias aritméticas são iguais e a variância da Linhagem I é superior à da II.
(x) as médias aritméticas são iguais e a variância da Linhagem I é inferior à da II.
( ) a média aritmética e a variância da Linhagem I são inferiores às da Linhagem II.
�
Distribuição normal padronizada
A distribuição dada por (1) representa uma família de distribuições, dependendo dos valores ( e (2. A particular distribuição normal com ( = 0 e 
 é referida como distribuição normal padronizada ou reduzida. Sua média e variância coincidem com as da variável
 (2)
onde X : N((, (2)
A variável Z é chamada variável normal padronizada, cuja função densidade pode ser obtida de (1), fazendo-se formalmente ( = 0 e ( = 1, isto é:
 (-( < z < ()
Se X: N((, (2), então a variável aleatória Z definida por (2) terá uma distribuição N(0, 1). Mostraremos que Z tem média 0 e variância 1:
mas, não é fácil é mostrar que Z tem distribuição normal e não será demonstrado aqui.
A curva normal padrão, f(z), é também simétrica em torno de (z e as áreas sob a curva nos intervalos de (1 a +1(( ( (), (2 a +2 (( ( 2() e (3 a +3 (( ( 3(), são também iguais a, respectivamente, 68,3%, 95,4% e 99,7% da área total, que é 1.
A vantagem de se usar a variável Z é que as áreas, ou as probabilidades, associadas à distribuição normal padronizada são tabeladas (ver Tabela 2). Assim, a transformação (2) é fundamental para o cálculo de probabilidades relativas a uma distribuição normal qualquer.
Aplicação
Suponha que X : N((, (2) e queiramos determinar P(a < X < b), tal como representado na figura a seguir:
Por exemplo, tomando a = 2 e b = 5 e supondo que X : N(3, 16), calculemos 
P(2 ( X ( 5) 
Vejamos, antes, como obter probabilidades a partir da Tabela 2 para a distribuição N(0,1).
A figura abaixo ilustra a probabilidade fornecida pela tabela, ou seja, 
 P(0 ( Z ( zc)
Se zc = 1,73
P(0 ( Z ( 1,73) = 0,4582
Observe:
 P(-1,73 ( Z ( 0 ) = P(0 ( Z ( 1,73) = 0,4582, devido à simetria da curva
 P(Z ( 1,73) = 0,5 – P(0 ( Z ( 1,73) = 0,5 – 0,4582 = 0,0418
 P(Z < -1,73) = P(Z > 1,73) = 0,0418
 P(Z ( 1,73) = P(Z ( -1,73) = P(0 ( Z ( 1,73) + P(Z < 0) = 0,4582 + 0,5 = 0,9582
 P(0,47 ( Z ( 1,73) = P(0 ( Z ( 1,73) - P(0 ( Z ( 0,47) = 0,4582 – 0,1808 = 
 = 0,2774
Para usar a Tabela 2 em conexão com uma variável aleatória X, tendo distribuição normal, deve-se efetuar a mudançade escala 
. Assim, no exemplo, 
P(2 ( X ( 5) = P(
( 
 ( 
)
 = P(
( Z (
) = P(-1/4 ( Z ( 1/2)
Pela tabela N(0,1):
P(-0,25 ( Z ( 0,5) = P(-0,25 ( Z ( 0) + P(0 < Z ( 0,5)
P(-0,25 ( Z ( 0,5) = 0,0987 + 0,1915 = 0,2902 ou seja, 
P(2 ( x ( 5) = 0,2902
Exemplo 1. Sabendo-se que os pesos à desmama (X) de 10.000 bezerros de um rebanho são distribuídos normalmente, com média (µ) 170 kg e desvio padrão (() 5 kg, (a) qual é o número esperado de bezerros com peso superior a 165 kg?; e (b) que peso (x) deve atingir um bezerro para que ele supere 80% dos pesos à desmama desse rebanho?
 
Solução:
(a) P(X > 165) = 
 P(Z > -1) = P(-1< Z ( 0) + P(Z > 0) =
 
 = 0,3413 + 0,5 = 0,8413
Portanto, o número esperado é 10.000 x 0,8413 ( 8.413 bezerros.
(b) P( X ( 170) + P(170 < X ( x) = 0,80 
 
 0,5 + P(170 < X ( x) = 0,80 
 
 P(170 < X ( x) = 0,30 e P(X ≥ x) = 0,20
 
 P(170 < X ( x) = 
= 
 e
 P(X ≥ x) = 0,5 - 
 zc = 
 ( x = 174,2kg
Aproximação Normal à Binomial
Se X tem distribuição binomial b(n, p), onde n é grande e p não é muito próximo de 0 ou 1, a distribuição da variável padronizada 
 é aproximadamente N(0,1). Assim,
P(a ( X ( b) = 
 
P(a ( X ( b) 
Tendo em vista que uma distribuição discreta (binomial) é aproximada por uma 
contínua (normal), a melhor aproximação é obtida calculando:
P(a ( X ( b) 
 
Dividindo-se os numeradores e denominadores do intervalo de Z por n, pode-se também escrever:
 
P(a ( X ( b) 
O termo ±1/(2n) é chamado “correção de continuidade”.
Exemplo 2. Supondo que X : b(15, 0,4)
P(7 ( X ( 10) = 
 P(7 ( X ( 10) 
 
Usando correção de continuidade:
 
 
Para justificar a correção de continuidade, basta atentar para a Figura 2.
Figura 2. Histograma da distribuição binomial b(15, 0,4) e a curva normal aproximada.
A distribuição normal pode ser recomendada para aproximar probabilidades binomiais, mesmo para n tão pequeno quanto 15, contanto que p seja próximo de 1/2. Quando p é muito pequeno e n é grande, a distribuição de Poisson é mais apropriada. Como uma norma prática, n pode ser assumido como “suficientemente” grande para se usar a distribuição normal, quando [np(1-p)] ( 3, sendo que a aproximação melhora com o crescimento de n.
(
(
(
_1092661669.unknown
_1218282115.unknown
_1363414811.unknown
_1363415376.unknown
_1394864034.unknown
_1394864093.unknown
_1363415401.unknown
_1363415362.unknown
_1363176007.unknown
_1363176213.unknown
_1331992602.unknown
_1153144310.unknown
_1153144499.unknown
_1110025318.unknown
_1027517733.unknown
_1061035697.unknown
_1078299777.unknown
_1078300475.unknown
_1092661457.unknown
_1078300176.unknown
_1061035733.unknown
_1061035743.unknown
_1061035718.unknown
_1027779461.unknown
_1029657118.unknown
_1027778612.doc
_1027165603.unknown
_1027165620.unknown
_1026827258.unknown
_1026827268.unknown
_1018875192.xls
Gráfico2
		10		10
		15		15
		0.001935725		20
		0.0047526235		25
		0.0120530025		0.0020881488
		0.0249102455		0.00638207
		0.0389879883		0.047662218
		0.0453268682		0.1017354535
		0.0389879883		0.047662218
		0.0249102455		0.00638207
		0.0120530025		0.0020881488
		0.0047526235		65
		0.001935725		70
Linhagem I
Linhagem II
Curva II
Curva I
Ganho de Peso (kg)
Freqüência
Plan1
		65		0
		
		65		(2/(2,5066*21,09))*EXP-((a3-79,61)/(2*444,64)
		
		65		0
		
		30		0.0164290212		1.0165647197		0.1766187813
		35		0.0895218604		1.0936512407		0.1900118562
		40		0.0557867039		1.0573721263		0.1837086933
		45		0.0501641778		1.0514437059		0.1826786848
		50		0.0445416517		1.0455485246		0.1816544512
		55		0.0389191256		1.0396863962		0.1806359602
		60		0.0332965995		1.0338571353		0.1796231797
		67		0.0276740734		1.0280605575		0.1786160775
		68		0.0220515473		1.0222964798		0.177614622
		69		0.0141800108		1.014281024		0.1762220102
		70		0.0130555056		1.0131411008		0.176023959
		71		0.0119310004		1.0120024587		0.1758261304
		72		0.0108064951		1.0108650962		0.1756285241
		73		0.0096819899		1.009729012		0.1754311399
		74		0.0085574847		1.0085942046		0.1752339776
		75		0.0074329795		1.0074606727		0.1750370368
		76		0.0063084743		1.0063284146		0.1748403174
		77		0.0051839691		1.0051974291		0.174643819
		78		0.0040594638		1.0040677146		0.1744475415
		79		0.0029349586		1.0029392698		0.1742514846
		80		0.0018104534		1.0018120933		0.174055648
		81		0.0006859482		1.0006861835		0.1738600315
		82		-0.000438557		0.9995615391		0.1736646349
		83		-0.0015630623		0.9984381587		0.1734694579
		84		-0.0026875675		0.9973160408		0.1732745002
		85		-0.0038120727		0.996195184		0.1730797616
		86		-0.0049365779		0.995075587		0.1728852419
		87		-0.0060610831		0.9939572482		0.0376041768
		88		-0.0071855883		0.9928401663		0.0375619145
		89		-0.0083100936		0.9917243398		0.0375196996
		90		-0.0094345988		0.9906097674		0.0374775322
				-0.010559104		0.9894964476		0.0374354122
				-0.0116836092		0.9883843791		0.0373933396
Plan2
		
		
		Curva II
		Eixo X		Média		Desvio
		10		45		9		-35		1225		-7.5617283951		0.0005199757				22.5596808488		0.0443268682				0.0000230489		0.0010230489
		15		45		9		-30		900		-5.5555555556		0.0038659201				22.5596808488		0.0443268682				0.0001713641		0.0011713641
		20		45		9		-25		625		-3.8580246914		0.0211096565				22.5596808488		0.0443268682				0.000935725		0.001935725
		25		45		9		-20		400		-2.4691358025		0.0846579886				22.5596808488		0.0443268682				0.0037526235		0.0047526235
		30		45		9		-15		225		-1.3888888889		0.2493522088				22.5596808488		0.0443268682				0.0110530025		0.0120530025
		35		45		9		-10		100		-0.6172839506		0.5394075072				22.5596808488		0.0443268682				0.0239102455		0.0249102455
		40		45		9		-5		25		-0.1543209877		0.8569968914				22.5596808488		0.0443268682				0.0379879883		0.0389879883
		45		45		9		0		0		0		1				22.5596808488		0.0443268682				0.0443268682		0.0453268682
		50		45		9		5		25		-0.1543209877		0.8569968914				22.5596808488		0.0443268682				0.0379879883		0.0389879883
		55		45		9		10		100		-0.6172839506		0.5394075072				22.5596808488		0.0443268682				0.0239102455		0.0249102455
		60		45		9		15		225		-1.3888888889		0.2493522088				22.5596808488		0.0443268682				0.0110530025		0.0120530025
		65		45		9		20		400		-2.4691358025		0.0846579886				22.5596808488		0.0443268682				0.0037526235		0.0047526235
		70		45		9		25		625		-3.8580246914		0.0211096565				22.5596808488		0.0443268682				0.000935725		0.001935725
		
		
		Curva I
		Eixo X		Média		Desvio
		10		45		4		-35		1225		-38.28125		0				10.0265248217		0.0997354535				0		0.002
		15		45		4		-30		900		-28.125		0				10.0265248217		0.0997354535				0		0.002
		20		45		4		-25		625		-19.53125		0.0000000033				10.0265248217		0.0997354535				0.0000000003		0.0020000003
		25		45		4		-20		400		-12.5		0.0000037267				10.0265248217		0.0997354535				0.0000003717		0.0020003717
		30		45		4		-15		225		-7.03125		0.0008838263				10.0265248217		0.0997354535				0.0000881488		0.0020881488
		35		45		4		-10		100		-3.125		0.0439369336				10.0265248217		0.0997354535				0.00438207		0.00638207
		40		45		4		-5		25		-0.78125		0.4578333618				10.0265248217		0.0997354535				0.045662218		0.047662218
		45		45		4		0		0		0		1				10.0265248217		0.0997354535				0.0997354535		0.1017354535
		50		45		4		5		25		-0.78125		0.4578333618				10.0265248217		0.0997354535				0.045662218		0.047662218
		55		45		4		10		100		-3.125		0.0439369336				10.0265248217		0.0997354535				0.00438207		0.00638207
		60		45		4		15		225		-7.03125		0.0008838263				10.0265248217		0.0997354535				0.0000881488		0.0020881488
		65		45		4		20		400		-12.5		0.0000037267				10.0265248217		0.0997354535				0.0000003717		0.002000371770		45		4		25		625		-19.53125		0.0000000033				10.0265248217		0.0997354535				0.0000000003		0.0020000003
		
		
		
		
		
		
		
				Curva II		Curva I
		10
		15
		20		0.001935725
		25		0.0047526235
		30		0.0120530025		0.0020881488
		35		0.0249102455		0.00638207
		40		0.0389879883		0.047662218
		45		0.0453268682		0.1017354535
		50		0.0389879883		0.047662218
		55		0.0249102455		0.00638207
		60		0.0120530025		0.0020881488
		65		0.0047526235
		70		0.001935725
Plan2
		1
Plan3
		1		1		1
Plan4
		1
Plan5
		1
Plan6
		1
Plan7
		1
Plan8
		0		0
		0		0
		0		0
		0		0
		0		0
		0		0
		0		0
		0		0
		0		0
		0		0
		0		0
		0		0
		0		0
Curva II
Curva I
Plan9
		0		0
		0		0
		0		0
		0		0
		0		0
		0		0
		0		0
		0		0
		0		0
		0		0
		0		0
		0		0
		0		0
Curva I
Curva II
Curva II
Curva I
Ganho de Peso (kg)
Freq.
Plan10
		
Plan11
		
Plan12
		
Plan13
		
Plan14
		
Plan15
		
Plan16

Continue navegando