Buscar

Distribuição t de Student

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 3, do total de 21 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 6, do total de 21 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 9, do total de 21 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Prévia do material em texto

Capítulo I
Introdução 
O presente trabalho da cadeira de Inferência Estatística (IE), aborda assuntos ligados com variáveis aleatórias e distribuições de probabilidades (de uma variável aleatória continua: normal, t-Student, Qui-Quadrado e F de snedecor) e, leitura de tabelas e aplicações. 
A distribuição Normal é a mais importante distribuição de probabilidade para descrever variáveis aleatórias contínuas. Isto justifica-se pelo grande número de aplicações que a utilizam tais como, altura, pressão arterial, medidas de testes psicológicos, tempo de vida útil de um dispositivo electrónico, temperatura corporal, dentre outras. Alem disso, pela sua capacidade de aproximar outras distribuições e também pela grande aplicação na inferência estatística. O uso dessa distribuição de probabilidade exige que a variável aleatória seja contínua.
Objectivos
Objectivo geral:
Desenvolver as variáveis aleatórias e as distribuições de probabilidades contínuas. 
Objectivos específicos: 
Definir as distribuições de probabilidades contínuas;
Demonstrar as distribuições de probabilidades contínuas;
Mostrar as aplicações das distribuições de probabilidades contínuas. 
Capítulo II
2.1. Distribuição normal
A DISTRIBUICAO NORMAL 
A distribuição normal é a mais importante das distribuições continuas de probabilidade porque um grande numero de variáveis aleatórias associadas a experimentos reais tem distribuiçoes de probabilidades que se aproximam da distribuição normal.
Também conhecida, como curva de sino ou de montanha, tem ssua origem associada aos erros de mensuração normalmente observados pelos cientistas nas medições efectivas das grandezas físicas (como distancia, pesos, volumes, etc.).
É sabido que, quando se efectuam repetidas mensurações de determinada grandeza com um aparelho equilibrado, não se chega ao mesmo resultado todas as vezes; obtem-se, ao contrario, um conjunto de valores que oscilam, de modo aproximadamente simétrico, em torno do verdadeiro valor. Construindo o histograma desses valores e o correspondente poligiono de frequência, obtem-se uma poligonal aproximadamente simétrica.
Inicialmente se suponha que todos os fenómenos da vida real devessem ajustar-se a uma curva em forma de sino; em caso contrario, suspeitava-se de alguma normalidade no processo de colecta de dados. Dai a designação de curva normal.
A observação mostrou que essa pertenca da curva, ou distribuição normal, não correspondia a realidade. De facto, não são poucos os exemplos de fenómenos da vida real representados por distribuições nao-normais (curvas assimetricas).
2.2 Características da curva normal	
É um modelo teórico e tem forma de sino ou de montanha;
É simétrica em relação ao ponto central (o de maxima frequencia);
Dada a simetria da distribuição, 50% dos valores são inferiores a media e 50% superiores a ela;
É unimodal, ou seja, no seu pico coincidem a media, a mediana e a moda;
Por ser o padrao de enviesamento e afilamento, tem-se que todos os momentos e os coeficientes de assimetria são iguais a zero e o coeficiente de curtose igual a 0,263;
É assintótica em relação ao eixo horizontal, ou seja, prolonga-se indefinidamente para a esquerda e para a direita sem jamais tocá-lo;
Fica completamente especificada pela media e pelo desvio-padrao da variavel;
Há uma curva normal para cada combinacao de media e desvio –padrao;
Qualquer distancia medida em desvio-padrao ,acima ou abaixo da media ,tem a mesma area sob a curva – ela é simetrica. Com isto a area sob a curva é igual a 1.
2.3 cálculo das probabilidades
As probabilidades associadas a distribuicao normal são dadas pela integral da sua funcao de densidade, dada a seguir:
 ou 
Onde: 	
Como se observa, calcular as áreas (e as probabilidades) pela formula acima não é uma tarefa facil.
Por essa razao, os principais valores foram previamente calculados e os resultados encontram-se na tabela de distribuicao normal.
Distribuicao normal padronizada ou normal reduzida
A montagem da tabela de probabilidades associada a distribuicao normal so é possivel omumapdroizcao. Isso porque na pratica humsere infitde distribuicos normais,cada uma produzida por um par de valores (media e disvio-padrao). A padronizacao é feita adotando-se uma distribuicao particular como referencia e transformando os valores reais em relativos. A distribuicao de referencia-chamada de distribuicao padronizada ou variavel normal padronizada ou variavel normal reduzida ou escala Z ou escore Z-mede o afastamento das variveis em relacao a media em numeros de disvios padroes. É aquela na qual a media de distribuicao é igual a 0 e o desvio padrao é igual a 1.
Calculo do escore Z é feito pela expressao:
 formula para populacao;
 formula para amostra.
Onde: 
Numero de desvios-padroes, a contar da media;
X=Valor qualquer da variavel aleatoria;
Media da distribuicao;
Desvio padrao da distribuicao
Exemplo: a taxa de hemoglobina no sangue de pessoas que gozam de bos saude segue uma distribuicao normal co media 12 e desvio-padrao 1.
Qual a probabilidade de sr encontrar uma pessoa normal com taaaxa de hemoglobina:
Superior a 15?
Inferior a 10?
Entre 10 e 13?
Num grupo de 500 pessoas, em quantas devemos esperar as caracteristicas acima?
Solucao: 	
 
GRAFICO
A variável aleatória contínua X com distribuição Normal tem função de densidade de probabilidade dada por:
 	para 
Onde: média
 Desvio-padrão
 3,14159…
 2,71828
A função densidade mostra exactamente que a média e variância continuam a ser os únicos que podem diferenciar duas distribuições normais. 
A sua média e variância são dadas por
 
 , Respectivamente.
No caso da distribuição normal, também se pode resumir a informação acerca das probabilidades recorrendo a ‘’medidas de localização e dispersão’’ – VALOR MÉDIO e VARIANCIA da distribuição de probabilidades:
 
 
Usaremos a notação , para indicar que a variável aleatória X tem distribuição Normal com parâmetros μ e .
Exemplo1: A concentração de um poluente em água libertada por uma fábrica tem distribuição N(8; 1,5). Qual a chance, de que num dado dia, a concentração do poluente exceda o limite regulatório de 10 ppm?
Resolução:
A resolução do problema resume-se em determinar a proporção da distribuição que está acima de 10 ppm, isto é, Usando a estatística z temos:
Portanto, espera-se que a água libertada pela fábrica exceda os limites regulatórios cerca de 9% do tempo. 
 
Distribuição Gama
Muitas variáveis aleatórias contínuas possuem assimetria (skewness) positiva, ou seja, são distorcidas à direita.
Frequentemente a distorção ocorre quando há um limite físico à esquerda que é relativamente próximo a variação dos dados (Wilks, 1995). Exemplos comuns desta situação são as quantias de precipitação e a velocidade do vento que são fisicamente não negativas.
Há uma variedade de distribuições continuas que são limitadas à esquerda por zero. Entretanto, a distribuição gama é comummente usada para representar dados de precipitação.
A função densidade de probabilidade da distribuição gama é:
onde, é um parâmetro de escala, é o parâmetro de forma, é a função gama ordinária de . A função gama tem as seguintes propriedades:
Para todo 
 para x=1,2,3,….
 para 
1,77245
O valor pode ser obtido, com boa aproximação, através da seguinte relação: A=
A média, a variância, e o coeficiente de assimetria (A) da distribuição gama podem ser obtidos por:
A distribuição gama tem assimetria positiva com o parâmetro diminuindo e o parâmetro aumentando. Variando-se , com constante, muda-se a escala da distribuição, enquanto variando-se , com constante, muda-se a sua forma.
Distribuição t de Student
Admita-se que a variável aleatória e a variável são independentes.
A distribuição de variável aleatória X obtida calculando o quociente designa-se por distribuição t de Student com GL grausde liberdade. O numero de grau de liberdade para um conjunto de dados corresponde ao numero de valores que podem variar apos terem sido impostas certas restrições a todos os valores. Por exemplo, se 10 estudantes tem em um teste nomas com a media 80, podemos atribuir valores arbitrários a 9 delas, mas a 10 fica determinada univocamente. A soma das 10 notas deve ser 800, de modo que a 10 nota deve ser igual a 800 menos a soma das 9 primeiras. Com as 9 primeiras nottas podem ser escolhidas arbitrariamente, dizemos que há 9 graus de liberdade.
Para as aplicações da distribuição, o numero de graus de liberdade é simplesmente o tamanho da amostra menos 1( ).
exemplo: o graifico da distribuição t de student, com 9 graus de liberdade esta representado na figura abaixo.
Determinar os valores de para os quais:
A área sombreada a direita=0,05;
A área sombreada=0,05;
A área não sombreada total (ou em branco) =0,99;
A área sombreada esquerda=0,01;
A area a esquerda de e representa o percentil , 
Solução:
Se a área sombreada a direita é 0,05, então a área a esquerda de é 
(Student foi o pseudónimo utilizado pelo estaticista inglês W.S Gosset que desenvolveu). A função densidade de probabilidade da variável é definida para <pela expressão abaixo demonstrada:
Para determinar a densidade de T considera-se a densidade conjunta do par 
=, com 
Na variável aleatória T tem uma distância t de student ou distribuicao t com ng.l. se a sua densidade é dada por 1.
Como Z2 tem uma distancia X2 com 1g.1.T ainda se pode escrever na forma sendo X2(1) e X2(n) variáveis X2 independentes com 1 e ng.1, respectivamente.
Relativamente ao ponto ao ponto X=0, sendo a sua configuração semelhante a da normal. Mais precisamente a curva y=tem um máximo para X=0 e decresce simetricamente para 0 quando modulo de 
Para n é e para n, V.
Se n=1 a distribuição t transforma-se na distribuicao de Cauchy; se n a distribuicao t de student não tem variância.
Os momentos e , quando existem, podem ser obtidos escrevendo t na forma e fazendo o uso da independência das variáveis x e y 
Então tende a distribuição normal como se reconhece imediatamente.
Exercício: uma fábrica de baterias alega que a mesma tem vida média de 50 meses. Em uma amostra de 25 baterias obteve-se vida media de 48,2 meses. Podemos afirmar que a media da população é menor que 50 meses, ao nível de significância de 5%. 
Resolução 
 
Propriedades da distribuição t de Student:
A função densidade da distribuição t de Student tem a mesma forma em sino da distribuição Normal, mas reflecte a maior variabilidade (com curvas mais alargadas) que é de se esperar em amostras pequenas.
Quanto maior o grau de liberdade, mais a distribuição t de Student se aproxima da distribuição Normal.
 
Abaixo temos um gráfico da função densidade de um t de Student com 10 graus de liberdade.
Exemplo: Considere variáveis aleatórias independentes e com distribuição normal com média e desvio padrão . Então, a variável
	
	
onde é o desvio padrão amostral, tem distribuição de Student com graus de liberdade. Este fato é decorrente do teorema a seguir.
 
Teorema: Considere e duas variáveis aleatórias independentes tal que e . Defina como sendo uma variável aleatória de tal forma que
	
	
Temos que a variável aleatória tem distribuição de Student com graus de liberdade.
Demonstração: A função densidade de probabilidade conjunta de e é dada por:
	
	
	
	
Considerando a transformação
e Y=V
	
	
O jacobiano é e então
	
	
E, 
	
	
Na sequência, ao fazermos a mudança de variável 
,
	
	
obtemos que 
	
	
que é a função densidade de probabilidade de uma distribuição t com k graus de liberdade.
Tabela t (student)
	gl/P
	0,90
	0,80
	0,70
	0,60
	0,50
	0,40
	0,30
	0,20
	0,10
	0,05
	0,02
	0,01
	0,001
	01
	0,158
	0,325
	0,510
	0,727
	1,000
	1,376
	1,963
	3,078
	6,314
	12,706
	31,821
	63,657
	636,619
	02
	0,142
	0,289
	0,445
	0,617
	0,816
	1,061
	1,386
	1,886
	2,920
	4,303
	6,965
	9,925
	31,598
	03
	0,137
	0,277
	0,424
	0,584
	0,765
	0,978
	1,250
	1,638
	2,353
	3,182
	4,541
	5,541
	12,924
	04
	0,134
	0,271
	0,414
	0,569
	0,741
	0,941
	1,190
	1,533
	2,132
	2,776
	3,747
	4,604
	8,610
	05
	0,132
	0,267
	0,408
	0,559
	0,727
	0,920
	1,156
	1,476
	2,015
	2,571
	3,365
	4,032
	6,869
	06
	0,131
	0,265
	0,404
	0,553
	0,718
	0,906
	1,134
	1,440
	1,943
	2,447
	3,143
	3,707
	5,959
	07
	0,130
	0,263
	0,402
	0,549
	0,711
	0,896
	1,119
	1,415
	1,895
	2,365
	2,365
	3,499
	5,408
	08
	0,130
	0,262
	0,399
	0,546
	0,706
	0,889
	1,108
	1,397
	1,860
	2,306
	2,896
	3,355
	5,041
	09
	0,129
	0,261
	0,398
	0,543
	0,703
	0,883
	1,100
	1,383
	1,833
	2,262
	2,821
	3,250
	4,781
	10
	0,129
	0,260
	0,397
	0,542
	0,700
	0,879
	1,093
	1,372
	1,812
	2,228
	2,764
	3,169
	4,587
	11
	0,129
	0,260
	0,396
	0,540
	0,697
	0,876
	1,088
	1,363
	1,796
	2,201
	2,718
	3,106
	4,437
	12
	0,128
	0,259
	0,395
	0,539
	0,695
	0,873
	1,083
	1,356
	1,782
	2,179
	2,681
	3,055
	4,318
	13
	0,128
	0,259
	0,394
	0,538
	0,694
	0,870
	1,079
	1,350
	1,771
	2,160
	2,650
	3,012
	4,221
	14
	0,128
	0,258
	0,393
	0,537
	0,692
	0,868
	1,076
	1,345
	1,761
	2,145
	2,624
	2,977
	4,140
	15
	0,128
	0,258
	0,393
	0,536
	0,691
	0,866
	1,074
	1,341
	1,753
	2,131
	2,602
	2,947
	4,073
	16
	0,128
	0,258
	0,392
	0,535
	0,690
	0,865
	1,071
	1,337
	1,746
	2,120
	2,583
	2,921
	4,015
	17
	0,128
	0,257
	0,392
	0,534
	0,689
	0,863
	1,069
	1,333
	1,740
	2,110
	2,567
	2,898
	3,965
	18
	0,127
	0,257
	0,392
	0,534
	0,688
	0,862
	1,067
	1,330
	1,734
	2,101
	2,552
	2,878
	3,922
	19
	0,127
	0,257
	0,391
	0,533
	0,688
	0,861
	1,066
	1,328
	1,729
	2,093
	2,539
	2,861
	3,883
	20
	0,127
	0,257
	0,391
	0,533
	0,687
	0,860
	1,064
	1,325
	1,725
	2,086
	2,528
	2,845
	3,850
	21
	0,127
	0,257
	0,391
	0,532
	0,686
	0,859
	1,063
	1,323
	1,721
	2,080
	2,518
	2,831
	3,819
	22
	0,127
	0,256
	0,390
	0,532
	0,686
	0,858
	1,061
	1,321
	1,717
	2,074
	2,508
	2,819
	3,792
	23
	0,127
	0,256
	0,390
	0,532
	0,685
	0,858
	1,060
	1,319
	1,714
	2,069
	2,500
	2,807
	3,767
	24
	0,127
	0,256
	0,390
	0,531
	0,685
	0,857
	1,059
	1,318
	1,711
	2,064
	2,492
	2,797
	3,745
	25
	0,127
	0,256
	0,390
	0,531
	0,684
	0,856
	1,058
	1,316
	1,708
	2,060
	2,485
	2,787
	3,726
	26
	0,127
	0,256
	0,390
	0,531
	0,684
	0,856
	1,058
	1,315
	1,706
	2,056
	2,479
	2,779
	3,707
	27
	0,127
	0,256
	0,389
	0,531
	0,684
	0,856
	1,057
	1,314
	1,703
	2,052
	2,473
	2,771
	3,690
	30
	0,127
	0,256
	0,389
	0,530
	0,683
	0,854
	1,055
	1,310
	1,697
	2,042
	2,457
	2,750
	3,646
	40
	0,126
	0,255
	0,388
	0,529
	0,681
	0,851
	1,050
	1,303
	1,684
	2,021
	2,423
	2,704
	3,551
	i
	0,126
	0,253
	0,385
	0,524
	0,674
	0,842
	1,036
	1,282
	1,645
	1,960
	2,326
	2,576
	3,291
Distribuição Qui-Quadrado
Considera-se um conjunto de G.L variáveis aleatórias , obedecendo as seguintes condições:
Cada variável segue uma distribuição normal padronizada
As variáveis , são mutuamente independentes (os valores que cada uma toma não são condicionados pelos valores das restantes). 
A variável aleatória x, constituída a partir da soma de G.L variáveis , elevadas ao quadrado, segue-se uma distribuição Qui-Quadrado com G.L graus de liberdade .
 Com .
Grau de liberdade corresponde ao número de parcelas incluídas na expressão: função de probabilidade.
=, Com onde:
Onde argumento = se designa função gama
 = com .
Os valores de , implica ser obtidos calculando esta integral, onde remete-nos=
=
Media de distribuição: 
Variância de distribuição: 
Função Geradora de Momentos, Valor Esperado e Variância
Como visto no Teorema 6.3.1, se X é uma variável aleatória com distribuição Qui-Quadrado com v graus de liberdades, sua função geradora de momentos é dada por:
	
	
Desta forma, temos que
e 
	
	
Portanto, podemos calcular o valor de esperado e a variância da variável X. De fato, temos que 
 e 
	
	
de onde concluímos que
	
	
Distribuição F de Snedecor
A distribuição F de Snedecor também conhecida como distribuição de Fisher é frequentemente utilizada na inferência estatística para análise da variância, mais detalhes pode ser encontrado na apostila de inferência.
Definição: uma variável aleatória contínua tem distribuição de Snedecor com graus de liberdade no numerador e graus de liberdade no denominador se sua função densidade de probabilidade é definida por:
Sejam e duas variáveis aleatórias independentes com distribuicao Qui-Quadrado.
Define-se distribuicao F com parâmetros e (de liberdade do numerador e = grau de liberdade do denominador; como:
 Onde: 
Neste caso, utilizamos a notação .
Observe: >0
Média da distribuicao: 
O gráfico abaixo ilustra a função densidade da distribuição de Snedecor com parâmetros e 
Exemplo: Um importante exemplo da distribuição de Snedecor corresponde a estatística : Suponha que temos duas populações independentes tendo distribuições normais com variâncias iguais a . Considere  uma amostra aleatória da primeira população com observações e  uma amostra aleatória da segunda população com observações. Então, a estatística
	
	
tem distribuição de Snedecor com graus de liberdade no numerador e graus de liberdade no denominador, ondee sãos os desvios padrão amostrais da primeira e da segunda amostra, respectivamente.
Teorema 6.6.1: Considere e  variáveis aleatórias com distribuição Qui-Quadrado com e graus de liberdade, respectivamente. Além disso, suponha que estas variáveis aleatórias são independentes. Então a variável aleatória
	
	
tem distribuição de Snedecor com graus de liberdade no numerador e graus de liberdade no denominador.
Demonstração: Seja uma variável aleatória positiva com função densidade de probabilidade e Y uma variável aleatória com função densidade Suponha que as variáveis aleatórias X e Y sejam independentes. Neste caso, a função densidade de probabilidade conjunta é dada por . Considere a fracção . Neste caso, a função densidade conjunta do quociente é dada por:
	
	
em que . Assim temos que 
	
	
Considerando a mudança de variável ; temos que:
	
	
Assim, a função densidade de probabilidade de Z é dada por
	
	
 Como X e Y são independentes, a distribuição conjunta do quociente é dada por
	
	
Portanto a distribuição do quociente , com e é dada por:
	
	
de onde concluímos que
	
	
Lembrando que . Fazendo a substituição e reorganizando a integral acima temos que:
	
	
Para finalizar, tomamos e, neste caso, temos que 
	
	
Ao realizarmos a transformação de variáveis , concluímos que
	
	
Ao substituirmos, concluímos que segue uma distribuição com graus de liberdade no numerador e graus de liberdade no denominador.
Capítulo III
Conclusão
Durante o debruçar dos conteúdos aqui expostos, conclui-se que as distribuições contínuas estão em total contraste com as distribuições discretas, a definição pode ser paradoxal, mas, conceitualmente, é o mesmo que considerar um intervalo não degenerado de números reais e cada ponto deste mesmo intervalo. A distribuição Normal é a mais importante distribuição de probabilidade para descrever variáveis aleatórias contínuas. Há uma variedade de distribuições contínuas que são limitadas à esquerda por zero. Entretanto, a distribuição gama é comummente usada para representar dados de precipitação. 
Referencias Bibliográficas
 GUIMARAES, Rui Campos e CABRAL, José A.S. Estatística, Edição revista, Lisboa
 1997, pp. 207-215. 
MARTINS, Gilberto de Andrade, Estatística geral e aplicada, 3edicao. Atlas. SA. São Paulo
 2009, pp. 140-157.
MELLO, F. Galvão de. Probabilidades e estatística conceitos e métodos fundamentais. 
 Editora Escolar. Vol1. Lisboa.

Continue navegando