Estatistica usado o R
224 pág.

Estatistica usado o R


DisciplinaBioestatística I4.695 materiais35.013 seguidores
Pré-visualização50 páginas
medias.3, pch=19)
ic.3<-cbind(medias.3-(qnorm(0.975)*sqrt(var.pop(notas)/3)), medias.3,
medias.3+(qnorm(0.975)*sqrt(var.pop(notas)/3)))
length(c(which(mean(notas)<ic.3[,1]), which(mean(notas)>ic.3[,3])))
17
6. Nós vimos que com a média das variâncias das amostras usando S 2 obtemos um
resultado enviesado, isto é, diferente da verdadeira variância da população de notas:
> mean(var.2.pop)
[1] 0.55545
> mean(var.3.pop)
[1] 0.7406
Baseado no que nós discutimos existe alguma maneira de se obter a variância da população
a partir desses valores?
7. Nós vimos na aula teórica que a média amostral é um estimador consistente, ou seja, ela:
\u2013 É assintoticamente não-enviesada (aliás ela é não-enviesada mesmo, não só assintoticamente)
\u2013 Sua variância tende para zero quando o tamanho da amostra tende para o infinito
Mostre graficamente essa segunda condição para um caso onde a variância da população
seja conhecida
8. A fdp de uma distribuição t de Student é dada por:
f \ue09e t\ue09f=
\ue0ac\ue09e\ue0c3\ue083 12\ue09f
\ue0ac\ue09e \ue0c32\ue09f
1
\ue0c3\ue0c6 \ue09e1\ue083 t2\ue0c3\ue09f\u2212 \ue0c3\ue08312 , onde \ue0c3 são os graus de liberdade e \ue0ac é a
função gama. Pode ser mostrado que para uma distribuição t com \ue0c3 > 2, sua média é fixa e igual
a zero e sua variância é dada por: 
\ue0c3
\ue0c3\u22122 . Mostre porque a distribuição t torna-se bastante
semelhante a uma Normal quando \ue0c3\ue08c\u221e . Dica: uma maneira de mostrar isso é usando a função
curve() para comparar gráficos de Normais e t's.
18
Exercícios - Respostas
Aula 3 \u2013 Distribuições amostrais
Livro: NA
1. Reveja a função que nós usamos para mostrar o TLC, histo.mean. Todas as linhas dessa
função estão comentadas. Você seria capaz de explicar a seguinte linha com o seu
respectivo comentário?
z[i] <- mean(sample(x,n)) #O verdadeiro truque
O que significa esse \u201cverdadeiro truque\u201d?
Esse truque é apenas a escolha aleatória de uma amostra de tamanho n do vetor x ,
aproveitando para se calcular a média de cada uma dessas amostras, que são guardadas em um vetor
z. Com isso, não é necessário armazenar cada uma das amostras, mas apenas os valores das suas
médias. Essa é uma boa aplicação da função sample().
2. Escolha duas distribuições, uma discreta e uma contínua, gere 1000 valores destas
distribuições e use o mesmo código que nós usamos para a Bernoulli na Aula para gerar
uma seqüência de histogramas, o primeiro com a distribuição gerada e os demais com as
distribuições das médias amostrais para um número crescente de tamanho da amostra.
Mostre os gráficos e descreva o que está acontecendo. Dicas: 1) Consulte a Tabela 1.1 da
Aula 1 para recordar algumas distribuições disponíveis no R (ou, claro, use um outro
programa qualquer para gerá-las); 2) O código ao qual estamos nos referindo é:
par(mfrow=c(3,3))
hist(x)
histo.mean(x)
histo.mean(x,5)
histo.mean(x,10)
histo.mean(x,15)
histo.mean(x,20)
histo.mean(x,25)
histo.mean(x,30)
histo.mean(x,100)
par(mfrow=c(1,1))x<-rpois(1000, 3)
Esse exercício é apenas uma aplicação direta de conhecimentos e o resultado será o mesmo
que o discutido em aula. Por exemplo, vamos fazer para uma Qui-quadrada com 2 graus de
liberdade e para uma Poisson com média 3:
x <- rchisq(1000, df=2)
x <- rpois(1000, lambda=3)
Aplicando o código acima, você visualizaria o mesmo conjunto de gráficos que vimos na
aula e com a mesma tendência de aproximação da média amostral da média verdadeira e
diminuição da dispersão da distribuição da média amostral, por alcunha o erro-padrão.
Os gráficos:
Para a Qui-quadrada:
1
Para a Poisson:
3. Explique com as suas palavras o que o código abaixo faz:
par(mfrow=c(1,3))
hist(notas, freq=F, breaks=seq(4,10), ylim=c(0,0.8))
curve(dnorm(x,7.01,1.111006), from=4, to=10, add=T)
2
Histogram of x
x
0 5 10 15
0
10
0
20
0
30
0
40
0
50
0
60
0
Histograma da média amostral de x
z
0 2 4 6 8 10
0
50
10
0
15
0
Histograma da média amostral de x
z
0 1 2 3 4 5
0
20
40
60
80
10
0
12
0
Histograma da média amostral de x
z
1 2 3 4
0
50
10
0
15
0
Histograma da média amostral de x
z
1 2 3 4
0
50
10
0
15
0
20
0
Histograma da média amostral de x
z
1.0 1.5 2.0 2.5 3.0 3.5
0
20
40
60
80
Histograma da média amostral de x
z
1.0 1.5 2.0 2.5 3.0 3.5
0
20
40
60
80
10
0
Histograma da média amostral de x
z
1.0 1.5 2.0 2.5 3.0 3.5
0
20
40
60
80
10
0
Histograma da média amostral de x
z
1.6 1.8 2.0 2.2 2.4 2.6
0
20
40
60
80
10
0
Histogram of x
x
0 2 4 6 8
0
50
10
0
15
0
20
0
Histograma da média amostral de x
z
0 2 4 6 8
0
50
10
0
15
0
Histograma da média amostral de x
z
1 2 3 4 5 6
0
20
40
60
80
10
0
14
0
Histograma da média amostral de x
z
2.0 2.5 3.0 3.5 4.0 4.5
0
20
40
60
Histograma da média amostral de x
z
2.0 2.5 3.0 3.5 4.0 4.5
0
20
40
60
80
Histograma da média amostral de x
z
2.0 2.5 3.0 3.5 4.0
0
20
40
60
80
10
0
Histograma da média amostral de x
z
2.0 2.5 3.0 3.5 4.0
0
20
40
60
80
10
0
Histograma da média amostral de x
z
2.0 2.5 3.0 3.5 4.0
0
20
40
60
80
10
0
14
0 Histograma da média amostral de x
z
2.6 2.8 3.0 3.2 3.4 3.6
0
20
40
60
80
10
0
12
0
hist(medias.2, freq=F, breaks=seq(4,10), ylim=c(0,0.8))
curve(dnorm(x,7.01,sqrt(1.111006/2)), from=4, to=10, add=T)
hist(medias.3, freq=F, breaks=seq(4,10), ylim=c(0,0.8))
curve(dnorm(x,7.01,sqrt(1.111006/3)), from=4, to=10, add=T)
par(mfrow=c(1,1))
Nota: Não é para explicar o código, mas apenas o que ele faz, interpretar a sua saída. Dica:
nós conhecemos a variância da população nesse caso?
Bem, essa é fácil demais. Basta colocar o código para rodar que veremos que estamos
simplesmente plotando histogramas da população e das distribuições amostrais das médias de
tamanhos 2 e 3, juntamente com a Normal teórica, com a sua variância conhecida, para
comparação.
4. Afirmamos na seção sobre Intervalos de Confiança que \u201cduas observações podem ser
feitas. A primeira é que nada é dito sobre n nesse caso, isto é, essa definição não depende
do tamanho da amostra, ela será válida para qualquer tamanho (embora para o caso de
variância da população desconhecida, n deve ser no mínimo 2...)\u201d.
Explique porque o tamanho de n deve ser no mínimo 2 nesta situação. Dica: lembre-se que o
IC depende basicamente de 3 valores: o nível de significância, o tamanho da amostra e a
variabilidade da amostra, como mostrado na equação abaixo, que é o IC para a média amostral com
variância da população desconhecida:
\ue097
x± tn \u22121,1\u2212\ue0b7 / 2× s
2 /n
Nesse caso, nós precisamos de alguma variabilidade nessa amostra para podermos calcular o
s2. Com uma amostra de tamanho 1, o nosso s2 será igual a zero e não será possível calcular um IC
para essa média.
5. Quantos ICs 95% calculados para as amostras de tamanho 3 das notas dos alunos de fato
continham a verdadeira média, no caso da variância conhecida? Mostre um gráfico para
ilustrar.
Dica: Basta modificar o código já dado para as amostras de tamanho 2, mas em todo caso
aqui está a cola:
plot(medias.3,rep(mean(medias.3),1000), type=&quot;b&quot;, ylim=c(0,15))
arrows(medias.3, medias.3+(qnorm(0.975)*sqrt(var.pop(notas)/3)), medias.3,
medias.3-(qnorm(0.975)*sqrt(var.pop(notas)/3)), angle=90, code=3, length=0.1)
points(medias.3, medias.3, pch=19)
ic.3<-cbind(medias.3-(qnorm(0.975)*sqrt(var.pop(notas)/3)), medias.3,
medias.3+(qnorm(0.975)*sqrt(var.pop(notas)/3)))
length(c(which(mean(notas)<ic.3[,1]), which(mean(notas)>ic.3[,3])))
Bem, aqui é só aplicação direta do código acima para quem já vinha fazendo a aula. O
resultado para mim foram 47 ICs, o que nos dá 95,3% dos ICs contendo a verdadeira média.
Bastante aproximadinho, até... Vou omitir o gráfico, por uma questão de espaço, pois o código
acima o fará automaticamente.
6. Nós vimos que com a média das variâncias das amostras usando S 2 obtemos um
resultado enviesado, isto é, diferente da verdadeira variância da população de notas:
> mean(var.2.pop)
[1] 0.55545
> mean(var.3.pop)
[1] 0.7406
3
Baseado no que nós discutimos existe alguma maneira de se obter a variância da população
a partir desses valores?
Bem, essa nós fizemos na aula: é só repetir. Vamos lá. Se S 2 = \ue09en\u22121\ue09f s
2
n
, basta