Buscar

Atividade Teorema Central do Limite

Prévia do material em texto

Universidade Federal do Estado do Rio de Janeiro -
UNIRIO
Atividade - Teorema Central do Limite
Prof. Alexandre Silva Abril de 2016
A distribuição amostral de qualquer média se torna Normal à medida que o tamanho
da amostra aumenta. Basta que as observações sejam independentes e coletadas com
aleatoriedade. Nem sempre precisamos nos importar com a forma da distribuição da
população! Este fato surpreendente foi provado de forma bastante geral em 1810, por
Pierre-Simon Laplace. O resultado é conhecido como Teorema Central do Limite -
TCL.
A distribuição das médias de muitas amostras aleatórias se aproxima do modelo Nor-
mal à medida que o tamanho da amostra aumenta, e isso é verdade apesar da forma
da distribuição da população! Mesmo se coletarmos uma amostra de uma população
assimétrica ou bimodal, o Teorema Central do Limite nos diz que médias de amostras
aleatórias repetidas tenderão a seguir um modelo Normal a medida que o tamanho da
amostra cresce. É claro, não é surpresa o fato de que ele funcione melhor e mais rápido
quanto mais próxima a distribuição da população estiver do modelo Normal. Também
funciona melhor para amostras maiores.
Tenha cuidado!! Estamos nos movendo suavemente entre o mundo real, onde coleta-
mos amostras aleatórias da dados, e um mundo mágico de modelos matemáticos, no qual
descrevemos como as médias e as proporções das amostras que observamos no mundo
real podem se comportar, caso pudéssemos ver os resultados de cada amostra aleatória
que consegúıssemos coletar. Agora, temos que lidar com duas distribuições. A primeira
é a distribuição da amostra do mundo real, que podemos exibir com um histograma ou
com uma tabela ou gráficos de barras. A segunda é a distribuição amostral da estat́ıstica
do mundo matemático, que modelamos com a Normal, baseado no TCL.
Por exemplo, não pense que o TCL indica que os dados estarão distribúıdos Normal-
mente, contanto que a amostra seja grande o suficiente. Na verdade, à medida que as
amostras ficam maiores, esperamos que a distribuição dos dados se pareça cada vez mais
com a distribuição da população de onde ela foram coletadas - assimétricas, bimodal,
o que for - mas não necessariamente Normal. Você pode coletar amostras dos salários
de alto executivos para os próximos 1000 anos, mas o histograma nunca parecerá Nor-
mal. Ele será assimétrico à direita. O TCL não fala sobre a distribuição dos dados da
amostra. Ele fala sobre as médias e proporções de várias amostras diferentes, coletadas
de mesma população. É claro, nunca coletamos todas essas amostras de fato, assim, o
TCL está falando sobre uma distribuição imaginária - o modelo da distribuição amostral.
TCL
Suponha uma amostra aleatória de tamanho n retirada de uma população com média µ e
variância σ2 finita (note que o modelo da variável aleatória não é especificado). Assim a
amosta (X1, X2, . . . , Xn) consiste de n variáveis aleatórias independentes e com a mesma
distribuição (iid), logo X segue aproximadamente um distribuição normal com média µ
e variância σ2/n, que podemos representar por:
X ∼ Normal(µ, σ
2
n
)
Exerćıcio
Para as distribuições Binomial, Poisson, Uniforme, Gama, Qui-quadrado, F-Snedecor,
t-Student
1. Identifique a parametrização da distribuição no programa R.
2. Simule no programa R, 10 mil valores (população).
3. Retire uma amostra de tamanho 100. Calcule a média e variância estimadas. Plote
estes valores junto com o histograma da amostra. Os valores estimados diferem dos
valores observados para a população?
4. Retire 9 mil amostras independentes. Sendo 3 mil de tamanho 20, 3 mil de tamanho
200 e 3 mil de tamanho 2000. Plote o histograma das médias da 3 mil amostras
nos 3 casos. O que você perecebe?
PS1: Você deverá especificar os parâmetros para gerar os valores da população.
PS2: Siga o exemplo da distribuição normal.

Continue navegando