Baixe o app para aproveitar ainda mais
Prévia do material em texto
Universidade Federal do Estado do Rio de Janeiro - UNIRIO Atividade - Teorema Central do Limite Prof. Alexandre Silva Abril de 2016 A distribuição amostral de qualquer média se torna Normal à medida que o tamanho da amostra aumenta. Basta que as observações sejam independentes e coletadas com aleatoriedade. Nem sempre precisamos nos importar com a forma da distribuição da população! Este fato surpreendente foi provado de forma bastante geral em 1810, por Pierre-Simon Laplace. O resultado é conhecido como Teorema Central do Limite - TCL. A distribuição das médias de muitas amostras aleatórias se aproxima do modelo Nor- mal à medida que o tamanho da amostra aumenta, e isso é verdade apesar da forma da distribuição da população! Mesmo se coletarmos uma amostra de uma população assimétrica ou bimodal, o Teorema Central do Limite nos diz que médias de amostras aleatórias repetidas tenderão a seguir um modelo Normal a medida que o tamanho da amostra cresce. É claro, não é surpresa o fato de que ele funcione melhor e mais rápido quanto mais próxima a distribuição da população estiver do modelo Normal. Também funciona melhor para amostras maiores. Tenha cuidado!! Estamos nos movendo suavemente entre o mundo real, onde coleta- mos amostras aleatórias da dados, e um mundo mágico de modelos matemáticos, no qual descrevemos como as médias e as proporções das amostras que observamos no mundo real podem se comportar, caso pudéssemos ver os resultados de cada amostra aleatória que consegúıssemos coletar. Agora, temos que lidar com duas distribuições. A primeira é a distribuição da amostra do mundo real, que podemos exibir com um histograma ou com uma tabela ou gráficos de barras. A segunda é a distribuição amostral da estat́ıstica do mundo matemático, que modelamos com a Normal, baseado no TCL. Por exemplo, não pense que o TCL indica que os dados estarão distribúıdos Normal- mente, contanto que a amostra seja grande o suficiente. Na verdade, à medida que as amostras ficam maiores, esperamos que a distribuição dos dados se pareça cada vez mais com a distribuição da população de onde ela foram coletadas - assimétricas, bimodal, o que for - mas não necessariamente Normal. Você pode coletar amostras dos salários de alto executivos para os próximos 1000 anos, mas o histograma nunca parecerá Nor- mal. Ele será assimétrico à direita. O TCL não fala sobre a distribuição dos dados da amostra. Ele fala sobre as médias e proporções de várias amostras diferentes, coletadas de mesma população. É claro, nunca coletamos todas essas amostras de fato, assim, o TCL está falando sobre uma distribuição imaginária - o modelo da distribuição amostral. TCL Suponha uma amostra aleatória de tamanho n retirada de uma população com média µ e variância σ2 finita (note que o modelo da variável aleatória não é especificado). Assim a amosta (X1, X2, . . . , Xn) consiste de n variáveis aleatórias independentes e com a mesma distribuição (iid), logo X segue aproximadamente um distribuição normal com média µ e variância σ2/n, que podemos representar por: X ∼ Normal(µ, σ 2 n ) Exerćıcio Para as distribuições Binomial, Poisson, Uniforme, Gama, Qui-quadrado, F-Snedecor, t-Student 1. Identifique a parametrização da distribuição no programa R. 2. Simule no programa R, 10 mil valores (população). 3. Retire uma amostra de tamanho 100. Calcule a média e variância estimadas. Plote estes valores junto com o histograma da amostra. Os valores estimados diferem dos valores observados para a população? 4. Retire 9 mil amostras independentes. Sendo 3 mil de tamanho 20, 3 mil de tamanho 200 e 3 mil de tamanho 2000. Plote o histograma das médias da 3 mil amostras nos 3 casos. O que você perecebe? PS1: Você deverá especificar os parâmetros para gerar os valores da população. PS2: Siga o exemplo da distribuição normal.
Compartilhar