Buscar

Métodos Quantitativos - Inferência Estatística: Um pouco de História_Aula 04

Prévia do material em texto

Métodos Quantitativos
PROF. DR. Renato Vicente
Método Estatístico
Amostra
População
Estatística 
Descritiva
Teoria de 
Probabilidades
Inferência
Estatística
Aula 4A
Inferência Estatística: Um 
pouco de História
Um pouco mais de história: A Física Social
No tempo de Quetelet (Início do seculo 19) 
Probabilidades e Estatística eram 
utilizadas basicamente para análise de 
erros experimentais e para cálculo de 
seguros. Quetelet acreditava ser possível 
estender seu uso para todo tipo de 
fenômeno humano no que chamava de 
“Física Social”. Publicou em 1834 seu 
Essai de physique sociale. Introduziu a 
Quetelet: 1796-1874
Essai de physique sociale. Introduziu a 
idéia do “homem médio”.
Galton e Darwin: Bioestatística
Após ler a Origem das Espécies, 
escrito por seu primo mais velho, 
Galton passou a se dedicar à 
Genética, dando origem ao ramo 
que levaria à Estatística moderna. 
Em 1869 Galton publicou 
Hereditary Genius tentando 
demonstrar quantitativamente que 
as características e habilidades as características e habilidades 
humanas seriam hereditárias. 
Francis Francis GaltonGalton
(1822(1822--1911)1911)Charles Darwin Charles Darwin 
(1809(1809--1882)1882)
Quincunx de Galton
Galton propôs o aparato 
ao lado para ilustrar a 
formação da distribuição formação da distribuição 
normal.
http://www.jcu.edu/math/isep/Quincunx/Quincunx.html
Karl Pearson: Departamento de Estatística 
Protegido de Galton, Pearson escreveu sua 
biografia. Em 1911 foi responsável pela criação do 
primeiro Departamento de Estatística no mundo 
no University College London .
Sobre o trabalho de Galton escreveu: “Eu
interpretei que... Galton ... quis dizer que há uma
categoria mais ampla do que a conexão causal,
que é a correlação,... e que este novo conceitoque é a correlação,... e que este novo conceito
de correlação fez da psicologia, da antropologia,
da medicina e da sociologia passíveis de
tratamento matemático. Foi Galton quem primeiro
me libertou do preconceito de que boa matemática
poderia apenas ser aplicada a conexões de causa
e efeito em fenômenos naturais.”
Seu livro a Gramática da Ciência foi a primeira
leitura da Academia Olímpica, grupo de estudos
liderado por Einstein quando tinha 23 anos.
Carl (Karl) Pearson 
(1857-1936)
Gosset (Student):Controle de Qualidade
William Gosset trabalhava na cervejaria Guinness.
Em 1906, assistiu a um curso com Pearson. 
Juntos tiveram a idéia de aplicar métodos 
estatísticos no controle de qualidade da 
cervejaria. Por trabalhar na cervejaria, 
publicou seus artigos utilizando o pseudônimo
Student, pelo qual hoje conhecemos sua principal Student, pelo qual hoje conhecemos sua principal 
contribuição : o teste t de Student para testarmos 
hipóteses sobre a média amostral (veja exemplo 
dos Shoshoni e a razão áurea na Aula 2).
William Gosset 
(1876-1937)
Fisher: Estatística Moderna
Em 1913 Fisher enviou uma carta para Gosset 
Contendo uma justificativa teórica para a 
distribuição t. Esta seria o início de uma seqüência 
deu forma a boa parte da Estatística Moderna.
Em 1919 Fisher foi contratado pela Estação de 
Experimentos Agrícolas de Rothamstead , onde 
desenvolveu um grande número de ferramentas 
teóricas para exame de impactos agrícolas, entre teóricas para exame de impactos agrícolas, entre 
elas estavam métodos para estimação estatística, 
planejamento experimental e análise de variância.
William Gosset 
(1876-1937)
Aula 4B
A Distribuição Normal
A Distribuição Normal 
FUVEST 2007 - Distribuição dos pontos na Primeira Fase (incluindo Bônus e 
ENEM) Candidatos Inscritos - Total das Carreiras de Exatas
A distribuição 
normal é uma 
curva em forma de 
sino que aparece 
freqüentemente 
em todo tipo de 
observações.
Os parâmetros da distribuição normal 
A distribuição Normal é totalmente descrita pela média e pelo desvio
padrão . Se mudarmos a média apenas deslocamos a curva pela abscissa. 
Se diminuirmos o desvio padrão tornamos a curva menos dispersa. 
m
s
Probabilidades de ocorrência 
m
A freqüência de ocorrência dos dados em uma distribuição normal é 
bem definida para cada intervalo em torno da média.
Escore z 
Sua altura é de 1,56 m. Você é alta?
Sua nota na FUVEST foi 60. Sua nota foi alta ?
O escore z permite que comparemos um valor específico com O escore z permite que comparemos um valor específico com 
a população levando-se em conta o valor típico e a 
dispersão.
A cada valor de z está associado um percentil. 
valor – média
desvio padrão
Escore z 
http://techniques.geog.ox.ac.uk/mod_2/tables/z-score.htm
Peso de Meninos por Idade 
Como fui na FUVEST? 
http://www.fuvest.br/scr/hist1f.asp?anofuv=2007&tipo=1&carreira=HUM
Média = 41,1 
Desvio Padrão = 15
Z = (60 – 41,1)/15 = 1,26
P(Z<1,26) = 89,6% 
Sua a nota foi alta.
Você é baixinha? 
Amostra : n=115 (alunos da EACH)
MÉDIA = 1,71 m DP = 9 cm
Z = (1,56 – 1,71)/0,09 = -1,67
P(Z<-1,67) = 4,7 %
Você muito provavelmente não é das 
mais altas !
Aula 4B
Distribuição Amostral e 
Estimação
Estatísticas 
Uma estatística é uma quantidade calculada a partir de 
amostras medidas em uma população.
0.693 0.662 0.690 0.606 0.570
Exemplo: A razão áurea e as molduras Shoshoni. 
0.693 0.662 0.690 0.606 0.570
0.749 0.672 0.628 0.609 0.844
0.654 0.615 0.668 0.601 0.576
0.670 0.606 0.611 0.553 0.933
A média, o desvio padrão, a mediana, os quartis, 
o máximo e o mínimo são estatísticas. 
Distribuições amostrais 
Uma distribuição amostral é a distribuição que obtemos 
quando calculamos uma estatística em várias amostras de 
uma população
Suponhamos que o quadro abaixo represente 
nossa população.
0.693 0.662 0.690 0.606 0.570
0.749 0.672 0.628 0.609 0.844
0.654 0.615 0.668 0.601 0.576
0.670 0.606 0.611 0.553 0.933
nossa população.
Distribuições amostrais 
0.693 0.662 0.690 0.606 0.570
0.749 0.672 0.628 0.609 0.844
0.654 0.615 0.668 0.601 0.576
0.670 0.606 0.611 0.553 0.933
A média de nossa população é µ = 0,6605 e o 
desvio padrão populacional é σ=0,09. A 
distribuição está representada ao lado.
0.670 0.606 0.611 0.553 0.933
Coletando 4 amostras com 
tamanho n=2 obtivemos:
=0.721 =0.6435
=(0.628+0.668)/2=0.648
=(0.844+0.576)/2=0.710
Distribuições amostrais 
0.693 0.662 0.690 0.606 0.570
0.749 0.672 0.628 0.609 0.844
0.654 0.615 0.668 0.601 0.576
0.670 0.606 0.611 0.553 0.933
A média amostral (média das médias de 
amostras) é µa = 0,668 e o desvio padrão 
amostral é σa=0.066.
Médias 
amostrais.
Repare que 
esta é mais 0.670 0.606 0.611 0.553 0.933
Coletando 4 amostras com 
tamanho n=2 obtivemos:
=0.721 =0.6435
=(0.628+0.668)/2=0.648
=(0.844+0.576)/2=0.710
esta é mais 
estreita que 
a 
distribuição
populacional
Distribuições amostrais 
0.693 0.662 0.690 0.606 0.570
0.749 0.672 0.628 0.609 0.844
0.654 0.615 0.668 0.601 0.576
0.670 0.606 0.611 0.553 0.933
E se as amostras forem maiores, n=8 por 
exemplo.
0.670 0.606 0.611 0.553 0.933
Aqui temos 2 amostras com 
tamanho n=8 
µa= 0,6606
σa=0,025
Distribuições amostrais 
Resumindo
Tamanho da
Amostra (n)
Média das 
médias de 
amostra
µa
Desvio padrão 
amostral
σa
2 0,6680 0,066
8 0,6606 0,025
20 (população) 0,6605 0,09
Teorema do Limite Central 
Para uma 
variedade ampla de 
distribuições a 
distribuição das 
médias amostrais 
tende a uma 
http://www.chem.uoa.gr/applets/AppletCentralLimit/Appl_CentralLimit2.html
tende a uma 
distribuição normal 
quando o número 
de amostras é 
grande.
Exemplo: Estimando a altura média da 
População 
Amostra : n=115 (alunos da EACH)
1,71 m é um estimadorpara a 
média populacional 
O desvio padrão DP=9cm é um estimador 
para o desvio padrão populacional.
Exemplo: Estimando a altura média da 
População 
A distribuição amostral para amostras de tamanho 
n=115 terá média igual à média populacional e 
desvio padrão igual ao desvio padrão populacional 
dividido por √115 , ou seja 
0,09/ √115 = 0,01 
1,71 ± 0,01 m
Nossa estimativa será portanto
O quanto podemos confiar nessa estimativa da 
média ?
Exemplo: Estimando a altura média da 
População 
O quanto podemos confiar nessa estimativa para a 
altura média ? 
1,72m1,70m
1,74m1,68m
Note que: esta é a distribuição para 
nosso erro de estimativa da altura 
média. 
Qualidade de Estimadores: Viés e Eficiência
Viés grande eficiência alta Viés pequeno eficiência baixa
Viés grande eficiência baixa Viés pequeno eficiência alta
Qualidade de Estimadores: Viés e Eficiência
Média Amostral= (x1 + x2 + x3 + ... + xn)/n é não-viesado 
e eficiente (eficiência máxima)
Desvio Padrão Amostral = 
RAIZ{ [(x1-Media)2 + (x2-Media)2 + ... (xn-Media)2]/ (n-1)}
é não-viesado.

Continue navegando