Baixe o app para aproveitar ainda mais
Prévia do material em texto
Métodos Quantitativos PROF. DR. Renato Vicente Método Estatístico Amostra População Estatística Descritiva Teoria de Probabilidades Inferência Estatística Aula 4A Inferência Estatística: Um pouco de História Um pouco mais de história: A Física Social No tempo de Quetelet (Início do seculo 19) Probabilidades e Estatística eram utilizadas basicamente para análise de erros experimentais e para cálculo de seguros. Quetelet acreditava ser possível estender seu uso para todo tipo de fenômeno humano no que chamava de “Física Social”. Publicou em 1834 seu Essai de physique sociale. Introduziu a Quetelet: 1796-1874 Essai de physique sociale. Introduziu a idéia do “homem médio”. Galton e Darwin: Bioestatística Após ler a Origem das Espécies, escrito por seu primo mais velho, Galton passou a se dedicar à Genética, dando origem ao ramo que levaria à Estatística moderna. Em 1869 Galton publicou Hereditary Genius tentando demonstrar quantitativamente que as características e habilidades as características e habilidades humanas seriam hereditárias. Francis Francis GaltonGalton (1822(1822--1911)1911)Charles Darwin Charles Darwin (1809(1809--1882)1882) Quincunx de Galton Galton propôs o aparato ao lado para ilustrar a formação da distribuição formação da distribuição normal. http://www.jcu.edu/math/isep/Quincunx/Quincunx.html Karl Pearson: Departamento de Estatística Protegido de Galton, Pearson escreveu sua biografia. Em 1911 foi responsável pela criação do primeiro Departamento de Estatística no mundo no University College London . Sobre o trabalho de Galton escreveu: “Eu interpretei que... Galton ... quis dizer que há uma categoria mais ampla do que a conexão causal, que é a correlação,... e que este novo conceitoque é a correlação,... e que este novo conceito de correlação fez da psicologia, da antropologia, da medicina e da sociologia passíveis de tratamento matemático. Foi Galton quem primeiro me libertou do preconceito de que boa matemática poderia apenas ser aplicada a conexões de causa e efeito em fenômenos naturais.” Seu livro a Gramática da Ciência foi a primeira leitura da Academia Olímpica, grupo de estudos liderado por Einstein quando tinha 23 anos. Carl (Karl) Pearson (1857-1936) Gosset (Student):Controle de Qualidade William Gosset trabalhava na cervejaria Guinness. Em 1906, assistiu a um curso com Pearson. Juntos tiveram a idéia de aplicar métodos estatísticos no controle de qualidade da cervejaria. Por trabalhar na cervejaria, publicou seus artigos utilizando o pseudônimo Student, pelo qual hoje conhecemos sua principal Student, pelo qual hoje conhecemos sua principal contribuição : o teste t de Student para testarmos hipóteses sobre a média amostral (veja exemplo dos Shoshoni e a razão áurea na Aula 2). William Gosset (1876-1937) Fisher: Estatística Moderna Em 1913 Fisher enviou uma carta para Gosset Contendo uma justificativa teórica para a distribuição t. Esta seria o início de uma seqüência deu forma a boa parte da Estatística Moderna. Em 1919 Fisher foi contratado pela Estação de Experimentos Agrícolas de Rothamstead , onde desenvolveu um grande número de ferramentas teóricas para exame de impactos agrícolas, entre teóricas para exame de impactos agrícolas, entre elas estavam métodos para estimação estatística, planejamento experimental e análise de variância. William Gosset (1876-1937) Aula 4B A Distribuição Normal A Distribuição Normal FUVEST 2007 - Distribuição dos pontos na Primeira Fase (incluindo Bônus e ENEM) Candidatos Inscritos - Total das Carreiras de Exatas A distribuição normal é uma curva em forma de sino que aparece freqüentemente em todo tipo de observações. Os parâmetros da distribuição normal A distribuição Normal é totalmente descrita pela média e pelo desvio padrão . Se mudarmos a média apenas deslocamos a curva pela abscissa. Se diminuirmos o desvio padrão tornamos a curva menos dispersa. m s Probabilidades de ocorrência m A freqüência de ocorrência dos dados em uma distribuição normal é bem definida para cada intervalo em torno da média. Escore z Sua altura é de 1,56 m. Você é alta? Sua nota na FUVEST foi 60. Sua nota foi alta ? O escore z permite que comparemos um valor específico com O escore z permite que comparemos um valor específico com a população levando-se em conta o valor típico e a dispersão. A cada valor de z está associado um percentil. valor – média desvio padrão Escore z http://techniques.geog.ox.ac.uk/mod_2/tables/z-score.htm Peso de Meninos por Idade Como fui na FUVEST? http://www.fuvest.br/scr/hist1f.asp?anofuv=2007&tipo=1&carreira=HUM Média = 41,1 Desvio Padrão = 15 Z = (60 – 41,1)/15 = 1,26 P(Z<1,26) = 89,6% Sua a nota foi alta. Você é baixinha? Amostra : n=115 (alunos da EACH) MÉDIA = 1,71 m DP = 9 cm Z = (1,56 – 1,71)/0,09 = -1,67 P(Z<-1,67) = 4,7 % Você muito provavelmente não é das mais altas ! Aula 4B Distribuição Amostral e Estimação Estatísticas Uma estatística é uma quantidade calculada a partir de amostras medidas em uma população. 0.693 0.662 0.690 0.606 0.570 Exemplo: A razão áurea e as molduras Shoshoni. 0.693 0.662 0.690 0.606 0.570 0.749 0.672 0.628 0.609 0.844 0.654 0.615 0.668 0.601 0.576 0.670 0.606 0.611 0.553 0.933 A média, o desvio padrão, a mediana, os quartis, o máximo e o mínimo são estatísticas. Distribuições amostrais Uma distribuição amostral é a distribuição que obtemos quando calculamos uma estatística em várias amostras de uma população Suponhamos que o quadro abaixo represente nossa população. 0.693 0.662 0.690 0.606 0.570 0.749 0.672 0.628 0.609 0.844 0.654 0.615 0.668 0.601 0.576 0.670 0.606 0.611 0.553 0.933 nossa população. Distribuições amostrais 0.693 0.662 0.690 0.606 0.570 0.749 0.672 0.628 0.609 0.844 0.654 0.615 0.668 0.601 0.576 0.670 0.606 0.611 0.553 0.933 A média de nossa população é µ = 0,6605 e o desvio padrão populacional é σ=0,09. A distribuição está representada ao lado. 0.670 0.606 0.611 0.553 0.933 Coletando 4 amostras com tamanho n=2 obtivemos: =0.721 =0.6435 =(0.628+0.668)/2=0.648 =(0.844+0.576)/2=0.710 Distribuições amostrais 0.693 0.662 0.690 0.606 0.570 0.749 0.672 0.628 0.609 0.844 0.654 0.615 0.668 0.601 0.576 0.670 0.606 0.611 0.553 0.933 A média amostral (média das médias de amostras) é µa = 0,668 e o desvio padrão amostral é σa=0.066. Médias amostrais. Repare que esta é mais 0.670 0.606 0.611 0.553 0.933 Coletando 4 amostras com tamanho n=2 obtivemos: =0.721 =0.6435 =(0.628+0.668)/2=0.648 =(0.844+0.576)/2=0.710 esta é mais estreita que a distribuição populacional Distribuições amostrais 0.693 0.662 0.690 0.606 0.570 0.749 0.672 0.628 0.609 0.844 0.654 0.615 0.668 0.601 0.576 0.670 0.606 0.611 0.553 0.933 E se as amostras forem maiores, n=8 por exemplo. 0.670 0.606 0.611 0.553 0.933 Aqui temos 2 amostras com tamanho n=8 µa= 0,6606 σa=0,025 Distribuições amostrais Resumindo Tamanho da Amostra (n) Média das médias de amostra µa Desvio padrão amostral σa 2 0,6680 0,066 8 0,6606 0,025 20 (população) 0,6605 0,09 Teorema do Limite Central Para uma variedade ampla de distribuições a distribuição das médias amostrais tende a uma http://www.chem.uoa.gr/applets/AppletCentralLimit/Appl_CentralLimit2.html tende a uma distribuição normal quando o número de amostras é grande. Exemplo: Estimando a altura média da População Amostra : n=115 (alunos da EACH) 1,71 m é um estimadorpara a média populacional O desvio padrão DP=9cm é um estimador para o desvio padrão populacional. Exemplo: Estimando a altura média da População A distribuição amostral para amostras de tamanho n=115 terá média igual à média populacional e desvio padrão igual ao desvio padrão populacional dividido por √115 , ou seja 0,09/ √115 = 0,01 1,71 ± 0,01 m Nossa estimativa será portanto O quanto podemos confiar nessa estimativa da média ? Exemplo: Estimando a altura média da População O quanto podemos confiar nessa estimativa para a altura média ? 1,72m1,70m 1,74m1,68m Note que: esta é a distribuição para nosso erro de estimativa da altura média. Qualidade de Estimadores: Viés e Eficiência Viés grande eficiência alta Viés pequeno eficiência baixa Viés grande eficiência baixa Viés pequeno eficiência alta Qualidade de Estimadores: Viés e Eficiência Média Amostral= (x1 + x2 + x3 + ... + xn)/n é não-viesado e eficiente (eficiência máxima) Desvio Padrão Amostral = RAIZ{ [(x1-Media)2 + (x2-Media)2 + ... (xn-Media)2]/ (n-1)} é não-viesado.
Compartilhar