Baixe o app para aproveitar ainda mais
Prévia do material em texto
Curso de Engenharia da Computação Estatística Capítulo 3 – Distribuições Amostrais e Estimação de Parâmetros Profº Dr. Elton Alves Amostragem e Inferência Estatística Conceitos ❑Parâmetro: • Algumas medida descritiva (média, variância, proporção e etc.) dos valores 𝑿𝟏, 𝑿𝟐, … , associados à população. • Exemplos: - Número de horas de estudos médios da população. Conceitos ❑Estatística • Alguma medida descritiva (média, variância, proporção e etc.) das variáveis 𝑿𝟏, 𝑿𝟐, … , associados à amostra. • Exemplo: - Número de horas de estudos médios da amostra. Parâmetro e Estatística Parâmetros e Estatística Parâmetro Versus Estatística • Proporção de pessoas de raça branca em uma população e numa amostra. Distribuição Amostral da Média Distribuição da Média Amostral • (Teorema do limite central) Se o tamanho da amostra for razoavelmente grande, então a distribuição amostral da média pode ser aproximada pela distribuição normal. Distribuição da Média Amostral População de Tamanho N Estimação de Parâmetros Estimação de Parâmetros Estimação de Parâmetros Tipos de Estimação de Parâmetros 1. Estimativas Pontuais: as estimativas são ditas pontuais quando apontam para um único valor. Exemplo: Prevalência de fumo entre os estudantes da Unifesspa. , onde Sn é a frequência do evento na amostra e n é o tamanho da amostra 2. Estimativas Intervalares: as estimativas são intervalares quando definem um intervalo da valores. ˆ n S p n = Estimação Pontual • Estimadores pontuais importantes: 1. Média: O melhor estimador para µ é a média amostral: 2. Proporção: O melhor estimador para p é a proporção amostral: • Onde, Sn é o número de elementos que apresentam uma determinada característica entre os n elementos da amostra. 3. Variância: O melhor estimador para 𝝈𝟐 é a variância amostral: 1 n i i x X n == ˆ n S p n = 2 2 1 ( ) 1 n i i x X S n = − = − Estimação Pontual • Exemplo: Num dos diversos estudos que levaram à proibição do uso de DDT, procedeu-se à medição da espessura de casca de ovos de falcões peregrinos. Os dados recolhidos numa região em que não se procede a exploração agrícola, e em que não tinha havido uso de DDT, com o objetivo de servirem de padrão de comparação, constam na tabela seguinte: Estimação Pontual • Suponha que a espessura, em mm, de ovos de falcão peregrino, X, segue uma distribuição normal: X≈N(μ,σ²). • A média da amostra recolhida é: • A média amostral, = 0,2725, é uma estimativa pontual da média populacional desconhecida μ. 0,28 0,24 0,28 0,32 ... 0,33 0,2725 20 X + + + + + = = X Estimação Pontual • Sejam, p proporção de alunos da Unifesspa que foram ao teatro pelo menos uma vez no último mês, e X: número de estudantes que respondem “sim” em uma pesquisa com n entrevistados. Suponha que foram entrevistados n = 500 estudantes e que, desses, k = 100 teriam afirmado que foram ao teatro pelo menos uma vez no último mês. Estime a proporção de alunos que foram ao teatro. Função Gaussiana ou Normal • É a distribuição de probabilidade mais utilizada na estatística; • Pode ser utilizada em modelagem de medidas da natureza; Função Gaussiana ou Normal • Propriedades: 1. Gráfico na forma de sino; 2. Suas média, medianas e modas são iguais; 3. É simétrica em torno da média 4. A área total sob curva normal é 1. Função Gaussiana ou Normal • Propriedades: 5. Os pontos em que a curva muda são chamados de pontos de inflexão; 6. À medida que a curva se afasta de média, aproxima-se cada vez mais do eixo X, mas nunca o toca. Função Gaussiana ou Normal • Médias e desvio padrão: uma distribuição normal pode ter qualquer média (µ) e qualquer desvio padrão (σ). • Os parâmetros (µ) e (σ) determinam o formato da curva. Curvas com médias diferentes e mesmo desvio padrão Função Gaussiana ou Normal • Curvas com médias diferentes e desvio padrão diferentes. Função Gaussiana ou Normal • Exemplo: Massas de homens e mulheres adultos. 1. Qual das curvas normais tem maior média? 2. Qual das curvas normais tem desvio padrão maior? Distribuição Normal Padrão • É uma distribuição que tem µ=0 e σ=1; Escore Z • O escore padrão ou escore Z, representa o número de desvio padrão que separa uma variável X da média. • Para transformar um valor X em um escore Z usamos a fórmula: valor média x Z desvio padrão − − = = Escore Z • Exemplo: as pontuações em um concurso público, com média de 152 e desvio padrão de 7. Determine o escore Z para um candidato com pontuação de: a) 161 b) 148 c) 152 Escore Z • Entendendo o escore Z: 1. Se cada valor de dados de uma variável X normalmente distribuída for transformada em um escore Z, o resultado será uma curva normal padrão; 2. Podemos usar a curva normal padrão e o escore Z para obter áreas ( e portanto probabilidades) sob a curva normal. Escore Z • Tabela da distribuição Normal Padrão Exercício – Tabela Normal Padrão • Calcule: Z>0,42 Z<0,42 (-0,42<Z<0,42) Estimação de Parâmetro: Intervalo de Confiança para Média •µ = média na população (parâmetro que se quer estimar) •ഥ𝑿 = média da amostra (pode ser calculada com base na amostra) Estimativa por Intervalo de Confiança ❑1-𝛼 é 𝑜 𝑛í𝑣𝑒𝑙 𝑑𝑒 𝑐𝑜𝑛𝑓𝑖𝑎𝑛ç𝑎; ❑𝛼 é um grau de confiança; ❑−𝑍 Τ𝛼 2e 𝑍 Τ𝛼 2𝑠ã𝑜 𝑜𝑠 𝑣𝑎𝑙𝑜𝑟𝑒𝑠 𝑐𝑟í𝑡𝑖𝑐𝑜𝑠. ❑Onde 𝑍 Τ𝛼 2é um valor tal que área da curva normal padronizada à sua direita é Τ𝛼 2 ❑ A escolha do nível de confiança depende da precisão que desejamos estimar o parâmetro. ❑ Geralmente, adota-se α = 1%, 5% ou 10%. Intervalo da Confiança para a Média •De modo geral, estamos interessados em encontrar um intervalo na forma: •Onde ε0 representa a semi-amplitude do intervalo de confiança, sendo chamado de ERRO de PRECISÃO em relação a µ. 0 0 0,X X X − + = Teorema do Limite Central Teorema do Limite Central • TEOREMA: para amostras aleatórias (X1, X2, ..., Xn), retiradas de uma população µ e variância σ² , a média amostral aproxima-se de uma distribuição Normal com média µ e variância σ²/n quando n razoavelmente grande. ( )1 2, ,..., /nX X X X n= 2 ,X N n Intervalo da Confiança para a Média • CASO 1: α² é conhecido - Dada a distribuição amostral da média : Temos que padronizando em Z : ~ N(0,1) (Normal Padrão). 2 ,X N n X Z n − = /2 /2 /2 /2 /2 /2 ( ) 1 1 1 1 P z Z z X P z z n P z X z n n P X z X z n n − = − − − = − − − = − − + = − Intervalo da Confiança para a Média • IC para μ com variância conhecida. (1 ) /2 /2( ) ,IC X z X z n n − = − + Zα/2 é o valor de Z que produz uma área de α/2 na cauda superior da Distribuição normal padrão. Exemplo 1 Em uma indústria de cerveja, a quantidade de cerveja inserida em latas tem-se comportado como uma variável com média 350 ml e desvio padrão 3 ml. Após alguns problemas da linha de produção, suspeita-se que houve alteração na média. Uma amostra de 20 latas acusou media ml. Construa um intervalo de confiança para o novo valor da quantidade média µ de cerveja inserida em latas, com nível de confiança de 95%, supondo que não tenha ocorrido alteração no desvio padrão do processo. 346X = Exemplo 2 A norma padrão ASTM E23 define métodos padrões de teste para o impacto em barras entalhadas, feitas de materiais metálicos. A técnica Charpy V-notch(CVN) mede a energia de impacto e é frequentemente utilizada para determinar se um material experimenta ou não uma transição dúctil-frágil com um decréscimo de temperatura. Dez medidas de energia (J) de impacto nos corpos de prova de aço A238, cortados a 60ºC, são: 64,1; 64,7; 64,5; 64,6; 64,5; 64,3; 64,6; 64,8; 64,2 e 64,3. Considere que a energia de impacto seja normalmente distribuída, com σ=1J.Queremos encontrar um IC de 95% para µ, a energia média do impacto. Intervalo da Confiança para a Média •CASO 2: α é desconhecido. - Substituir α pelo desvio padrão calculado com os dados da amostra. - Duas situações podem ocorrer: 1. Para uma amostra grande (digamos n≥50), a diferença entre 𝝈 e s pode ser desprezível (Uso de IC anterior) 2. Para uma amostra pequena, é necessário efetuar uma correção com a distribuição t de Student. ( ) 2 1 1 1 n i i S x X n = = − − Intervalo da Confiança para a Média •Distribuição t de Student: - Seja uma amostra aleatória proveniente de uma distribuição normal, com média µ e variância σ² desconhecida. A estatística: - Tem distribuição probabilidade com distribuição t de Student, com gl=n-1 graus de liberdade, e não mais distribuição normal. / X T S n − = 1 2 ,..., nX X X Distribuição t de Student Intervalo da Confiança para a Média: Distribuição t de Student • Para pequenas amostras a distribuição normal apresenta valores menos precisos, o que nos leva a utilizar um modelo melhor. •A principal diferença entre a distribuição normal e a t de Student é que esta tem mais área nas caudas. Intervalo da Confiança para a Média: Distribuição t de Student: • Existe um valor de t para cada tamanho de amostra, sendo que à medida que a amostra (n) cresce, a distribuição t de Student se aproxima da distribuição normal. • Para calcular o valor de t a ser usado é necessário ter: 1.Um nível de confiança desejado. 2.Qual o número de graus de liberdade a ser utilizado: Distribuição t de Student Como usar a tabela t • Ilustração com gl=9 e nível de confiança de 95%. Intervalo da Confiança para a Média: Distribuição t de Student: • Usando a tabela t de Student com n-1, podemos escolher o valor de 𝑡 Τ𝛼 2 em função do nível de confiança γ desejado, tal que: ( ) /2, 1 /2, 1 /2, 1 /2, 1 /2, 1 /2, 1 /2, 1, 1 1 / 1 n n n n n n n P t T t X P t t S n S S P X t X t n n S IC X t n − − − − − − − − = − − − = − − + = − = Exemplo 3 Deseja-se avaliar a dureza esperada de µ do aço produzido sob um novo processo de têmpera. Uma amostra de dez corpos de prova do aço produziu os seguintes resultados de dureza, em HRc: 36,4 35,7 37,2 36,5 34,9 35,2 36,3 35,8 36,6 36,9 Construir um intervalo de confiança para µ, com nível de confiança de 95%. Intervalo de Confiança para a Proporção Populacional •O IC para a proporção populacional é dado por ( ) /2, ˆ ˆ(1 ) ˆ p p p IC p z n − = Exemplo 4 •Uma droga foi testada em 25 pacientes e apresentou efeitos colaterais em 8 casos. Qual a proporção de ocorrência de efeitos colaterais? -Adotando-se um grau de confiança de 5%. ( ) /2, ˆ ˆ(1 ) ˆ p p p IC p z n − = Exemplo 5 •Na avaliação de dois sistemas computacionais, A e B, foram selecionadas 400 cargas de trabalho (tarefas) – supostamente uma amostra aleatória da infinidade de cargas de trabalho que poderiam ser submetidas a esses sistemas. O sistema A foi melhor que B em 60% dos casos. Construir intervalos de confiança para p (proporção de vezes que o sistema A é melhor que o sistema B, considerando todas as possíveis cargas de trabalho) usando níveis de confiança de 95% e 99%. Comente a diferença entre os resultados dos intervalos de confiança. ( ) /2, ˆ ˆ(1 ) ˆ p p p IC p z n − = Slide 1: Curso de Engenharia da Computação Estatística Slide 2: Amostragem e Inferência Estatística Slide 3: Conceitos Slide 4: Conceitos Slide 5: Parâmetro e Estatística Slide 6: Parâmetros e Estatística Slide 7: Parâmetro Versus Estatística Slide 8: Distribuição Amostral da Média Slide 9: Distribuição da Média Amostral Slide 10: Distribuição da Média Amostral Slide 11: População de Tamanho N Slide 12: Estimação de Parâmetros Slide 13: Estimação de Parâmetros Slide 14: Estimação de Parâmetros Slide 15: Tipos de Estimação de Parâmetros Slide 16: Estimação Pontual Slide 17: Estimação Pontual Slide 18: Estimação Pontual Slide 19: Estimação Pontual Slide 20: Função Gaussiana ou Normal Slide 21: Função Gaussiana ou Normal Slide 22: Função Gaussiana ou Normal Slide 23: Função Gaussiana ou Normal Slide 24: Função Gaussiana ou Normal Slide 25: Função Gaussiana ou Normal Slide 26: Distribuição Normal Padrão Slide 27: Escore Z Slide 28: Escore Z Slide 29: Escore Z Slide 30: Escore Z Slide 31: Exercício – Tabela Normal Padrão Slide 32: Estimação de Parâmetro: Intervalo de Confiança para Média Slide 33: Estimativa por Intervalo de Confiança Slide 34: Intervalo da Confiança para a Média Slide 35: Teorema do Limite Central Slide 36: Teorema do Limite Central Slide 37: Intervalo da Confiança para a Média Slide 38: Intervalo da Confiança para a Média Slide 39: Exemplo 1 Slide 40: Exemplo 2 Slide 41: Intervalo da Confiança para a Média Slide 42: Intervalo da Confiança para a Média Slide 43: Distribuição t de Student Slide 44: Intervalo da Confiança para a Média: Distribuição t de Student Slide 45: Intervalo da Confiança para a Média: Distribuição t de Student: Slide 46: Distribuição t de Student Slide 47: Como usar a tabela t Slide 48: Intervalo da Confiança para a Média: Distribuição t de Student: Slide 49: Exemplo 3 Slide 50: Intervalo de Confiança para a Proporção Populacional Slide 51: Exemplo 4 Slide 52: Exemplo 5
Compartilhar