Baixe o app para aproveitar ainda mais
Prévia do material em texto
23/09/2012 1 1 Unesp - Sorocaba Distribuição amostral – Média – Proporção Intervalo de confiança – Média – Proporção Teste de hipótese 2 Distribuição amostral da média Inferência: envolve a utilização de uma estatística para concluir, ou inferir, sobre o parâmetro correspondente O valor da estatística depende de como a amostra é coletada Para uma população de tamanho N é possível selecionar muitas amostras diferentes de tamanho n Essas amostras diferentes podem ter médias diferentes 23/09/2012 2 3 Para simplificar Suponha uma população com N = 4 mensalidades para quatro colégios Essas mensalidades são: R$ 100,00, R$ 200,00 R$ 300,00 e R$ 400,00. A média da mensalidade (população) é de: µ = R$ 250,00 4 Amostra Elementos Média da amostra 1 100, 200 150 2 100,300 200 3 100,400 250 4 200,300 250 5 200,400 300 6 300,400 350 Todas as amostras possíveis de tamanho 2 23/09/2012 3 5 Qual a probabilidade de uma amostra aleatória dessa população ter média R$ 250,00? 33,33% 66,67% apresentarão erro Esse é o erro amostral Erro amostral é a diferença entre o parâmetro populacional e a estatística da amostra usada para estimá-lo 6 Distribuição amostral da média Número de amostras Probabilidade 150 1 1/6 200 1 1/6 250 2 2/6 300 1 1/6 350 1 1/6 X 23/09/2012 4 7 Gráfico da distribuição da média amostral Distribuição de probabilidade da média amostral 0 0,05 0,1 0,15 0,2 0,25 0,3 0,35 150 200 250 300 350 Média amostral Pr ob ab ili da de 8 Média das médias amostrais k X X k i i 1 23/09/2012 5 9 Variância da distribuição amostral k X k i i X 2 12 10 Erro padrão da distribuição amostral da média amostral 2 XX n EPX 2 23/09/2012 6 11 Teorema central do limite As médias de todas as amostras possíveis, de igual tamanho, retiradas aleatoriamente de uma população, têm distribuição Gaussiana, não importando como se distribuem os dados na população original 12 Característica da DAM 1) Se a variável X tem distribuição Gaussiana, as médias de todas as amostras aleatórias de igual tamanho, originárias dessa população, também têm distribuição Gaussiana. 23/09/2012 7 13 2) ERRO PADRÃO DA MÉDIA n x 14 Exemplo Uma companhia eletrônica fabrica resistores que têm uma resistência média de 100Ω e um desvio padrão de 10Ω. A distribuição das resistência é normal. Encontre a probabilidade de uma amostra aleatória de n = 25 resistores ter uma resistência média menor do que 95Ω. 23/09/2012 8 15 Exercícios Uma empresa de telecomunicações planeja instalar novos equipamentos que trarão melhorias as suas operações. Contudo, antes dos executivos decidirem se as novas instalações serão um investimento eficaz, eles precisam determinar a probabilidade de que a média de uma amostra de tamanho n = 35: a) o tempo de transmissão esteja entre 145 e 150 segundos b) o tempo de transmissão seja maior do que 145 segundos c) o tempo de transmissão seja menor do que 155 segundos A média de transmissão é de 150 segundos com desvio de 15 segundos. 16 É necessário estabelecer critérios científicos para estabelecer a diferença ou desvio significativo: 1) A distribuição seja gaussiana 2) Os valores que se desviam devem ser uma fração pequena da população e que seja determinada a priori 23/09/2012 9 17 Partindo desses pressupostos, uma atitude razoável é considerar como estatisticamente não- significativos os desvios apresentados por valores ao redor da média populacional 18 Em geral estipula-se que tal fração seja de 95%, já que um valor discrepante deve ser raro. 47,5% adjacente e acima da média 47,5% adjacente e abaixo da média 23/09/2012 10 19 Fica então estabelecido um intervalo ao redor da média, o intervalo de desvios não-significativos, que corresponde a 95% dos valores da população A fração de 95% é arbitrária e denomina-se região de não-significância 20 REGIÕES DE SIGNIFICÂNCIA E NÃO-SIGNIFICÂNCIA -1,96 1,96 23/09/2012 11 21 95,096,196,1 n XP 22 Definições Nível de confiança: é a probabilidade de que o valor procurado esteja dentro do intervalo de confiança; Nível de significância: é a probabilidade de que o valor procurado esteja fora do intervalo de confiança. Essas medidas são complementares e o nível de significância é denotado por e o nível de confiança por 1 - : 23/09/2012 12 23 24 INTERVALO DE CONFIANÇA n zX n zX 2/12/ 23/09/2012 13 25 Os tempos amostrais de montagem para uma determinada peça fabricada foram 8, 10, 10, 12, 12, 14 e 17 minutos. Se a média da amostra é usada para estimar a média da população dos tempos de montagem, forneça um intervalo de confiança de 95% para a média da população, considerando que ela tem distribuição normal. 26 Distribuição amostral da proporção Em muitas situações nas ciências, usa-se a proporção para fazer inferências estatísticas sobre a proporção da população p. Seleciona-se em um amostra aleatória n elementos e calcula- se a proporção amostral que serve para fazer inferências sobre o valor de p na população. A distribuição de probabilidade para todos os valores possíveis da proporção da amostra é chamada de distribuição amostral da proporção 23/09/2012 14 27 A distribuição amostral da proporção pode ser aproximada por uma distribuição normal de probabilidade sempre que o tamanho da amostra é grande Para verificar isso, as duas condições devem ser satisfeitas: np≥ 5 e n(1-p)≥ 5 28 Distribuição amostral da proporção Erro padrão para a proporção n pq p 96,1 p e 96,1 ppp 23/09/2012 15 29 Exemplo A BellLabs obtém componentes para seus telefones celulares em lotes de 200 de uma firma em Palo Alto. Um componente tem uma taxa de defeito de 10%. As normas, recentemente estabelecidas, são: 30 Se houver mais de 12% de componentes defeituosos, implicará em contratar um novo fornecedor Se houver de 10% a 12% de componentes defeituosos, implicará em considerar um novo fornecedor Se houver de 5% a 10% implicará em continuar com o fornecedor Se houver menos de 5% implicará em aumentar as encomendas Qual a decisão mais provável? 23/09/2012 16 31 Outro exemplo O processo de produção das unidades de caixa de controle de um tipo específico de motor foi modificado recentemente. Antes dessa modificação, os dados históricos sugeriam que a distribuição dos diâmetros do orifício dos mancais nas caixas eram normais, com um desvio padrão de 0,10mm. Acredita-se que a modificação não tenha afetado o formato da distribuição ou o desvio padrão, mas que o valor médio do diâmetro médio possa ter mudado. Uma amostra de 40 unidades da caixa é selecionada e o diâmetro médio foi de 5,426mm. Qual o intervalo de confiança para a nova média populacional com um nível de confiança de 90%? 32 Se o desvio padrão da população é desconhecido? Usar o desvio padrão da amostra 23/09/2012 17 33 Correção para uma população finita n>0,05N n pq N nN X 1 34 Intervalo de confiança para proporção De maneira análoga a média pp pp zppzp zpzpIC 2 1 2 2 1 2 ],[ 23/09/2012 18 35 Exemplo O gerente de uma estação de televisão deve determinar qual a porcentagem de moradias da cidade que tem mais de uma televisão. Uma amostra de 500 casas revelou que 275 têm dois ou mais aparelhos de televisão. Qual é o intervalo de confiança de 95% para a proporção de casas com dois ou mais aparelhos? E com 90%? 36 Exercício Uma revista especializada reportou que um de cada quatro executivos é estrangeiros. Se, em uma amostra de 350 empresas, 77 têm executivos estrangeiros, estime o intervalo de confiança de 99% da proporção na população de executivos estrangeiros e se a afirmação da revista é justificável. 23/09/2012 19 37 TESTES DE HIPÓTESES 38 Teste de hipótese Análise estatística:reduzir o grau de incerteza no processo de tomada de decisões Inferência para determinar se uma declaração sobre o valor de um parâmetro da população pode ser rejeitado 23/09/2012 20 39 Exemplos Um produtor de hardware deseja certificar-se de que a proporção de unidades defeituosas é menor do que 3% Uma indústria quer saber se há evidências de que o processo de produção reduziu o custo médio de produção que era de R$ 5,00 por unidade 40 Hipótese estatística Uma hipótese estatística é uma afirmação sobre os parâmetros de uma ou mais populações Essa afirmação é provisória Após a formulação da hipótese, são realizados levantamentos de dados que são analisados estatisticamente, buscando resultados que confirmem ou não a hipótese 23/09/2012 21 41 Como os dados provêm de amostras, a decisão está associada a uma probabilidade de erro O erro de decisão não pode ser evitado, mas sua probabilidade pode ser controlada ou mensurada A estatística inferencial fornece métodos para se tomar decisão a respeito de hipóteses formuladas, informando também o risco de erro que acompanha a decisão 42 Hipóteses estatísticas Hipótese nula ou de nulidade Ho: estabelece a ausência de diferença entre os parâmetros. É sempre a primeira a ser formulada Hipótese alternativa H1: é a hipótese contrária a hipótese nula. Geralmente é a que o pesquisador quer ver confirmada 23/09/2012 22 43 Etapas do teste 1) Estabelecimento das hipóteses 2) Escolha do nível de significância 3) Determinação do valor crítico do teste 4) Determinação do valor calculado do teste 5) Decisão 44 Exemplo Um fabricante alega que a vida média das pilhas AA, por ele fabricadas, é de 300 minutos. Para testar a alegação do fabricante de pilhas foi obtida uma amostra aleatória com 100 pilhas. A média obtida foi de 294 minutos com desvio padrão de 20 minutos. Qual a confiança na afirmação do fabricante? Karol Realce 23/09/2012 23 45 Etapa-1 min300:0 H min300:1 H 46 Etapa-2 α=5% 23/09/2012 24 47 Etapa-3 Valor crítico 96,1025,0 2 zzzcrítico 48 Etapa-4 Valor calculado do teste 3 2 6 100 20 300294 n s xzcalculado 23/09/2012 25 49 Etapa-5-Decisão 0 0 H se-rejeita , Se H rejeita se não , Se críticocalculado críticocalculado zz zz 50 Decisão A hipótese nula não é aceita A amostra é não usual ou Hipótese é falsa 23/09/2012 26 51 REGIÕES DE SIGNIFICÂNCIA E NÃO-SIGNIFICÂNCIA 52 REGIÕES DE SIGNIFICÂNCIA E NÃO-SIGNIFICÂNCIA -1,96 1,96 3-3 23/09/2012 27 53 Tipos de erro Erro tipo I: Rejeitar a hipótese nula quando ela é verdadeira Erro tipo II: Aceitar a hipótese nula quando ela é falsa 54 = probabilidade de se cometer um erro do tipo I = probabilidade de se cometer um erro do tipo II 23/09/2012 28 55 Conclusão H0 Verdadeira H1 Verdadeira Aceitar H0 Conclusão correta Erro do tipo II Rejeitar H0 Erro do tipo I Conclusão correta Condição na população
Compartilhar