Baixe o app para aproveitar ainda mais
Prévia do material em texto
FUNDAMENTOS DE ESTATÍSTICA Webconferência III Professor(a): Mabel Lopes Intervalos de Confiança Exemplo Motivação : Pesquisas eleitorais Candidato Intenção de Voto João 35% Ana 32% Pedro 15% Com margem de erro de 2 pontos percentuais, para baixo ou para cima. Construir um intervalo de confiança nada mais é do que estabelecer uma “margem de erro” para um estimador e calcular o grau de confiança correspondente a esta margem. Intervalos de Confiança Um intervalo de confiança é um intervalo estimado de um parâmetro de interesse de uma população, dado um nível de confiança. Em vez de estimar o parâmetro por um único valor, é dado um intervalo de estimativas prováveis. Intervalos de confiança são usados para indicar a confiabilidade de uma estimativa. Como Construir esta estimativa intervalar ? Use uma estimativa pontual como centro do intervalo e depois adicione e subtraia uma margem de erro. Ex.: A estimativa pontual menos tendenciosa da média populacional μ é a média amostral . Intervalos de Confiança Como saber qual margem de erro utilizar? Antes de calcular a margem de erro, precisamos determinar o quão confiante devemos estar para que a estimativa intervalar obtenha o parâmetro. O nível de confiança c é a probabilidade de que o estimado intervalo obtenha a média populacional. A maioria dos experimentos estatísticos utiliza, 90%, 95% ou 99% como nível de confiança. Quando o tamanho da amostra é superior a 30 (n≥30), o teorema do limite central nos garante que a distribuição das médias amostrais segue uma distribuição normal. Assim o nível de confiança c corresponde à área sob a curva normal padrão, entre os valores críticos, e . Intervalos de Confiança • Vejamos o gráfico a seguir: • c é a porcentagem da área sob a curva normal entre e . • A área restante é 1-c, então a área em cada cauda é (1-c)/2. Intervalos de Confiança Voltando ao cálculo do erro para a estimativa intervalar. Quando μ é estimado, o erro de amostragem é a diferença entre . Porém na maioria dos casos μ é desconhecido e varia de amostra para amostra. Para uma média populacional μ, em que o desvio padrão σ é conhecido, e amostra é aleatória com n ≥ 30, a margem de erro E: Ex.: Em uma amostra de 30 funcionários de uma loja, a média de horas trabalhadas encontrada foi de 31,2 h. Para um nível de confiança de 95% queremos encontrar a margem de erro para o número médio de horas trabalhadas por estes funcionários. Suponha que o desvio padrão da população seja de 6,5 horas. Intervalos de Confiança Sol.: Como σ é conhecido, a amostra é aleatória e n=30, podemos utilizar a fórmula passada. O escore-z que corresponde a um nível de confiança de 95% é 1,96. Ou seja, 95 % da área sob a curva normal padrão está entre . Usando os valores , σ=6,5 e n=30. Você está 95% confiante de que a margem de erro para μ é de 2,33h. 47,5 %47,5 % Intervalos de Confiança Resumindo: Um intervalo de confiança c para a média populacional μ é de : A probabilidade de que o intervalo de confiança contenha μ, é c. Logo para o exemplo anterior o intervalo de confiança é de : 31,2- 2,33 < μ < 31,2+2,33 -> 28,8 < μ < 33,5. Ou seja, com 95 % de chances podemos dizer que o número médio de horas trabalhadas da população está entre 28,8 e 33,5. Intervalos de Confiança Tamanho mínimo da amostra Quanto maior o nível de confiança requerido, maior o intervalo de confiança e menor a precisão da estimativa. Uma forma de melhorar a precisão sem diminuir o nível de confiança é aumentar o tamanho da amostra. Intervalos de Confiança Como podemos construir um intervalo de confiança para a média quando σ não for conhecido? Para uma variável aleatória que é normalmente distribuída (ou aprox. normalmente distribuída), a variável média amostral comporta-se tal qual uma distribuição t. • Valores críticos de t são denotados por . • A média, moda e mediana da distribuição t são iguais a 0. • A distribuição t tem forma de sino e é simétrica em relação à média. • A área total sob a curva da distribuição t é igual a 1. Intervalos de Confiança • As caudas na distribuição t são “mais grossas” que as da distribuição normal padrão. • O desvio padrão da distribuição varia com o tamanho da amostra, mas é maior que 1. • A distribuição t é uma família de curvas, cada uma determinada por um parâmetro chamado de graus de liberdade. Os graus de liberdade são o número de escolhas livres deixadas depois que uma estatística amostral tal como é calculada. Os graus de liberdade são iguais ao tamanho da amostra menos 1, g.l=n-1. • Conforme os graus de liberdade aumentam, a distribuição t se aproxima da distribuição normal. Intervalos de Confiança Como construir um intervalo de confiança quando σ é desconhecido? Obs.: Se n<30 e a população NÃO é normalmente distribuída, NÃO podemos utilizar a distribuição normal padrão nem a distribuição t. Intervalos de Confiança Ex.:Qual é o nível de concentração de hemoglobina em mulheres grávidas que passaram por um hospital na cidade de Aracaju-Se? Dados: Foi coletada uma amostra aleatória de 16 mulheres grávidas nesse hospital em um dia típico. Foram obtidos uma média amostral de 14 g/dl e um desvio padrão de 3g/dl. Queremos encontrar um intervalo de confiança de 95% para o nível de concentração de hemoglobina em grávidas de Aracaju. Assuma que o nível de concentração é aproximadamente normalmente distribuído. n=16 , σ é desconhecido , e o nível de concentração é aprox. normalmente distribuído. Portanto, podemos utilizar a distribuição t. Intervalos de Confiança Para usar a tabela de distribuição t, como n=16, temos g.l=n-1=15, , s=3 e c=0,95. Vemos pela tabela que Cálculo da margem de erro E 3/ 1,6 O intervalo de confiança é de 14-1,6< μ < 14+1,6 →12,40< μ<15,6. ** Testes de Hipóteses Um teste de hipótese é um processo que usa estatísticas amostrais para testar uma afirmação sobre o valor de um parâmetro populacional. Ou seja, são usados para determinar se uma dada afirmação sobre um valor de um parâmetro populacional deve ou não ser rejeitada. Essa afirmação sobre um parâmetro populacional é chamado de hipótese estatística. Teste de uma hipótese estatística Hipótese Nula ( ) Hipótese Alternativa () É uma hipóteses estatística que contém É o complemento da hipótese nula que contém uma afirmação de igualdade, ≥,≤ ou =. uma afirmação de desigualdade estrita <,> ou≠. ❑❑ Testes de Hipóteses Para construir uma hipótese, escreva a afirmação feita sobre um parâmetro populacional por meio de uma sentença matemática, e logo escreva seu complemento. Por ex. se o valor da afirmação for k e o parâmetro populacional for μ, alguns pares possíveis de hipóteses nula e alternativa são: Obs.: Se não souber qual dos pares de hipóteses utilizar, assuma sempre μ=k e examine a distribuição amostral combase nessa suposição. Ex.: Uma concessionária de automóveis anuncia que o tempo médio para uma troca de óleo é menor que 15 min. Essa afirmação é escrita como μ<15. O complemento é μ≥15. (afirmação) Testes de Hipóteses Ao realizar um teste de hipótese você toma uma destas duas decisões: 1.Rejeitar a hipótese nula; 2.Não rejeitar a hipótese nula. Sabendo-se que sua decisão é em cima de uma amostra e não na população inteira, há sempre a possibilidade de você tomar uma decisão errada. Tipos de erros Significado da decisão Nível de Significância α: é a probabilidade de ocorrer o erro do tipo I. Um método para decidir se rejeita ou não a hipótese nula é verificar se a estatística de teste padronizada cai dentro de um intervalo de valores denominada de região de rejeição. Ex. Afirma-se que a altura média dos jogadores de basquete que disputam uma determinada liga é 1,95m. Numa amostra de 36 jogadores, foi encontrada uma média de 1,93m. Sabe-se que o desvio padrão da altura dos jogadores é 12 cm. Teste, com um nível de significância de 10%, se a afirmação é verdadeira. : ( Afirmação) : Como o teste é bilateral e o nível de significância então isso equivale a 5% em cada “cauda”. Na tabela da distribuição normal padronizada, isso equivale a um valor de z de 1,645. As regiões de rejeição são z<-1,645 e z>1,645. A estatística de teste padronizada é: =-0,02/0,02=-1 A figura abaixo mostra a localização das regiões de rejeição e a estatística de teste padronizado z. Como z está fora da região de rejeição você não rejeita a hipótese nula. Ou seja , não há evidência suficiente ao nível de significância de 10%, para rejeitar a afirmação de que a altura média dos jogadores que disputam a liga é de 1,95m. Z=-1 (fora da região de rejeição) Teste de hipótese para a média (σ desconhecido) Instruções: 1º passo: O teste para uma média μ, quando a amostra é aleatória e a população é normalmente distribuída ou n≤ 30, é dada pelo teste t que é calculado por: 2º passo: Calcular os valores críticos em uma distribuição t • Especifique o nível de significância α • Identifique os graus de liberdade g.l=n-1 • Calcule os valores críticos usando a tabela de distribuição t student, com n- 1 graus de liberdade. Quando o teste de hipóteses é: a)unicaudal à esquerda, use a coluna “unicaudal, α” com um sinal negativo. b)unicaudal à direita, use a coluna “unicaudal, α” com um sinal positivo. c) bicaudal, use a coluna“bicaudal, α” com um sinal negativo e um positivo. 3º Passo: Tome uma decisão para rejeitar ou não a hipótese nula. Se t está na região de rejeição, então rejeite . Caso contrário, não rejeite . 4º Passo: Interprete a decisão baseado na afirmação original. Ex.: Um vendedor de carros usados diz que o preço médio do sedan de dois anos é de pelo menos US$20.500. Você suspeita que essa afirmação é incorreta e descobre que uma amostra aleatória de 14 veículos similares tem um preço médio de US$19.850 e desvio padrão de US$ 1.084. Há evidência suficiente para rejeitar a afirmação do vendedor para o nível de significância α=0,05? Suponha que a população é normalmente distribuída. Sol.: Como σ é desconhecido, a amostra é aleatória e a população é normalmente distribuída, você pode usar o teste t. A afirmação é “o preço médio é de pelo menos US$ 20.500”. Então as hipóteses são: (Afirmação) O teste é unicaudal à esquerda, o nível de significância é α=0,05 e os graus de liberdade é g.l=n-1=14-1=13. Então o valor crítico é . A região de rejeição é t<-1,771. A estatística de teste padronizada é: A fig. mostra a localização da região de rejeição e a estatística de teste padronizada t. Como t está na re- gião de rejeição, você rejeita a hipótese nula. Interpretação: Há evidência suficiente, ao nível de significância de 5%, para rejeitar a afirmação de que o preço médio de um sedan de dois anos é de pelo menos US$ 20.500. Teste de hipótese para variância e desvio padrão Para uma população normalmente distribuída, você pode testar a variância e o desvio padrão usando a distribuição qui-quadrado com n-1 graus de liberdade. Como encontrar os valores críticos na distribuição qui-quadrado? 1.1º Especifique o nível de significância α. 2.2º Determine os graus de liberdade g.l =n-1. 3.Os valores críticos para a distribuição qui-quadrado são encontrados na tabela do anexo 4. Para encontrar os valores críticos para um teste: a)Unicaudal à direita, use o valor que corresponde a g.l e α. b)Unicaudal à esquerda, use o valor que corresponde a g.l e 1-α c)Bicaudal, use os valores que correspondem a g.l e ½ α e1- ½ α. Ex.: Encontre um valor crítico para um teste unilateral à esquerda quando n=11 e α=0,01. Sol.: Os graus de liberdade são n-1=10. A figura mostra uma distribuição qui-quadrado com 10 graus de liberdade e uma área sombreada de α=0,01 na cauda esquerda. A área a direita do valor crítico é 1- α=1-0,01=0,99. Na tabela do anexo 4, com g.l=10 e área 1- α =0,99 o valor crítico é =2,558. Vamos ao teste qui quadrado. O teste qui-quadrado só pode ser usado quando a população é normal. A estatística do teste é e a estatística de teste padronizada: segue uma distribuição qui-quadrado com graus de liberdade g.l=n-1. Ex.: Uma empresa afirma que o desvio padrão do tempo de duração de uma ligação recebida para ser transferida para a área correta é menor que 1,4 minuto. Uma amostra aleatória de 25 ligações recebidas tem um desvio padrão de 1,1 minuto. Para o nível de significância α=0,10, há evidência suficiente para concordar com a afirmação da empresa? Suponha que a população é normalmente distribuída. Sol.: Neste caso, utilizaremos o teste qui-quadrado. A afirmação é “o desvi o padrão é menor que 1,4 minuto”, então as hipóteses nula e alternativa são: (Afirmação) O teste é unilateral à esquerda , o nível de significância é α=0,10 e os graus de liberdade são: g.l= 25-1=24 Logo o valor crítico é: = 15,659 A região de rejeição é . A estatística de teste padronizada é: A figura mostra a região de rejeição e a estatística de teste padronizada . Como está na região de rejeição, você rejeita a hipótese nula. Interpretação: Há evidência suficiente, ao nível de significância de 10%, para concordar com a afirmação de que o desvio padrão da duração de que leva uma ligação recebida para ser transferida para área correta é menor que 1,4 min. ** 𝜒 ² 𝜒 ² 𝜒 2<15 ,659 FUNDAMENTOS DE ESTATÍSTICA Intervalos de Confiança Intervalos de Confiança Intervalos de Confiança Intervalos de Confiança Intervalos de Confiança Intervalos de Confiança Intervalos de Confiança Intervalos de Confiança Intervalos de Confiança Intervalos de Confiança Intervalos de Confiança Intervalos de Confiança Intervalos de Confiança Testes de Hipóteses Testes de Hipóteses Testes de Hipóteses Slide 18 Slide19 Slide 20 Slide 21 Slide 22 Slide 23 Slide 24 Slide 25 Slide 26 Slide 27 Slide 28 Slide 29 Slide 30
Compartilhar