Baixe o app para aproveitar ainda mais
Prévia do material em texto
FACULDADE DE TECNOLOGIA DE SOROCABA APOSTILA DE ESTATÍSTICA CURSO: ANÁLISE E DESENVOLVIMENTO DE SISTEMA PARTE II Ao escrever esta Apostila não pretendi outra coisa, senão proporcionar aos alunos da disciplina ESTATÍSTICA , a facilidade de dispor de notas de aulas dos temas do Programa da Disciplina. O acompanhamento das aulas e a pesquisa em Bibliografia sobre o assunto, tornam-se necessárias para o adequado aproveitamento do curso. PROF. OSNI PAULA LEITE INTERFERÊNCIA ESTATÍSTICA 1.0 CONFIABILIDADE DA AMOSTRA A estimativa do tamanho da amostra é um dos fatores determinantes para o sucesso de uma Pesquisa Estatística. Como já mencionado, o tamanho da amostra pode ser pequeno em relação à população geral. Ao longo do curso veremos formas especificas para o calculo da amostra mínima necessária para dar confiança aos resultados obtidos. Entretanto, existem dois fatores estatísticos que devem ser mantidos em mente: - Quanto maior o tamanho da amostra, mais precisas são as informações sobre a população; - Acima de determinado tamanho, poucas informações extras sobre a população podem ser obtidas, no entanto, os custos de tempo e dinheiro aumentam. 1.1 PLANEJAMENTO DA AMOSTRA A amostragem ideal para todo o estudo estatístico e a Amostragem Aleatória. Em estatística, um planejamento da amostra e um plano definido, completamente antes da coleta de quaisquer dados e que tem por objetivo a obtenção de uma amostra de uma população. Os métodos mais usuais de amostragem já foram estudados no curso e são: - Amostragem Sistemática; - Amostragem Estratificada; - Amostragem por Conglomerados. 1.2 ERROS PROVENIENTES DA AMOSTRAGEM Estes erros surgem do fato de a amostra não ser representativa em relação à população em questão. Eles geralmente são minimizados com a consideração cuidadosa do método de amostragem a ser utilizado. Com amostras Aleatórias, o tamanho desses erros de amostragem podem ser utilmente estimados e o método de cálculos veremos nos capítulos adiante. -94- 1.3 ERROS NÃO PROVENIENTES DA AMOSTRAGEM Estes surgem devido a varias causas, incluindo: - Registros incorretos dos dados; - Transferência incorreta de dados para a calculadora ou computador para processamento; - Medições incorretas; - Perguntas mal projetadas; 1.4 PLANEJAMENTO GERAL DA PESQUISA Para resumir, aqui temos uma lista de verificação das principais etapas do projeto de uma pesquisa: – Defina as metas da pesquisa; – Defina a população; – Identifique o esquema de Amostragem (definir a amostra e o tamanho que ela deve ter); – Decida que método de coleta de dados utilizar (questionário pessoal, entrevista, medições, etc); – Caso decida usar questionário, preparar um apropriado para entrevistas pessoais; – Selecione e treine qualquer pessoa envolvida no processo de coleta de dados. -95- 1.5 DISTRIBUIÇÕES AMOSTRAIS A distribuição Amostral é provavelmente o conceito mais fundamental da interferência estatística, e está relacionado com a idéia de variação aleatória que permite enfatizar a necessidade de medir a variabilidade de dados. Para ilustrar o conceito de distribuição amostral, vamos construir a da média de uma amostra aleatória de tamanho n=2 extraídas sem reposição, de uma população finita de tamanho N=5 cujos dados poderiam ser (3,5,7,9 e 11). Neste caso teremos: μ = 3 + 5 + 7 +9 +11 = 7 5 e seu desvio padrão é: σ = √ (3 – 7)² + (5 - 7)²+ (7 - 7)²+(9 - 7)²+(11 - 7)² = √8 5 Se tomarmos agora amostra n=2 neste caso temos 10 possibilidades, isto é, a combinação 5,2, ou seja, 5! = 10 2! 3! 3 e 5 3 e 7 3 e 9 3 e 11 5 e 7 5 e 9 5 e 11 7 e 9 7 e 11 9 e 11 e suas médias são: 4 5 6 7 6 7 8 8 9 10 Como cada amostra tem probabilidade 1/10, obtemos a seguinte Distribuição Amostral da Média: Média X Probabilidade 4 1/10 5 1/10 6 2/10 7 2/10 8 2/10 9 1/10 10 1/10 -96- Desta forma o Histograma da Distribuição das Probabilidades fica: y 2/10 1/10 1/10 X Observa-se que para X = 6, 7, 8 há uma probabilidade de 6/10 de uma Média Amostral não ser diferente de 1 da Média Populacional μ = 7. Também para média X = 5, 6, 7, 8 ou 9 há uma probabilidade de 8/10 de uma Média Amostral não ser diferente de 2 da Média Populacional μ = 7 Assim, se não conhecêssemos a Média da População dada e quiséssemos estima-la com a média de uma Amostra Aleatória de tamanho n =2 o processo acima nos daria uma idéia do tamanho possível do erro envolvido. Para obtermos outras informações úteis sobre a distribuição Amostral da Média Calculamos : μ x e σ x . μ x = 4 + 5 + 6 + 6 + 7 + 7 + 8 + 8 + 9 + 10 = 7 10 σ x = (4 – 7)²+ (6 – 7)²+ (6 – 7)²+ (7 – 7)²+ (7 – 7)²+ (8 – 7)²+ (8 – 7)²+ (9 – 7)²+ (10 – 7)² 10 σ x = √ 3 -97- 1.6 ERRO PADRÃO DA MÉDIA Para amostras Aleatória de tamanho n extraídas de uma população com média μ e desvio padrão σ, a Distribuição Normal de x tem média: μ x = μ e o Desvio Padrão da Média σ x = σ ou σ x = σ x √ N -n √n √n N -1 Dependendo de a População ser Infinita ou Finita de Tamanho N, respectivamente. Costuma-se referir-se a σ como o Erro Padrão da Média, se: σ x e pequeno há uma boa chance que a Média da Amostra estar próximo da Média da População. σ x e Grande a Média Amostral e consideravelmente diferente da Média da População. O Fator √ N -n e chamado de fator de Correção para População Finita N -1 Exemplo Com referência ao exercício anterior, tínhamos n =2 e N =5 e σ = √ 8 verifique que a segunda das formulas de σ x da √3 Fazendo n = 2 ,N = 5 e σ = √ 8 para formula para populações finitas temos: σ x = σ x √ N -n = √8 √5 – 2 = √ 8X3 = √ 3 √n N –1 √2 5 - 1 2X4 -98- EXERCÍCIOS 1- Qual e o valor do erro de correção para a população finita, Quando: a - n = 10 e N = 200 b- n = 10 e N = 500 c- n = 10 e N = 2000 d- n = 20 e N = 200 e- n = 40 e N = 400 f- n = 400 e N = 4000 2- Uma população Finita de N = 6 números 6, 9, 12, 15, 18 e 21: a- Calcule a Média Populacional e o Desvio Padrão b- Relacione Quantas Amostras são possíveis se n = 2 (combinação 6,2) c- Montar todas as amostras possíveis e calcular os X d- Construa o Histograma da Distribuição Amostral da Média para amostras Aleatórias de tamanho n = 2 extraídas, sem reposição, dessa População Finita. e- Determine o Desvio Padrão da Distribuição Amostral da Média σ x . -99- 1.7 TEOREMA CENTRAL DOLIMITE A capacidade de usar AMOSTRAS para se fazer interferências sobre parâmetros POPULACIONAIS depende do conhecimento da distribuição Amostral. Sabemos já calcular a média e o desvio padrão, mas temos também que saber a forma da Distribuição Amostral. Se temos uma distribuição A distribuição das médias também será normal para individual normal qualquer número de amostras Se a distribuição individual A distribuição das médias será normal para não e normal Amostras Grandes Isso significa que para qualquer distribuição individual, podemos sempre que tenhamos a distribuição normal com a única restrição que o tamanho da amostra seja grande, ou seja, acima de 30 amostras. Esses resultados são conhecidos como o Teorema Central do Limite. O TEOREMA CENTRAL DO LIMITE 1- Se a população sob amostragem tem distribuição normal, a distribuição das médias também será normal para todos os tamanhos de amostras. 2- Se a população básica não e normal, a distribuição das médias amostrais será aproximadamente normal para grandes amostras. Exemplo 1 Uma população muito grande tem média μ = 20 e desvio padrão σ = 1,4. Extrai-se uma amostra de 49 observações . Questões Resolvidas: A- Qual a média da Distribuição Amostral? A média da distribuição Amostral e sempre igual a média da população μ, logo μ x = 20. -100 - A - Qual o desvio padrão da distribuição amostral? σ x = σx 1,4 = 1,4 = 0,2 √n √49 7 C - Qual a Percentagem das possíveis médias amostrais que diferirão por mais de 0,2 da média da população ? Como n > 30, podemos supor que a distribuição e normal. TEMOS: σ x = 0,2 μ x = 20 Portanto a curva normal seria μ x μ x-3σ x μ x-2σ x μ x -σ x μ x+σ x μ x +2σ x μ x+ 3σ x Z Z1 Z2 Z1 = 19,8 – 20 = - 0,2 = -1 Iz1= 0,3413 0,2 0,2 Z1 = 20,2 – 20 = 0,2 = 1 Iz1= 0,3413 0,2 0,2 IT= 0,5 – 0,3413 + 0,5 – 0,3413 0,1587 + 0,1587 = 0,3174 Médias Inferiores a 19,8 e Superiores a 20,2 -101 - F (x) 0,3413 0,3413 EXERCICIOS 1- Um fabricante de baterias alega que seu artigo de primeira categoria tem uma vida esperada média de 50 meses. Sabe-se que o desvio padrão correspondente é de 4 meses. Que percentagem da amostra de 36 observações acusara vida média no intervalo de 1 mês em torno de 50 meses, admitindo-se ser de 50 meses a verdadeira vida média das baterias? Qual será a reposta para uma amostra de 64 observações? 2- Se se extrai uma amostra de uma distribuição normal, qual a probabilidade de a média amostral estar compreendida em cada intervalo? a - μx ± 1,96 σx b - μx ± 2,00 σx c - μx ± 2,33 σx 3- A média de uma distribuição amostral de médias e 50 e seu desvio padrão e de 10. Suponha normal a distribuição Amostral. a - Que percentagem de médias amostrais estará entre 45 e 55? b- Idem para 42,5 e 57,5 c - Que percentagem de médias amostrais será menor que a média populacional? d - Que percentagem de médias amostrais será igual à média populacional? 4- Determine a média da distribuição de médias amostrais, dada cada uma das seguintes médias populacionais: a- 5,01 b- 199,5 -102 - 5- Calcule o desvio padrão da distribuição amostral de médias para cada um dos casos seguintes: a- σ x = 5,0 e n = 6 b- σ x = 6,2 e n = 100 c- σ x = 1,0 e n = 36 d- σ x = 3,2 e n = 44 e- σ x = 2,0 e n = 40 6- Deve-se extrair uma amostra de 36 observações de uma máquina que cunha moedas comemorativas a espessura média das moedas e de 0,2 cm, com desvio padrão de 0,01 cm. a- É preciso saber que a população é normal para determinar a percentagem de médias amostrais que estão dentro de certos intervalos? Explique. b- Que percentagem de médias amostrais estará no intervalo 0,20 ± 0,004 cm? c- Qual a probabilidade de se obter uma média amostral que se afaste por mais de 0,005 cm da média do processo? -103 - 2.0 ESTIMATIVAS E TAMANHO DE AMOSTRAS 2.1 ASPECTOS GERAIS Quando decidimos usar métodos de Amostragem para checar a uma decisão sobre a variável investigada, devemos definir rigorosamente nossos conceitos e procedimentos. Em seguida, devemos assegurar que nossa “Amostra” reflita as características do agregado no máximo grau possível. A principal vantagem de se adotar seleção aleatória de amostras em investigação cientifica é a de que sabemos matematicamente alguma coisa sobre a natureza do comportamento destas Amostras Aleatórias. Do ponto de vista do Estatístico as amostras devem ser tão grandes quanto possíveis. Quanto maior è a amostra, maior é a confiança que se tem nos resultados. Para entender as razoes desse ponto de vista, imagine que em uma cidade existem dois hospitais. Em um deles nascem 120 bebes por dia e no outro 12. A razão de meninos e meninas é, em média, 50% nos dois hospitais. Uma vez nasceu, em um dos hospitais, duas vezes mais meninos do que meninas (67% meninos e 33% meninas). Em qual dos hospitais é provável que isso tenha ocorrido? É claro que foi no menor. A probabilidade de obter uma estimativa que se desvia muito do parâmetro aumenta quando a amostra for pequena. As amostras muito pequenas são inúteis por que não dão, em geral, boas estimativas. No entanto amostras muito grandes, porem mal feitas, são piores porque dão a ilusão de conter a verdade. -104 - 2.2 ESTIMATIVAS DE UMA MÉDIA POPULACIONAL: GRANDES AMOSTRAS Em geral a média amostral x é a melhor estimativa de uma média populacional μ. Um estimador é uma estatística amostral (como a média amostral x) utilizada para obter uma aproximação de um parâmetro populacional. Uma estimativa è um valor especifico, ou um intervalo de valores, usado para aproximar um parâmetro populacional. Há duas razoes para explicar por que uma média amostral x tende a centrar-se em torno da média populacional μ. 1- Para muitas populações, a distribuição de médias amostrais x tende a ser consistente (apresentar menor variação) do que as distribuições de outras estatísticas amostrais (mediana ou a moda). 2- A média amostral x tende a centrar-se em torno da média Populacional μ. x 1 x6 x 3 x5 x4 μ x 2 x8 x7 2.2.1INTERVALOS DE CONFIANÇA Quando usamos a média x para estimar a média populacional μ e fazemos uma estimativa pontual não temos qualquer indicação de quão boa e essa estimativa. Para isso foi desenvolvida outro tipo de estimativa, que efetivamente indica quão boa é uma estimativa pontual. -105 - Essa estimativa, chamada intervalo de confiança ou estimativa intervalar, consiste em uma amplitude (ou um intervalo) de valores, em lugar de um único valor. Um intervalo de confiança está associado a um grau de confiança que e a medida da nossa certeza de que o intervalo contem o parâmetro populacional. Para tanto usa a probabilidade α, que corresponde a área na curva normal, a qual pela simetria da curva divide-se em duas partes como aprece sombreada na curva abaixo: α/2 z=0 α/2 São escolhas comuns para o grau de confiança: 90% (com α = 0,10) 95% (com α = 0,05) 99% (com α = 0,01) A opção mais comum e a opção 95% EXEMPLOS 1- Ache os valores críticos z α/2 correspondentes aos graus de confiança: 90% 95% 99% -106 - α 90% α = 0,10 10% DE INCERTEZA α/2=0.05 α/2=0,05 z=-1,645 z=0 z=1,645 95% α = 0,05 5% DE INCERTEZA α/2=0.025 α/2=0.025 z=-1,96 z=0 z=1,96 99% α = 0,01 1% DE INCERTEZA α/2=0.005 α/2=0.005 z=-2,575 z=0 z=2,575 -107 - α 0,45 0,45 α/2=0.05 α 0,475 0,475 α 0,495 0,495 z α/2 z=0 z α/2 AREAS SIMETRICAS NAS CAUDAS AREA Z α/2 AREA Z α/2 AREA Z α/2 AREA Z α/2 0,001 3,291 0,01 2,576 0,06 1,881 0,20 1,282 0,002 3,090 0,02 2,326 0,07 1,812 0,30 1,036 0,003 2,968 0,03 2,170 0,08 1,751 0,40 0,842 0,004 2,878 0,04 2,054 0,09 1,695 0,50 0,674 0,005 2,807 0,05 1,960 0,10 1,645 0,60 0,524 Quando utilizamos dados amostrais para estimar uma média populacional μ, a margem de erro, denotada por E e a diferença máxima provável (com probabilidade 1-α) entre a média amostral observada é a verdadeira média populacional μ. E = erro máximo da estimativa FORMULA E = Z α/2 x σ √n Essa formula só pode ser usada quando conhecemos σ (Desvio padrão da população) -108 - α Quando σ e desconhecido: Se n > 30, podemos substituir σ na fórmula acima pelo Desvio padrão Amostral S. Se n ≤ 30, a curva deve ser normal e devemos conhecer obrigatóriamente o σ para aplicar a formula. Adiante daremos uma outra solução quando n ≤ 30. Com base na definição da margem de erro E, podemos agora identificar o intervalo de confiança para a média populacional μ. Intervalo de confiança ( ou estimativa Intervalar) para a média populacional μ (com base em grandes amostras: n > 30). X – E ≤ μ ≤ X - E Onde E = Z α/2 x σ √n RESUMO Processo de construção de um intervalo de confiança para a média μ (n > 30). 1- Determinar o valor critico Z α/2 correspondente ao grau de confiança desejado. Exemplo: 95% Z α/2 = 1,96 2- Calcular a margem de erro E = Z α/2 x σ se o desvio padrão da população √n não é conhecido, utilizar o desvio padrão da amostra S, desde que n > 30. 3- Com a margem de erro e o valor da média amostral X, calcular os valores X – E e X+ E Levar esses valores na expressão do intervalo de confiança. X – E ≤ μ ≤ X – E ±E Ou μ = X ou ( X – E ;X – E) -109 - EXERCÍCIO: 1- Determine o intervalo de confiança 95% para a média populacional μ para os valores abaixo: 69,9 69,9 72,6 70,2 70,0 71,8 70,6 72,8 69,0 68,4 60,0 68,4 68,3 69,6 71,7 69,2 70,8 71,0 70,4 66,8 70,4 66,8 69,9 69,2 70,5 70,2 70,0 70,8 72,6 70,6 72,8 70,8 70,2 71,7 70,0 68,3 66,8 69,9 69,0 69,4 70,4 69,4 69,9 70,0 71,7 70,2 70,8 72,8 71,0 69,9 2- Determine o valor critico de Z α/2 que corresponde ao grau de confiança indicado: a- 99% b- 94% c- 98% d- 92% e- 96% 2- Use o grau de confiança e os valores amostrais dados para achar a margem de erro e o intervalo de confiança para a média populacional μ. a- Altura das alunas: 95% de confiança, n = 50, X = 164 S = 4,5 b- Médias das notas: 99% de confiança, n = 70, X = 7,0 S = 0,88 c- Notas de um teste: 90% de confiança, n = 150, X = 77,6 S = 14,6 d- Salário da Policia: 92% de confiança, n = 64, X = R$ 1200,00 S = R$ 80,00 3- A partir de uma amostra de 35 crânios de homens egípcios que viveram por volta de 1850 AC mede-se a largura máxima de cada crânio, obtendo-se: X = 134,5 mm e S = 3,48 mm. Com esses dados amostrais construa um intervalo de 95% de confiança para a média populacional μ. -110 - 2.2.2 DETERMINAÇÃO DO TAMANHO DA AMOSTRA Suponha que estamos definindo um procedimento para uma pesquisacientifica. Como sabemos quantos elementos da população devem ser escolhidos? Suponha por exemplo, que queiramos estimar a renda média de pessoas que concluíram um curso superior, no primeiro ano após a formatura. Quantas rendas devemos incluir em nossa amostra? Partindo da expressão da margem de erro E e resolvendo em relação ao tamanho da amostra n temos: 2 n = Z α/2 x σ E O número da amostra deve ser um número inteiro, quando isso não ocorre devemos arredondar usando o número inteiro mais próximo para cima. EXEMPLO Um Economista deseja estimar a renda média para o primeiro ano de trabalho de um bacharel por uma faculdade, que teve a feliz idéia de fazer um curso de Estatística. Quantos valores de renda devem ser tomados, se o Economista deseja ter 95% de confiança que a média amostral esteja a menos de R$ 20,00 da verdadeira média Populacional? suponha que saibamos por um estudo prévio, que, para tais rendas o desvio padrão σ = R$ 100,00. SOLUÇÃO: Queremos determinar o tamanho da amostra “n” dado que α = 0,05 (95% de confiança). Desejamos que a média Amostral esteja a menos de R$ 20,00 da média populacional de forma que o Erro E = 20. Supondo que σ = R$ 100,00, aplicamos a Formula 2 2 n = Z α/2 x σ 1,96 x 100 = 96.04 ≈ 97 amostras E 20 -111 - Devemos, portanto, obter uma amostra de 97 rendas de primeiro ano, selecionadas aleatoriamente, de Bacharéis de Faculdades que tenham feito um curso de estatística. Com tal amostra teremos 95% de confiança em que a média amostral X difira em menos de R$ 20,00 da verdadeira média populacional, X – E < μ < X - E X – 20 < μ < X + 20 Quando não conhecemos o valor de σ podemos estimar o valor a partir pelo menos de 31 valores amostrais selecionando aleatoriamente em um estudo piloto, no caso anterior poderíamos encontrar o valor R$ 2300,00 como a maior renda e R$ 1900,00 como a menor renda, o σ pode ser estimado: σ = RT σ = 400 = 100 4 4 2.3 ESTIMATIVA DE UMA MÉDIA POPULACIONAL, PEQUENAS AMOSTRAS Agora veremos a estimativa da média populacional “μ” quando o tamanho “n” da m amostra é pequeno, ou seja, n ≤ 30. Neste caso: A melhor estimativa continua sendo a partir de X Usaremos intervalo de confiança a partir da curva normal com a mesma margem de erro do capitulo anterior. Usaremos a distribuição t de Student t = X - μ S √n -112 - O número de graus de liberdade para um conjunto de dados corresponde ao número de valores que podem variar apos terem sido impostas certas restrições a todos os valores. EXEMPLO Se 10 estudantes têm em um teste média 80, podemos atribuir valores arbitrários a nove delas, mas a décima fica determinada univocamente. A soma das 10 notas deve ser 800, de modo que a 10ª deve ser igual a 800 menos a soma das 9 primeiras. Como as nove primeiras podem ser escolhidas arbitrariamente, dizemos que há nove graus de liberdade (n – 1 ). Propriedades importantes da distribuição t de Student 1- A distribuição t de Student é diferente, conforme o tamanho da amostra; 2- A t de Student tem a mesma forma geral simétrica (forma de sino) que a distribuição normal, mas reflete a maior variabilidade que é esperada em pequenas amostras; 3- A distribuição t de Student tem média t = 0 igual a distribuição normal padronizada que tem média Z = 0. 4- O desvio padrão da distribuição t de Student varia com o tamanho da amostra ”n” mas é superior a 1, ao contrário que a destruição normal onde σ = 1. 5- À medida que aumenta o tamanho “n” da amostra a distribuição t de Student se aproxima mais e mais da distribuição normal Padronizada. Condições para o uso da distribuição t de Student 1- O tamanho da amostra é pequeno (n ≤ 30) 2- σ é desconhecido 3- A população original tem distribuição Normal -113 - Margem de erro para a estimativa de μ para n ≤ 30 E = t α/2 x S onde t α/2 tem n-1 graus de liberdade √n Intervalo de confiança para estimativa de μ X – E < μ < X - E Onde E = t α/2 x S √n EXEMPLO: Testes Destrutivos O teste de colisão de carros é um exemplo muito dispendioso de teste destrutivo.Dificilmente pode-se fazer colidir mais de 30 carros, a fim de poder utilizar uma distribuição normal. Suponhamos que tenhamos feito teste de colisão de 12 carros de um tipo “A” cujo preço de venda seja R$ 59.000,00 sob diversas condições que simulam colisões típicas. A analise do 12 carros danificados resulta em custos de conserto que parecem ter distribuição em forma de sino com média de $ 26.000,00 e desvio padrão S= $ 15.000,00. Determine: a- A melhor estimativa da média populacional μ, do custo de conserto de cada carro danificado. b- A estimativa intervalar de 95% de μ. -114 - SOLUÇÃO: a- A melhor estimativa pontual de μ é o valor X neste caso $ 26.000,00. b- Usamos t de Student porque as condições básicas estão satisfeitas: - n ≤ 30 n=12 - σ desconhecido porem conhecemos S= $ 15.000,00 - A curva tem a forma de Sino Então: E = t α/2 x S 2,201 x 15000 = 9.530,61 √n √12 Podemos agora escrever a estimativa intervalar de 95% de confiança: X – E < μ < X - E 26.000 – 9.530,61 < μ < 26.000 + 9.530,61 16.490 < μ < 35.530 ou ± 9.530 26.000 ou (16.490;35.530) Com base nesse resultado, temos 95% de confiança de que os limites 16.490 e 35.530 contem o valor da média populacional μ. Esse exemplo é real e trata de um carro americano, dos mais caros para consertar em caso de colisão. Esta informação é de grande importância para as companhias de seguros. -115 - EXERCICIOS: 1- Ache os valores críticos t α/2 que corresponde ao grau de confiança e ao tamanho da amostra “n” a- 98% n=10 b- 98% n=21 c- 95% n=16 d- 90% n=8 2- Dados os graus de confiança e os elementos amostrais, determine: I- Margem de erro II-O intervalo de confiança para a média μ. Admita que a população tenha distribuição normal. a- Altura das alunas: 95% de confiança; n=10; X= 164; S= 4,5cm. b- Média das Notas: 99% de confiança; n=15; X= 7,0; S= 0,88. c- Notas de um teste: 90% de confiança; n= 16 X= 77,6; S= 14,2 d- salário da Policia: 98% de confiança, n=19, X=R$1200,00; S= R$80,00 3- Determine corretamente se os intervalos de confiança são calculados com a distribuição normal padronizada ou com a distribuição t de Student. Em teste de colisão feitos em 15 minivans Honda, os custos de conserto apresentam distribuição em forma de sino, com média de $ 1786 e desvio padrão de $937.Construa um intervalo de confiança de 99% para o custo médio de conserto para esse tipo de veiculo. 4- Suponha que tenhamos apenas 10 temperaturas do corpo Humano, para esses valoresa média X = 98,44°F e S= 0,30°F. Construa um intervalo de confiança de 95% para a média de todas as temperaturas do corpo humano. Sabendo-se que essa distribuição é normal. -116 - 2.4 ESTIMATIVA DE UMA PROPORCÃO POPULACIONAL Neste capitulo vamos abordar os mesmos três conceitos estudados nos capítulos anteriores. (1) Estimativa pontual (2) Intervalo de confiança (3) Determinação do tamanho da Amostra “n”. Nos capítulos anteriores aplicamos esses conceitos a estimativa de uma média populacional μ; neste capitulo vamos aplica-lo a Proporção Populacional “P”. EXEMPLO: Uma companhia de seguros poderia se interessar na estimativa da proporção de motoristas embriagados. Vamos trabalhar com a denominação p^ ( lê-se p chapéu) para a proporção amostral. Sabemos já que Q=1-P; podemos associar que Q^= 1-P^, desta forma: P= Proporção Populacional P^= proporção Amostral FORMULAS Estimativa Pontual A proporção Amostral P^ é a melhor estimativa pontual da proporção Populacional P. Margem de Erro da Estimativa P E= Z α/2 √ P^Q^ n Intervalo de confiança (ou estimativa intervalar de uma proporção Populacional P) P^ - E < P < P^+E Eventualmente podemos dizer: ±E P = P^ Ou ( P^- E; P^+E) -117 - EXEMPLO: Os pesquisadores de opinião publica são atormentados por uma diversidade de fatores de confusão, como secretárias eletrônicas. Em uma pesquisa junto a 1068 Americanos, 673 informaram ter secretaria eletrônica com esses resultados amostrais determine: a- A estimativa pontual da proporção populacional de todos os Americanos que possuem secretaria eletrônica. b- A estimativa intervalar 95% da proporção Populacional de todos os Americanos que tem secretaria eletrônica SOLUCAO: A- A estimativa pontual de P e: P^ = X = 673 = 0,630 n 1068 Dai Q^= 1 – P^ 1 – 0,63 = 0,37 B- A construção do intervalo de confiança exige primeiro o calculo da margem de erro E. E= Z α/2 √ P^Q^ 1,96 x √ 0,63 x 0,37 = 0,029 n 1068 Podemos agora achar o intervalo de confiança usando P^= 0,63 e E= 0,029 P^ - E < P < P^+E 0,63 – 0,029 < P < 0,63 + 0,029 0,601 < P < 0,659 ou 60,1% < P < 65,9% O resultado costuma ser apresentado da seguinte forma: Entre os Americanos, a percentagem dos que tem secretaria eletrônica e estimada em 63%, com uma margem de erro de ± 2,9 pontos percentuais -118 - C- Determinação do tamanho da amostra Se E= Z α/2 √ P^Q^ n Podemos definir: Quando se conhece uma estimativa de P^ n = Z α/2 ² x P^ x Q^ E² Quando não se conhece uma estimativa de P^ n = Z α/2 ² x 0,25 E² EXEMPLO: As companhias de seguros estão preocupadas com o fato de que o número crescente de telefones celulares resulte em um maior número de colisões de veículos. Então, por isso, estão pensando em cobrar um prêmio maior para motoristas que usam celulares. Desejamos estimar com uma margem de erro de três pontos percentuais 3%, a percentagem de motoristas que falam ao celular enquanto estão dirigindo. Supondo que se pretende um nível de confiança de 95% nos resultados, Quantos motoristas devem ser pesquisados? A- Suponha que tenhamos uma estimativa de P^ com base em estudos anteriores que mostrou que 18% dos motoristas falam ao telefone dirigindo. B- Suponha que não tenhamos qualquer informação que possa sugerir um valor de P^ a- P^= 0,18 Q^ = 0,82 Ao nível de 95% Z α/2 = 1,96 Margem de erro 3% 0,03 n = Z α/2 x P^x Q^ 1,96² x 0,18 x 0,82 = 631 (arredondado para cima) E² 0,03² -119 - b- Quando não sabemos P^ usamos P^xQ^= 0,25 n = Z α/2 x 0,25 1,96² x 0,25 = 1068 (arredondado para cima) E² 0,03² No caso da pesquisa eleitoral Determine o tamanho da amostra necessária para saber a preferência do eleitorado com um nível de confiança de 95% e admitindo um erro de mais ou menos 2,2 pontos percentuais. SOLUÇÃO: Como desconhecemos as proporções P^ dos candidatos usamos a fórmula: n = Z α/2 x 0,25 1,96² x 0,25 = 1985 (arredondado para cima) E² 0,022² a- Calcular o mesmo exercício para um nível de confiança de 99% com margem de erro de ± 2 pontos percentuais. b- Calcular o mesmo exercício para um nível de confiança de 90% com margem de erro de ± 2 pontos percentuais. Note que essas fórmulas não incluem o tamanho da população N, neste caso e irrelevante. A maioria das pesquisas de opinião apresentadas em jornais, revistas e tv envolvem amostras com tamanho de 1000 a 2000 elementos. -120 - EXERCICIOS: 1- Usando uma amostra para estimar uma proporção populacional P. Determine a margem de erro que corresponde aos valores dados n, X, e o grau de confiança: a- n= 800 X=600 grau de confiança 95% b- n= 4275 X=2576 grau de confiança 98% c- n= 1400 X=420 grau de confiança 99% d- n= 887 X=209 grau de confiança 90% 2- Utilize os dados amostrais e o grau de confiança para construir uma estimativa intervalar para a proporção populacional P: a- n= 800 X=600 grau de confiança 95% b- n= 2000 X=300 grau de confiança 99% c- n= 2475 X=992 grau de confiança 90% d- n= 5200 X=1024 grau de confiança 98% 3- Utilize os dados abaixo para determinar o tamanho da amostra necessária para estimar uma proporção ou percentagem populacional? a- Margem de erro 0,02, nível de confiança 95% P^ e Q^ desconhecidos. b- Margem de erro 0,01, nível de confiança 90% P^ e Q^ desconhecidos c- Margem de erro 4 pontos percentuais, nível de confiança 99%, P^ estimado em 0,20 com base em estudos anteriores. d- Margem de erro 2 pontos percentuais, nível de confiança 97%, P^ estimado em 0,85 com base em estudos anteriores. 4- A Itaú seguros deseja estimar a percentagem dos motoristas que trocam fita ou CD enquanto dirigem, uma amostra de 850 motoristas acusou 544 que trocam fitas ou CD quando dirigem. -121 - a- Determine a estimativa pontual da percentagem de todos os motoristas que trocam fitas ou Cd quando dirigem. b- Determine uma estimativa intervalar de 90% da percentagem de todos os motoristas que trocam fitas ou Cd. 5- Selecionados aleatoriamente e pesquisados 500 estudantes universitários verificou/se que 135 deles tem computadores pessoais. A- Determine a estimativa pontual da verdadeira proporção populacional de todos os universitários que tem computador pessoal. B- Determine um intervalo de confiança de 95% para a verdadeira proporção de todos os universitários que tem computador pessoal. -121 - 2.5 ESTIMATIVA DE UMA VARIANÇA POPULACIONAL Neste capitulomantendo a linha de estudos dos capítulos anteriores usaremos agora a VARIANCA Populacional σ², uo ao desvio padrão σ. Para isso usaremos a distribuição Qui-Quadrado Χ ² = (n – 1) S ² σ ² n= Tamanho da Amostra S ² = Variança Amostral σ ² = Variança da população Denotamos Qui-Quadrado por Χ ². Para achar os valores críticos dos valores Qui-Quadrado recorremos à Tabela 1 a seguir. A distribuição Qui-Quadrado e determinada pelo número de graus de liberdade< neste capitulo utilizamos (n-1) graus de liberdade. Propriedades da distribuição da estatística Qui-Quadrado. 1- A distribuição Qui-Quadrado não e simétrica ao contrario das distribuições Normal e t de Student. Na medida que aumenta o número de graus de liberdade, a distribuição vai se tornando menos assimétrica. GL=10 GL=20 5 10 15 20 25 30 40 45 -122 - 2- Os valores podem ser zero ou positivos nunca negativos. 3- A uma distribuição Qui-Quadrado diferente para cada número de graus de liberdade. À medida que eles aumentam a distribuição tende à Normal. Tabela 1 Cada valor critico Χ ² corresponde a uma área dada na linhá superior da Tabela, e essa área representa a região total localizada a direita do valor critico. EXEMPLO: Determine os valores críticos de Χ² que definem regiões criticas contendo uma área de 0,025 em cada cauda. Suponhá que o tamanho da amostra seja 10, de modo que o número de graus de liberdade é 10-1= 9. solução: Conforme a figura abaixo, obtem-se o valor critico à direita (Χ² = 19,023) diretamente, localizando 9 na coluna de graus de liberdade a Esquerda e 0,025 na parte superior. O valor critico Χ² = 2,70 a esquerda mais uma vez correspondente a 9 na coluna de graus de liberdade mas devemos localizar 0,975 (1- 0,025) na parte superior, por que os valores no topo são sempre áreas à direita do valor critico. Verifique na figura abaixo, que a área total a direita de Χ ² = 2,70 e 0,975. 0,025 0,025 Χ²L=2,7 Χ²R =19,023 Este valor corresponde na coluna Este valor corresponde na coluna esquerda 9 graus de liberdade esquerda 9 graus de liberdade e e 0,975 na linhá superior 0,025 na linhá superior. Χ² (GL=9) -123 - Estimadores de σ² A variança Amostral S² e a melhor estimativa pontual da variança populacional σ². Embora S² seja a melhor estimativa de σ² não podemos avaliar quão boa e essa estimativa, portanto estabelecemos uma estimativa intervalar mais reveladora. Intervalo de confiança (ou estimativa Intervalar) para a variança populacional σ². (n-1) σ² < σ² < n-1) σ² Χ²R Χ²L Dessa expressão deferimos a estimativa Intervalar para o desvio padrão Populacional através da raiz quadrada de cada componente. √ (n-1) σ² < σ < √ n-1) σ² Χ²R Χ²L Com uma área total α dividida igualmente entre as extremidades de uma distribuição Qui-Quadrado, Χ²L denota o valor critico da extrema esquerda e Χ²R denota o valor critico da extrema direita. Outra conotação: Χ²L= Χ 1 - α/2 Χ²R = Χ α/2 EXEMPLO: Uma confeitaria fabrica bombons que são embalados em pacotes com 12 unidades pesando no total 420 g. Se a variação dos bombons e muito grande, algumas caixas terão peso a menos (prejudicando o consumidor) e outras terão peso a mais (diminuindo o lucro). Este problema pode ser evitado se os bombons tiverem um peso médio de 35 gramas e um desvio padrão de 0,60 gramas ou menos. Selecionam-se aleatoriamente, na linhá de produção, doze bombons que são pesados, dando os resultados a seguir: 35,8 35,0 36,8 36,1 34,2 35,2 36,6 35,0 33,6 34,2 -124 - Construa dois intervalos de confiança de 95%, um para σ² e outro para σ, e determine se o processo esta com problemas. Calcula-se: X = 35,25 σ n-1 = 1,070 superior ao desejado 0,60. Passamos a construção do intervalo de confiança de σ² Com uma amostra de 10 valores, temos 9 graus de liberdade. Com o grau de confiança de 95%, dividimos α = 0,05 igualmente entre as duas caudas de distribuição Χ² e localizamos os valores 0,975 e 0,25 na linhá superior. Os valores críticos de Χ²R e Χ²L na tabela são: Χ²L = 2,70 Χ²R = 19,023 X = 35,25 σ n-1 = 1,070 n = 10 Aplicamos a fórmula (n-1) σ² < σ² < n-1) σ² Χ²R Χ²L (10 –1) 1,07² < σ² < (10 –1) 1,07² 19,023 2,70 0,5416 < σ² < 3,816 ou 0,736 < σ < 1,953 Com base nesses resultados parece que o desvio padrão populacional e sempre superior ao desejado σ= 0,60 mostrando que o peso dos bombons deve ser mais consistente. Deve-se controlar melhor o processo. -125 - EXERCICIOS: 1- Ache os valores críticos Χ²L e Χ²R que correspondem ao grau de confiança e ao tamanho da amostra dados: a- 95% n = 26 b- 90% n = 60 a- 99% n = 17 a- 95% n = 50 2- Use o grau de confiança e os dados amostrais indicados para achár um intervalo de confiança para o desvio padrão populacional σ. Em cada caso admita que a população tenhá distribuição normal. a- Altura das alunas: 95% de confiança, n = 10, X = 164 S = 4,5 b- Médias das notas: 99% de confiança, n = 15, X = 7,0 S = 0,88 c- Notas de um teste: 95% de confiança, n = 16, X = 77,6 S = 14,2 d- salário da Policia: 92% de confiança, n = 19, X = R$ 1200,00 S= R$ 80,00 3- Suponhá uma pesquisa na Uniso junto aos formandos do curso de Administração, sobre o tempo gasto para se formarem. A média é de 5,15 anos e o desvio padrão 1,68 anos, Suponhá que a amostra seja 100 alunos. Com base nesses dados amostrais, construa o intervalo de 99% de confiança para o desvio padrão do tempo gasto por todos os formandos? -126 - Bibliografia Bibliografia básica FREUND, John E. e SIMON, Gary A. Estatística aplicada –economia, administração e contabilidade. Porto Alegre: Bookman, 2000. TRIOLA, Mário F. Introdução à estatística. Rio de Janeiro: LTC, 1999. Bibliografia complementar KUME, Hitoshi, Métodos Estatísticos para a Melhoria da Qualidade. São Paulo:Gente,1993. RAMOS A.W., CEP para Processos Contínuos e em Bateladas. São Paulo:E.Blucher, 2000. BUSSAB, Wilton O e MORETTIN, Pedro A. Estatística básica. São Paulo: Saraiva,2002. DOWNING Douglas e CLARK Jeffrey. Estatística aplicada. São Paulo: Saraiva, 2000. MILONE, Giuseppe e ANGELINI, Flávio. Estatística aplicada. São Paulo: Atlas, 1995. KAZMIER, L.B. Estatística aplicada à Economia e à Administração. São Paulo: McGraw-Hill, 1982. SPIEGEL, Murray R. Estatística. São Paulo: Makron Books, 1993. (519.5 S734e) -127 -
Compartilhar