Baixe o app para aproveitar ainda mais
Prévia do material em texto
Inferência Estatística Material Teórico Responsável pelo Conteúdo: Prof.ª Me. Adriana Domingues Freitas Revisão Textual: Prof.ª Dr.ª Luciene Oliveira da Costa Granadeiro Intervalos de Confiança • O Que é Uma Distribuição Amostral? E Qual a Importância do Teorema do Limite Central? • Conclusão. • Reconhecer as características de uma distribuição amostral; • Compreender o nível de confi ança como a taxa de probabilidade de sucesso do método de construção do intervalo de confi ança; • Calcular intervalos de confi ança, para parâmetros populacionais, conhecido o desvio-padrão. OBJETIVOS DE APRENDIZADO Intervalos de Confi ança Orientações de estudo Para que o conteúdo desta Disciplina seja bem aproveitado e haja maior aplicabilidade na sua formação acadêmica e atuação profissional, siga algumas recomendações básicas: Assim: Organize seus estudos de maneira que passem a fazer parte da sua rotina. Por exemplo, você poderá determinar um dia e horário fixos como seu “momento do estudo”; Procure se alimentar e se hidratar quando for estudar; lembre-se de que uma alimentação saudável pode proporcionar melhor aproveitamento do estudo; No material de cada Unidade, há leituras indicadas e, entre elas, artigos científicos, livros, vídeos e sites para aprofundar os conhecimentos adquiridos ao longo da Unidade. Além disso, você tam- bém encontrará sugestões de conteúdo extra no item Material Complementar, que ampliarão sua interpretação e auxiliarão no pleno entendimento dos temas abordados; Após o contato com o conteúdo proposto, participe dos debates mediados em fóruns de discus- são, pois irão auxiliar a verificar o quanto você absorveu de conhecimento, além de propiciar o contato com seus colegas e tutores, o que se apresenta como rico espaço de troca de ideias e de aprendizagem. Organize seus estudos de maneira que passem a fazer parte Mantenha o foco! Evite se distrair com as redes sociais. Mantenha o foco! Evite se distrair com as redes sociais. Determine um horário fixo para estudar. Aproveite as indicações de Material Complementar. Procure se alimentar e se hidratar quando for estudar; lembre-se de que uma Não se esqueça de se alimentar e de se manter hidratado. Aproveite as Conserve seu material e local de estudos sempre organizados. Procure manter contato com seus colegas e tutores para trocar ideias! Isso amplia a aprendizagem. Seja original! Nunca plagie trabalhos. UNIDADE Intervalos de Confiança O Que é Uma Distribuição Amostral? E Qual a Importância do Teorema do Limite Central? Imagine uma população e, a partir dessa população, você seleciona um número de amostras, de mesmo tamanho “n” e, para fazer a análise estatística, para cada uma dessas amostras, calcula o respectivo estimador – chamamos de distribuição amostral o conjunto dos valores dos estimadores obtidos nas amostras de tamanho n de uma mesma população. População Amostra Amostra Amostra Amostra Amostra Amostra Amostra Amostra Amostra Amostra amostra Figura 1 – População e Amostras Vamos supor que, para as n amostras de uma determinada população, você calcule a média x , tendo em mente que as amostras nem sempre apresentarão o mesmo valor de média, cada qual terá seu respectivo valor, algumas próximas entre si, umas mais próximas do valor real da média μ da população, outras nem tanto. A Distribuição Amostral é, então, a distribuição das frequências de um determinado estimador (ou estatística) – no caso do nosso exemplo, é a média, obtida a partir das diversas amostras de uma mesma população, mas poderíamos ter utilizado outro estimador, como, por exemplo, a proporção. Ao somar essas respectivas estatísticas amostrais e dividir pelo número de amos- tras, você obterá o que chamamos de Média Amostral. Muito frequentemente não há acesso à população, e nem sempre é possível observar um número grande de amostras, mas, quanto maior o número de amos- tras da população, mais próximo se chega da distribuição amostral. É importante destacar que a distribuição amostral se aproxima da distribuição normal e suas características: como ser simétrica e centrada na média. Cabe ressaltar que essas características a respeito da média e do desvio padrão de uma distribuição amostral aplicam-se para qualquer população, não apenas para a Normal. O Teorema do Limite Central (TLC) diz que, quando se retira uma amostra aleatória simples de tamanho n, de uma população qualquer com média μ e 8 9 desvio-padrão finito σ, a distribuição amostral da média amostral x é aproxima- damente Normal, mesmo que os dados originais não tenham uma distribuição normal, ou seja: ,x N n s m æ ö÷ç@ ÷ç ÷÷çè ø Esse teorema é especialmente importante para a inferência estatística, uma vez que permite calcular estimadores e inferir para os parâmetros sem o conhecimento completo da distribuição da população. Assim, com técnicas e procedimentos estatísticos, podemos estimar, com certo grau de confiabilidade, parâmetros sobre as populações a partir dos resultados ob- tidos para os estimadores das amostras. Características de uma Distribuição Amostral Uma Distribuição Amostral se aproxima da curva normal, desde que o tamanho da amostra seja razoavelmente grande, com n > 30. A média da distribuição amostral, ou seja, a média das médias amostrais é igual à média populacional (μ). A variância da média amostral, ou seja, Var (x ) será igual à variância das distri- buições amostrais. Temos então que: ( ) ( ) 2 2 x xVar n s s= = . Assim, quanto maior o número de amostras, a variância das médias amostrais tende a ser igual à variân cia da população. Já o desvio padrão da média amostral será: ( ) ( ) 2 x x n s s s= = . O desvio padrão de uma distribuição amostral (s) é menor do que o da po- pulação (σ), ou seja, a média amostral é mais estável do que os escores que a compõem. O Desvio Padrão de uma Distribuição Amostral, também chamado de erro padrão, é o desvio padrão das médias das amostras. É a medida que mostra o quanto uma amostra pode ser representativa da população, já que, normalmente, não é possível ter acesso a todas as amostras de uma população. Nesse caso, gerenciamos o erro padrão a partir da seguinte fórmula. X s N s = A distribuição amostral de uma variável é a distribuição dos valores da variável entre todos os indivíduos da amostra, já a distribuição amostral de um estimador (ou estatística) é a distribuição dos valores assumidos pelo estimador (estatística) em todas as amostras possíveis de mesmo tamanho, de uma mesma população. 9 UNIDADE Intervalos de Confiança A distribuição populacional descreve os indivíduos que constituem a população, en- quanto a distribuição amostral descreve como a estatística varia em muitas amos- tras extraídas da população. Intervalo de Confiança O intervalo de confiança é um procedimento estatístico, a partir de dados amos- trais, para inferência de um parâmetro populacional. Vale destacar que: o intervalo de confiança é uma estimativa, em forma de intervalo para o parâmetro populacio- nal e não um único valor pontual estimado. Assim, ao invés de estimar um valor pontual, é calculado um intervalo, determinado por dois números, no qual se espe- ra que, com uma determinada margem de confiança, baseada em probabilidade, esteja o valor real do parâmetro da população. Figura 2 – Esquema Gráfico: intervalo de confiança Esse intervalo de confiança é determinado a partir de um valor da amostra (cha- mada também de estimativa pontual), pela margem de erro e um nível de confiança. O intervalo de confiança de nível C para um parâmetro é constituído, então, de duas partes, normalmente escrito da seguinte forma: estimativa ± margem de erro e um nível de confiança C, que fornece a probabilidade de que o intervalo contenha o verdadeiro valor do parâmetro em amostras repetidas. Esse nível de confiança C é arbitrário, ou seja, por escolha do pesquisador. Nor- malmente esse nível varia de 90%a 99% e é usual o valor escolhido ser de 95%. Observe que, ao escolher o nível de confiança, temos previamente definida a probabilidade do determinado intervalo de confiança conter efetivamente o valor do parâmetro populacional. Para compreender melhor esse nível de confiança e a margem de erro, tomemos o exemplo de uma população para a qual desejamos calcular a média populacio- nal μ. Como não há condições de analisar toda a população, podemos extrair dez amostras de tamanho n e realizar o cálculo da média x em cada amostra. Logo, teremos dez médias ( x � x x � x � x � x � x � x � x x�� � � � � � � � � ��, , , , , , , , e ) que não terão todas exata- mente o mesmo valor, talvez algumas com valores mais próximos ou até mesmo iguais, já outras com valores mais distantes. Se, a partir de cada média xn , calcularmos o respectivo intervalo de confiança para cada uma das dez amostras e, por exemplo, assumirmos o nível de confiança de 90%, temos então que, estatisticamente, a probabilidade de o valor da média populacional μ estar contida no determinado intervalo é de 9 em 10. 10 11 Observe o esquema a seguir no qual ilustramos o exemplo: valor de µ x1 x2 x3 x4 x5 x6 x7 x8 x9 x10 Figura 3 – Esquema gráfi co para o Intervalo de Confi ança para um dado Nível de Confi ança Note que, no esquema gráfico, temos a média populacional μ que é o parâmetro fixo da população, ao passo que temos uma variação da média x para cada amos- tra e, observe que cada amostra possui sua respectiva média contida no intervalo de confiança (já que esse é calculado à parte da média de cada amostra) e quase todos contêm também o valor da média populacional μ (destacado em vermelho). Porém, como nesse exemplo adotamos o Nível de Confiança de 90%, implica que 9 em cada 10 amostras (90%) possuem em seu intervalo de confiança o valor da média populacional μ, em contrapartida, 1 em 10 (10%) não contém o valor em seu respectivo intervalo de confiança e que no esquema gráfico está representado pelo intervalo que contém a média x8. Importante ressaltar que usamos a média como exemplo, mas poderíamos ter falado de qualquer outro parâmetro como proporção, desvio padrão e variância. Para calcular o intervalo de confiança, de determinado parâmetro, devemos cal- cular a estimativa, a partir dos dados amostrais, e a margem de erro (descrita por ±) para que justamente tenhamos, a partir dessa margem, o extremo inferior e o ex- tremo superior do intervalo de confiança a um determinado nível de confiança C. Uma forma de ilustrar essa situação são as pesquisas para intenção de votos, nas quais cada candidato possui, a partir de uma amostra, a estimativa para o pa- râmetro proporção de votos. Essa estimativa vem descrita em forma de intervalo de confiança, como, por exemplo: candidato A possui 27% ± 2% com nível de confiança de 95%. O que representa essa informação? Representa que o candidato possui de 27% de intenção dos votos com variação de 2% para mais e para menos, a um nível de confiança de 95%, assim, estatisticamente, o parâmetro real estima- do está no intervalo 25% ≤ P ≤ 27%, com uma probabilidade de 95% de chances de pertencer ao intervalo dado. 11 UNIDADE Intervalos de Confiança –2% +2% 25% 27% 29% Figura 4 – Intervalo de Confiança Dessa forma, ao considerar a população de eleitores, se escolhêssemos 100 amostras distintas de mesmo tamanho n, a intenção de votos para esse candidato pertenceria ao intervalo de 27% ± 2% em 95 delas. Observe que, para construir o intervalo de confiança, não são necessárias as 100 amostras, mas apenas uma amostra que representa as demais e, a partir dessa amos- tra, teremos a estimativa para o parâmetro de acordo com o nível de confiança C. Cálculo do Intervalo de Confiança para a Média Calcular o intervalo de confiança para a Média Populacional μ implica ter acesso ao número n de termos de amostra, à média x da amostra e ao desvio-padrão populacional. Com esses dados, utilizamos o valor crítico z da distribuição normal de probabilidade para realizar o cálculo. O valor crítico z é o número que engloba a probabilidade, sob a curva normal padrão de distribuição normal. Importante destacar que nem sempre é possível ter acesso ao desvio-padrão σ populacional ou à variância σ2. Na realidade, situações como essa são mais co- muns de ocorrer do que o valor do desvio padrão e a variância populacional serem conhecidos, e nesse caso usamos outra distribuição estatística, que veremos em unidades posteriores, a Distribuição t de Student. Veremos, então, como realizar o cálculo para o intervalo de confiança para a Média Populacional μ conhecido o desvio padrão σ. Intervalo de Confiança para Média, conhecido o Desvio Padrão σ Um intervalo de confiança para μ com desvio-padrão conhecido é obtido por: x z n s m= ± Onde: • o valor crítico z é o número que engloba a probabilidade, sob a curva normal padrão de distribuição normal; • x é a média amostral; • n é o número da amostra; • σ é o desvio padrão populacional. 12 13 Observe a figura a seguir. Se partirmos da média amostral x e nos afastarmos z n s tanto à esquerda como à direita de x , obteremos o intervalo que contém a média populacional μ em uma proporção C de todas as amostras. A área sob a curva normal delimitada entre os valores de –z e z corresponderá ao intervalo de confiança de acordo com o determinado nível de confiança estabelecido. Observe que as áreas à esquerda e à direita de z têm relação direta com o nível de confiança estabelecido e como a curva é simétrica em relação à média, então essas áreas são determinadas por: (1-C)/2 em cada um dos extremos da curva. –Z Zx 1 – C 2 1 – C 2 Área correspondente ao intervalo de con�ança C Figura 5 – Esboço correspondente ao intervalo de confi ança Observe que, se o nível de confiança for de 95% (0,95), então a área lateral, em cada um dos extremos da normal padronizada, será dada por (1-C)/2 = (1-0,95)/2 = 0,05/2 = 0,025. –Z Zμ 0,025 0,475 0,025 0,475 0,95 Figura 6 – Esboço correspondente ao nível de Confi ança de 95% Convém observar que, se temos um Nível de Confiança maior, teremos um intervalo maior, o que implica também em uma margem de erro maior. Já se tivermos um Nível de Confiança menor, teremos um intervalo menor, o que implica uma margem de erro menor. Ex pl or Mais à frente, retomaremos essa reflexão com um exemplo numérico e verifica- remos como se comportam os intervalos de confiança. 13 UNIDADE Intervalos de Confiança Vejamos agora como realizar o cálculo para definir o intervalo de confiança para uma média μ se for conhecido o desvio-padrão σ. Exemplo 1: calcule o intervalo de confiança para a média populacional μ, com nível de confiança de 95%, suponha uma amostra de 80 registros cuja média é x = 40 e é conhecido o desvio-padrão σ = 6. Para a resolução, sabemos que o intervalo de confiança numericamente será dado por: µ σ = ±x z n Dos dados informados, temos que: x = 40; σ = 6 e n = 80. O número z vem a partir da observação da tabela normal. Veremos, ainda, nesta unidade, que normalmente se utilizam três valores de z para os seguintes níveis de confiança: 90%, 95% e 99%. Porém, para compreendermos o que de fato repre- senta cada um desses valores, bem como podermos conferir maior liberdade na escolha do nível de confiança (além dos valores de 90%, 95% e 99%), exploraremos como reconhecer esse valor de z, a partir do entendimento do nível de confiança e da análise da tabela normal reduzida. Para identificar z na tabela normal, temos que fazer a análise do nível de con- fiança que foi solicitado. Perceba que a área toda abaixo da curva normal padrão corresponde a 100%, ou seja, 1. Como o nível de confiança solicitado foi de 95%, então temos que a área será correspondente a 0,95. Devemos lembrar que a área sob a curva normal é dividida em duas partes iguais e simétricas; logo, a área de 0,95 será composta por duas áreas de 0,475, uma à esquerdada média e outra à direita da média. Da mesma forma, temos que 1 – C = 1 – 0,95 = 0,05 que corresponde a 5% (0,05) e será representando no esboço por duas áreas simétri- cas de 0,025. –Z Zμ 0,025 0,475 0,025 0,475 Figura 7 – Intervalo de Confiança, com nível C de 95% Observe na figura que 95% (0,95) correspondem à soma de duas áreas simétri- cas de 0,475 (47,5%). 14 15 Logo, o valor de z, na tabela normal reduzida, será o valor correspondente a 0,475. A tabela que apresentaremos é a tabela mais usual e traz valores para uma variável x, que esteja entre 0 (que é a média da normal padronizada) e o valor de z procurado, ou seja, ela fornece o valor das áreas para dados intervalos em que 0 ≤ x ≤ z. Mas devemos alertar que em alguns livros didáticos, a tabela apresentada é a Tabela Normal Acumulada. Os valores estão sob a perspectiva da área acumulada e não a partir do zero. Isso muda a leitura dos dados, mas não o resultado final. Contudo, neste estudo, utilizaremos sempre a Tabela Normal Reduzida z ≥ 0. Como já vimos anteriormente, nessa tabela reduzida, na primeira coluna da esquerda, temos o valor inteiro e o primeiro decimal de z. As demais colunas cor- respondem ao segundo decimal do valor de z. Consideraremos o valor z sempre com duas casas decimais. Bem, em nosso exemplo, desejamos obter o valor de z para a área correspon- dente a 0,475 (47,5% que são metade de 95% solicitados como nível de confian- ça). Observe que, na tabela, o valor de 0,475 está na direção do encontro de 1,9 (primeira coluna de z) e 0,06. O que significa que 0,475 em área correspondem ao z = 1,960. Figura 8 – Tabela normal Reduzida z ≥ 0 Com o valor de z = 1,960, podemos dar prosseguimento aos cálculos do inter- valo de confiança. Dos dados informados, temos que x = 40; σ = 6, n = 80 e, conforme verificado, z = 1,960. 15 UNIDADE Intervalos de Confiança Logo, o intervalo de confiança será dado por: 640 1,960 80 640 1,960 80 40 1,31 x z n s m m m m = ± = ± = ± = ± Assim, ao nível de confiança de 95%, a partir da média x = 40 da amostra, sa- bemos que o intervalo de confiança envolve dois extremos: um que está abaixo do valor de e outro está 1,31 acima, ou seja, com base nos dados da amostra, temos que a média populacional será de 40 com margem de erro de ± 1,31. Portanto, está no intervalo de confiança de 38,69 ≤ μ ≤ 41,31 com nível de confiança de 95%. Exemplo 2: calcule o intervalo de confiança para a média populacional μ, sa- bendo que o desvio padrão é σ = 2,5 e a média x = 7,25 em uma amostra de 50 registros, considere o nível de confiança de 90%. Para a resolução, sabemos que o intervalo de confiança numericamente será dado por: µ σ = ±x z n Dos dados informados, temos que: x = 7,25; σ = 2,5 e n = 50, com o nível de confiança de 90%. Como sabemos, a área abaixo da curva corresponde a 1, como o nível de con- fiança será de 90%, teremos 0,9 para a área que representa o intervalo de confian- ça, e novamente essa área (agora em 0,9) se distribui em duas regiões simétricas, agora em 0,45. Observe que, para (1-C)/2, teremos (1 -0,9)/2 = 0,1 / 2 = 0,05. –Z Zμ 0,05 0,45 0,05 0,45 Figura 9 16 17 Ao observar, na tabela normal padronizada, o valor de z para a área de 0,45, temos: Figura 10 – Tabela normal Reduzida z ≥ 0 Observe que não há exatamente o valor 0,45 na tabela, então buscamos a média entre os dois mais próximos. Veja que próximos do valor de 0,45 temos 0,4495 e 0,4505, que correspondem respectivamente a 0,04 e 0,05, o que nos fornece como média 0,045. Portanto, o valor de z, será 1,6 + 0,045 = 1,645. Dessa forma, temos que o valor de z, para a área de 45% será 1,645 e sabemos que x = 7,25; σ = 2,5 e n = 50, logo: 2,57,25 1,645 50 7,25 0,58 m m = ± = ± Portanto, ao nível de confiança de 90%, a partir da média x = 7,25 da amostra, sabemos que o intervalo de confiança envolve dois extremos: um que está 0,58 abaixo do valor de x e outro está 0,58 acima, ou seja: a média populacional μ está no intervalo de confiança de 6,67 ≤ μ ≤ 7,83 com nível de confiança de 90%. Exemplo 3: antes de abordar outros exemplos, veremos na tabela padronizada, qual será o valor de z para um intervalo de confiança de 99%. Ora, se o intervalo de confiança será de 99%, então a área correspondente (na tabela normal reduzida) será 0,99/2 = 0,495. E nossa margem de erro terá área correspondente a 0,005. Ao procurar o valor de z correspondente a 0,495, na tabela padronizada redu- zida, observamos que não temos exatamente o valor procurado, mas dois valores próximos que são: 0,4949 e 0,4951, que correspondem a 0,07 e 0,08 na coluna do segundo dígito, que nos fornecem a média de 0,76. Logo, o valor será de 2,576. 17 UNIDADE Intervalos de Confiança Figura 11 – Tabela normal Reduzida z ≥ 0 Dessa forma, o valor de z, na tabela normal reduzida, para o cálculo de um in- tervalo de confiança, considerando 99% de nível de confiança, é de 2,576. Como mencionamos anteriormente, os níveis de confiança mais usuais são: 90%, 95% e 99% e os respectivos valores críticos de z, para esses níveis, conforme verificamos nos exemplos anteriores, são respectivamente: Tabela 1 Nível de Confiança C 90% 95% 99% Valor Crítico z 1,645 1,960 2,576 Assim, os exemplos que veremos a seguir estarão com base nesses níveis de confiança, contudo, caso você deseje outros níveis de confiança, basta usar a tabela normal para consultar o z crítico, ou softwares estatísticos. Exemplo 4: uma amostra da altura de trinta estudantes do sexo feminino da faixa etária de 16 anos, em uma determinada cidade, apontou média de altura de 165cm. Sabendo que o desvio-padrão populacional é de σ = 3,8cm, calcule os intervalos de confiança para μ populacional, com nível de confiança de 90%, pos- teriormente com 95% e, por fim, 99%; Inicialmente, calcularemos para o nível de confiança de 90%. Temos conhecidos: n =30, x = 165 e σ = 3,8. Além disso, para nível de con- fiança de 90%, temos z = 1,645, logo: 3,8165 1,645 30 165 1,14 x z n s m m m = ± = ± = ± Logo, ao nível de confiança de 90%, a partir da média x = 165 da amostra, sabemos que o intervalo de confiança envolve dois extremos: um que está 1,14 abaixo do valor de x e outro está 1,14 acima, ou seja, com base na amostra anali- sada, temos que a média populacional μ da altura está no intervalo de confiança de 163,86 ≤ μ ≤ 166,14 com nível de confiança de 90%. 18 19 Agora faremos a estimativa de μ com um nível de confiança de 95%. Continuamos utilizando: n = 30, x = 165 e σ = 3,8, porém, agora com outro nível de confiança, e para o nível de confiança de 95%, temos z = 1,960: 3,8165 1,960 30 165 1,36 x z n s m m m = ± = ± = ± Logo, a média populacional μ estimada é de μ = 165 ± 1,36 ao nível de confiança de 95%. O que implica que, em com 95%, de chances de acertos a média populacio- nal μ da altura estará no intervalo de: intervalo de confiança de 163,64 ≤ μ ≤ 166,36. Por fim, faremos a estimativa de µ com um nível de confiança de 99%. Continuamos utilizando: n = 30, x = 165 e σ = 3,8, porém, agora com outro nível de confiança, e para o nível de confiança de 99%, temos z = 2,576: 3,8165 2,576 30 165 1,79 x z n s m m m = ± = ± = ± Logo, a média populacional μ estimada é de μ = 165 ± 1,79 ao nível de confiança de 99%. O que implica que, em com 99% de chances de acertos, a média populacio- nal μ da altura estará no intervalo de: intervalo de confiança de 163,21 ≤ μ ≤ 166,79. Observe, na imagem abaixo, a ilustração (sem escala) dos três intervalos com os respectivos níveis de confiança: –1,14 +1,14 163,86 166,14 NC = 90% x = 165 –1,36 +1,36 163,64 166,36 NC = 95% x = 165 –1,79 +1,79 163,21 166,79 NC = 99% x = 165 Figura 12 – Esboço dos Intervalos de Confi ança, com a variação do Nível de Confi ança 19 UNIDADE Intervalos de Confiança É intuitivo observar que um maior nível de confiança (em um mesmo tamanho de amostra) aumenta o intervalo no qual se estima a médiae, portanto, aumenta também a margem de erro, dessa forma, diminuindo a precisão da inferência para o parâmetro. O contrário também é verdadeiro. Com um nível de confiança menor, é constru- ído um intervalo de confiança menor e, assim, com menor margem de erro (maior precisão na estimativa), porém, com menor nível de confiabilidade. Devemos perceber que, para obtermos uma margem de erro menor, é preciso uma menor confiança de que os dados de fato representem a realidade. Uma pequena margem de erro representa uma maior precisão e um maior nível de confiança representa uma maior probabilidade de os dados estarem próximos do real. Vale ainda observarmos que, matematicamente, a margem de erro para o inter- valo de confiança é dada por: z n s E que s n interfere na margem de erro, mesmo deixando um z fixo. Ou seja: vamos supor que tenhamos um nível de confiança de 90%, ao aumentar o ta- manho n da amostra, reduziremos a margem de erro. Para se ter uma ideia de como se dá essa redução, cabe destacar, que como n está em uma raiz quadrada, o aumento da amostra deve ser de pelo menos 4 vezes para reduzir a margem de erro pela metade. Em linhas gerais, ao construir um intervalo de nível de confiança podemos pon- derar entre menor margem de erro ou maior nível de confiabilidade, levando em consideração o tamanho da amostra a ser trabalhada. Exemplo 5: para uma avaliação da satisfação dos clientes de um determinado callcenter, há uma nota final atribuída a cada atendimento que vai de 1 a 5. Do úl- timo experimento realizado, é conhecido o desvio padrão populacional de 2,5 pontos. A partir da amostra de 20 avaliações, conforme tabela a seguir, devemos estimar a média de avaliação dos clientes desse callcenter com um nível de con- fiança de 90%. 4,0 3,0 4,0 3,0 2,0 1,0 2,0 1,0 4,0 3,0 1,0 1,0 4,0 5,0 3,0 2,0 5,0 4,0 4,0 3,0 Resolução: sabemos que, para calcular a estimativa de μ, precisamos de x , σ e z. É informado que σ = 2,5 e o nível de confiança esperado é de 90%, então temos que z = 1,645. A partir da amostra das 20 avaliações, podemos calcular x . 20 21 Temos que 1 x n i ix n = S = logo: 59 2,95 20 x = = . Agora basta calcular μ: 2,52,95 1,645 20 2,95 0,92 x z n s m m m = ± = ± = ± Portanto, podemos afirmar com 90% de chances de certeza de que a média de avaliação dos clientes desse callcenter é uma nota compreendida com 90% de confiança, entre 2,03 e 3,87. Conclusão A partir da distribuição amostral, por meio da Teoria do Limite Central, temos a possibilidade de descrever os valores dos estimadores em todas as amostras pos- síveis de um mesmo tamanho n e, além disso, com base em uma amostra, realizar a inferência para parâmetros populacionais. Importante destacar que a amostra é a parte do todo, ou seja: a amostra é um subconjunto da população e devemos diferenciar que um parâmetro (μ, σ, σ2 e π) descreve uma população, ao passo que uma estimativa, ou estatística, (x , s, s2 e p) descreve uma amostra, que a amostra é uma parte da população. Vimos, no decorrer desta unidade, que a inferência estatística é um conjunto de técnicas e procedimentos estatísticos e probabilísticos que permitem ao pesquisa- dor afirmar, com certa confiabilidade, medidas que caracterizam uma determinada população que são construídas a partir de resultados observados em amostras des- sa população. Dentre essas técnicas e procedimentos, o destaque desta unidade ficou para o intervalo de confiança que, a partir de dados amostrais, permite calcular um pa- râmetro desconhecido de uma população. Veja que nos nossos exemplos tivemos sempre situações nas quais o valor do desvio padrão, ou variância populacional eram conhecidos, mas há casos em que isso não é possível, então a técnica se al- tera, e utilizamos outros métodos como veremos na sequência dos nossos estudos. É importante ter em mente que o nível de confiança é a taxa de possibilidade de acerto de o intervalo de confiança construído conter de fato o valor do parâmetro populacional. Contudo, trata-se de uma probabilidade e temos uma margem de erro que se torna menor à medida que o tamanho da população se torna maior e o desvio padrão menor. Em se tratando ainda de nível de confiança, quanto menor o 21 UNIDADE Intervalos de Confiança nível de confiança, maior será o intervalo (se perde talvez na precisão), mas maior a chance de o intervalo conter o valor real do parâmetro da população. Procure reler o material, assista à videoaula e refaça os exemplos do material e, para complementar seus estudos ou aprofundá-los, não deixe de ver a indicação do material complementar. Esperamos que você tenha uma excelente trilha de aprendizagem. Bons estudos! 22 23 Material Complementar Indicações para saber mais sobre os assuntos abordados nesta Unidade: Vídeos Tabela da Normal Padrão: como usar | Distribuição Normal de Probabilidades Para esclarecer melhor como fazer a leitura de uma tabela normal, assista ao vídeo do prof. Conrad Pinheiro. https://youtu.be/OTyc8gUHqv0 Exercícios sobre intervalo de confiança para média Como exemplo de exercício resolvido, recomendamos o vídeo da UNIVESP, com o prof. André Fleury. https://youtu.be/unNyFOmbovo Intervalo de Confiança para a Média com Variância Conhecida https://youtu.be/SReIn8aCCNo Conceitos Básicos de Estatística II – Distribuição Amostral e Teorema do Limite Central Para aprodundar o tema de distribuição amostral, recomendamos o link abaixo que traz uma palestra da Universidade Federal do ABC a respeito do tema. https://youtu.be/ykfZzVYd0W8 Leitura Exercícios de Intervalos de Confiança para media, variância e proporção Para treinar, recomendamos o acesso à lista de exercícios resolvidos que está disponível no link da Universidade do Estado de São Paulo. http://bit.ly/2ma52yQ Leitura A estatística básica e sua prática Para melhor aprofundamento dos temas tratados nesta unidade, sugerimos a leitura dos capítulos 15 e 16 do livro: A estatística básica e sua prática. MOORE, D. S.; NOTZ, W. I.; FLIGNER M. A. A estatística básica e sua prática. Tradução de Ana Maria Lima de Farias. Rio de Janeiro: LTC, 2017. 23 UNIDADE Intervalos de Confiança Referências MOORE, D. S.; NOTZ, W. I.; FLIGNER M. A. A estatística básica e sua prática. Tradução de Ana Maria Lima de Farias. Rio de Janeiro: LTC, 2017. 24
Compartilhar