Baixe o app para aproveitar ainda mais
Prévia do material em texto
52 Unidade II Unidade II Amostragem: estimação e decisão estatística A partir de agora, iremos nos aprofundar nas teorias da estimação estatística e da decisão estatística. Na primeira dessas teorias, talvez o campo mais usado e conhecido da amostragem, veremos como estimar uma população a partir de amostras dela retiradas. Na segunda teoria, nossa preocupação será diferenciar o que é causal do que é casual na amostragem. Objetivos do módulo Anteriormente, vimos que é possível prever o comportamento de amostras sabendo o comportamento da população do qual elas são retiradas. Do ponto de vista prático, no entanto, normalmente é mais interessante o movimento ao contrário, ou seja, a partir do estudo de uma amostra, estimar-se o comportamento de uma população. Podemos, por exemplo, prever quem será eleito em uma próxima eleição a partir de uma pesquisa eleitoral, ou estimar qual será o volume de vendas de um produto que iremos lançar a partir de uma pesquisa de mercado, ou, ainda, quantos desempregados existem em uma região ou em um país. Já aprendemos que uma maneira imediata e intuitiva de se conhecer um problema é coletar todos os dados relativos a ele. Estatisticamente é a ideia do censo. Porém, muitas vezes é impossível ou difícil de fazê-lo. Envolve muito trabalho e custo, isso quando os dados forem reais; se forem improváveis, nem com muito trabalho chegaremos a um resultado adequado. A alternativa é coletarmos e estudarmos amostras e a partir delas estimarmos a população. Essas estimativas estão no centro do próximo assunto que iremos abordar. Por outro lado, também vimos que em estatística sempre estamos sujeitos a cometer erros de predição. Mensurar, diminuir e se possível eliminar esses erros é fundamental para a qualidade do estudo estatístico. Veremos isso aqui, quando serão estudadas casualidade e causalidade dos experimentos. Saiba mais Uma das mais importantes pesquisas por amostragem no Brasil é a PNAD – Pesquisa Nacional por Amostra em Domicílios, base para grande parte do planejamento econômico nacional. INSTITUTO BRASILEIRO DE GEOGRAFIA E ESTATÍSTICA. Pesquisa nacional por amostra de domicílios (PNAD). Disponível em: <https://ww2.ibge.gov. br/home/estatistica/pesquisas/pesquisa_resultados.php?id_pesquisa=40>. Acesso em: 13 jun. 2019. 53 ESTATÍSTICA APLICADA 5 TEORIA DA ESTIMAÇÃO ESTATÍSTICA A princípio, o valor central da amostra é igual ao valor central correspondente da população. Por exemplo, tomamos uma amostra de um determinado processo produtivo e ela revelou uma produtividade média de 150 toneladas por hora ( X = 150 t/h). É lícito pensar que se fosse possível avaliar toda a população (ou seja, as infinitas vezes em que o processo foi e será repetido), a produtividade média dela seria 150 toneladas por hora também (µ = 150 t/h). Esse raciocínio é conhecido por estimativa por pontos. É intuitivo notar que esse tipo de estimativa é lógico, mas dificilmente exato. Acasos ocasionarão variações que têm que ser de algum modo consideradas. Isso nos conduz ao conceito de fidedignidade da estimativa, que consiste em declarar um intervalo de variação. É a chamada estimativa por intervalos. No caso do processo produtivo, estimaríamos que a produtividade estivesse, por exemplo, entre 145 e 155 t/h, portanto, uma estimativa por intervalos. Calcular esses intervalos é o nosso problema desta etapa. Esse campo do estudo estatístico é conhecido como inferência estatística, sendo esta normalmente feita com a definição dos chamados intervalos de confiança. Suponha uma distribuição amostral das médias cuja média seja Xµ e o erro padrão Xσ . Note que uma amostra qualquer, retirada da população correspondente, deve pertencer a essa distribuição. Consequentemente, podemos afirmar que temos 100% de certeza (ou de confiança) que a média de toda e qualquer amostra estará dentro do intervalo entre X X X X4 até 4µ − σ µ + σ . Lembrete A curva normal tem como uma de suas características mais notáveis o fato de que varia entre mais ou menos quatro vezes o desvio padrão, em torno da média. Não existem probabilidades acima ou abaixo desses limites. Logo, se uma amostra ou população tiver média igual a 10 e desvio padrão igual a 1, será impossível se obter nela valores acima de 14 ou abaixo de 6. Vamos entender melhor isso através de um exemplo numérico. Suponha que a população de alunos da UNIP que cursaram Estatística no passado apresente uma nota média igual a 6,2, com desvio padrão igual a 0,4, distribuída normalmente. Para estudo, retiramos uma amostra de 16 alunos. Qual a nota média amostral decorrente, ou seja, entre que valores essa amostra pode ocorrer? Os parâmetros amostrais seriam: X 6,2µ = µ = 54 Unidade II X X X 0,4 0,1 n 16 σσ = → σ = → σ = Portanto, temos 100% de certeza que qualquer amostra de 16 alunos retirada da população de alunos de Estatística da UNIP terá sua média entre 5,8 e 6,6. É estatisticamente impossível um valor médio superior a 6,6 ou inferior a 5,8 ocorrer. Podemos fazer o raciocínio inverso. Caso tomemos uma amostra com X e desvio padrão S, poderemos afirmar com 100% de certeza que o valor real da população estará entre X − S até X + S. Vamos imaginar que temos uma amostra com 25 alunos de Matemática Financeira da UNIP e calculamos sua média e desvio padrão chegando aos valores X = 5,6 e S = 2,5. Podemos estimar que a nota média desses estudantes (todos) estará entre 3,6 e 7,6, com 100% de certeza. Veja os cálculos: X X 5,6µ = µ = = X X X 2,5 0,5 n 25 σσ = → σ = → σ = X X X X4 até 4 5,6 4 0,5 até 5,6 4 0,5 3,6 até 7,6µ − σ µ + σ = − × + × = Observação Nesses cálculos, utilizamos a média da amostra ( X ) no lugar da média da população (µ) e o desvio padrão da amostra (S) em vez do desvio padrão da população (σ), visto não conhecermos os parâmetros populacionais (é o que desejamos saber). O uso alternativo da média é obvio. Espera-se que as médias da amostra, da população e a amostral sejam iguais, por definição de amostragem. Já a igualdade dos desvios padrões é menos intuitiva, mas pode ser assumida se n ≥ 30 ou se a distribuição for normal. Quando isso não acontecer, recairemos na Teoria das Pequenas Amostras, que não é objeto dos nossos estudos. Essa estimativa não é satisfatória, afinal, prever que as notas médias estarão entre 3,6 e 7,6 é pouco melhor do que prever que elas estejam entre 0 e 10 e para isso não precisaríamos de estatística. Temos duas maneiras de aperfeiçoá-la. A primeira é aumentar o número de elementos da amostra. Imagine que pegamos uma amostra de 100 alunos e que ela também apresenta os mesmos valores de média e desvio padrão. Refazendo os cálculos, notaríamos uma melhoria significativa: 55 ESTATÍSTICA APLICADA X X 5,6µ = µ = = X X X 2,5 0,25 n 100 σσ = → σ = → σ = X X X X4 até 4 5,6 4 0,25 até 5,6 4 0,25 4,6 até 6,6µ − σ µ + σ = − × + × = Estima-se, portanto, que a média de todos os alunos de Matemática Financeira da UNIP esteja entre 4,6 e 6,6, com 100% de certeza. Reduziu-se pela metade a margem de erro da estimativa, mas o custo foi multiplicado por quatro. Esse é um grande problema da amostragem, o custo aumenta muito mais rapidamente que a precisão. Observação Usamos os termos “margem de erro” e “erro esperado” como sinônimos do intervalo de confiança de uma estimativa, que é a variação prevista para mais e para menos da estimativa por pontos. A segunda maneira é trabalhar com níveis de confiabilidade, ou confiança, menores, assumindo algum risco de estarmos em desacordo com a realidade. O gráfico a seguir demonstra esse raciocínio. Z P(z) 68,2% 95,4% 97,7% 100,0% -4σx -3σx -2σx -1σx µx 1σx 2σx 3σx 4σx Figura 14 56 Unidade II Observe que a probabilidade de que uma amostra tenha valor médio entre X X X X4 até 4µ − σ µ + σ é de 68,2%, quer dizer, temos uma confiança de 68,2% de que o valor médio de uma amostraqualquer esteja entre aqueles valores mencionados. Em outras palavras, o intervalo de confiança de 66,2% são os valores entre X X X X até µ − σ µ + σ . De modo semelhante, o intervalo de confiança de 99,7% está entre X X X X3 até 3µ − σ µ + σ , e assim por diante. O número de erros padrões que estabelecem a confiabilidade é chamado de coeficientes de confiança ou valores críticos e simbolizado por zc. Podemos determinar uma confiança a partir do valor crítico ou, ao contrário, estabelecer o valor crítico a partir da confiança desejada, utilizando a tabela da curva normal reduzida. Por exemplo, caso queiramos trabalhar com uma confiabilidade de 90%, o valor crítico será de 1,645. Chega-se a esse valor através do raciocínio estabelecido no gráfico a seguir: Z P(z) -Zc Zc 100% - 90% 2 = 5% = 0,0500 100% - 90% 2 = 5% = 0,050090% Figura 15 Utilizando a tabela da distribuição reduzida, teríamos: tab cA 0,0500 z 1,645= → = − Perceba que a área 0,0500 é exatamente o ponto médio entre os valores 0,0495 (Z= -1,65) e 0,0505 (Z= -1,64), daí o valor intermediário igual a -1,645. O sinal negativo será ignorado, por causa da simetria da curva. Existe um zc positivo e outro negativo, simétricos. Vamos voltar ao exemplo dos alunos de matemática financeira. Devemos considerar a amostra original de 25 alunos, e refazer os cálculos para uma confiabilidade de 90%. Como vimos anteriormente, 57 ESTATÍSTICA APLICADA o valor de zc para uma confiabilidade de 90% seria igual a 1,64 (na prática não usamos o valor 1,645. Seria trabalhar com uma precisão desnecessária). Ficaria assim: X X 5,6µ = µ = = X X X 2,5 0,50 n 25 σσ = → σ = → σ = c cX X X Xz até z 5,6 1,64 0,50 até 5,6 1,64 0,50 4,8 até 6,4µ − × σ µ + × σ = − × + × = Estima-se, portanto, que a média de todos os alunos esteja entre 4,8 e 6,4, com 90% de certeza. Isso quer dizer que se tomarmos 100 amostras de 25 alunos cada, em 90 delas estaríamos corretos, mas em 10 delas errados, ou seja, errando a estimativa, por pouco, mas equivocando-se. Olhando os vários cálculos chegaremos, provavelmente, à conclusão de que essa última estimativa é a mais adequada. Tomar uma decisão com um risco de 10% não é tão ruim assim na maioria dos casos práticos. Perceba que até aqui falamos e exemplificamos usando sempre a média. Isso é o mais comum na prática, mas todas as medidas estatísticas podem ser estimadas. As formulações dos intervalos de confiança para os principais parâmetros estão relacionadas a seguir. Forma geral das estimativas por intervalos: Valor estimado Valor mais provável coeficiente de confiança erro padrão= ± × Intervalo de confiança para a média: cValor estimado X z n σ= ± × Intervalo de confiança para as proporções: ( ) c p 1 p Valor estimado p z n − = ± × Intervalo de confiança para a soma de médias: ( ) 2 2 A B A B c A B Valor estimado X X z n n σ σ= + ± × + 58 Unidade II Intervalo de confiança para as diferenças de médias: ( ) 2 2 A B A B c A B Valor estimado X X z n n σ σ= − ± × + Intervalo de confiança para a soma das proporções: ( ) ( ) ( )A A B BA B c A B p 1 p p 1 p Valor estimado p p z n n − − = + ± × + Intervalo de confiança para as diferenças das proporções: ( ) ( ) ( )A A B BA B c A B p 1 p p 1 p Valor estimado p p z n n − − = − ± × + Alguns exemplos facilitarão o entendimento da teoria apresentada. Exemplo 1: um auditor contábil separou aleatoriamente uma amostra de 45 contas pagas por uma empresa e encontrou um valor médio para elas de R$ 14.900,00 com desvio padrão de R$ 3.600,00. Baseando-se nesses valores, qual foi o valor estimado para a média populacional, com 95% de confiabilidade? Resolução: A estimativa para a média é dada por: cValor estimado X z n σ= ± × Para se fazer essa estimativa, precisamos das seguintes informações: • Média: X 14.900,00= • Valor crítico: zc = 1,96, conforme o seguinte cálculo: tab c 1 confiabilidade 1 0,95 A 0,0250 z 1,96 z 1,96 2 2 − −= = = → = − → = • Desvio padrão: σ = s = 3600 59 ESTATÍSTICA APLICADA • Tamanho da amostra: 45 c 3600 Valor estimado X z 14900 1,96 Valor estimado 14.900,00 1.052,00 n 45 σ= ± × = ± × → = ± Baseado nesse cálculo e nessa amostra, nós podemos dizer que se estima que as contas dessa empresa tenham um valor médio entre R$ 13.848,00 e R$ 15.952,00 com 95% de certeza. Exemplo 2: uma pesquisa eleitoral feita com 2.500 eleitores revelou que o candidato A tinha 45% de intenções de voto para determinado cargo eletivo. Qual a estimativa da votação que esse candidato teria se a eleição fosse hoje, com 99% de confiabilidade? Resolução: A estimativa para a proporção é dada por: ( ) c p 1 p Valor estimado p z n − = ± × Para se fazer essa estimativa, precisamos das seguintes informações: • Proporção: p = 0,45 • Valor crítico: zc = 2,58, conforme o seguinte cálculo: tab c 1 confiabilidade 1 0,99 A 0,0050 z 2,58 z 2,58 2 2 − −= = = → = − → = • Tamanho da amostra: n = 2500 ( ) ( ) c p 1 p 0,45 1 0,45 Valor estimado p z 0,45 2,58 n 2500 0,45 0,026 ou valor estimado 45% 2,6% − − = ± × = ± × = ± = ± Desse modo, podemos afirmar que, se a eleição fosse hoje, o candidato A teria 45% dos votos, com uma margem de erro, para mais ou para menos, de 2,6%, com 99% de confiabilidade, ou então dizer que temos 99% de certeza de que ele teria entre 42,4% e 47,6% dos votos. Exemplo 3: uma amostra de 300 lâmpadas da marca A apresentou uma durabilidade média de 2.300 horas, com desvio padrão de 200 horas. Outra amostra de 150 lâmpadas da marca B apresentou vida útil de 2.000 horas, com desvio padrão de 90 horas. Estime com 90% de confiabilidade a diferença entre as vidas úteis de ambas as marcas de lâmpadas. 60 Unidade II Resolução: A estimativa para a diferença de médias é dada por: ( ) 2 2 A B A B c A B Valor estimado X X z n n σ σ= − ± × + Para se fazer essa estimativa, precisamos das seguintes informações: • Médias: A BX 2300 e X 2000= = • Valor crítico: zc = 1,64, conforme o seguinte cálculo: tab c 1 confiabilidade 1 0,90 A 0,0500 z 1,64 z 1,64 2 2 − −= = = → = − → = • Desvios padrões: σA = sA = 200; σB = sB = 90 • Tamanhos das amostras: nA = 300; nB = 150 ( ) ( ) 2 2 A B A B c A B 2 2 Valor estimado X X z n n 200 90 2300 2000 1,64 Valor estimado 300 22,4 300 150 σ σ= − ± × + = − ± × + → = ± As lâmpadas da marca A devem durar mais do que as lâmpadas da marca B entre 277,4 horas e 322,4 horas, com 90% de confiança. Exemplo 4: uma amostra aleatória, com 250 homens e 320 mulheres, revelou que 150 dos homens e 240 das mulheres apreciaram o design de um novo modelo de automóvel. Estime com 98% de confiabilidade a diferença entre a proporção de todos os homens e mulheres em relação a esse novo automóvel. Resolução: A estimativa para a diferença de proporções é dada por: ( ) ( ) ( )A A B BA B c A B p 1 p p 1 p Valor estimado p p z n n − − = − ± × + 61 ESTATÍSTICA APLICADA Para se fazer essa estimativa, precisamos das seguintes informações: • Proporções: H M 150 240 p 0,6 e p 0,75 250 320 = = = = • Valor crítico: zc = 2,33, conforme o seguinte cálculo: tab c 1 confiabilidade 1 0,98 A 0,0100 z 2,33 z 2,33 2 2 − −= = = → = − → = • Tamanho da amostra: nH = 250; nM = 320 ( ) ( ) ( ) ( ) ( ) ( ) M M H H M H c M H p 1 p p 1 p Valor estimado p p z n n 0,75 1 0,75 0,60 1 0,60 0,75 0,60 2,33 0,15 0,092 ou 1 5% 9,2% 320 250 − − = − ± × + − − = − ± × + = ± ± Estima-se que 15% a mais de mulheres do que homens gostem do design desse automóvel, com uma margem de erro de 9,2% e uma confiabilidade de 98% –, ou em outras palavras, a diferença entre mulheres e homens nesse aspecto está entre 5,8% e 24,2%, com 98% de certeza. Grande parte das utilizações práticas desses conceitos envolve o cálculo do tamanho da amostra necessária para se atender a determinadas condições estatísticas. O raciocínio é o mesmo dos casos anteriores, invertendo-se, no entanto, a incógnita procurada. As questões seguintes demonstram esse equacionamento.Exemplo 5: um analista de treinamento deseja estimar o tempo de treinamento em horas para determinado cargo com uma confiabilidade de 95% e erro esperado de 2 horas. Baseado em estudos anteriores, ele estima o desvio padrão das horas gastas em treinamento em 18 horas. Qual é o tamanho de amostra com que deve trabalhar? Resolução: Observe que o erro esperado, ou margem de erro, é dado por: cerro esperado z n σ= × 62 Unidade II Para se fazer essa estimativa, precisamos das seguintes informações: • Valor crítico: zc = 1,96, conforme o seguinte cálculo: tab c 1 confiabilidade 1 0,95 A 0,0250 z 1,96 z 1,96 2 2 − −= = = → = − → = • Desvio padrão: σ = s = 18 horas • Erro esperado desejável: 2 horas 2 c 18 18 18 erro esperado z 2 1,96 n 1,96 n 1,96 n 312 2 2n n σ = × → = × → = × → = × → = Baseado nesse cálculo, concluímos que o analista deve trabalhar com uma amostra de 312 elementos. Observação O cálculo feito na verdade resulta em 311,17, mas como não existe fração de elemento e estamos trabalhando a favor da segurança, arredondaremos para cima, nesses casos. Exemplo 6: uma pesquisa com amostra de 100 consumidores detectou que 40% deles preferiam o sabão em pó Lavafacil, em vez de qualquer outra marca. Ao se estimar o comportamento de toda a população, com uma confiabilidade de 95%, chegou-se a uma margem de erro inconveniente. O cliente da pesquisa deseja que a estimativa seja feita com um erro de no máximo 5%, mantida a confiabilidade. Dessa forma, mais quantos consumidores devem ser pesquisados para atender o estabelecido, supondo que a proporção de consumidores de Lavafacil permanecesse constante? Resolução: Observe que o erro esperado, ou margem de erro, é dado por: ( ) c p 1 p erro esperado z n − = × Para se fazer essa estimativa, precisamos das seguintes informações: • Erro esperado estabelecido, ou margem de erro: 5% ou 0,05. 63 ESTATÍSTICA APLICADA • Confiabilidade: zc = 1,96 tab c 1 confiabilidade 1 0,95 A 0,0250 z 1,96 z 1,96 2 2 − −= = = → = − → = • Proporção de consumidores que preferem Lavafacil: 0,4 ( ) ( ) c 2 2 p 1 p 0,4 1 0.4 0,05 0,24 erro esperado z 0,05 1,96 n n 1,96 n 0,05 0,24 0,24 n n 369 consumidores 1,96 n 0,05 1,96 − − = × → = × → = → = → = → = Como já foram entrevistados 100 consumidores, precisaríamos entrevistar mais 269 consumidores (369 - 100 = 269). Observação Constantemente, no cálculo do tamanho da amostra para uma estimativa de proporções, não se conhece o valor da proporção (p). Nesse caso, utilizamos p = 0,5, porque esse é o valor para o qual ocorre o maior erro padrão, portanto, gera as amostras de maior tamanho, o que favorece a segurança do cálculo. Utilizando essa diretriz no exemplo, chegaríamos a 385 entrevistados em vez de 369. Exemplo 7: um engenheiro deseja avaliar a diferença entre duas marcas distintas de cabos de aço e para tanto ensaiou uma amostra de 64 cabos de cada marca, chegando aos valores a seguir: Tabela 8 Cabos Resistência média em kgf Desvio padrão da resistência média em kgf Marca A 1635 125 Marca B 1284 93 Ao fazer uma estimativa das diferenças de resistência média de todos os cabos de cada uma das duas marcas, chegou a 99% de confiabilidade e percebeu que a margem de erro que não o agradava. Ele deseja reduzir essa margem de erro em 20 kgf. Quantos cabos a mais ele deverá ensaiar? 64 Unidade II Resolução: A estimativa inicial feita pelo engenheiro foi de 351 kgf ± 49,7 kgf a favor dos cabos da marca A. ( ) ( ) 2 2 A B A B c A B 2 2 Valor estimado X X z n n 125 93 1635 1284 2,57 Valor estimado 351 50 64 64 σ σ= − ± × + = − ± × + → = ± Sendo: tab c 1 confiabilidade 1 0,99 A 0,0050 z 2,57 z 2,57 2 2 − −= = = → = − → = Como ele deseja reduzir essa margem de erro em 20 kgf, o erro esperado deverá baixar para 30 kgf, logo: 2 2 2 2 A B c A B 2 2 125 93 erro esperado z 30 2,57 30 n n n n 24274 30 24274 30 24274 24274 2,57 n n 179 cabos n 2,57 n 2,57 n 30 2,57 σ σ= × + → = × + → = × → = → = → = → = Como já foram ensaiados 64 cabos, o engenheiro precisaria ensaiar mais 115 cabos (179 - 64 = 115). Exemplo 8: uma amostra de 20 baterias elétricas para uso em tablets revelou uma vida útil média de 30.000 horas com desvio padrão de 2.600 horas. Baseado nesses dados, um técnico estimou que as baterias desse tipo tivessem uma vida útil de 30.000±744 horas. Qual a confiabilidade dessa estimativa? Resolução: O erro esperado ou margem de erro é dado por: cerro esperado z n σ= × Sabemos que o erro da estimativa é igual a 744 horas, que o desvio padrão da amostra foi de 2.600 horas e que o tamanho da amostra é de 20 baterias. Com esses dados conseguimos determinar o valor de zc. 65 ESTATÍSTICA APLICADA cerro esperado z 744 n σ= × → c c 2600 z z 20 = × → c 744 z 1,28 2600 20 = → = Invertendo o raciocínio que utilizamos anteriormente para determinar o valor crítico (zc), obteremos o valor da confiabilidade da amostra, como mostra a figura a seguir. Z P(z) -1,28 Área tabelada 0,1003 ou 10,03% Área tabelada 0,1003 ou 10,03% Confiabilidade = 1 - (2 x 0,1003) = 0,7994 ≅ 0,80 ou 80% 1,28 Figura 16 Podemos então afirmar que o técnico tem 80% de confiança na estimativa que fez. Exemplo 9: às vésperas de uma eleição, um importante órgão da mídia informou que, se a eleição fosse naquele momento, o candidato João Honesto venceria com 42% dos votos. Afirmou também que a pesquisa havia sido feita com 2.000 eleitores e que a margem de erro era de 1% para mais ou para menos. Qual a confiabilidade que essa informação tem? Resolução: A margem de erro é dada por: 66 Unidade II ( ) c p 1 p erro esperado z n − = × Temos informado que a margem de erro é de 1%, que o candidato teve 42% dos votos na amostra e que o seu tamanho era de 2.000 eleitores. Logo: ( ) ( ) ( )c c c p 1 p 0,42 1 0,42 0,01 erro esperado z 0,01 z z 0,91 n 2000 0,42 1 0,42 2000 − − = × → = × → = = − Reproduzindo o raciocínio do exemplo 6 definimos que o valor da confiabilidade da informação é de apenas 63,72%: ( )c tabz 0,91 z 0,91 A 0,1814 Confiabilidade 1 2 0,1814 0,6372 ou 63,72%= → = − → = → = − × = Exemplo 10: uma pesquisa de mercado pegou amostras do salário de funcionários de duas empresas concorrentes, chegando aos valores a seguir: Tabela 9 Empresa Tamanho da amostra tomada Salário médio da amostra Desvio padrão dos salários médios ABC 120 R$ 3.850,00 R$ 850,00 WXY 165 R$ 4.020,00 R$ 1.018,00 A partir desses dados, um analista estimou que a diferença salarial entre as duas empresas seria de R$ 170,00 ± R$ 166,00. Qual é a confiança que podemos ter nessa estimativa? Resolução: O erro esperado para a estimativa da diferença de médias é dado por: 2 2 A B c A B Erro esperado z n n σ σ= × + Logo, nesse caso, teríamos: 2 2 2 2 A B c c c c A B 850 1018 166 Erro esperado z 166 z 166 z 111 z 1,50 n n 120 165 111 σ σ= × + → = × + → = × → == = ( )c tabz 1,50 z 1,50 A 0,0668 Confiabilidade 1 2 0,0668 0,8664 ou 86,64%= → = − → = → = − × = 67 ESTATÍSTICA APLICADA A estimativa apresenta uma confiabilidade de 86,64%. Exemplo 11: às vésperas de uma importante eleição foi feita uma pesquisa com 4.866 eleitores que revelou uma polarização entre dois candidatos. O candidato A teria 48,7% das intenções de votos, enquanto o candidato B ficaria com 46,1% dos votos. Um importante jornal decide “cacifar” o resultado e coloca na manchete do dia da eleição que o Candidato A será eleito. Considerando que não ocorram variações nas intenções de votos, qual é a confiabilidade que o jornal tem dessa informação? Resolução: Caso consideremos a estimativa por pontos, o candidato A evidentemente ganharia, pois teria 2,6% de votos a mais, mas vimos que isso não seria preciso. Ambas as votações têm variações, portanto, precisamos considerá-las. Irá ganhar a eleição o candidato que tiver um voto a mais do que o outro, ou seja, a diferença entre eles deverá ser superior a 0%.A estimativa da diferença das proporções é dada por: ( ) ( ) ( )A A B BA B c A B p 1 p p 1 p Valor estimado p p z n n − − = − ± × + ( ) ( ) ( )c 0,487 1 0,487 0,461 1 0,461 Valor estimado 0,487 0,461 z 4866 4866 − − = − ± × + ( ) cValor estimado 0,0260 z 0,0101= ± × Perceba que o candidato A deverá ter 2,6% mais ou menos uma variação. Ele ganhará a eleição se tiver mais 0% dos votos, ou seja, se a margem de erro for abaixo de 2,6%, ele vence. Em outras palavras, o valor estimado para a diferença das votações deve ser acima de 0%, e como temos: ( ) cValor estimado 0,0260 z 0,0101= ± × , podemos estabelecer que, no limite: ( ) c c0 0,0260 z 0,0101 0,0260 z 0,0101= − × → − = − × → c c 0,0260 multiplicando por menos 1 0,0260 z 0,0101 z 2,57 0,0101 → + = + × → = = ( )c tabz 2,57 z 2,57 A 0,0051 Confiabilidade 1 2 0,0051 0,9898 ou 98,98%= → = − → = → = − × = 68 Unidade II Esse cálculo, no entanto, tem uma imprecisão conceitual. Veja a figura a seguir: Z P(z) -2,57 Probabilidade de o candidato B ter mais votos que o candidato A Probabilidade de o candidato A ter acima de 2,6 dos votos que o candidato B Confiabilidade calculada: 99% 2,57 Figura 17 Perceba que a confiabilidade calculada de 99% exclui duas áreas na cauda da curva normal. A área da esquerda realmente tem que ser excluída, visto ser a área na qual o candidato B vence e, portanto, a estimativa do jornal estaria errada. Mas a área à direita não tem motivo para ser excluída, visto que ela se refere à vitória ainda mais expressiva do candidato A, portanto, a favor da previsão do jornal. A confiabilidade é calculada em um conceito conhecido como bicaudal, ou seja, caudas de exceção de ambos os lados da curva. O nosso problema é de um tipo diferente, o unicaudal. Só faz sentido de um dos lados da curva, no exemplo, à esquerda. Assim, o jornal estaria correto em todos os casos, com exceção das ocorrências da cauda esquerda, ou seja, a confiança que ele tem na manchete é dada pela confiabilidade calculada mais a cauda da direita, portanto, 99,49% (0,9898+0,0051). Saiba mais Pesquisas eleitorais talvez sejam as aplicações mais rotineiras da estimação de resultados. É possível verificar muitas dessas previsões e os efetivos resultados das eleições, acessando: PODER 360. Publicações por Fernando Rodrigues. [on-line]: [s.d.]. Disponível em: <https://www.poder360.com.br/author/fernando-rodrigues/>. Acesso em: 13 jun. 2019. 69 ESTATÍSTICA APLICADA 6 TEORIA DA DECISÃO ESTATÍSTICA Quando trabalhamos no terreno das probabilidades, é inevitável aceitar uma variação em torno dos valores reais ou esperados. Por exemplo, ao jogarmos certo número de vezes uma moeda honesta (não viciada), o esperado é que em metade das vezes saia cara e na outra metade, coroa. Portanto, se jogarmos uma moeda honesta 50 vezes, imaginamos que em 25 delas saia cara. E se saírem 26 caras? Provavelmente a moeda é honesta e por casualidade saiu uma cara a mais. Mas e se saírem 30 caras? Ainda poderemos dizer que a moeda é honesta? Uma variação dessas é aceita como uma casualidade? Ou existe uma causa para saírem mais caras (a moeda ser viciada)? Precisamos decidir isso. Observação Fisicamente, o peso de uma moeda deve ser distribuído de modo uniforme para que ela seja aleatória, ou seja, não tenha tendência de cair de um dos lados. Caso isso não ocorra, porque, por exemplo, colocou-se de um lado um pequeno e pouco visível peso, a moeda passa a ter a tendência de cair com esse lado mais pesado para baixo, ficando viciada. A probabilidade de a face mais leve ser sorteada será maior do que 50%. Consideramos que uma pequena variação a mais de caras ou coroas acima ou abaixo dos 50% é devido à aleatoriedade. Nesse caso, a diferença seria casual, ocasionada pela aleatoriedade do experimento. Todavia, além de um dado ponto, essas desproporções deixam de ser casuais e se tornam causais. Ocorrem pela disparidade de peso entre as faces da moeda. Decidir quando ocorre um ou outro fato nos leva ao terreno da Teoria da Decisão Estatística, a terceira e última abordagem da amostragem. Essa teoria é especialmente útil quando precisamos nos decidir sobre populações a partir de amostras delas retiradas. Por exemplo, decidir, entre duas campanhas publicitárias, qual é a mais eficaz, ou, entre dois processos produtivos, qual é o mais eficiente, ou, entre dois produtos similares, qual tem melhor desempenho, ou, ainda, se uma moeda é viciada ou não. Vamos iniciar nosso estudo pela decisão de se uma moeda é honesta ou viciada. Suponha que você tenha na mão uma moeda e não consiga determinar, visualmente, se ela é honesta ou viciada. A única maneira de se chegar a uma conclusão é testar a referida moeda e, a partir dos resultados, decidir se ela é viciada ou não. Perceba que existem duas hipóteses, ou a moeda é honesta ou é viciada. A hipótese de que ela seja honesta é o que se chama de hipótese nula e é simbolizada por H0. Assume-se essa possibilidade muitas vezes para desmenti-la. Caso estivéssemos analisando a eficiência de dois processos, por exemplo, formularíamos como hipótese H0 não existir diferença entre ambos. 70 Unidade II Qualquer hipótese que não seja a zero é chamada de hipótese alternativa e simbolizada por H1. Assim sendo, no caso de ela ser honesta, tanto a probabilidade de sair cara como de sair coroa é igual a 0,5, é a hipótese nula (p=0,5). Qualquer ocorrência diferente (p≠0,5) é considerada hipótese alternativa. Imaginemos que uma moeda seja jogada 100 vezes e queiramos saber se ela é viciada ou não. Vimos anteriormente que as estatísticas esperadas são: Valor esperado = média populacional = média amostral = np = 100 x 0,5 = 50 caras ou 50 coroas Desvio padrão da média populacional = ( ) ( )Desvio padrão da média populacional n p 1 p 100 0,5 1 0,5 5 caras ou 5 coroas= × × − = × × − = = 5 caras ou 5 coroas Como o tamanho da amostra é maior que 30 (n≥30) e o número esperado de caras ou de coroas é maior que 5 (npcara = npcoroa = 100 x 0,5 = 50), podemos usar a aproximação da binomial pela distribuição normal. Observação Jogar uma moeda envolve uma distribuição binomial, para variáveis discretas, mas podemos usar a aproximação para a normal sempre que n ≥ 30 e np ≥ 5. Como vimos, são recomendações dadas por vários estatísticos, entre eles Murray Siegel. Utilizando a distribuição normal, podemos afirmar que é impossível lançar 100 vezes uma moeda honesta e ter menos de 30 caras ou de 30 coroas – e, consequentemente, mais de 70 coroas ou de 70 caras. A figura a seguir relembra esse conceito: Z P(z) 100,0% 50 - 4 x 5 = 30 50 + 4 x 5 = 70 σ = 5 -4σ -3σ -2σ -1σ µ= 50 1σ 2σ 3σ 4σ Figura 18 71 ESTATÍSTICA APLICADA Portanto, se ao coletarmos uma amostra de 100 jogadas dessa moeda saírem mais do que 70 caras (e, consequentemente, menos do que 30 coroas) ou mais do que 70 coroas (e, consequentemente, menos do que 30 caras), a moeda será viciada, nos casos contrários ela será honesta. Perceba que essa afirmação tem 100% de confiabilidade, já que abrange toda a curva normal. Mas já vimos que esse nível não é muito utilizado na prática. Normalmente, se usam níveis menores de confiabilidade, por exemplo, 95%. Isso porque quanto maior o nível de confiabilidade, mais custo teremos para obtermos uma precisão adequada. Note que aceitar como honesta uma moeda com toda essa variação (entre 30 e 70 caras ou coroas) na prática é pouco interessante. Iremos trabalhar com menores confiabilidades, por exemplo, 95%. Graficamente teremos: Z P(z) -1,96 Região crítica 2,5% Região crítica 2,5% 95% +1,96 Figura 19 tab c 1 confiabilidade 1 0,95 A 0,0250 z 1,96 z 1,96 2 2 − −= = = → = − → = Com 95% de confiança, afirmamos que a moeda será honesta caso em uma amostra de 100 jogadas não se obtenha mais de 60 caras ou coroas ou menos do que 40 caras ou coroas: cX z X 50 1,96 5 40 e X 50 1,965 60 = µ ± × σ → = + × = = − × = Resumindo, caso ao jogarmos 100 vezes a moeda obtenhamos entre 40 e 60 caras ou coroas, assumimos que ela é honesta, caso contrário, entendemos que a moeda é viciada. Perceba que os valores que correspondem à moeda ser viciada estão nas áreas sombreadas do gráfico, chamadas de região crítica. Resultados nessas áreas expressam que existem diferenças observadas significativas, o que nos leva a rejeitar a hipótese nula (H0). 72 Unidade II Essa regra que estabelecemos (aceitarmos a hipótese zero se o número de caras ou coroas estiver entre 40 e 60 e rejeitarmos nos casos contrários) é nomeada como teste de hipóteses ou regra de decisão ou ainda teste de significância. Perceba que essas regras de decisão são sujeitas a incertezas, como todas as estimativas estatísticas. Nesse assunto estamos sujeitos a dois tipos de erros. Podemos aceitar como falsa uma hipótese verdadeira, ou seja, rejeitarmos uma situação que deveria ser aceita. No nosso exemplo, acharmos que é viciada uma moeda honesta. Esse é o chamado erro do tipo I. E, ao contrário, podemos aceitar como verdadeira uma hipótese falsa, ou seja, aceitarmos um evento que deveria ser rejeitado. No nosso modelo, considerarmos que é honesta uma moeda viciada. Esse é o chamado erro do tipo II. Em ambos os casos, teríamos incorrido em decisões erradas ou em um erro de julgamento. Um teste de hipóteses deve ser planejado para apresentar os menores erros possíveis, seja do tipo I ou do tipo II. O problema é que isso não é uma tarefa elementar. Mantido o tamanho da amostra, se nós diminuirmos o erro de um tipo, nós aumentamos o erro do outro. Reduzir os dois erros simultaneamente implica acréscimo do tamanho da amostra e, por consequência, nos acréscimos de custo já discutidos anteriormente. Na prática verificamos qual o tipo de erro mais importante e focamos nele nossos esforços de redução. Nesse caso, o que é pior, aceitar uma moeda honesta como viciada ou outra como honesta? Da nossa decisão sairá o foco da redução do tipo de erro. Via de regra os erros do tipo I são mais importantes e normalmente objeto de tentativa de redução. Quando fixamos, como fizemos agora há pouco, um nível de confiabilidade, assumimos um risco de ocorrência de erro do tipo I. Nesse caso, nosso nível de confiabilidade foi de 95%, portanto, temos um risco de 5% de ocorrerem erros do tipo I. Em outras palavras, se fizermos com essa moeda 100 testes e em cada um jogarmos a moeda 100 vezes, em 5 desses testes o resultado cairá na zona sombreada, causando um erro do tipo I. A esse risco máximo damos o nome de nível de significância do teste (simbolizado normalmente por α). Na prática, utilizamos níveis de significância de 0,05 (5%) ou 0,01 (1%), mas qualquer outro nível pode ser utilizado. Assim sendo, se adotamos um nível de significância de 0,05 ou 5%, quer dizer que há cerca de 5 chances em 100 de a hipótese ser rejeitada quando deveria ser aceita; em outras palavras, temos 95% de confiança na nossa decisão. Suponha que tenhamos obtido uma amostra com 38 caras (e, claro, 62 coroas). Diríamos que a hipótese de a moeda ser honesta foi rejeitada no nível de significância 0,05. Haveria, portanto, a probabilidade de erro tipo I de 5%. 73 ESTATÍSTICA APLICADA Observação Perceba que o nível de significância e o nível de confiabilidade são complementares. A soma dos dois sempre será sempre igual a 1 ou 100%. Agora, imagine que tenhamos obtido uma amostra com 42 caras e, portanto, com 58 coroas. Pela regra de decisão que estabelecemos (moeda é honesta caso saiam entre 40 e 60 caras ou coroas), aceitamos que a moeda é honesta, mas podemos estar incorrendo em um erro do tipo II. Comete-se um erro do tipo II quando se aceita uma hipótese que deveria ser rejeitada. Para evitá-lo, em vez de aceitá-la, simplesmente não a rejeitamos, o que significa que não estaríamos tomando qualquer decisão a respeito. Poderíamos então redigir a regra de decisão da seguinte forma para evitar um erro do tipo: se o número de caras ou coras estiver entre 40 e 60, não rejeitaremos a hipótese, caso contrário o faremos. Perceba que aceitar a hipótese é diferente de não a rejeitar. Não rejeitar é uma não decisão. Na prática, no entanto, muitas vezes é necessário definir se uma hipótese deverá ser aceita ou não. Isso requer um estudo mais completo dos erros tipo II que faremos posteriormente. Existem, portanto, quatro resultados possíveis em um teste de hipóteses: Tabela 10 Hipótese H0 Decisão Verdadeira Falsa Não rejeitar H0 Decisão correta Erro tipo II Rejeitar H0 Erro tipo I Decisão correta Um exemplo deixa mais claro todo o processo. No processo de negociação de uma nova máquina automática o fornecedor informa à empresa compradora que a produtividade dela é de 260 toneladas por hora com um desvio padrão de 43 toneladas por hora. O comprador decide verificar a veracidade da informação para aceitar ou não essa afirmação, e consequentemente adquirir ou não a máquina, e para tanto efetua uma amostragem com 36 observações. Para essa amostra, a produtividade média observada foi de 240 toneladas por hora. Estabeleça para esses dados: • Quais as hipóteses possíveis? • Qual o nível de significância que o estudo irá utilizar? 74 Unidade II • Quais os valores críticos de teste, ou em outras palavras, qual a regra de decisão? • Qual a decisão a ser tomada? • Quais os riscos desta tomada de decisão? Lembrete A distribuição normal de probabilidades pode ser utilizada para testar um valor hipotético quando n≥30 ou caso n<30 apenas se a população for normalmente distribuída. Existem duas hipóteses possíveis. A hipótese nula é que o valor da produtividade média seja efetivamente de 260 t/h (H0: µ=260) e a hipótese alternativa é a de que a produtividade seja diferente de 260 t/h (H1: µ≠260). Em tese, qualquer nível de significância pode ser utilizado. Os mais usados são 0,01 e 0,05. Vamos utilizar no exemplo esse último. tab c 1 confiabilidade significância 0,05 A 0,0250 z 1,96 z 1,96 2 2 2 −= = = = → = − → = Observe que a estatística de teste que iremos usar é a média (produtividade média). Dessa forma, o valor esperado é de 260 t/h ( Xµ ) e como estamos falando de uma amostra de 36 observações (n) e de um desvio padrão populacional de 43 t/h (σ), os valores críticos da média da amostra seriam: crítico cX 43 x z 260 1,96 260,00 14,05 n 36 σ= µ ± × = ± = ± A regra de decisão será a seguinte: • Aceita-se que o fornecedor informou corretamente a produtividade da máquina se a amostra estiver com valores entre 245,95 e 274,05 t/h. • Rejeita-se a informação do fornecedor se a amostra estiver fora dos limites mencionados. Resumindo, aceitamos que a produtividade média da máquina é de 260 t/h, com significância de 5%, caso uma amostra de 36 observações apresente resultados entre 245,95 e 274,05 t/h. A amostra coletada apresentou um valor médio para a produtividade de 240 t/h, fora dos limites estabelecidos, portanto, nossa decisão seria rejeitar a hipótese H0 e aceitar a hipótese alternativa H1. Isso significa que não aceitamos a informação do fornecedor porque a produtividade média da máquina seja igual a 260 t/h. 75 ESTATÍSTICA APLICADA Essa decisão apresenta risco de erros. O quadro a seguir resume as possibilidades: Quadro 1 Nossa decisão A afirmação do fornecedor é verdadeira A afirmação do fornecedor não é verdadeira Rejeitamos H0 Cometemos um erro do tipo II. A máquina tem a produtividade anunciada pelo fabricante, mas não aceitamos isso e deixamos de comprá-la. Decisão acertada. A máquina não tem a produtividade anunciada pelo fabricante, e ao não comprá-la tomamos a decisão correta. Não rejeitamos H0 Decisão acertada. A máquina tem a produtividade anunciada pelo fabricante, e ao não comprá-la tomamos a decisão correta. Cometemos um erro do tipo I. A máquina não tem a produtividade anunciada pelo fabricante, e ao comprá-la cometemos um erro do tipo I. Observe,no entanto, uma peculiaridade nesse exemplo. O fabricante da máquina afirma que a produtividade dela é de 260 t/h, e como nossa amostra apresentou produtividade de 240 t/h, rejeitamos a produtividade anunciada. Mas e se nossa amostra tivesse registrado uma produtividade média de 280 t/h? Teríamos rejeitado também, porque está fora do intervalo estabelecido (245,95 e 274,05 t/h). No entanto, essa rejeição não teria sentido prático, porque a produtividade seria maior que a alegada pelo fabricante e, portanto, iria nos favorecer mais ainda, na compra da máquina. Isso acontece porque ao resolvermos o exercício adotamos um raciocínio bilateral, rejeitando ambos os extremos da curva normal, quando o correto seria usar o raciocínio unilateral, preterindo apenas o lado da curva que nos interessa. Região crítica Região crítica Teste bilateral Teste unilateral Região crítica Zc ZcZc Figura 20 Dessa forma, a resolução do exercício ficaria muito mais adequada com o aspecto prático se a regra de decisão fosse a seguinte: • aceita-se que o fornecedor informou corretamente a produtividade da máquina se a amostra estiver com valores superiores à região crítica do teste unilateral; • rejeita-se a informação do fornecedor se a amostra estiver na zona crítica do teste unilateral. 76 Unidade II Mantendo o nível de significância em 0,05, o valor de zc seria igual a 1,64, e, portanto, os valores críticos seriam dados por: crítico cX 43 x z 260 1,64 260,00 11,75 248,25 n 36 σ= µ − × = − = − = Consequentemente, aceitaríamos a afirmação do fornecedor se a nossa amostra ficasse com valores acima de 248,25 t/h, e rejeitaríamos no caso contrário, com os riscos decorrentes de incorrer em erros do tipo I ou II. No exemplo dado, no qual a amostra de 36 observações teria resultado em uma produtividade média de 240 t/h, rejeitaríamos a afirmação do fornecedor com um nível de significância de 5%. Observação Perceba que para o teste unilateral o cálculo do coeficiente zc é alterado, em razão de a região crítica ficar toda em um dos lados da curva normal, portanto, sem dividir a significância por 2: tab cA significância 0,0500 z 1,64 z 1,64= = → = − → = O modelo visto trata de um dos parâmetros estatísticos, a média (no caso, produtividade média), mas todos os outros indicadores estão sujeitos aos testes de hipóteses. Nos exemplos a seguir veremos algumas aplicações práticas. Exemplo 1: um empreendedor pretende assumir uma franquia em determinada região da cidade na qual se alega que a renda média familiar é de R$ 15.000,00. Não confinado nessa informação, ele faz sua própria pesquisa com 15 famílias e obtém para elas uma renda média de R$ 14.000,00. De estudos anteriores ele sabe que o desvio padrão aceitável para as rendas dessa zona é de R$ 2.000,00. Ele deve aceitar a alegação feita com um nível de significância de 5%? Resolução: Observe que H0: µ = R$ 15.000,00 e H1: µ ≠ R$ 15.000,00 e que para um nível de significância bilateral zc = 1,96, logo: crítico cX 2.000 x z 15.000 1,96 15.000,00 1.012,14 n 15 σ= µ ± × = ± = ± Assim, aceitamos a hipótese se a amostra estiver entre R$ 13.987,86 e R$ 16.012,14, que é efetivamente o caso visto que o empreendedor obteve uma amostra de média de R$ 14.000,00. Desse modo, ele não rejeita a informação recebida. 77 ESTATÍSTICA APLICADA Exemplo 2: considere que o empreendedor do exemplo anterior não esteja interessado na possibilidade de a renda familiar da região ser maior que R$ 15.000,00 e sim de ser menor. Qual seria então a regra de decisão a ser aplicada? Resolução: Essa situação é mais realista, visto que para o empreendedor rendas menores que as esperadas representam riscos, não as superiores. O cálculo seria feito não se considerando um teste bilateral e sim unilateral. A alteração ocorreria apenas no fator de criticidade (zc), que passaria de 1,96 para 1,64, conforme mostrado anteriormente, e teríamos então H0: µ ≥ R$ 15.000,00 e H1: µ< R$ 15.000,00. Para um nível de significância unilateral zc = 1,64, logo: crítico cX 2.000 x z 15.000 1,64 15.000,00 846,89 n 15 σ= µ − × = − = − A regra de decisão fica então: aceita-se a hipótese zero se o valor amostral for maior ou igual a R$ 14.153,11 e rejeita-se nos casos contrários. Como a amostra que ele obteve foi de R$ 14.000,00 ele deve rejeitar a informação recebida. Exemplo 3: um fabricante informa que 95% dos pequenos motores elétricos que fornece estão rigorosamente de acordo com as especificações. Um comprador testou 200 desses motores e encontrou 18 defeituosos. A afirmação do fabricante pode ser aceita com nível de significância de 1%? Resolução: Note que é um teste unilateral, só interessa testar a quantidade de motores fora da especificação; portanto, as hipóteses seriam: • H0: p ≤ 0,05 • H1: p > 0,05 • zc = 2,33 ( ) ( ) crítico c p 1 p 0,05 1 0,05 p p z 0,05 2,33 0,05 0,036 ou 5% 3,6% n 200 − − = + × = − = + + Aceita-se a hipótese zero se a porcentagem de defeitos for menor ou igual a 8,6% e rejeita-se no caso contrário. A amostra apresentou 18 defeitos em 200, ou seja, 9%; portanto, rejeitamos a afirmação do fabricante com uma significância de 1%. 78 Unidade II O gráfico da figura a seguir resume a situação calculada. Rejeita-se a afirmação Significância: 1% (Zc=2,33) Defeitos apresentados Aceita-se a afirmação 5% 9% Figura 21 Exemplo 4: duas classes em princípio semelhantes foram submetidas a uma avaliação da disciplina de estatística e obtiveram os resultados mostrados a seguir: Tabela 11 Classe Média alcançada Desvio padrão Quantidade de alunos A 74 8 40 B 78 7 50 Podemos afirmar com um nível de significância de 5% que as classes apresentam diferenças significativas nos seus aproveitamentos? Resolução: Vamos supor que as duas classes vêm de populações cujas médias são respectivamente µA e µB. Nesse caso, as hipóteses seriam: • H0: µA = µB, ou seja, as eventuais diferenças são casualidades. • H1: µA ≠ µB, ou seja, existem diferenças significativas entres as salas. Considerando um teste bilateral, visto que nos interessa saber se há diferenças de uma em relação à outra, teríamos: ( ) 2 2 A B A B Acrítico B c A B (x x z n n ) σ σ− = µ − µ ± × + 79 ESTATÍSTICA APLICADA crític 2 2 A B o 8 7 (x x 0 1,96 0 3,15 40 5 ) 0 − = ± × + = ± O valor crítico de z (zc) é calculado por: tab c significância 0,05 A 0,0250 z 1,96 z 1,96 2 2 = = = → = − → = Dessa forma, podemos supor que no caso de as diferenças entre as notas das classes estarem entre -3,15 e +3,15, verifica-se a hipótese zero, ou seja, são casuais; nas situações contrárias, as variações são significativas. É o que acontece, a diferença entre os escores foi de 74 - 78 = -4, portanto, existem desproporções significativas entre os aproveitamentos das classes com a segunda, sendo, provavelmente, a melhor no nível de 5% de significância. Exemplo 5: como ficaria o teste de hipóteses do exemplo anterior para o nível de significância de 1%? Resolução: Vamos supor que as duas classes venham de populações cujas médias são respectivamente µA e µB. Nesse caso, as hipóteses seriam: • H0: µA = µB, ou seja, as eventuais diferenças são casualidades. • H1: µA ≠ µB, ou seja, existem diferenças significativas entres as salas. Considerando um teste bilateral, visto que nos interessa saber se há diferenças de uma em relação à outra, teríamos: ( ) 2 2 A B A B Acrítico B c A B (x x z n n ) σ σ− = µ − µ ± × + crític 2 2 A B o 8 7 (x x 0 2,58 0 4,14 40 5 ) 0 − = ± × + = ± O valor crítico de z (zc) é calculado por: tab c significância 0,01 A 0,0050 z 2,58 z 2,58 2 2 = = = → = − → = 80 Unidade II Dessa forma, podemos supor que no caso de as diferenças entre as notas das classes estarem entre -4,14 e +4,14, verifica-se a hipótese zero, ou seja, são casuais; nas situações contrárias, as variações são significativas. A diferença entre os escores foi de 74 - 78 = -4, portanto, não existem diferenças significativas entre os aproveitamentosdas classes, no nível de 1% de significância. Murray Spiegel (1993) afirma que alguns estatísticos fazem a seguinte distinção terminológica: Tabela 12 Resultados significativos no nível de São considerados 1% Altamente significativos 5% Provavelmente significativos Acima de 5% Não significativos Usando esse conceito terminológico nos exemplos 4 e 5 poderíamos afirmar que os resultados são provavelmente significativos, visto que estão no nível de 5%, mas não significativos no nível de 1%. Exemplo 6: uma pesquisa médica trabalhou com dois grupos de pacientes portadores da mesma doença, cada um deles com 100 elementos. Ao grupo A ministrou uma nova medicação em desenvolvimento, enquanto ao grupo B administrou apenas placebo (substância com aparência medicamentosa, mas sem princípios ativos), para que ele se comportasse como grupo de controle. Todas as demais condições foram mantidas idênticas para ambos os grupos. Terminado o teste, constatou-se que 75 pessoas do grupo A tinham sido curadas, contra 65 indivíduos do grupo B. Teste a hipótese de o medicamento ministrado auxiliar na cura com um nível de significância de 5%. Resolução: As proporções de cura para os dois grupos seriam: A B 75 65 p 0,75 e p 0,65 100 100 = = = = Portanto, a amostragem apresentou uma diferença de 0,10 ou 10% a favor da utilização da medicação. Esse resultado é significativo? O teste de hipóteses seria montado da seguinte forma: • H0: pA = pB, ou seja, as eventuais diferenças são casualidades. • H1: pA > pB, ou seja, existem diferenças significativas quando do uso do medicamento. 81 ESTATÍSTICA APLICADA Observe que se trata de um teste unilateral, portanto: ( ) ( ) ( )A A B BA B crítico A B c A B p 1 p p 1 p (p p p p) z n n − − − = − ± × + ( ) ( ) A B crítico 0,75 1 0,75 0,65 1 0,65 (p p 0 1,64 0 0,106, ou seja, 0 10,6 pessoas 100 100 ) − − − = + × + = + + tab cA significância 0,0500 z 1,64 z 1,64= = → = − → = Observação O sinal ± da fórmula é substituído, no cálculo, pelo sinal + por ser um teste unilateral. A hipótese zero só será rejeitada se a proporção de pessoas curadas com a medicação for maior do que a curada sem medicação, ou seja, interessa a cauda direita do gráfico. Portanto, as diferenças serão significativas se o número de pessoas curadas com medicação for superior a 10,6 daquelas curadas sem medicação. A diferença, no entanto, é de 10 indivíduos (75 - 65), ou seja, a medicação não apresenta variações significativas no nível de 5% de significância. Portanto, a discrepância de resultados é devida ao acaso nesse nível de significância. Exemplo 7: como ficaria o exemplo anterior no caso de um nível de significância de 10%? Resolução: As proporções de cura para os dois grupos seriam: A B 75 65 p 0,75 e p 0,65 100 100 = = = = Portanto, a amostragem apresentou uma diferença de 0,10 ou 10% a favor da utilização da medicação. Esse resultado é significativo? O teste de hipóteses seria montado da seguinte forma: • H0: pA = pB, ou seja, as eventuais diferenças são casualidades. • H1: pA > pB, ou seja, existem diferenças significativas quando do uso do medicamento. 82 Unidade II Observe que se trata de um teste unilateral, portanto: ( ) ( ) ( )A A B BA B crítico A B c A B p 1 p p 1 p (p p p p) z n n − − − = − ± × + ( ) ( ) A B crítico 0,75 1 0,75 0,65 1 0,65 (p p 0 1,28 0 0,083, ou seja, 0 8,3 pessoas 100 10 ) 0 − − − = + × + = + + tab cA significância 0,1000 z 1,28 z 1,28= = → = − → = Consequentemente, as diferenças serão significativas se o número de pessoas curadas com medicação for superior a 8,3 daquelas curadas sem medicação. Como a diferença foi de 10 pessoas (75 - 65), a medicação apresenta diferenças significativas no nível de 10% de significância. Portanto, ela é significativa. Note que usando a terminologia apresentada no exemplo 5, diríamos que a amostragem demonstra diferenças não significativas. Observação As conclusões anteriores dependem do risco que estamos dispostos a correr ao tomar a decisão requerida. Caso o medicamento seja ineficaz, isto é, as diferenças sejam casuais, e concluirmos que as diferenças são decorrentes dela, nós estaremos incorrendo em um erro do tipo I e acabaremos aplicando a medicação a um grupo muito grande somente para chegar à conclusão de que ele é ineficaz. Por outro lado, se o medicamento for eficaz e concluirmos que ele não é (erro do tipo II), nós poderemos colocar vidas humanas em risco. Ambos os erros trazem problemas e devem ser muito bem avaliados, o que na prática nem sempre acontece. Resumo Grande parte dos problemas administrativos reside na formulação de cenários futuros para respaldar a tomada de decisão, nos aspectos estratégicos, financeiros, mercadológicos, operacionais, entre outros. A estatística de modo geral e a amostragem em particular em muito facilitam esse processo, permitindo estimações quantitativas. A teoria da estimação permite que ponderemos situações futuras tendo o domínio sobre as margens de erro e os custos dos trabalhos estatísticos, determinando uma relação de compromisso que ao mesmo tempo nos permita tomar decisões com pouco risco, com alta confiabilidade e custos- 83 ESTATÍSTICA APLICADA benefícios adequados. Equilibrando custos dos estudos (diretamente ligados aos tamanhos das amostras), precisão requerida e confiabilidade apropriada nós conseguimos ter dados quantitativos suficientemente pertinentes às atividades profissionais e científicas de qualidade. Entre essas ferramentas decorrentes dos conceitos de amostra, uma que se destaca é o controle estatístico da qualidade, vital para a avaliação da efetiva eficiência e eficácia de todo e qualquer processo. Esses e outros indicadores, muitos deles estatísticos, são decisivos nas melhores práticas administrativas. Outro aspecto importante tratado foi o dilema que se põe em qualquer comparação de observações. As diferenças observadas entre várias observações, inevitáveis de ocorrer, seriam devidas a um motivo real, ou seja, a uma causa, ou a algo acidental, apenas casual? Essa análise pode ser delicada e sutil e nos levar a tomar decisões erradas, aceitando o que deveria ser rejeitado ou rejeitando o que deveria ser aceito. Estimar algo futuro ou muito complexo e decidir se as ocorrências são casuais ou causais nos dá condições de exercer adequadamente toda e qualquer atividade decisória. Exercícios Questão 1. “Diversas pesquisas na área de economia aplicada procuraram avaliar a hipótese da histerese no desemprego por meio da aplicação de testes de raízes unitárias. Song & Wu (1998), por exemplo, analisaram o referido fenômeno no desemprego dos EUA utilizando dados anuais desagregados de desemprego de quarenta e oito estados norte-americanos. Os resultados apontados pelos autores indicam a existência de uma tendência estocástica nas séries, em consonância com a hipótese de histerese.” Disponível em: <https://bit.ly/2Idcd1M>. Acesso em: 13 jun. 2019. O teste de raiz unitária é extremamente importante em séries temporais. A partir dele será possível saber se os resultados são seguros ou não. Aponte a alternativa correta: A) Quando uma série possui raiz unitária significa que os resultados não são estocásticos. B) Uma série com raiz unitária possui alto grau de correlação. C) O teste de raiz unitária é dispensável em regressões cujo R2 seja maior que 95%. 84 Unidade II D) O teste de raiz unitária é facultativo em regressões com muitas observações. E) A ausência do teste de raiz unitária pode levar a regressões espúrias. Resposta correta: alternativa E. Análise das alternativas A) Alternativa incorreta. Justificativa: justamente o contrário, séries com raiz unitária apontam para possíveis resultados estocásticos. B) Alternativa incorreta. Justificativa: a correlação entre as variáveis é perfeitamente visível tanto em séries que apresentam raiz unitária quanto naquelas em que a média e a variância são constantes. C) Alternativa incorreta. Justificativa:de forma alguma, a correlação entre variáveis explicativas e dependentes não anula a necessidade de observar se a série apresenta raiz unitária. D) Alternativa incorreta. Justificativa: o tamanho da amostra não determina se a regressão pode ser ou não espúria, portanto, neste caso é indispensável o uso de testes como o Dickey-Fuller aumentado, para identificar se a série tem ou não raiz unitária. E) Alternativa correta. Justificativa: sim, algumas variáveis apresentam alto grau de correlação sem, no entanto, terem qualquer relação entre si. Questão 2. “A estimativa é um processo em que uma amostra é selecionada, medem-se as estatísticas necessárias, como, por exemplo, a altura média e o desvio padrão da amostra. Então é feita uma inferência, ou seja, um processo de generalização, dizendo que a partir da média da amostra será possível concluir que ela será a média da população. Em outras palavras, com os dados da amostra tira-se conclusão da população.” Disponível em: <https://bit.ly/2NjthrA>. Acesso em: 24 jun. 2019. 85 ESTATÍSTICA APLICADA O texto anterior faz referência a: A) Estimativa por intervalo. B) Fidedignidade da estimativa. C) Estimativa por pontos. D) Intervalo de confiança. E) Semelhanças para as proporções. Resolução desta questão na plataforma.
Compartilhar