Baixe o app para aproveitar ainda mais
Prévia do material em texto
ESTATÍSTICA Juliane Silveira Freire da Silva Testes relativos à média e a proporções (grandes e pequenas amostras) Objetivos de aprendizagem Ao final deste texto, você deve apresentar os seguintes aprendizados: � Diferenciar testes relativos à média de testes relativos a proporções. � Contrastar testes relativos à média de testes de grandes e de pequenas amostras. � Comparar testes relativos às proporções e testes de grandes e de pequenas amostras. Introdução Neste capítulo, você vai estudar os testes estatísticos, ou seja, os testes de hipóteses. Você irá aprender como aplicá-los e verificar em que situações eles são utilizados. Aqui você irá conhecer melhor dois deles: o teste de hipóteses relativo à média e o teste de hipóteses relativo à proporção. É importante saber que não existem apenas esses dois tipos de testes de hipóteses, mas especialmente os testes de hipóteses para médias e para proporções são os mais utilizados. Testes para médias e proporções Testes estatísticos fazem parte da estatística inferencial. Existem testes de hipóteses para vários parâmetros, aqui veremos os testes relativos às médias e testes relativos às proporções. Os testes relativos à média servem para testar médias de uma amostra com o parâmetro populacional. Para a média ainda temos testes para comparar duas ou mais médias de amostras diferentes. Além disso, com essa mesma teoria de testes estatísticos, também podemos calcular intervalos de confiança para a média. Os testes relativos à proporção servem para testar uma determinada pro- porção, um determinado percentual, verificar se esse percentual é diferente ou não da proporção populacional. Não são apenas esses os testes existentes em estatística, temos outros, por exemplo, o teste para a variância. Segundo Kazmier (2008), o propósito do teste de hipóteses é determinar se um valor suposto (hipotético) para um parâmetro da população, como a média populacional, deve ser aceitável como sendo plausível, baseado no indício da amostra. Independentemente do tipo de teste realizado e do parâmetro a ser testado, o procedimento para a aplicação de um teste de hipóteses será o mesmo. Hipóteses Quando falamos em testes estatísticos, estamos falando em testes de hipóteses, sendo assim, antes de iniciarmos qualquer um dos testes, precisamos formular as hipóteses. Sempre teremos duas hipóteses, uma oposta complementar à outra. São denominadas hipótese nula e hipótese alternativa: H0: hipótese nula H1: hipótese alternativa Na literatura, também é encontrada a hipótese alternativa representada por Ha, em vez de H1. A hipótese nula representa o valor que se tem como referência e sempre será a hi- pótese de igualdade (=, ≥, ≤). Já a hipótese alternativa representa o contraposto a essa referência. Testes relativos à média e a proporções (grandes e pequenas amostras)2 O teste de hipótese é realizado para aceitar ou rejeitar a hipótese nula, para verificar se existem evidências suficientes para rejeitar a hipótese nula ou se não existem evidências suficientes para não a rejeitar (ou seja, aceitar a hipótese nula). Essa decisão é tomada com base no nível de significância, representado por α, que é a probabilidade de erro do tipo I. Os testes podem aceitar ou rejeitar a hipótese nula. Quando aceitamos ou rejeitamos essa hipótese, podemos cometer dois tipos de erros (Quadro 1): � Erro do tipo I — é o erro cometemos ao rejeitar a hipótese nula, quando, na realidade, a hipótese nula é verdadeira. A probabilidade de cometer o erro do tipo I é o nível de significância. � Erro do tipo II — é o erro que cometemos ao aceitar a hipótese nula quando, na realidade, a hipótese nula é falsa. A probabilidade de co- metermos o erro do tipo II é representada por β. H0 verdadeira H0 falsa H0 aceita Decisão correta Erro tipo II (β) H0 rejeitada Erro tipo I (α) Decisão correta Quadro 1. Tipos de erros no teste de hipóteses O funcionamento de quaisquer testes de hipóteses passa por etapas bem definidas. Sempre precisamos, de forma inicial, formular as hipóteses nula e alternativa para depois definir o nível de significância do teste. Cada um dos testes terá uma estatística de teste a ser comparada com o nível de significância (α). A partir da comparação do valor calculado com o nível de significância aceitamos ou rejeitamos a hipótese alternativa. Nível de significância Segundo Spiegel e Stephens (2009), ao testar uma hipótese estabelecida, a probabilidade máxima com a qual estaremos dispostos a correr o risco de erro do tipo I é denominada nível de significância do teste. 3Testes relativos à média e a proporções (grandes e pequenas amostras) O nível de significância do teste (α), é representado pelo valor de p ou também co- nhecido como p-value (termo em inglês). Quanto menor for o valor de p, menor é a consistência entre os dados da hipótese nula. Esse nível de significância deve ser estabelecido antes de realizarmos o teste, antes de coletarmos a amostra. Rejeitamos H0 se o valor da probabilidade da estatística de teste for inferior ao valor de p. Não podemos rejeitar H0 quando o valor da probabilidade da estatística de teste for maior do que o valor de p. Na Figura 1, vemos a representação da curva normal, utilizada para o teste de hipóteses para médias. A região crítica considera um nível de significância de 5%. A região de rejeição é representada nas duas caudas da curva, dividimos, então, 2,5% para cada uma das caudas. Valores da probabilidade da estatística de teste inferiores a 0,025 recaem dentro da região crítica, em que rejeitamos H0; valores superiores a 0,025 recaem na região de aceitação; então, valores da probabilidade da estatística de teste superiores a 0,025 não nos permitem rejeitar a hipótese nula. Figura 1. Curva normal reduzida com região crítica (0,05) e região de aceitação (0,95). Fonte: Spiegel e Stephens (2009, p. 267). Região crítica 0,025 Região crítica 0,025 Região de aceitação 0,95 z = –1,96 z = 1,96 Testes relativos à média e a proporções (grandes e pequenas amostras)4 Podemos utilizar a comparação do p-value com a probabilidade da estatística de teste ou, então, comparar o valor calculado na estatística de teste com o valor tabelado referente ao nível de significância. Os testes podem ser unilaterais ou bilaterais, essa escolha ocorre de acordo com a hipótese alternativa (Figura 2). � Se a hipótese for de o parâmetro estudado ser menor, a região crítica será unilateral e a região crítica estará na cauda da esquerda. � Se a hipótese for de o parâmetro estudado ser maior, a região crítica será unilateral e a região crítica estará na cauda da direita. � Se a hipótese for de o parâmetro estudado ser diferente, a região crítica será bilateral e a região crítica estará nas duas caudas e o nível de significância será dividido por dois. Figura 2. Regiões críticas dos testes de hipóteses. Fonte: Doane e Seward (2014, p. 345). Teste unilateral à esquerda Teste bilateral Teste unilateral à direita Rejeitar Rejeitar Rejeitar Rejeitar α α/2 α/2 α Não rejeitar Não rejeitar Não rejeitar 1 – α 1 – α 1 – α μ0 μ0 μ0 Valor crítico Valores críticos Valores críticos Valor crítico Podemos construir um roteiro para aplicação de um teste de hipóteses. Esse roteiro pode ser seguido, independentemente do tipo de teste de hipóteses aplicado, seja ele paramétrico ou não paramétrico (Figura 3). 5Testes relativos à média e a proporções (grandes e pequenas amostras) Figura 3. Passos para aplicação do teste de hipóteses. Formulação das hipóteses e de nição do nível de signi cância Cálculo da estatística de teste De acoro com o nível de signi cância estabelecer a regra de decisão Concluir a respeito, aceitar ou rejeitar o H0 Em resumo, os passos para a formulação de um teste de hipóteses seguem sempre a mesma rotina; porém, duas hipóteses e estatísticas de teste variam de teste para teste, assim como as distribuições de probabilidades aplicadas (tabelasutilizadas para a obtenção do nível de significância). Testes relativos à média e a proporções (grandes e pequenas amostras)6 Testes de hipóteses para a média Para os testes de médias, podemos ter testes para uma, duas ou mais de duas médias. Podemos querer comparar a média de um valor amostral com a média da população (valor de referência), ou podemos querer comparar duas médias oriundas de duas populações distintas. Também podemos querer comparar mais de duas médias de populações distintas. Teste para uma média com σ (desvio-padrão) conhecido Esse teste é realizado quando temos uma média amostral e a comparamos com um valor de referência. Nesse caso, sabemos o valor do desvio-padrão populacional por estudos anteriores. Coletamos uma amostra, calculamos a sua média e a comparamos com um valor de referência da média da população. Essa é a diferença dos testes para pequenas e grandes amostras. Se tiver- mos uma amostra maior do que 30 utilizamos a tabela de distribuição normal para o teste. Caso não conheçamos o desvio-padrão populacional, ou nossa amostra seja inferior a 30 elementos, utilizamos a tabela de distribuição de probabilidade t-student. Precisamos seguir uma espécie de roteiro para a realização de um teste de hipóteses, definimos as hipóteses e o nível de significância (é importante defini-lo antes da realização do teste para não sermos tendenciosos; após, calculamos a estatística de teste, estabelecemos a regra de decisão e concluí- mos a respeito). No caso do teste de hipóteses para uma média considerando o desvio populacional conhecido, teremos as etapas definidas. As hipóteses a serem formuladas podem ser as seguintes: H0: μ = μ0 H1: μ ≠ μ0 H0: μ ≥ μ0 H1: μ < μ0 H0: μ ≤ μ0 H1: μ > μ0 Teste bilateral Teste unilateral à esquerda Teste unilateral à direita 7Testes relativos à média e a proporções (grandes e pequenas amostras) Esse valor compara a média amostral com o valor de referência. Zcalculdo = x— – µ0 σ/√n Onde: x—é a média amostral; μ0 é o valor de referência; 𝜎 é o desvio-padrão populacional; n é o tamanho da amostra. Para que possamos tomar a decisão sobre o resultado do teste temos duas opções. Uma delas é comparar o valor calculado nessa estatística de teste (nessa fórmula), comparando com um valor tabelado referente ao nível de significância e teremos: Se |zcalculado| > |ztabelado| → rejeitamos H0 Se |zcalculado| < |ztabelado| → não rejeitamos H0 A outra opção é comparar a probabilidade do valor encontrado na estatís- tica de teste e compará-lo diretamente com o p-value (nível de significância). O valor da probabilidade da estatística de teste pode ser obtido com recursos computacionais ou, então, pela tabela da distribuição normal padrão (Figura 4). Os valores do nível de significância mais comumente utilizados são 1%, 5% e 10% (α = 0,01; α = 0,05; α = 0,10). Teremos: Se o nível de significância da estatística de teste < α → rejeitamos H0 Se o nível de significância da estatística de teste > α → não rejeitamos H0 Por fim, tomamos a decisão de aceitar ou rejeitar nossa hipótese nula. Obviamente, quando rejeitamos a hipótese nula, a hipótese que passa a valer é a hipótese alternativa. Testes relativos à média e a proporções (grandes e pequenas amostras)8 Fi gu ra 4 . T ab el a de d is tr ib ui çã o de p ro ba bi lid ad e no rm al p ad rã o, á re a so b a cu rv a. 9Testes relativos à média e a proporções (grandes e pequenas amostras) Uma empresa de envase de refrigerantes está recebendo reclamações a respeito da quantidade de líquido nas garrafas de 2 litros do produto. Sabe-se que, historicamente, a média dessas embalagens é de 2 litros com um desvio-padrão de 0,3 litros. Uma amostra de 50 garrafas retirada de um lote apresentou média de 1,8 litros. Verificaremos se existem evidências suficientes para afirmar que as garrafas possuem quantidade envasada inferior a 2 litros, com nível de significância de 5%. Formulando as hipóteses, o que queremos testar é a hipótese de termos menos de 2 litros em cada garrafa, então o teste será unilateral à esquerda: H0: μ ≥ 2 H1: μ < 2 Cálculo da estatística de teste: Zcalculado = x— – μ0 σ/√n = = –4,71 1,8 – 2 0,3/√50 Podemos estabelecer a regra de decisão de duas formas, conforme visto. De forma ini- cial, procuramos na tabela o valor para o nível de significância de 5%. Esse valor é encon- trado procurando no meio da tabela o valor de 0,0500; com a precisão dessa tabela encon- tramos o valor aproximado de 0,0505 e, cruzando a linha e a coluna em que esses valores se encontram, achamos o valor tabelado de -1,64. Observe que, se o teste fosse unilateral, à direita teríamos esse mesmo valor; porém com o sinal positivo, uma vez que a distribuição normal é simétrica em torno do eixo. Então: Se |4,71| > |1,64| → rejeitamos H0. Para exercitarmos, vamos verificar a regra de decisão utilizando a probabilidade da estatística de teste comparada com o nível de significância de 0,05. Em primeiro lugar, recorremos à tabela ou a algum software. Na tabela, procuramos o valor de -4,7 cruzando a primeira coluna com a coluna do 0,01 (que é a segunda casa decimal). A tabela inicia em -3,99 e, antes disso, temos probabilidade 0,0000. Qualquer valor antes disso também terá probabilidade 0,0000; assim sendo, a probabilidade da estatística de teste de -4,71 é de 0,0000. Se o nível de significância da estatística de teste = 0,0000 < α = 0,0500 → rejeitamos H0. Podemos tomar a decisão utilizando uma ou outra forma. Aqui foram utilizadas as duas formas para melhor explicação. Podemos concluir que existem evidências suficientes para afirmar que a quantidade envasada nas garrafas de 2 litros dessa empresa é inferior a esse conteúdo, com nível de significância de 5%. Testes relativos à média e a proporções (grandes e pequenas amostras)10 Teste para uma média com σ (desvio-padrão) desconhecido Esse teste também serve para comparar a média da amostra com o valor refe- rência da população; porém o utilizamos sempre que tivermos uma amostra pequena (n < 30) ou quando não conhecermos o verdadeiro valor do desvio- -padrão populacional. Para esse teste faremos uso de outra tabela, a t-student. Essa tabela é de uma distribuição de probabilidades t que tem formato muito semelhante ao da distribuição normal; no entanto, na distribuição t, o tamanho da amostra influencia na probabilidade abaixo da curva. Figura 5. Tabela de distribuição de probabilidade t-student, área sob a curva cauda da direita. 11Testes relativos à média e a proporções (grandes e pequenas amostras) As hipóteses a serem formuladas são as mesmas de quando se conhece o desvio-padrão populacional. Continuamos comparando uma média amostral com um valor de referência. H0: μ = μ0 H1: μ ≠ μ0 H0: μ ≥ μ0 H1: μ < μ0 H0: μ ≤ μ0 H1: μ > μ0 Teste bilateral Teste unilateral à esquerda Teste unilateral à direita Na estatística de teste de hipóteses para uma média, esse valor compara a média amostral com o valor de referência. tcalculdo = x— – µ0 s/√n Em que: x— é a média amostral; μ0 é o valor de referência; s é o desvio-padrão amostral; n é o tamanho da amostra. Também podemos comparar o valor calculado nessa estatística de teste, comparando com um valor tabelado referente ao nível de significância. Para localizarmos o valor de t tabelado, escolhemos, na primeira linha, o valor do nível de significância. Escolhemos na coluna desse o valor referente ao tamanho da amostra pesquisada e teremos: Se |tcalculado| > |ttabelado| → rejeitamos H0 Se |tcalculado| < |ttabelado| → não rejeitamos H0 Ou, ainda, podemos comparar a probabilidade do valor encontrado na estatística de teste e compará-lo diretamente com o p-value (nível de signifi- cância). Nesse caso, podemos conseguir o valor da probabilidade da estatística Testes relativos à média e a proporções (grandes e pequenas amostras)12 de teste apenas por recursos computacionais, pois a tabela possui apenasvalores fixos de α. Teremos: Se o nível de significância da estatística de teste < α → rejeitamos H0 Se o nível de significância da estatística de teste > α → não rejeitamos H0 Ainda temos testes para comparação de duas médias, tanto para desvio- -padrão conhecido quanto para o desvio-padrão desconhecido ou amostras menores do que 30 elementos. Hipóteses: H0: μ1 = μ2 H1: μ1 ≠ μ2 H0: μ1 ≥ μ2 H1: μ1 < μ2 H0: μ1 ≤ μ2 H1: μ1 > μ2 Teste bilateral Teste unilateral à esquerda Teste unilateral à direita Estatística de teste Para desvio-padrão conhecido: zcalculado = x—1 – x — 2 σ2 n1 1 σ2 n2 2+ Onde: x—1 e x — 2 — médias amostrais; σ21 e σ22 — variâncias populacionais; n1 e n2 — tamanhos da amostra. 13Testes relativos à média e a proporções (grandes e pequenas amostras) Estatística de teste Para desvio-padrão desconhecido ou tamanho da amostra inferior a 30 elementos: zcalculado = x—1 – x — 2 s2 n1 1 s2 n2 2+ Onde: x—1 e x — 2 — médias amostrais; s21 e s22— variâncias amostrais; n1 e n2 — tamanhos da amostra. Além do teste para duas médias, ainda temos o teste para a comparação de mais de duas médias que se chama ANOVA (do inglês, analysis of variance) e o teste para amostras pareadas. O teste ANOVA utiliza a tabela de distribuição F. O cálculo da estatística de teste é bastante complexo, pois realizamos vários cálculos para montarmos a tabela ANOVA para podermos encontrar o valor calculado da estatística de teste. Testes de hipóteses para proporção Segundo Doane e Seward (2014), as proporções são usadas com frequência em situações de negócios porque a coleta de dados de proporção é simples. Também, porque muitos indicadores de desempenho em negócios, como a fatia de mercado, são expressos como proporção. Como vimos, independentemente do tipo de teste de hipóteses a ser uti- lizado, sempre teremos o mesmo roteiro de aplicação, que será a formulação das hipóteses e a escolha do nível de significância, o cálculo da estatística de teste, o estabelecimento da regra de decisão, ou seja, a rejeição ou não da hipótese nula e, finalmente, a tomada de decisão com base no teste. Testes relativos à média e a proporções (grandes e pequenas amostras)14 Um pressuposto que precisamos salientar com relação ao teste de hipóteses para a proporção é que, para uma amostra considerada grande, a proporção dessa amostra estudada segue uma distribuição normal. Assim sendo, a tabela utilizada para os níveis de significância e para a estatística de teste é a da distribuição normal quando temos grandes amostras. Passando por cada uma das etapas de um teste de hipóteses, no caso de compararmos uma proporção à um valor referência, teremos: As hipóteses para o teste de uma proporção: H0: � = �0 H1: � ≠ �0 H0: � ≥ �0 H1: � < �0 H0: � ≤ �0 H1: � > �0 Teste bilateral Teste unilateral à esquerda Teste unilateral à direita A estatística de teste para esse teste será: zcalculado = p – �0 �0(1 – �0) n Onde: p é a proporção amostral; π0 é a proporção referência; n é o tamanho da amostra. A regra de decisão estabelecida será de acordo com o nível de significância e o valor da estatística de teste. Assim como no teste da média podemos utilizar duas formas para a regra de decisão. Ambas resultam no mesmo resultado, na mesma escolha. Tomada de decisão com base no valor calculado comparando com um valor tabelado referente ao nível de significância: 15Testes relativos à média e a proporções (grandes e pequenas amostras) Se |Zcalculado| > |Ztabelado| → rejeitamos H0 Se |Zcalculado| < |Ztabelado| → não rejeitamos H0 E também comparando a probabilidade da estatística de teste com o p-value (nível de significância): Se o nível de significância da estatística de teste < α → rejeitamos H0 Se o nível de significância da estatística de teste > α → não rejeitamos H0 Com essa regra de decisão podemos decidir sobre a conclusão do teste aplicado. Uma fábrica de carros realizou uma pesquisa com 100 consumidores que adquiriam um determinado modelo de automóvel quanto à proporção de clientes satisfeitos com o acabamento geral do veículo. A proporção calculada nessa amostra foi de 65% de clientes amostrados satisfeitos. Sabe-se que, em geral, o nível de satisfação dos consumidores é de 70%. Vamos testar a hipótese de diminuição dessa proporção, com nível de significância de 5%. Formulando as hipóteses, o que queremos testar é a hipótese de termos menos de 65% de satisfação, então o teste será unilateral à esquerda. H0: π ≥ 0,7 H1: π < 0,7 Calculando a estatística de teste: Zcalculado = p – π0 π0(1 – π0) n 0,65 – 0,7 0,7(1 – 0,7) 100 = = –0,1091 = –0,11 Vamos verificar a regra de decisão das duas maneiras disponíveis. O valor para o nível de significância de 5% já visto é o valor aproximado de 0,0505 e, cruzando a linha e a coluna em que esses valores se encontram, achamos o valor tabelado de -1,64. Então: Se |0,11| < |1,64| → não rejeitamos H0 Pela regra de decisão, utilizando a probabilidade da estatística de teste comparada com o nível de significância de 0,05, para o valor de -0,11 temos probabilidade 0,4562. Se o nível de significância da estatística de teste = 0,4562 > α = 0,0500 → não rejeitando H0 Concluímos que não existem evidências suficientes para afirmar que a satisfação dos clientes quanto ao acabamento do carro tenha diminuído, com nível de significância de 5%. Testes relativos à média e a proporções (grandes e pequenas amostras)16 DOANE, D. P.; SEWARD, L. E. Estatística aplicada à administração e economia. 4. ed. Porto Alegre: AMGH; Bookman, 2014. 840 p. KAZMIER, L. J. Estatística aplicada à administração e economia. 4. ed. Porto Alegre: Bookman, 2008. 392 p. (Coleção Schaum). SPIEGEL, M. R.; STEPHENS, L. J. Estatística. 4. ed. Porto Alegre: Bookman, 2009. 600 p. (Coleção Schaum). 17Testes relativos à média e a proporções (grandes e pequenas amostras) Conteúdo:
Compartilhar