Baixe o app para aproveitar ainda mais
Prévia do material em texto
ESTATÍSTICA Juliane Silveira Freire da Silva Testes de hipóteses paramétricos Objetivos de aprendizagem Ao final deste texto, você deve apresentar os seguintes aprendizados: � Conhecer a estrutura dos testes de hipóteses. � Reconhecer as consequências dos tipos de erros. � Contrastar os tipos de erro de acordo com a empresa ou atividade envolvida. Introdução Neste capítulo, você conhecerá a estrutura dos testes de hipóteses paramétrico e não paramétrico. Além disso, saberá reconhecer as consequências de cada tipo de erros e contrastá-los, na prática, de acordo com a empresa ou atividade envolvida. Estrutura dos testes de hipóteses Os testes estatísticos são utilizados nas estatísticas inferenciais, utilizados para verificar estatisticamente hipóteses para médias, variâncias, proporções, dentre outros. Em estatística, há dois grupos de testes de hipóteses: paramétricos e não paramétricos. Os testes paramétricos são utilizados quando existem variáveis com nível de mensuração quantitativa e se pode calcular intervalos de confiança para os dados. Existe, também, a exigência de normalidade para os dados, o que costuma ocorrer com amostras maiores do que 30 elementos (devido à teoria do limite central) e se é necessário supor a homogeneidade dos dados. Os testes não paramétricos têm menos exigências, e o nível de mensuração das variáveis pode ser qualitativo. Não é necessário que se conheça a distri- buição de probabilidades que os dados seguem. Algumas vezes, quando os pressupostos dos testes paramétricos não são aceitos, pode-se utilizar testes não paramétricos para as variáveis quantitativas. O objeto de estudo deste capítulo serão os testes paramétricos, em que consideraremos normalidade e homogeneidade nas variáveis estudadas. Independentemente de o teste estatístico utilizado ser paramétrico ou não paramétrico, sempre teremos as mesmas etapas para a sua resolução. Em todos os testes de hipóteses, precisamos formular duas destas — uma o oposto da outra. Formulamos a H0 – hipótese nula — e a H1 – hipótese alternativa (que também pode ser representada por Ha). H0: hipótese nula H1: hipótese alternativa Em todos os testes de hipóteses, há uma estatística de teste que é composta por um ou mais cálculos matemáticos. A cada teste, teremos um cálculo diferente. Os testes paramétricos costumam ter fórmulas matemáticas menos complicadas para essa resolução. Para cada um dos testes, teremos uma tabela de distribuição de probabi- lidades associada, para que possamos definir a região crítica, e sempre con- cluiremos de acordo com o resultado do teste realizado nos passos anteriores (Quadro 1). 1. Formular hipóteses. 2. Calcular a estatística de teste. 3. Definir a região crítica. 4. Concluir a respeito do teste. Quadro 1. Passos para a resolução de um teste de hipóteses Os testes de hipóteses podem ser utilizados para comparar uma estimativa com um parâmetro (valor de referência) ou, então, comparar duas estimativas entre elas, ou mais de duas estimativas. Entre os testes paramétricos, veremos exemplos de teste para uma média, teste para duas médias e para mais de duas médias. Testes de hipóteses paramétricos2 Parâmetros são resumos numéricos referentes a uma população, e estimadores são resumos numéricos referentes a uma amostra. Consequências dos tipos de erros Precisamos ficar atentos, pois, sempre que realizamos um teste de hipóteses, estamos lidando com valores de médias, e não estamos analisando valores únicos e absolutos. Estamos, sim, comparando a média de uma amostra, ou de duas ou mais amostras. Sabemos que, ao compararmos os valores absolutos 2 e 3, por exemplo, estes obviamente são diferentes, pois estamos comparando valores absolutos. Todavia, no caso de uma amostra de tamanho n de uma variável que tenha uma média e uma variabilidade, será que esses valores podem ser considerados estatisticamente diferentes? Quando realizamos um teste de hipóteses, existe a possibilidade de come- termos um erro na nossa decisão. Podemos rejeitar uma hipótese quando, na realidade, ela seria a hipótese verdadeira. Quando aceitamos H0 e essa é a hipótese verdadeira, estamos tomando a decisão correta. Assim como também ocorre quando rejeitamos a hipótese nula, que é realmente a hipótese falsa. Porém, podemos cometer um erro ao rejeitar H0 quando, na realidade, esta é a hipótese verdadeira. Nesse caso, estamos cometendo o erro do tipo I quando rejeitamos a hipótese verdadeira. Simbolizamos esse tipo de erro pela letra α. Quando aceitamos H0 e essa é, na realidade, a hipótese falsa, estamos cometendo o erro do tipo II, cujo símbolo é a letra β. Veja o Quadro 2, a seguir. H0 verdadeira H0 falsa H0 aceita Decisão correta Erro tipo II (β) H0 rejeitada Erro tipo I (α) Decisão correta Quadro 2. Tipos de erros no teste de hipóteses 3Testes de hipóteses paramétricos Segundo Doane e Seward (2014), pelo fato de raramente contarmos com informações perfeitas sobre uma situação verdadeira, não conseguimos sempre saber se foi cometido o erro tipo I ou tipo II. Entretanto, ao utilizarmos a esta- tística, podemos calcular a probabilidade de tomarmos uma decisão incorreta, minimizando a chance de erro, ao reunirmos o maior número de evidências amostrais que nossos recursos permitam e selecionando procedimentos de testes adequados. Podem ser feitas analogias, normalmente utilizadas para exemplificar os tipos de erros que podemos cometer ao termos duas hipóteses a serem testadas. Uma das analogias utilizadas é a de um julgamento, considerando que a hipótese nula seja a de o réu ser inocente. Consequentemente, a hipótese alternativa será a de o réu ser culpado. Dessa forma, cometemos o erro do tipo I, quando condenamos o réu, mas, na realidade, ele é inocente. O erro do tipo II é cometido quando absolvemos o réu, sendo este, na verdade, culpado. Ao cometermos o erro tipo I, estamos prejudicando o réu, enquanto o erro do tipo II prejudica a sociedade, pelo fato de termos absolvido um criminoso. Outra analogia é o lançamento de um medicamento por uma indústria farmacêutica. A empresa só investirá nesse medicamento caso a eficácia seja comprovada. Consideramos a hipótese nula — o medicamento é eficiente — e a hipótese alternativa — o medicamento não é eficiente. Ao cometermos o erro do tipo I, não lançamos o medicamento, alegando que ele não é eficiente, mas, na realidade, ele é. Ao cometermos o erro do tipo II, lançamos o medicamento, alegando que ele é eficiente, quando, na realidade, ele não é. Podem ser feitas várias analogias para o dia a dia. Outro exemplo: em uma agência bancária, a gerente concede crédito para os clientes que ela julga serem bons pagadores, por escores de crédito. H0 representa o cliente bom pagador e H1, o cliente mau pagador. A gerente comete erro do tipo I quando não concede crédito a um cliente que, na verdade, seria um bom pagador e comete erro do tipo II quando concede crédito a um mau pagador. O erro considerado mais importante a ser evitado ou controlado é o erro do tipo I, representado por α e denominado como o nível de significância do teste estatístico aplicado. O seu complementar 1 – α é denominado nível de confiança. Os valores para o nível de significância são encontrados em tabelas de distribuição de probabilidades e determinarão a região crítica, se rejeitamos a hipótese nula ou se não temos evidências suficientes para rejeitar a hipótese nula (aceitar H0). Observe que, quando aceitamos H0, podemos estar cometendo o erro do tipo II, que não é fixado. Então, não podemos afirmar que aceitamos H0 ao nível de significância fixado, pois não é esse tipo de erro que está nessa sentença. Testes de hipóteses paramétricos4 Esse nível de significância determinará a região crítica de acordo com as hipóteses formuladas. Com testes unilaterais, existe a probabilidade em uma das caudas da distribuição de probabilidades, dependendo das hipóteses formuladas. Já com um teste bilateral,há α/2 nas duas caudas da distribuição. Veja as representações da Figura 1. Figura 1. Regiões críticas, considerando a distribuição normal. Fonte: Freund (2006, p. 307). Rejeitar a hipótese nula Rejeitar a hipótese nula Rejeitar a hipótese nula Rejeitar a hipótese nula α α/2 α/2 α –zα –zα/2 zα/2 zα z z z Hipótese alternativa μ < μ 0 Hipótese alternativa μ > μ 0 Hipótese alternativa μ ≠ μ 0 0 0 0 Identificar o tipo de erro faz parte do teste de hipóteses, quando definimos o nível de significância do teste — ele é definido juntamente com as hipóteses, antes mesmo de qualquer coleta de dados ser efetuada. 5Testes de hipóteses paramétricos O valor de nível de significância (α) mais utilizado é o de 5%. Isso dependerá de uma decisão do pesquisador, querendo ser mais rigoroso ou não. Com a teoria das probabilidades de erro tipo I e tipo II, podemos, também, determinar o poder do teste utilizado. O poder de um teste é definido pela probabilidade do complementar do erro do tipo II, ou seja, 1 – β. Logo, quanto menor a probabilidade de erro do tipo II, mais poder terá o teste aplicado. Para a diminuição da probabilidade de erro do tipo II, aumenta-se a amostra estudada. Então, costuma-se afirmar que, quanto maior for o tamanho da amostra pesquisada, mais poderoso será o teste utilizado. Tipos de erros na prática Quando estamos comparando hipóteses, podemos, na maioria das vezes, estar cometendo um erro na nossa decisão. Só podemos ter certeza se soubermos a verdade. Para uma melhor compreensão dessa situação, podemos fazer uma analogia com um ditado que diz: “para toda a situação existem três versões: a sua, a da outra parte e a verdade”. No caso da estatística, só sabemos se temos efetivamente a verdade quando tivermos o valor do parâmetro populacional. Fora isso, quando temos uma amostra da população, haverá sempre uma possibilidade de errar, o que seria a realidade da população em estudo. Além dos exemplos do caso jurídico, do lançamento do medicamento e da concessão de crédito, no dia a dia, existem outros dos mais variados na tomada de decisões. Por exemplo, muitos celulares atualmente desbloqueiam a tela por impressão digital, sendo assim: H0 desbloqueia a tela, as impressões conferem. H1 não desbloqueia a tela, as impressões não conferem. Cometemos o erro do tipo I quando rejeitamos H0, e, na realidade, as im- pressões eram verdadeiras. E cometemos o erro do tipo II quando aceitamos H0, mas, na verdade, as impressões não conferem. Assim como nos demais exemplos, o erro a ser controlado é do tipo I, “que seja culpado até que provem o contrário”. Isso ocorre no exemplo do réu, julgando que um dano ao réu (uma vez que será condenado sendo inocente) seja menos prejudicial à sociedade do que o erro do tipo II, que considera inocente um criminoso. Porém, de acordo com os direitos humanos, não podemos arcar com o dano de condenar uma pessoa Testes de hipóteses paramétricos6 inocente. Para controlar o erro do tipo II, as cortes refinam seus métodos de julgamento. No exemplo da indústria farmacêutica, quando não lançamos um medi- camento ao cometer o erro do tipo I, estamos de qualquer forma deixando os usuários desse medicamento sem a solução para a doença. Porém, se cometemos o erro do tipo II, lançamos um medicamento que não é eficaz, o que pode causar danos, mas a indústria farmacêutica refina a cada dia seus métodos para testes de novos medicamentos. Assim como no exemplo da gerente de banco, conceder crédito a um mau pagador, que configura erro do tipo II, é prejudicial apenas para a instituição de crédito. Já o erro do tipo I, de negar crédito a um bom pagador, acaba prejudicado o cliente e não o banco. Sendo assim, o erro tipo I seria o pior de ser aceito, sem contar que as instituições financeiras a cada dia melhoram seus escores de crédito, e o erro do tipo II é menos comum. Por esses motivos que o erro fixado é o do tipo I, chamado de nível de significância (α). Essa será sempre a probabilidade de erro fixada nos testes de hipóteses paramétricos e não paramétricos. Desejamos controlar, então, o falso positivo, erro do tipo I, quando rejeita- mos a hipótese nula e ela seria a verdadeira. Os falsos negativos, erros do tipo II, quando aceitamos a hipótese nula e ela seria falsa, podem ser controlados com o aumento da amostra estudada. Devemos, então, conseguir um equilíbrio por meio da redução de ambas as probabilidades de erro. Na prática, um teste estatístico será iniciado pela formulação das hipóteses nula e alternativa, depois calculada a estatística de teste, que atualmente é facilmente resolvida em planilhas eletrônicas e softwares estatísticos, então, a tomada de decisão de acordo com o nível de significância do teste realizado e, por último, a conclusão do teste. Queremos comparar as médias salariais de homens e mulheres que trabalham com cargos gerenciais. Foram coletados dados de 15 homens e 12 mulheres, considerando nível de significância de 5%. Como estamos lidando com duas amostras independentes, utilizaremos o teste t para duas delas. 7Testes de hipóteses paramétricos Primeiro, formulamos as hipóteses: H0: salário dos homens é igual ao salário das mulheres H1: salário dos homens é diferente do salário das mulheres Depois calculamos a estatística de teste: tcalc = (x–1 – x – 2) s21 n1 s22 n2 + = = (6640 – 6375) 174000 15 + 367500 12 265 205,49 = 1,2896 De acordo com a saída do Excel: Homem Mulher Média 6640 6375 Variância 174000 367500 Observações 15 12 Hipótese da diferença de média 0 gl 19 Stat t 1,289618 P(T<=t) unicaudal 0,106331 t crítico unicaudal 1,729133 P(T<=t) bicaudal 0,212661 t crítico bicaudal 2,060024 Teste-t: duas amostras presumindo variâncias diferentes O próximo passo é definir a região crítica. Nesse caso, o valor tabelado da distribuição é t-student com α/2 = 0,025 e com os graus de liberdade iguais a GL = n1 + n2 – 2 = 15 + 12 – 2 = 25. Testes de hipóteses paramétricos8 Nível de significância - alfa GL 0,250 0,100 0,050 0,025 0,010 0,005 1 1,000 3,078 6,314 12,706 31,821 63,657 2 0,816 1,886 2,920 4,303 6,965 9,925 3 0,765 1,638 2,353 3,182 4,541 5,841 4 0,741 1,533 2,132 2,776 3,747 4,604 5 0,727 1,476 2,015 2,571 3,365 4,032 6 0,718 1,440 1,943 2,447 3,143 3,707 7 0,711 1,415 1,895 2,365 2,998 3,499 8 0,706 1,397 1,860 2,306 2,896 3,355 9 0,703 1,383 1,833 2,262 2,821 3,250 10 0,700 1,372 1,812 2,228 2,764 3,169 11 0,697 1,363 1,796 2,201 2,718 3,106 12 0,695 1,356 1,782 2,179 2,681 3,055 13 0,694 1,350 1,771 2,160 2,650 3,012 14 0,692 1,345 1,761 2,145 2,624 2,977 15 0,691 1,341 1,753 2,131 2,602 2,947 16 0,690 1,337 1,746 2,120 2,583 2,921 17 0,689 1,333 1,740 2,110 2,567 2,898 18 0,688 1,330 1,734 2,101 2,552 2,878 19 0,688 1,328 1,729 2,093 2,539 2,861 20 0,687 1,325 1,725 2,086 2,528 2,845 21 0,686 1,323 1,721 2,080 2,518 2,831 22 0,686 1,321 1,717 2,074 2,508 2,819 23 0,685 1,319 1,714 2,069 2,500 2,807 24 0,685 1,318 1,711 2,064 2,492 2,797 25 0,684 1,316 1,708 2,060 2,485 2,787 9Testes de hipóteses paramétricos Na tabela, encontramos o valor tabelado de 2,06. Como a estatística de teste = 1,2896 < valor tabelado = 2,06, consequentemente fora da região crítica, aceitamos H0. Por fim, concluímos a respeito do teste: Não existem evidências suficientes para rejeitar H0. Logo, o salário médio de homens e mulheres pode ser considerado igual, ao nível de significância de 5%. Estamos estudando o valor do preço do combustível nos 3 estados da região Sul. Em cada uma das regiões, foi pesquisado o valor da gasolina comum. Tomaremos a decisão considerando o nível de significância de 5%. Como estamos querendo comparar três médias, utilizaremos o teste ANOVA (análise de variância). Primeiramente, formulamos as hipóteses: H0: o valor do preço médio da gasolina comum é igual nos três estados H1: o valor do preço médio da gasolina comum é diferente em pelo menos um dos três estados O segundopasso é o cálculo da estatística de teste. Para o teste ANOVA, os cálculos manuais são bastante extensos. Por isso, tomaremos por base apenas a saída do Excel. Resumo Grupo Contagem Soma Média Variância RS 10 48,63 4,863 0,001534 SC 12 55,65 4,6375 0,002039 PR 8 39,66 4,9575 0,001393 Testes de hipóteses paramétricos10 ANOVA Fonte da va- riação SQ gl MQ F valor-P F crítico Entre grupos 0,554895 2 0,277448 162,9027 8,54E-16 3,354131 Dentro dos grupos 0,045985 27 0,001703 Total 0,60088 29 Na terceira etapa, definimos a região crítica. Como o valor calculado na tabela F = 162,9027 > valor tabelado da distribuição Fcrítico = 3,354131, rejeitamos H0. Observe que podemos tomar a decisão do teste por meio da comparação do valor calculado da estatística de teste com o valor tabelado na distribuição de probabilidades referente ao teste utilizado. Esse valor tabelado é o que chamamos de crítico — é o valor tabelado considerando o nível de signifi- cância fixado. Se estatística de teste > valor tabelado (valor crítico) → rejeitamos H0 Se estatística de teste < valor tabelado (valor crítico) → não rejeitamos H0 Assim como também podemos tomar a decisão de acordo com a probabi- lidade da estatística de teste (valor p) comparada com a probabilidade fixada do nível de significância (por exemplo, 5%). valor de p (probabilidade da estatística de teste) > nível de significância → não rejeitamos H0 valor de p (probabilidade da estatística de teste) > nível de significância → rejeitamos H0 11Testes de hipóteses paramétricos M ét od o N ív el d e m en su ra çã o da v ar iá ve l Te st es d e hi pó te se s U m a am os tr a D ua s am os tr as Vá ri as a m os tr as Re la ci on ad as N ão re la ci on ad as Re la ci on ad as N ão re la ci on ad as N ão Pa ra m ét ric o N om in al Bi no m ia l Q ui q ua dr ad o um a am os tr a M ac N em ar Q ui q ua dr ad o du as a m os tr as Co ch ra n Q Q ui q ua dr ad o vá ria s a m os tr as in de pe nd en te s O rd in al Ko lm og or ov - -S m irn ov W ilc ox on M ed ia na , M an n- W hi tn ey U , Ko lm og or ov - -S m irn ov An ál ise d e va riâ nc ia e m du as d ire çõ es de F rie dm an M ed ia na - -v ár ia s a m os tr as in de pe nd en te s An ál ise d e va riâ nc ia nu m a di re çã o de Kr us ka l-W al lis Pa ra m ét ric o Q ua nt ita tiv a z pa ra u m a m éd ia , t p ar a um a m éd ia t p ar a am os tr as re la ci on ad as (p ar ea da s) D ife re nç a de m éd ia s z pa ra d ua s a m os - tr as in de pe nd en te s t p ar a du as a m os - tr as in de pe nd en te s Re gr es sã o An ál ise d e va riâ nc ia Q ua dr o 3. R es um o de ti po s d e te st es d e hi pó te se s Testes de hipóteses paramétricos12 DOANE, D. P.; SEWARD, L. E. Estatística aplicada à administração e economia. 4. ed. Porto Alegre: AMGH, 2014. FREUND, J. E. Estatística aplicada: economia, administração e contabilidade. 11. ed. Porto Alegre: Bookman, 2006. 13Testes de hipóteses paramétricos Conteúdo:
Compartilhar