Baixe o app para aproveitar ainda mais
Prévia do material em texto
BIOESTATÍSTICA OBJETIVOS DE APRENDIZAGEM > Descrever o que é um teste de análise de variância. > Identificar quando deve ser utilizado um teste de análise de variância. > Definir o valor de F de uma Anova. Introdução Os testes de hipóteses são muito importantes no âmbito da estatística. Eles são utilizados quando se deseja verificar uma hipótese específica e também quando se quer verificar se existem evidências estatísticas para atestar que determinada diferença seja significativa. Neste capítulo, você vai estudar a Anova, um teste paramétrico utilizado para a comparação de mais de duas médias. Você também vai ver como realizar uma Anova. Além disso, vai verificar quando utilizar essa técnica de inferência estatística e como analisar seus resultados. Teste de Anova Os testes de hipóteses integram a área da estatística chamada de “estatís- tica inferencial”. Os testes de hipóteses dividem-se em paramétricos e não paramétricos. Os testes paramétricos distinguem-se dos não paramétricos basicamente porque se baseiam em variáveis que seguem uma distribuição de probabilidades conhecida, geralmente a distribuição normal. Existem testes de hipóteses que verificam afirmações a respeito de médias, variâncias, proporções e associações, por exemplo. Análise de variância Juliane Silveira Freire da Silva Uma hipótese estatística é uma suposição sobre determinado parâmetro da população, como média, desvio-padrão, coeficiente de correlação, etc. Por sua vez, um teste de hipótese é um procedimento utilizado para decidir sobre a veracidade ou falsidade de determinada hipótese. Para que uma hipótese estatística seja validada ou rejeitada com certeza, seria necessário examinar toda a população, o que na prática é inviável. Portanto, como alternativa, extrai-se uma amostra aleatória da população de interesse (FAVIERO, 2017). A Anova é um teste que verifica a igualdade de duas ou mais médias. Os pressupostos para a utilização desse teste são: � as amostras em estudo devem ser independentes; � as amostras devem ser retiradas de populações que sigam a distri- buição normal ou aproximadamente normal; � deve haver homocedasticidade (igualdade de variâncias); � as variáveis em estudo devem ser numéricas. Por ser um teste de hipóteses estatísticas, esse teste segue o mesmo procedimento de outros testes de hipóteses. Tal procedimento implica: � formular hipóteses; � definir o nível de significância do teste (α); � calcular a estatística de teste; � definir a região crítica de acordo com o nível de significância estabelecido; � concluir (rejeitar ou não H0). Segundo Moretin e Bussab (2017), o objetivo do teste de hipóteses é indicar, de acordo com a estatística de teste, se H0 é verdadeira ou não. Operacional- mente, essa decisão é tomada por meio da consideração de uma região crítica (RC), também conhecida como “região de rejeição”. Caso o valor observado na estatística de teste pertença a essa região, rejeita-se a hipótese nula; caso contrário, não se pode rejeitar H0. Componentes de um teste de Anova Há duas hipóteses de pesquisa: a hipótese nula, também chamada de “hipó- tese de igualdade” (H0), e a hipótese alternativa (H1 ou Ha). No teste de Anova, é possível descrever genericamente as hipóteses como indicado a seguir. Análise de variância2 � H0: as médias são iguais. � H1: ao menos uma das médias difere das demais. As duas afirmações são hipóteses porque a verdade é desconhecida. Serão feitos esforços para rejeitar a hipótese nula (às vezes chamada de “hipótese firmada” ou “hipótese de pesquisa”). A H0 deve ser enunciada de forma precisa para que possa ser testada mediante as evidências empíricas de uma amostra. Se H0 representa uma teoria estabelecida, espera-se efetivamente não rejeitá-la, mas, de qualquer maneira, há uma tentativa de fazê-lo. Quando H0 é rejeitada, procura-se concluir que a hipótese alternativa H1 é a verdadeira. A H0representa o status quo (por exemplo, a situação corrente dos negócios), enquanto a H1 é às vezes chamada de “ação alternativa”, pois alguma ação pode ser exigida se H0 for rejeitada em favor de H1 (DOANE, 2014). O nível de significância do teste é a probabilidade de erro do tipo 1, que consiste em rejeitar H0 quando ela é a hipótese verdadeira. O nível de signi- ficância é representado pela letra grega α (alfa). No Quadro 1, a seguir, veja os tipos de erro associados à realização dos testes estatísticos. Quadro 1. Erros associados à realização dos testes estatísticos e suas res- pectivas probabilidades Conclusão do teste Verdade Não se rejeita H0 Rejeita-se H0 H0 é verdadeira Decisão correta Probabilidade: 1 – α Decisão errada: erro tipo I Probabilidade: α H0 é falsa Decisão errada: erro tipo II Probabilidade: β Decisão correta Probabilidade: 1 – β (poder do teste) Fonte: Adaptado de Callegari-Jacques (2007). A probabilidade α de se cometer um erro do tipo I (ou de primeira espécie) é um valor arbitrário e recebe o nome de “nível de significância do teste”. O resultado da amostra é tanto mais significante para rejeitar H0 quanto menor for esse nível α. Ou seja, quanto menor for α, menor é a probabilidade de se obter uma amostra com estatística pertencente à região crítica. Nesse sentido, é pouco verossímil a obtenção de uma amostra da população para a qual H0 seja verdadeira. Usualmente, o valor de α é fixado em 5%, 1% ou 0,1% (MORETIN; BUSSAB, 2017). Análise de variância 3 O erro do tipo I é fixado como o nível de significância. Por sua vez, o erro do tipo II pode ser controlado com o aumento do tamanho da amostra. A estatística do teste depende do teste escolhido. No caso da Anova, são feitos alguns cálculos para se encontrar a estatística de teste F. Os cálculos necessários para a estatística de teste são trabalhosos. Por isso, em geral essa análise é realizada por meio de software. Os dados precisam estar dispostos como no Quadro 2 para que se possa realizar os cálculos para a obtenção da estatística de teste. Caso o teste seja rodado no Excel, é necessário que as amostras de cada um dos grupos estejam organizadas de forma semelhante à apresentada no Quadro 2. Contudo, isso não é uma exigência de todo software estatístico. Quadro 2. Organização de amostras Tratamento Total 1 2 3 ... k Y11 Y21 Y31 ... Yk1 Y12 Y22 Y32 ... Yk2 Y13 Y23 Y33 ... Yk3 ... ... ... ... ... Y1r Y2r Y3r ... Ykr Total T1 T2 T3 ... Tk ΣT = Σy Número de repetições r1 r2 r3 ... rk Σr = n Média ... Análise de variância4 Veja algumas notações importantes: � k — grupos ou tratamentos; � r — número de repetições em cada grupo, ou seja, tamanho da amostra para cada grupo a ser comparado; � n — tamanho total da amostra (n = Ʃr); � y — valores da variável de cada unidade amostral. A seguir, veja os cálculos a serem realizados para obter o valor da estatística de teste em uma tabela Anova. � Graus de liberdade: ■ Grupos (tratamentos) = k – 1 ■ Resíduo (erro) = n – k ■ Total = n – 1 � Valor de correção C: � Soma de Quadrados Total (SQT): � Soma de Quadrados de Tratamentos (SQTRr): � Soma de Quadrados de Resíduo (SQR): � Quadrado Médio de Tratamentos (QMTr): � Quadrado Médio de Resíduo (QMR): � Valor da estatística de teste F: Agora observe a Tabela Anova. Causas de variação Graus de liberdade (GL) Soma dos quadrados (SQ) Quadrados médios (QM) F Grupos (tratamentos) k – 1 SQTr QMTr F Resíduo n – k SQR QMR Total n – 1 SQT A regra de decisão é tomada em função do nível de significância estabe- lecido. Caso o F calculado caia na região crítica, rejeita-se H0. Caso o valor calculado de F não caia na região crítica, não se pode rejeitar a hipótese nula. A distribuição F é uma distribuição assimétrica à direita que começa a partir do zero (F não pode ser negativo, pois as variâncias são somas de quadrados) e Análise de variância 5 não tem limite superior (pois as variâncias podem ser de qualquer magnitude). Para a Anova, o teste F é um teste unilateralà direita. Considera-se um nível de significância fixado α (DOANE, 2014). O que delimita a região crítica é um valor tabelado de acordo com a dis- tribuição F de Snedcor correspondente aos graus de liberdade e ao nível de significância fixa. Caso você tome a decisão com base nos valores calculados (FCALC) e tabelados (FTAB), deve considerar a regra de decisão apresentada a seguir. � Se FCALC > FTAB, rejeita-se H0. Logo, existe diferença significativa. � Se FCALC < FTAB, aceita-se H0. Logo, não existe diferença significativa. Caso você tome a decisão com base no nível de significância do teste (valor–p), que representa a área abaixo da curva F correspondente ao valor de F calculado, comparado ao nível de significância fixado, deve considerar a regra a seguir. � Se valor–p < nível de significância (α), rejeita-se H0. Logo, existe dife- rença significativa. � Se valor–p > nível de significância (α), aceita-se H0. Logo, não existe diferença significativa. A escolha de uma dessas duas formas de interpretação depende da fer- ramenta disponível (calculadora ou pacote computacional). Ambas as opções levam ao mesmo resultado. A conclusão indica se a hipótese nula foi rejeitada ou não. Utilização da Anova A Anova é um teste para comparação de médias. Além dela, existem ou- tros testes para comparação de médias, como o teste t para uma média, o teste t para duas amostras independentes e o teste t pareado. Porém, esses testes limitam-se a uma ou duas amostras. Já o teste de Anova é utilizado quando se tem mais de duas amostras oriundas de populações normais ou aproximadamente normais e essas amostras são independentes entre si e homocedásticas. A Anova segue as mesmas premissas dos demais testes de hipóteses pa- ramétricos. Caso as variâncias não sejam iguais, ou os dados não sigam uma distribuição normal e a sua distribuição seja desconhecida, é preciso utilizar Análise de variância6 testes similares para comparação de médias (porém, testes não paramétricos, também conhecidos como “testes livres de distribuição”). A Anova testa se existe ou não diferença entre as médias oriundas de populações independentes. Todavia, esse teste indica apenas se a diferença existe ou não; ele não consegue informar entre quais grupos a diferença é significativa. Exemplo Imagine que você coletou amostras de pessoas e investigou o número de salários mínimos recebidos em três diferentes estados do Brasil. O seu obje- tivo é verificar se existe diferença significativa no número médio de salários recebidos pelos moradores desses três estados. A seguir, veja os números coletados. São Paulo Rio de Janeiro Rio Grande do Sul 5 6 9 6 8 5 4 7 6 8 9 4 9 5 8 11 8 5 12 9 6 9 6 7 8 11 5 8 8 9 Como você deseja realizar um teste para verificar se existe diferença significativa entre os ganhos de salários mínimos em cada um dos estados, deve iniciar formalizando as hipóteses de pesquisa. Veja a seguir. � H0: as médias de salários mínimos nos três estados são iguais. � H1: em ao menos um dos estados, a média de salários mínimos é diferente. Análise de variância 7 Após a formulação das hipóteses, você deve fixar o nível de significância em 5% e realizar o cálculo da estatística de teste F com o auxílio do Excel. Observe a tabela a seguir. Grupo Contagem Soma Média Variância São Paulo 11 89 8,0909 5,6909 Rio de Janeiro 9 69 7,6667 3,5000 Rio Grande do Sul 10 63 6,3000 2,6778 Agora veja a Tabela Anova, a seguir. Fonte da variação SQ GL MQ F Valor–p F crítico Entre grupos 17,9576 2 8,9788 2,2239 0,1276 3,3541 Dentro dos grupos 109,0091 27 4,0374 Total 126,9667 29 Com a estatística de teste, você pode definir a regra de decisão. Se você analisar a estatística de teste comparada ao valor tabelado, vai verificar que FCALC (2,2239) < FTAB (3,3541), ou seja, H0 é aceita. Logo, não existe diferença significativa. Já se você considerar a significância da estatística de teste comparada ao nível de significância, vai verificar que valor–p (0,1276) > nível de significância (α = 0,05), ou seja, H0 é aceita. Logo, não existe diferença significativa. As duas opções levam à mesma resposta. Então, não se pode rejeitar H0. Logo, as médias de salários mínimos são iguais nos três estados analisados, ao nível de significância de 5%. Como você viu, o teste de Anova indica se existe diferença entre as médias, mas fica limitado a isso e não consegue informar quais são as variáveis que diferem em relação à média. Para saber exatamente quais são as relações de diferença significativa, você precisa utilizar outros testes. Esses testes são chamados de “post hocs”. Os testes de comparações múltiplas mais comuns são os testes Tukey, Newman-Keuls, Bonferroni, Scheffé, Duncan e Fisher. Análise de variância8 Estatística de teste F O teste de Anova leva em consideração a distribuição de probabilidade F, e a partir dela se obtêm as probabilidades abaixo dessa curva. A distribuição F descreve a razão de duas variâncias. Portanto, faz sentido que a estatística do teste de Anova seja a estatística do teste F. A estatística F é a razão da variância devida ao tratamento pela variância devida ao erro. O QMTr é o qua- drado médio devido ao tratamento, e o QMR é o quadrado médio dentro dos tratamentos, também chamado de “quadrado médio residual” (DOANE, 2014). Segundo Doane (2014), a estatística de teste F não pode ser negativa (ela é baseada em somas de quadrados). O teste F, que testa a igualdade de médias dos tratamentos, é sempre um teste unilateral à direita, pois é a razão entre a variância explicada (pelo fator) e a variância do erro (não explicada pelo fator). Se há apenas uma pequena diferença entre os tratamentos, se espera que QMTr esteja próximo de zero, porque as médias dos tratamentos estão próximas da média geral. Logo, se F estiver próxima de zero, não se espera rejeitar a hipótese de igualdade das médias dos grupos. Quanto maior for a estatística F, mais o pesquisador se inclina a rejeitar a hipótese de igualdade de médias. Mas quão grande deve ser F para convencê-lo de que as médias diferem? Em síntese, essa estatística de teste é comparada ao valor tabelado re- ferente ao nível de significância fixado, delimitando assim a região crítica do teste. Caso a estatística de teste seja superior ao valor tabelado ao nível de significância, esse teste terá a hipótese nula rejeitada. Já se o valor da estatística de testes for inferior ao valor tabelado, não será possível rejeitar a hipótese nula. A estatística de teste é calculada com base nos dados obtidos em uma amostra. Assim, as hipóteses são testadas com base nessa amostra. A estatís- tica de teste é o ponto-chave de qualquer teste de hipóteses. Ela é calculada com base em dados amostrais, e esse é o valor comparado ao valor do nível de significância. Então, com base nos dados amostrais, é possível verificar se o teste em estudo é significativo ou não. Cada teste de hipóteses terá a sua estatística de teste correspondente e, consequentemente, uma função de probabilidade conhecida correspondente (no caso dos testes paramétricos). A estatística de teste F é calculada com base nas somas de quadrado entre e dentro dos tratamentos. Esse valor segue uma distribuição F desde que os pressupostos de independência entre as amostras e as populações de onde elas foram retiradas sigam uma distribuição normal ou aproximadamente normal e que a homocedasticidade seja satisfeita. Análise de variância 9 Se os dados estiverem em conformidade com os pressupostos, o pesqui- sador pode formular as hipóteses adequadas e calcular a estatística de teste que permitirá verificar se o teste é significativo ou não. Assim, ele poderá afirmar se é possível rejeitar a hipótese nula ou não. Os testes de hipóteses são muito importantes quando se precisa verificar uma diferença estatisticamente. O teste de Anova entra em cena como o teste paramétrico utilizado para comparação de mais de duas médias. Ele pode ter comoestatística de teste o valor calculado F, que pode ser comparado a um valor tabelado de acordo com a distribuição F. Outra opção é comparar o valor–p da estatística de teste ao nível de significância. Isso possibilita que o pesquisador tome a sua decisão com base nos dados amostrados. Referências CALLEGARI-JACQUES, S. M. Bioestatística: princípios e aplicações. Porto Alegre: Artmed, 2007. DOANE, D. P. Estatística aplicada à administração. 4. ed. Porto Alegre: Bookman, 2014. FAVIERO, L. P. Manual de análise de dados. Rio de Janeiro: Elsiver, 2017. MORETIN, P. A.; BUSSAB, W. O. Estatística básica. 9. ed. São Paulo: Saraiva, 2017. Os links para sites da web fornecidos neste capítulo foram todos testados, e seu funcionamento foi comprovado no momento da publicação do material. No entanto, a rede é extremamente dinâmica; suas páginas estão constantemente mudando de local e conteúdo. Assim, os editores declaram não ter qualquer responsabilidade sobre qualidade, precisão ou integralidade das informações referidas em tais links. Análise de variância10
Compartilhar