Buscar

Teste de Análise de Variância (ANOVA)

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 3, do total de 12 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 6, do total de 12 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 9, do total de 12 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Prévia do material em texto

BIOESTATÍSTICA
OBJETIVOS DE APRENDIZAGEM
 > Descrever o que é um teste de análise de variância.
 > Identificar quando deve ser utilizado um teste de análise de variância.
 > Definir o valor de F de uma Anova.
Introdução
Os testes de hipóteses são muito importantes no âmbito da estatística. Eles são 
utilizados quando se deseja verificar uma hipótese específica e também quando 
se quer verificar se existem evidências estatísticas para atestar que determinada 
diferença seja significativa.
Neste capítulo, você vai estudar a Anova, um teste paramétrico utilizado 
para a comparação de mais de duas médias. Você também vai ver como realizar 
uma Anova. Além disso, vai verificar quando utilizar essa técnica de inferência 
estatística e como analisar seus resultados.
Teste de Anova
Os testes de hipóteses integram a área da estatística chamada de “estatís-
tica inferencial”. Os testes de hipóteses dividem-se em paramétricos e não 
paramétricos. Os testes paramétricos distinguem-se dos não paramétricos 
basicamente porque se baseiam em variáveis que seguem uma distribuição 
de probabilidades conhecida, geralmente a distribuição normal. Existem 
testes de hipóteses que verificam afirmações a respeito de médias, variâncias, 
proporções e associações, por exemplo.
Análise de variância
Juliane Silveira Freire da Silva
Uma hipótese estatística é uma suposição sobre determinado parâmetro 
da população, como média, desvio-padrão, coeficiente de correlação, etc. 
Por sua vez, um teste de hipótese é um procedimento utilizado para decidir 
sobre a veracidade ou falsidade de determinada hipótese. Para que uma 
hipótese estatística seja validada ou rejeitada com certeza, seria necessário 
examinar toda a população, o que na prática é inviável. Portanto, como 
alternativa, extrai-se uma amostra aleatória da população de interesse 
(FAVIERO, 2017).
A Anova é um teste que verifica a igualdade de duas ou mais médias. Os 
pressupostos para a utilização desse teste são:
 � as amostras em estudo devem ser independentes;
 � as amostras devem ser retiradas de populações que sigam a distri-
buição normal ou aproximadamente normal;
 � deve haver homocedasticidade (igualdade de variâncias);
 � as variáveis em estudo devem ser numéricas.
Por ser um teste de hipóteses estatísticas, esse teste segue o mesmo 
procedimento de outros testes de hipóteses. Tal procedimento implica:
 � formular hipóteses;
 � definir o nível de significância do teste (α);
 � calcular a estatística de teste;
 � definir a região crítica de acordo com o nível de significância 
estabelecido;
 � concluir (rejeitar ou não H0).
Segundo Moretin e Bussab (2017), o objetivo do teste de hipóteses é indicar, 
de acordo com a estatística de teste, se H0 é verdadeira ou não. Operacional-
mente, essa decisão é tomada por meio da consideração de uma região crítica 
(RC), também conhecida como “região de rejeição”. Caso o valor observado na 
estatística de teste pertença a essa região, rejeita-se a hipótese nula; caso 
contrário, não se pode rejeitar H0.
Componentes de um teste de Anova
Há duas hipóteses de pesquisa: a hipótese nula, também chamada de “hipó-
tese de igualdade” (H0), e a hipótese alternativa (H1 ou Ha). No teste de Anova, 
é possível descrever genericamente as hipóteses como indicado a seguir.
Análise de variância2
 � H0: as médias são iguais.
 � H1: ao menos uma das médias difere das demais.
As duas afirmações são hipóteses porque a verdade é desconhecida. Serão 
feitos esforços para rejeitar a hipótese nula (às vezes chamada de “hipótese 
firmada” ou “hipótese de pesquisa”). A H0 deve ser enunciada de forma precisa 
para que possa ser testada mediante as evidências empíricas de uma amostra.
Se H0 representa uma teoria estabelecida, espera-se efetivamente não 
rejeitá-la, mas, de qualquer maneira, há uma tentativa de fazê-lo. Quando H0 
é rejeitada, procura-se concluir que a hipótese alternativa H1 é a verdadeira. 
A H0representa o status quo (por exemplo, a situação corrente dos negócios), 
enquanto a H1 é às vezes chamada de “ação alternativa”, pois alguma ação 
pode ser exigida se H0 for rejeitada em favor de H1 (DOANE, 2014).
O nível de significância do teste é a probabilidade de erro do tipo 1, que 
consiste em rejeitar H0 quando ela é a hipótese verdadeira. O nível de signi-
ficância é representado pela letra grega α (alfa). No Quadro 1, a seguir, veja 
os tipos de erro associados à realização dos testes estatísticos.
Quadro 1. Erros associados à realização dos testes estatísticos e suas res-
pectivas probabilidades
Conclusão do teste
Verdade Não se rejeita H0 Rejeita-se H0
H0 é verdadeira Decisão correta
Probabilidade: 1 – α
Decisão errada: erro tipo I
Probabilidade: α
H0 é falsa Decisão errada: erro tipo II
Probabilidade: β
Decisão correta
Probabilidade: 1 – β (poder 
do teste)
Fonte: Adaptado de Callegari-Jacques (2007).
A probabilidade α de se cometer um erro do tipo I (ou de primeira espécie) 
é um valor arbitrário e recebe o nome de “nível de significância do teste”. 
O resultado da amostra é tanto mais significante para rejeitar H0 quanto 
menor for esse nível α. Ou seja, quanto menor for α, menor é a probabilidade 
de se obter uma amostra com estatística pertencente à região crítica. Nesse 
sentido, é pouco verossímil a obtenção de uma amostra da população para 
a qual H0 seja verdadeira. Usualmente, o valor de α é fixado em 5%, 1% ou 
0,1% (MORETIN; BUSSAB, 2017).
Análise de variância 3
O erro do tipo I é fixado como o nível de significância. Por sua vez, 
o erro do tipo II pode ser controlado com o aumento do tamanho 
da amostra.
A estatística do teste depende do teste escolhido. No caso da Anova, são 
feitos alguns cálculos para se encontrar a estatística de teste F. Os cálculos 
necessários para a estatística de teste são trabalhosos. Por isso, em geral 
essa análise é realizada por meio de software.
Os dados precisam estar dispostos como no Quadro 2 para que se possa 
realizar os cálculos para a obtenção da estatística de teste. Caso o teste seja 
rodado no Excel, é necessário que as amostras de cada um dos grupos estejam 
organizadas de forma semelhante à apresentada no Quadro 2. Contudo, isso 
não é uma exigência de todo software estatístico.
Quadro 2. Organização de amostras
Tratamento Total
1 2 3 ... k
Y11 Y21 Y31 ... Yk1
Y12 Y22 Y32 ... Yk2
Y13 Y23 Y33 ... Yk3
... ... ... ... ...
Y1r Y2r Y3r ... Ykr
Total T1 T2 T3 ... Tk ΣT = Σy
Número de 
repetições
r1 r2 r3 ... rk Σr = n
Média ...
Análise de variância4
Veja algumas notações importantes:
 � k — grupos ou tratamentos;
 � r — número de repetições em cada grupo, ou seja, tamanho da amostra 
para cada grupo a ser comparado;
 � n — tamanho total da amostra (n = Ʃr);
 � y — valores da variável de cada unidade amostral.
A seguir, veja os cálculos a serem realizados para obter o valor da estatística 
de teste em uma tabela Anova.
 � Graus de liberdade:
 ■ Grupos (tratamentos) = k – 1
 ■ Resíduo (erro) = n – k
 ■ Total = n – 1
 � Valor de correção C: 
 � Soma de Quadrados Total (SQT): 
 � Soma de Quadrados de Tratamentos (SQTRr): 
 � Soma de Quadrados de Resíduo (SQR): 
 � Quadrado Médio de Tratamentos (QMTr): 
 � Quadrado Médio de Resíduo (QMR): 
 � Valor da estatística de teste F: 
Agora observe a Tabela Anova.
Causas de 
variação
Graus de 
liberdade (GL)
Soma dos 
quadrados (SQ)
Quadrados 
médios (QM) F
Grupos 
(tratamentos)
k – 1 SQTr QMTr F
Resíduo n – k SQR QMR
Total n – 1 SQT
A regra de decisão é tomada em função do nível de significância estabe-
lecido. Caso o F calculado caia na região crítica, rejeita-se H0. Caso o valor 
calculado de F não caia na região crítica, não se pode rejeitar a hipótese nula.
A distribuição F é uma distribuição assimétrica à direita que começa a partir 
do zero (F não pode ser negativo, pois as variâncias são somas de quadrados) e 
Análise de variância 5
não tem limite superior (pois as variâncias podem ser de qualquer magnitude). 
Para a Anova, o teste F é um teste unilateralà direita. Considera-se um nível 
de significância fixado α (DOANE, 2014).
O que delimita a região crítica é um valor tabelado de acordo com a dis-
tribuição F de Snedcor correspondente aos graus de liberdade e ao nível de 
significância fixa. Caso você tome a decisão com base nos valores calculados 
(FCALC) e tabelados (FTAB), deve considerar a regra de decisão apresentada 
a seguir.
 � Se FCALC > FTAB, rejeita-se H0. Logo, existe diferença significativa.
 � Se FCALC < FTAB, aceita-se H0. Logo, não existe diferença significativa.
Caso você tome a decisão com base no nível de significância do teste 
(valor–p), que representa a área abaixo da curva F correspondente ao valor 
de F calculado, comparado ao nível de significância fixado, deve considerar 
a regra a seguir.
 � Se valor–p < nível de significância (α), rejeita-se H0. Logo, existe dife-
rença significativa.
 � Se valor–p > nível de significância (α), aceita-se H0. Logo, não existe 
diferença significativa.
A escolha de uma dessas duas formas de interpretação depende da fer-
ramenta disponível (calculadora ou pacote computacional). Ambas as opções 
levam ao mesmo resultado. A conclusão indica se a hipótese nula foi rejeitada 
ou não.
Utilização da Anova
A Anova é um teste para comparação de médias. Além dela, existem ou-
tros testes para comparação de médias, como o teste t para uma média, o 
teste t para duas amostras independentes e o teste t pareado. Porém, esses 
testes limitam-se a uma ou duas amostras. Já o teste de Anova é utilizado 
quando se tem mais de duas amostras oriundas de populações normais ou 
aproximadamente normais e essas amostras são independentes entre si e 
homocedásticas.
A Anova segue as mesmas premissas dos demais testes de hipóteses pa-
ramétricos. Caso as variâncias não sejam iguais, ou os dados não sigam uma 
distribuição normal e a sua distribuição seja desconhecida, é preciso utilizar 
Análise de variância6
testes similares para comparação de médias (porém, testes não paramétricos, 
também conhecidos como “testes livres de distribuição”).
A Anova testa se existe ou não diferença entre as médias oriundas de 
populações independentes. Todavia, esse teste indica apenas se a diferença 
existe ou não; ele não consegue informar entre quais grupos a diferença é 
significativa.
Exemplo
Imagine que você coletou amostras de pessoas e investigou o número de 
salários mínimos recebidos em três diferentes estados do Brasil. O seu obje-
tivo é verificar se existe diferença significativa no número médio de salários 
recebidos pelos moradores desses três estados. A seguir, veja os números 
coletados.
São Paulo Rio de Janeiro Rio Grande do Sul
5 6 9
6 8 5
4 7 6
8 9 4
9 5 8
11 8 5
12 9 6
9 6 7
8 11 5
8 8
9
Como você deseja realizar um teste para verificar se existe diferença 
significativa entre os ganhos de salários mínimos em cada um dos estados, 
deve iniciar formalizando as hipóteses de pesquisa. Veja a seguir.
 � H0: as médias de salários mínimos nos três estados são iguais.
 � H1: em ao menos um dos estados, a média de salários mínimos é 
diferente.
Análise de variância 7
Após a formulação das hipóteses, você deve fixar o nível de significância 
em 5% e realizar o cálculo da estatística de teste F com o auxílio do Excel. 
Observe a tabela a seguir.
Grupo Contagem Soma Média Variância
São Paulo 11 89 8,0909 5,6909
Rio de Janeiro 9 69 7,6667 3,5000
Rio Grande do Sul 10 63 6,3000 2,6778
Agora veja a Tabela Anova, a seguir.
Fonte da 
variação
SQ GL MQ F Valor–p F crítico
Entre grupos 17,9576 2 8,9788 2,2239 0,1276 3,3541
Dentro dos 
grupos
109,0091 27 4,0374
Total 126,9667 29
Com a estatística de teste, você pode definir a regra de decisão. Se você 
analisar a estatística de teste comparada ao valor tabelado, vai verificar que 
FCALC (2,2239) < FTAB (3,3541), ou seja, H0 é aceita. Logo, não existe diferença 
significativa.
Já se você considerar a significância da estatística de teste comparada ao 
nível de significância, vai verificar que valor–p (0,1276) > nível de significância 
(α = 0,05), ou seja, H0 é aceita. Logo, não existe diferença significativa.
As duas opções levam à mesma resposta. Então, não se pode rejeitar H0. 
Logo, as médias de salários mínimos são iguais nos três estados analisados, 
ao nível de significância de 5%.
Como você viu, o teste de Anova indica se existe diferença entre as 
médias, mas fica limitado a isso e não consegue informar quais são 
as variáveis que diferem em relação à média. Para saber exatamente quais são 
as relações de diferença significativa, você precisa utilizar outros testes. Esses 
testes são chamados de “post hocs”. Os testes de comparações múltiplas mais 
comuns são os testes Tukey, Newman-Keuls, Bonferroni, Scheffé, Duncan e Fisher.
Análise de variância8
Estatística de teste F
O teste de Anova leva em consideração a distribuição de probabilidade F, e a 
partir dela se obtêm as probabilidades abaixo dessa curva. A distribuição F 
descreve a razão de duas variâncias. Portanto, faz sentido que a estatística 
do teste de Anova seja a estatística do teste F. A estatística F é a razão da 
variância devida ao tratamento pela variância devida ao erro. O QMTr é o qua-
drado médio devido ao tratamento, e o QMR é o quadrado médio dentro dos 
tratamentos, também chamado de “quadrado médio residual” (DOANE, 2014).
Segundo Doane (2014), a estatística de teste F não pode ser negativa (ela é 
baseada em somas de quadrados). O teste F, que testa a igualdade de médias 
dos tratamentos, é sempre um teste unilateral à direita, pois é a razão entre a 
variância explicada (pelo fator) e a variância do erro (não explicada pelo fator).
Se há apenas uma pequena diferença entre os tratamentos, se espera que 
QMTr esteja próximo de zero, porque as médias dos tratamentos estão próximas 
da média geral. Logo, se F estiver próxima de zero, não se espera rejeitar a 
hipótese de igualdade das médias dos grupos. Quanto maior for a estatística 
F, mais o pesquisador se inclina a rejeitar a hipótese de igualdade de médias. 
Mas quão grande deve ser F para convencê-lo de que as médias diferem?
Em síntese, essa estatística de teste é comparada ao valor tabelado re-
ferente ao nível de significância fixado, delimitando assim a região crítica 
do teste. Caso a estatística de teste seja superior ao valor tabelado ao nível 
de significância, esse teste terá a hipótese nula rejeitada. Já se o valor da 
estatística de testes for inferior ao valor tabelado, não será possível rejeitar 
a hipótese nula.
A estatística de teste é calculada com base nos dados obtidos em uma 
amostra. Assim, as hipóteses são testadas com base nessa amostra. A estatís-
tica de teste é o ponto-chave de qualquer teste de hipóteses. Ela é calculada 
com base em dados amostrais, e esse é o valor comparado ao valor do nível 
de significância.
Então, com base nos dados amostrais, é possível verificar se o teste em 
estudo é significativo ou não. Cada teste de hipóteses terá a sua estatística 
de teste correspondente e, consequentemente, uma função de probabilidade 
conhecida correspondente (no caso dos testes paramétricos).
A estatística de teste F é calculada com base nas somas de quadrado entre 
e dentro dos tratamentos. Esse valor segue uma distribuição F desde que os 
pressupostos de independência entre as amostras e as populações de onde 
elas foram retiradas sigam uma distribuição normal ou aproximadamente 
normal e que a homocedasticidade seja satisfeita.
Análise de variância 9
Se os dados estiverem em conformidade com os pressupostos, o pesqui-
sador pode formular as hipóteses adequadas e calcular a estatística de teste 
que permitirá verificar se o teste é significativo ou não. Assim, ele poderá 
afirmar se é possível rejeitar a hipótese nula ou não.
Os testes de hipóteses são muito importantes quando se precisa verificar 
uma diferença estatisticamente. O teste de Anova entra em cena como o teste 
paramétrico utilizado para comparação de mais de duas médias. Ele pode 
ter comoestatística de teste o valor calculado F, que pode ser comparado a 
um valor tabelado de acordo com a distribuição F. Outra opção é comparar o 
valor–p da estatística de teste ao nível de significância. Isso possibilita que 
o pesquisador tome a sua decisão com base nos dados amostrados.
Referências
CALLEGARI-JACQUES, S. M. Bioestatística: princípios e aplicações. Porto Alegre: Artmed, 
2007.
DOANE, D. P. Estatística aplicada à administração. 4. ed. Porto Alegre: Bookman, 2014.
FAVIERO, L. P. Manual de análise de dados. Rio de Janeiro: Elsiver, 2017.
MORETIN, P. A.; BUSSAB, W. O. Estatística básica. 9. ed. São Paulo: Saraiva, 2017.
Os links para sites da web fornecidos neste capítulo foram todos 
testados, e seu funcionamento foi comprovado no momento da 
publicação do material. No entanto, a rede é extremamente dinâmica; suas 
páginas estão constantemente mudando de local e conteúdo. Assim, os editores 
declaram não ter qualquer responsabilidade sobre qualidade, precisão ou 
integralidade das informações referidas em tais links.
Análise de variância10

Continue navegando