Teste de Análise de Variância (ANOVA)

•

UCAM

4

0

4

0

1

Junior Lucas

26/09/2022

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Você viu 3, do total de 12 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Você viu 6, do total de 12 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Você viu 9, do total de 12 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

E aí, curtiu este material?

Ajude a incentivar outros estudantes a melhorar o conteúdo

Gostou desse material? Compartilhe! 🧡

Metodos Quantitativos Aplicados

1.293 Materiais compartilhados

Baixe o app para aproveitar ainda mais

Leia os materiais offline, sem usar a internet. Além de vários outros recursos!

Prévia do material em texto

BIOESTATÍSTICA
OBJETIVOS DE APRENDIZAGEM
> Descrever o que é um teste de análise de variância.
> Identificar quando deve ser utilizado um teste de análise de variância.
> Definir o valor de F de uma Anova.
Introdução
Os testes de hipóteses são muito importantes no âmbito da estatística. Eles são
utilizados quando se deseja verificar uma hipótese específica e também quando
se quer verificar se existem evidências estatísticas para atestar que determinada
diferença seja significativa.
Neste capítulo, você vai estudar a Anova, um teste paramétrico utilizado
para a comparação de mais de duas médias. Você também vai ver como realizar
uma Anova. Além disso, vai verificar quando utilizar essa técnica de inferência
estatística e como analisar seus resultados.
Teste de Anova
Os testes de hipóteses integram a área da estatística chamada de “estatís-
tica inferencial”. Os testes de hipóteses dividem-se em paramétricos e não
paramétricos. Os testes paramétricos distinguem-se dos não paramétricos
basicamente porque se baseiam em variáveis que seguem uma distribuição
de probabilidades conhecida, geralmente a distribuição normal. Existem
testes de hipóteses que verificam afirmações a respeito de médias, variâncias,
proporções e associações, por exemplo.
Análise de variância
Juliane Silveira Freire da Silva
Uma hipótese estatística é uma suposição sobre determinado parâmetro
da população, como média, desvio-padrão, coeficiente de correlação, etc.
Por sua vez, um teste de hipótese é um procedimento utilizado para decidir
sobre a veracidade ou falsidade de determinada hipótese. Para que uma
hipótese estatística seja validada ou rejeitada com certeza, seria necessário
examinar toda a população, o que na prática é inviável. Portanto, como
alternativa, extrai-se uma amostra aleatória da população de interesse
(FAVIERO, 2017).
A Anova é um teste que verifica a igualdade de duas ou mais médias. Os
pressupostos para a utilização desse teste são:
� as amostras em estudo devem ser independentes;
� as amostras devem ser retiradas de populações que sigam a distri-
buição normal ou aproximadamente normal;
� deve haver homocedasticidade (igualdade de variâncias);
� as variáveis em estudo devem ser numéricas.
Por ser um teste de hipóteses estatísticas, esse teste segue o mesmo
procedimento de outros testes de hipóteses. Tal procedimento implica:
� formular hipóteses;
� definir o nível de significância do teste (α);
� calcular a estatística de teste;
� definir a região crítica de acordo com o nível de significância
estabelecido;
� concluir (rejeitar ou não H0).
Segundo Moretin e Bussab (2017), o objetivo do teste de hipóteses é indicar,
de acordo com a estatística de teste, se H0 é verdadeira ou não. Operacional-
mente, essa decisão é tomada por meio da consideração de uma região crítica
(RC), também conhecida como “região de rejeição”. Caso o valor observado na
estatística de teste pertença a essa região, rejeita-se a hipótese nula; caso
contrário, não se pode rejeitar H0.
Componentes de um teste de Anova
Há duas hipóteses de pesquisa: a hipótese nula, também chamada de “hipó-
tese de igualdade” (H0), e a hipótese alternativa (H1 ou Ha). No teste de Anova,
é possível descrever genericamente as hipóteses como indicado a seguir.
Análise de variância2
� H0: as médias são iguais.
� H1: ao menos uma das médias difere das demais.
As duas afirmações são hipóteses porque a verdade é desconhecida. Serão
feitos esforços para rejeitar a hipótese nula (às vezes chamada de “hipótese
firmada” ou “hipótese de pesquisa”). A H0 deve ser enunciada de forma precisa
para que possa ser testada mediante as evidências empíricas de uma amostra.
Se H0 representa uma teoria estabelecida, espera-se efetivamente não
rejeitá-la, mas, de qualquer maneira, há uma tentativa de fazê-lo. Quando H0
é rejeitada, procura-se concluir que a hipótese alternativa H1 é a verdadeira.
A H0representa o status quo (por exemplo, a situação corrente dos negócios),
enquanto a H1 é às vezes chamada de “ação alternativa”, pois alguma ação
pode ser exigida se H0 for rejeitada em favor de H1 (DOANE, 2014).
O nível de significância do teste é a probabilidade de erro do tipo 1, que
consiste em rejeitar H0 quando ela é a hipótese verdadeira. O nível de signi-
ficância é representado pela letra grega α (alfa). No Quadro 1, a seguir, veja
os tipos de erro associados à realização dos testes estatísticos.
Quadro 1. Erros associados à realização dos testes estatísticos e suas res-
pectivas probabilidades
Conclusão do teste
Verdade Não se rejeita H0 Rejeita-se H0
H0 é verdadeira Decisão correta
Probabilidade: 1 – α
Decisão errada: erro tipo I
Probabilidade: α
H0 é falsa Decisão errada: erro tipo II
Probabilidade: β
Decisão correta
Probabilidade: 1 – β (poder
do teste)
Fonte: Adaptado de Callegari-Jacques (2007).
A probabilidade α de se cometer um erro do tipo I (ou de primeira espécie)
é um valor arbitrário e recebe o nome de “nível de significância do teste”.
O resultado da amostra é tanto mais significante para rejeitar H0 quanto
menor for esse nível α. Ou seja, quanto menor for α, menor é a probabilidade
de se obter uma amostra com estatística pertencente à região crítica. Nesse
sentido, é pouco verossímil a obtenção de uma amostra da população para
a qual H0 seja verdadeira. Usualmente, o valor de α é fixado em 5%, 1% ou
0,1% (MORETIN; BUSSAB, 2017).
Análise de variância 3
O erro do tipo I é fixado como o nível de significância. Por sua vez,
o erro do tipo II pode ser controlado com o aumento do tamanho
da amostra.
A estatística do teste depende do teste escolhido. No caso da Anova, são
feitos alguns cálculos para se encontrar a estatística de teste F. Os cálculos
necessários para a estatística de teste são trabalhosos. Por isso, em geral
essa análise é realizada por meio de software.
Os dados precisam estar dispostos como no Quadro 2 para que se possa
realizar os cálculos para a obtenção da estatística de teste. Caso o teste seja
rodado no Excel, é necessário que as amostras de cada um dos grupos estejam
organizadas de forma semelhante à apresentada no Quadro 2. Contudo, isso
não é uma exigência de todo software estatístico.
Quadro 2. Organização de amostras
Tratamento Total
1 2 3 ... k
Y11 Y21 Y31 ... Yk1
Y12 Y22 Y32 ... Yk2
Y13 Y23 Y33 ... Yk3
... ... ... ... ...
Y1r Y2r Y3r ... Ykr
Total T1 T2 T3 ... Tk ΣT = Σy
Número de
repetições
r1 r2 r3 ... rk Σr = n
Média ...
Análise de variância4
Veja algumas notações importantes:
� k — grupos ou tratamentos;
� r — número de repetições em cada grupo, ou seja, tamanho da amostra
para cada grupo a ser comparado;
� n — tamanho total da amostra (n = Ʃr);
� y — valores da variável de cada unidade amostral.
A seguir, veja os cálculos a serem realizados para obter o valor da estatística
de teste em uma tabela Anova.
� Graus de liberdade:
■ Grupos (tratamentos) = k – 1
■ Resíduo (erro) = n – k
■ Total = n – 1
� Valor de correção C:
� Soma de Quadrados Total (SQT):
� Soma de Quadrados de Tratamentos (SQTRr):
� Soma de Quadrados de Resíduo (SQR):
� Quadrado Médio de Tratamentos (QMTr):
� Quadrado Médio de Resíduo (QMR):
� Valor da estatística de teste F:
Agora observe a Tabela Anova.
Causas de
variação
Graus de
liberdade (GL)
Soma dos
quadrados (SQ)
Quadrados
médios (QM) F
Grupos
(tratamentos)
k – 1 SQTr QMTr F
Resíduo n – k SQR QMR
Total n – 1 SQT
A regra de decisão é tomada em função do nível de significância estabe-
lecido. Caso o F calculado caia na região crítica, rejeita-se H0. Caso o valor
calculado de F não caia na região crítica, não se pode rejeitar a hipótese nula.
A distribuição F é uma distribuição assimétrica à direita que começa a partir
do zero (F não pode ser negativo, pois as variâncias são somas de quadrados) e
Análise de variância 5
não tem limite superior (pois as variâncias podem ser de qualquer magnitude).
Para a Anova, o teste F é um teste unilateralà direita. Considera-se um nível
de significância fixado α (DOANE, 2014).
O que delimita a região crítica é um valor tabelado de acordo com a dis-
tribuição F de Snedcor correspondente aos graus de liberdade e ao nível de
significância fixa. Caso você tome a decisão com base nos valores calculados
(FCALC) e tabelados (FTAB), deve considerar a regra de decisão apresentada
a seguir.
� Se FCALC > FTAB, rejeita-se H0. Logo, existe diferença significativa.
� Se FCALC < FTAB, aceita-se H0. Logo, não existe diferença significativa.
Caso você tome a decisão com base no nível de significância do teste
(valor–p), que representa a área abaixo da curva F correspondente ao valor
de F calculado, comparado ao nível de significância fixado, deve considerar
a regra a seguir.
� Se valor–p < nível de significância (α), rejeita-se H0. Logo, existe dife-
rença significativa.
� Se valor–p > nível de significância (α), aceita-se H0. Logo, não existe
diferença significativa.
A escolha de uma dessas duas formas de interpretação depende da fer-
ramenta disponível (calculadora ou pacote computacional). Ambas as opções
levam ao mesmo resultado. A conclusão indica se a hipótese nula foi rejeitada
ou não.
Utilização da Anova
A Anova é um teste para comparação de médias. Além dela, existem ou-
tros testes para comparação de médias, como o teste t para uma média, o
teste t para duas amostras independentes e o teste t pareado. Porém, esses
testes limitam-se a uma ou duas amostras. Já o teste de Anova é utilizado
quando se tem mais de duas amostras oriundas de populações normais ou
aproximadamente normais e essas amostras são independentes entre si e
homocedásticas.
A Anova segue as mesmas premissas dos demais testes de hipóteses pa-
ramétricos. Caso as variâncias não sejam iguais, ou os dados não sigam uma
distribuição normal e a sua distribuição seja desconhecida, é preciso utilizar
Análise de variância6
testes similares para comparação de médias (porém, testes não paramétricos,
também conhecidos como “testes livres de distribuição”).
A Anova testa se existe ou não diferença entre as médias oriundas de
populações independentes. Todavia, esse teste indica apenas se a diferença
existe ou não; ele não consegue informar entre quais grupos a diferença é
significativa.
Exemplo
Imagine que você coletou amostras de pessoas e investigou o número de
salários mínimos recebidos em três diferentes estados do Brasil. O seu obje-
tivo é verificar se existe diferença significativa no número médio de salários
recebidos pelos moradores desses três estados. A seguir, veja os números
coletados.
São Paulo Rio de Janeiro Rio Grande do Sul
5 6 9
6 8 5
4 7 6
8 9 4
9 5 8
11 8 5
12 9 6
9 6 7
8 11 5
8 8
9
Como você deseja realizar um teste para verificar se existe diferença
significativa entre os ganhos de salários mínimos em cada um dos estados,
deve iniciar formalizando as hipóteses de pesquisa. Veja a seguir.
� H0: as médias de salários mínimos nos três estados são iguais.
� H1: em ao menos um dos estados, a média de salários mínimos é
diferente.
Análise de variância 7
Após a formulação das hipóteses, você deve fixar o nível de significância
em 5% e realizar o cálculo da estatística de teste F com o auxílio do Excel.
Observe a tabela a seguir.
Grupo Contagem Soma Média Variância
São Paulo 11 89 8,0909 5,6909
Rio de Janeiro 9 69 7,6667 3,5000
Rio Grande do Sul 10 63 6,3000 2,6778
Agora veja a Tabela Anova, a seguir.
Fonte da
variação
SQ GL MQ F Valor–p F crítico
Entre grupos 17,9576 2 8,9788 2,2239 0,1276 3,3541
Dentro dos
grupos
109,0091 27 4,0374
Total 126,9667 29
Com a estatística de teste, você pode definir a regra de decisão. Se você
analisar a estatística de teste comparada ao valor tabelado, vai verificar que
FCALC (2,2239) < FTAB (3,3541), ou seja, H0 é aceita. Logo, não existe diferença
significativa.
Já se você considerar a significância da estatística de teste comparada ao
nível de significância, vai verificar que valor–p (0,1276) > nível de significância
(α = 0,05), ou seja, H0 é aceita. Logo, não existe diferença significativa.
As duas opções levam à mesma resposta. Então, não se pode rejeitar H0.
Logo, as médias de salários mínimos são iguais nos três estados analisados,
ao nível de significância de 5%.
Como você viu, o teste de Anova indica se existe diferença entre as
médias, mas fica limitado a isso e não consegue informar quais são
as variáveis que diferem em relação à média. Para saber exatamente quais são
as relações de diferença significativa, você precisa utilizar outros testes. Esses
testes são chamados de “post hocs”. Os testes de comparações múltiplas mais
comuns são os testes Tukey, Newman-Keuls, Bonferroni, Scheffé, Duncan e Fisher.
Análise de variância8
Estatística de teste F
O teste de Anova leva em consideração a distribuição de probabilidade F, e a
partir dela se obtêm as probabilidades abaixo dessa curva. A distribuição F
descreve a razão de duas variâncias. Portanto, faz sentido que a estatística
do teste de Anova seja a estatística do teste F. A estatística F é a razão da
variância devida ao tratamento pela variância devida ao erro. O QMTr é o qua-
drado médio devido ao tratamento, e o QMR é o quadrado médio dentro dos
tratamentos, também chamado de “quadrado médio residual” (DOANE, 2014).
Segundo Doane (2014), a estatística de teste F não pode ser negativa (ela é
baseada em somas de quadrados). O teste F, que testa a igualdade de médias
dos tratamentos, é sempre um teste unilateral à direita, pois é a razão entre a
variância explicada (pelo fator) e a variância do erro (não explicada pelo fator).
Se há apenas uma pequena diferença entre os tratamentos, se espera que
QMTr esteja próximo de zero, porque as médias dos tratamentos estão próximas
da média geral. Logo, se F estiver próxima de zero, não se espera rejeitar a
hipótese de igualdade das médias dos grupos. Quanto maior for a estatística
F, mais o pesquisador se inclina a rejeitar a hipótese de igualdade de médias.
Mas quão grande deve ser F para convencê-lo de que as médias diferem?
Em síntese, essa estatística de teste é comparada ao valor tabelado re-
ferente ao nível de significância fixado, delimitando assim a região crítica
do teste. Caso a estatística de teste seja superior ao valor tabelado ao nível
de significância, esse teste terá a hipótese nula rejeitada. Já se o valor da
estatística de testes for inferior ao valor tabelado, não será possível rejeitar
a hipótese nula.
A estatística de teste é calculada com base nos dados obtidos em uma
amostra. Assim, as hipóteses são testadas com base nessa amostra. A estatís-
tica de teste é o ponto-chave de qualquer teste de hipóteses. Ela é calculada
com base em dados amostrais, e esse é o valor comparado ao valor do nível
de significância.
Então, com base nos dados amostrais, é possível verificar se o teste em
estudo é significativo ou não. Cada teste de hipóteses terá a sua estatística
de teste correspondente e, consequentemente, uma função de probabilidade
conhecida correspondente (no caso dos testes paramétricos).
A estatística de teste F é calculada com base nas somas de quadrado entre
e dentro dos tratamentos. Esse valor segue uma distribuição F desde que os
pressupostos de independência entre as amostras e as populações de onde
elas foram retiradas sigam uma distribuição normal ou aproximadamente
normal e que a homocedasticidade seja satisfeita.
Análise de variância 9
Se os dados estiverem em conformidade com os pressupostos, o pesqui-
sador pode formular as hipóteses adequadas e calcular a estatística de teste
que permitirá verificar se o teste é significativo ou não. Assim, ele poderá
afirmar se é possível rejeitar a hipótese nula ou não.
Os testes de hipóteses são muito importantes quando se precisa verificar
uma diferença estatisticamente. O teste de Anova entra em cena como o teste
paramétrico utilizado para comparação de mais de duas médias. Ele pode
ter comoestatística de teste o valor calculado F, que pode ser comparado a
um valor tabelado de acordo com a distribuição F. Outra opção é comparar o
valor–p da estatística de teste ao nível de significância. Isso possibilita que
o pesquisador tome a sua decisão com base nos dados amostrados.
Referências
CALLEGARI-JACQUES, S. M. Bioestatística: princípios e aplicações. Porto Alegre: Artmed,
2007.
DOANE, D. P. Estatística aplicada à administração. 4. ed. Porto Alegre: Bookman, 2014.
FAVIERO, L. P. Manual de análise de dados. Rio de Janeiro: Elsiver, 2017.
MORETIN, P. A.; BUSSAB, W. O. Estatística básica. 9. ed. São Paulo: Saraiva, 2017.
Os links para sites da web fornecidos neste capítulo foram todos
testados, e seu funcionamento foi comprovado no momento da
publicação do material. No entanto, a rede é extremamente dinâmica; suas
páginas estão constantemente mudando de local e conteúdo. Assim, os editores
declaram não ter qualquer responsabilidade sobre qualidade, precisão ou
integralidade das informações referidas em tais links.
Análise de variância10