Baixe o app para aproveitar ainda mais
Prévia do material em texto
1 Análise da Variância ANOVA Conceito • Considere populações independentes com distribuição normal, nas quais precisamos demonstrar a significância das diferenças entre três ou mais médias amostrais, ou, na hipótese nula, que todas as médias amostrais são iguais. • Podemos aplicar este teste também para duas populações. • A comparação é feita por uma análise de variância acompanhada de um teste F que supõe que: 2 – as observações são independentes; – as variâncias populacionais devem ser iguais nos g grupos; – a distribuição das observações em cada grupo deve ser normal. • Assim temos as hipóteses: Experimento de um Fator • As medições ou observações são obtidas para g grupos (tratamentos) independentes de amostras, onde n é o numero de repetições ou replicações. • Considerando tamanhos de amostras iguais, n, podemos colocar as somas e as médias em uma tabela. 3 Experimento de um Fator A média da amostra global, denotada por é a soma de todas as observações divididas pelo número total de observações: X Para cada elemento xij podemos calcular a sua distancia à média global da forma: ij x X− tomamos o quadrado da distância: ( ) 2 ij x X− somando os quadrados de todas as observações temos assim a variação total de todas as observações: ( ) gn 2 Tot ij i 1 j 1 SQ x X = = = −∑∑ N x ng x g nx g X X g j n i ij g j n i ij g j n i ij g j j ∑∑∑∑∑∑∑ = −= −= −= ==== 1 11 11 11 / 4 Vamos chamar de soma de quadrados dos tratamentos, SQTrat, a variação entre tratamentos: ( ) ( ) g gn 2 2 Trat j j j 1 i 1 j 1 SQ X X n X X = = = = − = −∑∑ ∑ que calcula ou mede as diferenças da média do tratamento com relação à média global, associada exclusivamente a um efeito dos grupos. E a soma de quadrados dos erros dada por: ( ) gn 2 erro ij j i 1 j 1 SQ x X = = = −∑∑ que calcula ou mede as variações dentro de cada grupo ou tratamento, que não é mais do que a soma dos quadrados dos resíduos devidos exclusivamente ao erro aleatório. ∑ = −= g j jj Sn 1 2 )1( Quando uma soma de quadrados é dividia pelo número de seus graus de liberdade, o resultado é chamado de variância quadrática média, assim a variância quadrática média entre tratamentos é: Trat Trat SQ QM g 1 = − e a variância quadrática média dos erros, isto é dentro de cada tratamento, é: gN SQ gng SQ QM ErroErroErro − = − = 5 Finalmente, definimos a estatística F como: Trat Erro QM F QM = que segue uma distribuição F com g -1 graus de liberdade no numerador e N - g graus de liberdade no denominador. •Se a hipótese nula H0 não é verdadeira (isto é, as médias dos tratamentos não são iguais), podemos esperar que QMTrat seja maior pois depende das médias, ao passo que QMErro não. •Assim, se esta estatística é significativamente grande, podemos concluir que existe uma diferença significativa entre as médias dos tratamentos e portanto, rejeitamos H0, caso contrário podemos aceitar H0. •Desta forma, com um nível de significância dado, obtemos o valor Fα com g -1 graus de liberdade no numerador e N -g graus de liberdade no denominador, o ponto crítico. Região de aceitação Região de rejeição A região crítica define-se por F > Fα. 6 As somas de quadrados podem ser resumidas em uma tabela conhecida como tabela ANOVA: OBS: Quando os tamanhos das amostras são diferentes, N = n1+n2+...+nj ∑ = −= g j jj Sn1 2 )1( ∑ = − g j jj Sn 1 2 )1( Exemplo 1: A National Computer Products, INC. (NCP) produz impressoras e máquinas de fax em suas fábricas localizadas em Atlanta, Dallas e Seattle. Para medir quanto os empregados dessas fábricas sabem sobre gerenciamento da qualidade total, uma amostra aleatória de seis empregados de cada fábrica foi selecionada e seus integrantes foram submetidos a um exame de seus conhecimentos sobre qualidade. As notas de exame obtidas estão na tabela abaixo. Os gerentes querem usar esses dados para testar a hipótese de que a média das notas de exame é a mesma para todas as 3 fábricas. Observação Fábrica 1 Atlanta Fábrica 2 Dallas Fábrica 3 Seattle 1 85 71 59 2 75 75 64 3 82 73 62 4 76 74 69 5 71 69 75 6 85 82 67 Solução: H0 : µ1 = µ2 = µ3 H1 : Nem todas as médias populacionais são iguais 7 73 3 6674791 = ++ == ∑ = g X X g j j Entre os Tratamentos 8 Dentro dos Tratamentos Teste F calculado 9 Tabela ANOVA: 516 430 946 3-1=2 6x3-3=15 6x3-1=17 258 28,67 9 Como F>Fα, rejeita-se H0.Ou seja, com 5% de significância, nem todas as médias nos exames são iguais. 10 Excel 11 Exemplo 2 • Um determinado departamento governamental está preocupado com os aumentos dos custos verificados no decurso de projetos de investigação e desenvolvimento encomendados aos institutos A, B, C e D. Assim, decidiu analisar os custos associados a diferentes projetos,calculando para cada um deles a razão entre o custo final incorrido e o custo inicialmente previsto. • Os resultados apresentam-se na tabela seguinte: • A questão que se coloca é a de saber se os quatro institutos têm um comportamento distinto em relação ao agravamento de custos. • Considere α=0,05 12 • Como o F calculado é maior que o tabelado (Fα=3,16) leva-nos à rejeição da hipótese da igualdade das médias (ao nível de significância 0.05), concluindo-se que os institutos têm comportamentos distintos no que diz respeito ao agravamento dos custos.
Compartilhar